1952年,贝尔实验室(BellLabs)生产一台6英尺高自动数字辨识机“Audrey”,它可以辨识数字0~9的发音,且准确度高达90%以上。并且它对熟人的精准度低,而对陌生人则偏高。1956年,普林斯顿大学RCA实验室研发了单音节词识别系统,需要辨识特定人的十个单音节词中所包括的有所不同音节。
1959年,MIT的林肯实验室研发了针对十个元音的非特定人语音识别系统。二十世纪六十年代初,东京无线电实验室、京都大学和NEC实验室在语音辨识领域获得了开拓性的进展,各自先后制作了需要展开语音辨识的专用硬件。
1964年的世界博览会上,IBM向世人展出了数字语音辨识的“shoeboxrecognizer”。二十世纪七十年代,语音辨识的研究获得了突破性的进展,研究焦点依然是孤立无援词语语音辨识。1971年,美国国防部研究所(Darpa)赞助商了五年期限的语音解读研究项目,期望将辨识的单词量提高到1000以上。
参予该项目的公司和学术机构还包括IBM、卡内基梅隆大学(CMU)、斯坦福研究院。就这样,Harpy在CMU问世了。不像之前的识别器,Harpy可以辨识整句话。
二十世纪八十年代,NEC明确提出了二阶动态规划算法,Bell实验室明确提出了分层结构算法,以及帧实时分层结构算法等。同时,连接词和大词汇量倒数语音的辨识获得了较小发展,统计资料模型逐步代替模板给定的方法,隐马尔科夫模型(HMM)沦为语音识别系统的基础模型。八十年代中期,IBM建构了一个语音掌控的打字机—Tangora,需要处置约20000单词。IBM的研究就是基于隐形马尔科夫链模型(hiddenMarkovmodel),在信号处理技术中重新加入统计资料信息。
这种方法使得在等价音素情况下,很有可能预测下一个因素。1984年,IBM公布的语音识别系统在5000个词汇量级上超过了95%的识别率。
1985年AT&T贝尔实验室修建了第一个智能麦克风系统,用来研究大室内空间的声源方位跟踪问题。1987年开始,国家开始继续执行963计划后,国家863智能计算机主题专家组为语音辨识研究立项,每两年一次。
本文来源:华体会hth最新登录地址-www.imgits.com