- http://210.60.226.25/science/content/1999/00050353/0006.htm
- http://www.speech.cm.nctu.edu.tw/courses/speech/speech%20process(2009)/%E8%AA%9E%E9%9F%B3%E8%BE%A8%E8%AA%8D.pdf
就发展历史来看,1955年PCM语音编码技术被提出,1962年第一条数位传输系统开始使用。直到1970年前後,APC(Adaptive Prediction Coding)、LPC(Linear Prediction Coding)语音编码技术被提出,科学家藉由数学式将人类发出语音信号的机制模式化,同时也开始建立了最早的语音信号分析数学模式。透过语音信号的特徵分析,用来描述人类在发出不同语音时发音器官的不同特性。语音辨认的研究於是展开了。
以目前的语音辨认技术应用,根据操作平台的不同,大致可以概分为三类:
(一)以资讯查询为主的伺服器端应用:由於硬体设备强大的运算能力,可以结合自然语言处理技术与资料库搜寻引擎,建立针对特定领域的语音资讯查询系统。这类应用主要是以电话做为远端的语音输入装置,透过电脑电话整合介面与语音伺服器连结。其中以客服系统为主要应用。
(二)行动手持装置上的语音命令:如行动电话,利用语音做为输出入成为人性化操作介面的设计重点之一。早期行动手持装置上的语音输入以使用者特定语音辨识为主,使用者需要进行冗长的语音标记训练,故并未获得一般使用者的喜爱。随着行动手持装置硬体能力的提昇,非特定语者语音指令辨识均已在行动手持装置上出现。目前此类应用以声控拨号及语音指令操作为主。
(三)应用消费性电子产品的声控晶片:例如玩具,所用的晶片往往是低价位低运算能力的晶片。虽然语音技术一直被看好可以为消费性电子产品带来新的产品设计概念,但由於在远距语音输入及环境噪音问题仍无法有效解决,故一直无法有效的发挥。
参考资料