线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

电话语音识别中基于统计模型的动态通道

韩兆兵; 张化云; 张树武; 徐波 电子与信息学报 2004年第11期

摘要:与桌面环境相比,电话网络环境下的语音识别率仍然还比较低,为了推动电话语音识别在实际中的应用,提高其识别率成了当务之急.先前的研究表明,电话语音识别率明显下降通常是因为测试和训练环境的电话通道不同引起数据失配造成的,因此该文提出基于统计模型的动态通道补偿算法(SMDC)减少它们之间的差异,采用贝叶斯估计算法动态地跟踪电话通道的时变特性.实验结果表明,大词汇量连续语音识别的字误识率(CER)相对降低约27%,孤立词的词误识率(WER)相对降低约30%.同时,算法的结构时延和计算复杂度也比较小,平均时延约200 ms,可以很好地嵌入到实际电话语音识别应用中.

关键词:电话语音识别动态通道补偿最大似然估计最大后验估计

单位:中国科学院自动化研究所模式识别国家重点实验室; 北京; 100080

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

电子与信息学报

北大期刊

¥1272.00

关注 31人评论|2人关注