摘要:该文提出了一种嵌入自联想神经网络的高斯混合模型,它充分利用了神经网络和高斯混合模型各自的优点,以最大似然概率(ML)为准则,把它们作为一个整体来进行训练。训练过程中,高斯混合模型和神经网络的参数交替更新。由于神经网络起到了"数据整形"的作用,因而提高了类内数据的相似性。实验结果表明,采用该文提出的模型在各种信噪比情况下的识别率都比基线系统有所提高,最高能达到19%。
关键词:说话人识别 嵌入
单位:东南大学信息科学与工程学院 南京210096
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社