摘要:提出了一种适用于视听融合的简化型重要性函数粒子滤波器(ISPF),该算法充分利用视听媒体间的天然时空相关性,基于视听信息的融合实现了特定场景中对说话人的跟踪。将声源定位结果转换为一个具有特殊权重的粒子,以图像彩色信息模板匹配算法作为视觉底层跟踪,通过具有特殊权重的粒子来限制和引导视觉跟踪结果。实验结果表明,文中算法与基于单一信息的目标跟踪相比平均误差降低了约三倍,具有明显的优越性。
关键词:目标跟踪 声源定位 视听信息融合 模版匹配 ispf
单位:兰州理工大学计算机与通信学院 兰州730050
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社