摘要:该文应用词袋模型对图像进行分类,并针对传统词袋模型存在的不足进行改进,提出了一种基于兴趣区域(Region Of Interest,ROI)提取以及金字塔匹配原理的优化方法。首先对训练图像进行ROI提取,对得到的ROI区域进行密集尺度不变特征变换(Scale-Invariant Feature Transform,SIFT)特征的抽取和描述并生成视觉词典,由此产生的视觉词典更能精确的描述图像的特征,且能够抵抗多变的位置信息及背景信息的影响。其次应用金字塔匹配原理对图像进行基于视觉词典的直方图表示,代入支持向量机(Support Vector Machine,SVM)分类器进行分类。通过对Caltech 101和Caltech 256两个数据库进行实验,结果表明该方法较传统方法提高了分类的正确率,且能够在训练图像较少的情况下达到良好的分类效果。最后通过与现有同类方法的比较验证了该方法的优越性。
关键词:图像分类 词袋模型 兴趣提取 金字塔匹配
单位:哈尔滨工程大学信息与通信工程学院 哈尔滨150001 日本东京电气通信大学金子研究室 日本东京182-8585
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社