基于图正则化与非负组稀疏的自动图像标注

钱智明钟平王润生电子与信息学报 2015年第04期

摘要：设计一个稳健的自动图像标注系统的重要环节是提取能够有效描述图像语义的视觉特征。由于颜色、纹理和形状等异构视觉特征在表示特定图像语义时所起作用的重要程度不同且同一类特征之间具有一定的相关性,该文提出了一种图正则化约束下的非负组稀疏（Graph Regularized Non-negative Group Sparsity,GRNGS）模型来实现图像标注,并通过一种非负矩阵分解方法来计算其模型参数。该模型结合了图正则化与2,1l-范数约束,使得标注过程中所选的组群特征能体现一定的视觉相似性和语义相关性。在Corel5K和ESP Game等图像数据集上的实验结果表明：相较于一些最新的图像标注模型,GRNGS模型的鲁棒性更强,标注结果更精确。

关键词：图像标注图正则化组稀疏非负矩阵分解