摘要:迁移学习通过充分利用源域共享知识,实现对目标域的小样本问题求解,然而,对训练和测试样本分布差异测度仍然是该领域的主要挑战。该文针对多源迁移学习算法中,由于源域选择和源域辅助样本选择不当引起的"负迁移"问题进行研究,提出一种可迁移测度准则下的协变量偏移修正多源集成方法。首先,根据源域和目标域之间的协变量偏移原则,利用联合概率的密度估计,定义辅助样本的可迁移测度,验证目标域和源域在数据空间中标记分布的一致性。其次,在多源域选择阶段,引入非迁移判别过程,提高了源域知识的迁移准确性。最后,在Caltech 256数据集中,验证了Gist特征知识表示和迁移的有效性,分析了多种条件下的辅助样本选择和源域选择的有效性。实验结果表明所提算法可有效降低"负迁移"现象的发生,获得更好的迁移学习性能。
关键词:集成学习 迁移学习 协变量偏移 图像分类
单位:合肥工业大学计算机与信息学院 合肥230009
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社