摘要:群体特征提取是发现特定知识群体偏好,进而提供个性化服务的基础.TFIDF是进行特征提取的常用方法,然而传统{\rm TFIDF}方法却未考虑到类间集中度和类内分散度的问题.针对该情况文章引进了CD因子,提出了新的TFIDF算法,以读者借阅数据为基础开展了图书馆知识群体特征提取研究.并以某高校建筑与城市规划群体为例,采用传统和改进两种TFIDF方法对群体特征进行提取.实证表明,改进TFIDF方法效果更佳.
关键词:tfidf 图书馆 知识群体 特征提取
单位:哈尔滨工程大学经济管理学院; 哈尔滨150001; 工业和信息化部电子第五研究所; 广州510610
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社