线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

基于集成学习的网页主题识别算法

葛东谋 张钢 李谦 电子测试 2013年第19期

摘要:在海量网页中进行自动的主题识别是网页信息分析挖掘的重要研究方向,具有重要的理论和应用意义。提出一种基于集成学习的网页主题识别算法框架,由异质网页属性集构建不同的最大间隔分类器,使用集成学习对基分类器的信息进行融合。在基准数据集上进行测试,其结果表明该算法对网页主题识别是有效的。

关键词:网页主题识别集成学习文本分类向量空间模型最大间隔分类器

单位:华南理工大学软件学院 广东工业大学自动化学院

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

电子测试

省级期刊

¥260

关注 42人评论|1人关注