首页 > 期刊 > 电子测试 > 基于集成学习的网页主题识别算法 【正文】
摘要:在海量网页中进行自动的主题识别是网页信息分析挖掘的重要研究方向,具有重要的理论和应用意义。提出一种基于集成学习的网页主题识别算法框架,由异质网页属性集构建不同的最大间隔分类器,使用集成学习对基分类器的信息进行融合。在基准数据集上进行测试,其结果表明该算法对网页主题识别是有效的。
关键词:网页主题识别 集成学习 文本分类 向量空间模型 最大间隔分类器
单位:华南理工大学软件学院 广东工业大学自动化学院
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
相关期刊
相关范文
省级期刊
¥260