摘要:回顾了中文和英文语言环境下的Web文本挖掘现状,阐明了其现阶段的特点和技术瓶颈.之后提出了一种基于Web文本挖掘的网页内容挖掘技术:AIS(Augmented information support),介绍了相关实现所涉及的基础技术和功能.最后将AIS技术应用于香山科学会议网站,开发了AIS4XSSC文本挖掘系统并展示了现阶段其主要功能.实践表明AIS技术能够从大量的Web文本中有效提炼信息,提高用户检索效率并向用户推送有价值的信息.
关键词:web文本挖掘 知识发现 ais 综合集成研讨厅 香山科学会议
单位:中国科学院软件研究所互联网实验室 北京100190 北陆先端科学技术大学院大学 日本石川县923-1211 中国科学院数学与系统科学研究院 北京100190
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社