摘要:本文针对基于关联规则的文本过滤器设计做了如下探索:(1)针对中文网络语言的特点,引入n-Gram方法提取文本的特征;(2)提出边界样本的概念;(3)在设计基于关联规则的文本过滤器时,引进了否定选择算法,采用否定选择算法对过滤器的检测器集合进行自体耐受,最终建立高准确率的文本过滤器。实验表明,经过自体耐受的过滤器可以有效地提高过滤准确率。
关键词:文本过滤 否定选择算法 关联规则
单位:宁波工程学院电子与信息工程学院 浙江宁波315016 攀枝花学院电气信息与工程学院 四川攀枝花617000
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社