摘要:从大规模无标注的文本中获取特定领域的术语词典,通常采用的方法是从术语抽取器得到相关术语,而后使用手工的方式进行术语筛选,得到相关领域的术语。这需要大量的人力物力,并且标准无法统一。本文提出了一种利用CBC聚类方法从抽取的术语文本中自动别除非此领域的术语,并且通过对训练语料库文本的不断丰富,还可以对新词进行识别,以扩大该领域的术语集。最后,通过对实验结果进行评测,显示了CBC聚类方法对术语筛选的良好效果。
关键词:cbc聚类方法 术语筛选 语料库 术语抽取
单位:襄樊学院电气信息工程系 湖北襄樊441053
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社