摘要:本文主要研究从由带标签有序树构成的森林中挖掘嵌入式频繁子树,具体做法是:首先对XML文档进行预处理,生成最简结构树SST,然后从SST中挖掘出频繁子树。本文提出了SSTMiner算法,该算法针对TreeMiner算法存在的瓶颈问题,结合当前所处理的SST的结构特点进行改进,进一步提高了算法执行的效率。实验证明,本文提出的方法能够准确高效地挖掘出XML文档中的频繁子树。
关键词:xml 频繁子树 treeminer
单位:华侨大学计算机科学系; 福建泉州362021
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社