摘要:针对C程序提出一种生成标记字符串的方法,即用XML文本表示C程序.首先格式化源程序,从C语言全集中挑选出部分能代表程序结构的关键结构,并用正则表达式进行识别,然后将C程序中容易发生抄袭的结构信息存储到XML文本中,最后对实验系统进行了测试.测试结果表明,该方法能快速找到程序中发生抄袭的代码,从而提高相似度比较的速度和准确性.
关键词:c程序 转换 xml文本 相似度
单位:内蒙古师范大学计算机与信息工程学院 内蒙古呼和浩特010022
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社