线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

基于改进Apriori算法的肺癌致病因素研究

张润; 冯云霞 计算机技术与发展 2020年第02期

摘要:随着人民生活水平的不断提高,肿瘤疾病的人数在不断增多,其中肺癌是21世纪严重危害人类健康的重大疾病。面向肺癌电子病历如此庞大的数据量时,传统Apriori算法的串行计算方式需要频繁扫描数据库,会消耗巨大的内存占用量。对此,提出一种基于改进Apriori算法的肺癌风险评估因素分析的方法。运用Hadoop平台实现并行Apriori算法的优化,应用HBase文件存储系统对海量数据分布式存储以及Map Reduce框架进行分布式计算,最后给出基于Hadoop平台和MapReduce分布式计算模型的执行流程和测试结果。实验结果表明,改进算法在处理大数据及时有较好的执行效率以及良好的可扩展性,得出了肺癌的疾病模式与致病因素之间的隐匿规则,从而验证了改进后的Apriori算法对于辅助肺癌临床实验具有重要的意义。

关键词:关联规则apriori算法hadoop肺癌

单位:青岛科技大学信息科学技术学院; 山东青岛266000

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机技术与发展

统计源期刊

¥400.00

关注 25人评论|3人关注