线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

基于生物信息学特征的DNA序列数据压缩算法

纪震; 周家锐; 朱泽轩; Q; H; Wu 电子学报 2011年第05期

摘要:本文通过将生物学特征和生物学含义引入DNA序列数据的压缩处理中,提出了基于生物信息学特征的BioLZMA压缩算法.在BioLZMA算法中,DNA序列根据组成部分生物学含义的不同切分重组为四个集合:编码序列CDS集合、内含子序列集合、RNA序列集合以及剩余序列的集合.根据各集合中序列的具体生物学特征分别使用针对性的压缩策略进行预处理,并通过LZMA算法进行压缩编码.实验结果表明,BioLZMA算法在基准测试序列上的压缩性能优于原有的DNA序列压缩方法.特别是对于生物信息学特征清晰的长序列,算法能够在较短的时间内获得较高的压缩率.

关键词:dna数据压缩生物信息学序列重组近似重复片段lzma

单位:深圳大学计算机与软件学院; 广东深圳518060; 浙江大学生物医学工程与仪器科学院; 浙江杭州310027; 利物浦大学电气电子工程系; 利物浦; L69; 3GJ; UK

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

电子学报

北大期刊

¥1272.00

关注 25人评论|0人关注