点击次数:
发布时间:2018-12-18
第一作者:陈聪
发表时间:2011-01-01
发表刊物:计算机工程
所属单位:数理与信息工程学院
文献类型:期刊
期号:第11期
页面范围: 184-186,189
ISSN号:1000-3428
关键字:有限状态自动机;DNA子序列;重复体频率;频率统计算法;最长公共子序列
摘要:针对现有DNA重复体频率统计算法效率低、灵活性差等不足,基于字符串多模式匹配的有限状态自动机,构造DNA子序列比对自动机,利用KMP算法对自动机进行状态转移优化,由此提出一种高效的重复体频率统计算法。该算法通过对DNA数据库的线性扫描,得到每个DNA子序列在全局数据库中重叠与非重叠的重复体频率统计信息以及指定DNA序列集合的最长公共子序列信息。实验结果表明,该算法具有效率高、匹配精确、信息获取方式灵活、支持在线操作等优势。
是否译文:否