Hits :
First Author : 陈聪
Date of Publication : 2011-01-01
Journal : 计算机工程
Affiliation of Author(s) : 数理与信息工程学院
Document Type : 期刊
Issue : 第11期
Page Number : 184-186,189
ISSN : 1000-3428
Key Words : 有限状态自动机;DNA子序列;重复体频率;频率统计算法;最长公共子序列
Abstract : 针对现有DNA重复体频率统计算法效率低、灵活性差等不足,基于字符串多模式匹配的有限状态自动机,构造DNA子序列比对自动机,利用KMP算法对自动机进行状态转移优化,由此提出一种高效的重复体频率统计算法。该算法通过对DNA数据库的线性扫描,得到每个DNA子序列在全局数据库中重叠与非重叠的重复体频率统计信息以及指定DNA序列集合的最长公共子序列信息。实验结果表明,该算法具有效率高、匹配精确、信息获取方式灵活、支持在线操作等优势。
Translation or Not : no