blast进行重复序列屏蔽

  • A+
所属分类:Bioinformatics

1. 构建数据库的时候屏蔽参考序列的重复

segmasker 屏蔽氨基酸的低复杂序列

dustmasker 屏蔽核算序列的低复杂序列

windowmasker 按照序列重复的次数来屏蔽

convert2blastmask 根据小写字母来屏蔽

这几个都可以先得到一个含有屏蔽信息的文件。然后进行 makeblastdb 的时候输入这个文件,就可以相应的 masked 数据库了。

参考:http://www.ncbi.nlm.nih.gov/books/NBK279681/

2. 比对的时候对query序列的重复进行屏蔽

blast 比对的时候,可以对 query 序列进行屏蔽。 这几个参数估计这样理解:

-seg blastp的参数,是否对query 序列使用 segmasker来屏蔽低复杂重复,默认 no

-dust blastn的参数,是否对query 序列使用 dustmasker来屏蔽低复杂重复,默认 no

-lcase_masking 对query序列的小写部分进行屏蔽

-soft_masking 是否进行软屏蔽。软屏蔽则是不会使用屏蔽的序列进行种子比对,但是可以延长时候比对。硬屏蔽,则是直接不对屏蔽序列部分进行比对。blastn的默认值是yes,blastp的默认值是no

原文来自:http://www.chenlianfu.com/?p=2406

 

avatar

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: