使用 Gblocks 提取保守序列

  • A+
所属分类:Bioinformatics

1. Gblocks 简介

Gblocks用于从多序列比对结果中提取保守位点,以利于下一步的进化分析。
在线说明文档:http://molevol.cmima.csic.es/castresana/Gblocks/Gblocks_documentation.html
在线服务网站:http://molevol.cmima.csic.es/castresana/Gblocks_server.html

2. Gblocks 安装

$ wget http://molevol.cmima.csic.es/castresana/Gblocks/Gblocks_Linux64_0.91b.tar.Z
$ sudo yum install -y ncompress
$ tar Zxf Gblocks_Linux64_0.91b.tar.Z -C /opt/biosoft/
$ echo 'PATH=$PATH:/opt/biosoft/Gblocks_0.91b/' >> ~/.bashrc
$ source ~/.bashrc

3. Gblocks 使用

Gblosk 有两种使用方式,第一种是交互式的方式(按提示输入文件改变参数),第二种是命令行式(在命令行中输入参数)。

命令行式的常用例子:

使用默认的设置:

$ Gblocks proteins.fasta -t=p

必须是 fasta 文件在前,参数在后。若没有参数,则进入交互式界面。

得到更长的序列

$ Gblocks proteins.fasta -b4=5 -b5=h

命令行式的常用参数:

-t= default:p

设置序列的类型,可选的值是 p,d,c 分别代表 protein, DNA, Codons 。

-b1= default:( 序列条数的 50% + 1 )

设定保守性位点必须有 >= 该值的序列数。该参数后接一个 integer 数,默认下比序列条数的 50% 大 1.

-b2= default: 序列条数的 85%

确定保守位点的侧翼位点时,其位点必须有 >= 该值的序列数。该值必须要比 -b1 的值要大。

-b3= default: 8

最大连续非保守位点的长度。

-b4= default: 10

保守位点区块的最小长度。该值必须 >=2 。

-b5= default: n

设置允许含有 Gap 位点。可选的值有 n,h,a 分别代表 None, With Half, All 。 当为 h 时,表示

-e= default: -gb

设置输出结果的后缀。

原文来自:http://www.chenlianfu.com/?p=2213

avatar

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: