RepeatMasker安装方法与使用

RepeatMasker4

RepeatMasker是一款专门用于基因组重复序列识别的软件,几乎用于所有物种。是做基因组、非编码RNA的必备软件。很多ncRNA与Repeat区有高度相关性。

安装在Ubuntu 12.04上,时间为2013-4-7,所有相关软件和数据库全为最新版。

1. RMBlast序列搜索引擎

下载源RMBlast源码包: ftp://ftp.ncbi.nlm.nih.gov/blast/executables/rmblast/2.2.28/ncbi-rmblastn-2.2.28-src.tar.gz
[shell]
sudo apt-get install g++ #安装g++编译器
tar zxvf ncbi-rmblastn-2.2.28-src.tar.gz #解压
cd ncbi-rmblastn-2.2.28-src.tar.gz/c++/
./configure --with-mt --prefix=/usr/local/rmblast --without-debug
make #编译,需要半小时
sudo make install
[/shell]

2. TRF(Tandem Repeat Finder)搜寻串联重复序列
http://tandem.bu.edu/trf/trf407b.linux.download.html

[shell]
sudo mv trf407b.linux /usr/local/bin/trf #将程序移到可执行目录并改名
[/shell]

3. RepeatMasker程序

http://www.repeatmasker.org/RMDownload.html 2/21/2013: RepeatMasker-open-4-0-1.tar.gz

[shell]
tar xvzf RepeatMasker-open-4-0-1.tar.gz
[/shell]

数据库http://www.girinst.org/server/RepBase/index.php, 需要注册才能下载,人工审批,可能要等两天

repeatmaskerlibraries-20120418.tar.gz (26.76 MB)

也可以在我的百度网盘下载,http://pan.baidu.com/share/link?shareid=417337&uk=1946176681

[shell]
cp repeatmaskerlibraries-20120418.tar.gz RepeatMasker/
sudo tar xvzf repeatmaskerlibraries-20120418.tar.gz #解压并覆盖原目录
./configure #主要是输入RMBlast安装目录,/安装目录/ncbi-rmblastn-2.2.28-src/c++/GCC460-ReleaseMT/bin
sudo ln -s /安装目录/RepeatMasker/RepeatMasker /usr/local/bin/RepeatMasker #设置环境变量
[/shell]

以拟南芥基因组为例
[shell]
~/Documents/Data/genome_ath10$ RepeatMasker -species arabidopsis TAIR10_chr_all.fas
[/shell]

  • 本文由 整理发表
  • 网站部分文章源自互联网,若未正确标注来源,请联系管理员更新。文章转载,请务必保留本文链接

您必须才能发表评论!

评论:2   其中:访客  2   博主  0
    • microibs

      很不错,谢谢分享,大家要行动起来,积极和朋友分享好的东西

      • yangjh

        想请教博主关于RepeatMasker的-species参数问题,但不知怎么跟您联系呢?邮箱?或者bioask账号?