使用 L_RNA_scaffolder 进行转录组序列对基因组序列的 rescaffolding

23,030

1. L_RNA_scaffolder简介

L_RNA_scaffolder能利用长的转录子序列来辅助基因组的scaffolding拼接。这些长的转录子序列可以是454/sanger/Ion_Torrent的测序结果,也可以是illumina测序的de novo组装结果。

在使用此软件进行scaffolding之前,需要将这些长的转录子序列使用BLAT软件map到基因组上,得到PSL(without heading)文件。将此PSL文件和基因组的初步组装结果文件输入到L_RNA_scaffolder,很快能得到结果文件。

2. L_RNA_scaffolder的安装

$ wget http://www.fishbrowser.org/software/L_RNA_scaffolder/downloads/L_RNA_scaffolder.tar.gz
$ tar zxf L_RNA_scaffolder.tar.gz
$ cd L_RNA_scaffolder

运行软件的主程序,不加参数给出帮助信息

$ ./L_RNA_scaffolder.sh

3. L_RNA_scaffolder的使用

先使用blat,将转录子序列比对到基因组

$ blat genome.fasta transcripts.fasta -noHead out.psl

再使用L_RNA_scaffolder.sh得到最终的基因组文件

$ mkdir L_RNA_scaffolder_output
$ /opt/biosoft/L_RNA_scaffolder/L_RNA_scaffolder.sh -d /opt/biosoft/L_RNA_scaffolder/ -i out.psl -j genome.fasta -o ./L_RNA_scaffolder_output

最终的结果文件为./L_RNA_scaffolder_output/L_RNA_scaffolder.fasta

原文来自:http://www.chenlianfu.com/?p=2124

评论  2  访客  2
    • iceworld 1

      ybzhao你好,昨天刚用了下L_RNA_scaffolder,半道得出一个结果,lesspid0.90.file,也找不到文件格式的说明。能加QQ聊聊不?我在PLOB群里,名片遗传育种-iceworld

        • heihei 0

          @ iceworld 你只要保证 blat 的时候加上 -noHead 的结果就不会出错了

      发表评论

      匿名网友