获得RNA-seq的原始数据后,首先需要将所有测序读段通过序列映射(mapping)定位到参考基因组上,这是所有后续处理和分析的基础.在读段定位之前,有时还需要根据测序数据情况对其做某些基本的预处理....
iAssembler: 拼接Roche-454/Sanger转录组数据的拼接软件
iAssembler利用MIRA以及CAP3软件,将454以及sanger测序产生的转录组数据(EST)拼接成基因组。 官方介绍: iAssembler is a standalone package...
SSPACE:一款专门做scaffolding的软件
在做基因组拼接的时候,有时候已经获得了一堆contig或者scaffold,然后需要利用另外的一个pair-end或者mate-pair文库进一步做scaffolding的话。用什么软件好呢? 最近使...
RPKM简介
RNA-seq是透过次世代定序的技术来侦测基因表现量的方法,在衡量基因表现量时,若是单纯以map到的read数来计算基因的表现量,在统计上是一件相当不合理事,因为在随机抽样的情况下,序列较长的基因被抽...
fastaq2fasta
之前在本博客上发表一篇利用sed 将fastq转换成fasta的文章,这种方法利用linux系统自带的程序sed进行处理,速度很快,但是后来发现当fastq中某一reads的质量值以‘@’开头的话就会...
基因组拼接中专业术语名词解释
Glossary terms in genome assembly RNA sequencing (RNA-seq). An experimental protocol that uses next-...
velvet使用介绍
新一代测序技术组装拼接软件velvet使用简介 目前用于新一代的测序的主要仪器有Illumina/Solexa的Genome Analyzer、ABI的Solid和Roche的454,它们都能高通量的...
Glimmer3安装与使用
一、软件介绍 Glimmer是一款寻找原核生物基因的预测软件,从1.0版本到现在的3.0版本,预测的准确度和速度都已经提高了很多,并且是一个免费开源的软件必须在Linux或者Mac OSX系统上才能使...
Identification of Pseudogenes
By Seth Axen (11/18/08) Explanation: A pseudogene is a genetic sequence which is nonfunctional. Wha...
利用BioJava读取一个GenBank,SwissProt,EMBL文件
SeqIOTools类包含了读取GenBank,SwissProt,EMBL文件的方法。因为文件中包含了不止一条序列,所以SeqIOTools返回一个序列遍历器(SequenceIterator)能够...