如何从BAM文件中提取fastq Bioinformatics

如何从BAM文件中提取fastq

虽然高通量测序分析最常用的操作是将fastq比对到参考基因组得到BAM文件,但偶尔我们也需要提取BAM文件中特定区域中fastq。最开始我认为这是一个非常简单的操作,因为samtools其实已经提供了...
阅读全文
根据Barcode序列拆分fastq文件 Bioinformatics

根据Barcode序列拆分fastq文件

扩增子测序不同于其他高通量测序项目,扩增子测序往往样品量较大,但单个样品的数据量要求不高(因为仅仅研究扩增区域的序列)。为了节约成本,研究者们通常会把多个样品混在一个文库,并给不同样品加上一段 Bar...
阅读全文
fasterq-dump使用介绍 Bioinformatics

fasterq-dump使用介绍

之前写过一篇文章Fastq-dump使用, 详细介绍了fastq-dump的用法。 虽然fastq-dump参数很多,而且一直被吐槽参数说明写的太差,但是如果真的要用起来其实也就是一行代码 fastq...
阅读全文
Fastq-dump使用 Bioinformatics

Fastq-dump使用

做生信的基本上都跟NCBI-SRA打过交道,尤其是fastq-dump大家肯定不陌生.NCBI的fastq-dump软件一直被大家归为目前网上文档做的最差的软件之一",而我用默认参数到现在基本也没有出...
阅读全文
三代测序数据pacbio数据处理 Bioinformatics

三代测序数据pacbio数据处理

三代测序仪现在逐步投入正式使用之中,目前三代测序例如pacbio数据大的特点之一就是测序得到的reads特别长,最近我开展的一个项目中利用pacbio测序的到的reads中最长的到了23165bp,平...
阅读全文
FastQ数据质量值转换 Script

FastQ数据质量值转换

不同的平台测出来的数据采用的质量编码格式一般会有差异。关于FastQ的格式介绍可以阅读《FastQ格式介绍》 譬如sanger的编码采用的是质量值+33,而Soleax采用的是质量值+64。有时候由于...
阅读全文
FASTX-Toolkit Bioinformatics

FASTX-Toolkit

FASTX-Toolkit是一款用于处理Short-Reads FASTA/FASTQ文件的程序,里面包含了丰富的FASTA/FASTQ文件格式转换、统计等命令。 下面是其功能介绍:  FASTQ-t...
阅读全文
FastQ格式介绍 Glossary

FastQ格式介绍

为了便于测序数据的发布和共享,高通量测序数据以FASTQ 格式来记录所测的碱基读段和质量分数.如下图 所示,FASTQ 格式以测序读段为单位存储,每条读段占4 行,其中第1 行和第3行由文件识别标志和...
阅读全文