根据Barcode序列拆分fastq文件 Bioinformatics

根据Barcode序列拆分fastq文件

扩增子测序不同于其他高通量测序项目,扩增子测序往往样品量较大,但单个样品的数据量要求不高(因为仅仅研究扩增区域的序列)。为了节约成本,研究者们通常会把多个样品混在一个文库,并给不同样品加上一段 Bar...
阅读全文
Fastq-dump使用 Bioinformatics

Fastq-dump使用

做生信的基本上都跟NCBI-SRA打过交道,尤其是fastq-dump大家肯定不陌生.NCBI的fastq-dump软件一直被大家归为目前网上文档做的最差的软件之一",而我用默认参数到现在基本也没有出...
阅读全文
三代测序数据pacbio数据处理 Bioinformatics

三代测序数据pacbio数据处理

三代测序仪现在逐步投入正式使用之中,目前三代测序例如pacbio数据大的特点之一就是测序得到的reads特别长,最近我开展的一个项目中利用pacbio测序的到的reads中最长的到了23165bp,平...
阅读全文
FastQ数据质量值转换 Script

FastQ数据质量值转换

不同的平台测出来的数据采用的质量编码格式一般会有差异。关于FastQ的格式介绍可以阅读《FastQ格式介绍》 譬如sanger的编码采用的是质量值+33,而Soleax采用的是质量值+64。有时候由于...
阅读全文
FASTX-Toolkit Bioinformatics

FASTX-Toolkit

FASTX-Toolkit是一款用于处理Short-Reads FASTA/FASTQ文件的程序,里面包含了丰富的FASTA/FASTQ文件格式转换、统计等命令。 下面是其功能介绍:  FASTQ-t...
阅读全文
FastQ格式介绍 Glossary

FastQ格式介绍

为了便于测序数据的发布和共享,高通量测序数据以FASTQ 格式来记录所测的碱基读段和质量分数.如下图 所示,FASTQ 格式以测序读段为单位存储,每条读段占4 行,其中第1 行和第3行由文件识别标志和...
阅读全文