Genomics

测序量估计

考虑这样一个问题,“如果要保证基因组上95%的区域其覆盖深度在30x以上的话,那么最低的平均测序深度应该是多少?”。 关于测序量的估计,对于做生物信息的人来讲应算是家常便饭了,多数时候我们都能直接根据...
阅读全文
Genomics

三代基因组测序技术原理简介

前言:首先,这一篇博文中的内容并非原创,而是对多篇文献中内容的直接摘录,有些图片和资料还来自身边的同事(在此深表谢意!),再夹杂自己的零星想法,写在这里分享与大家,同时也是为了方便自己日后若有需要能够...
阅读全文
Genomics

bcftools使用笔记

什么是vcf?全称是variant call format,是用来记录SNP,INDEL和SV变异信息的文本。在GATK软件中得到最好的支持,当然SAMtools得到的结果也是VCF格式,和GATK的...
阅读全文
Genomics

GATK使用

首先说说GATK可以做什么。它主要用于从sequencing 数据中进行variant calling,包括SNP、INDEL。比如现在风行的exome sequencing找variant,一般通过...
阅读全文
Genomics

基因组数据库-一个物种的官网

基因组数据库相当于一个物种的官网,关心该物种的科学家可以通过访问网站了解物种信息、科研进展、做blast等简单分析、下载基因组数据,基因组数据库最核心的模块是基因组浏览器,可以可视化查看基因结构、变异...
阅读全文
Genomics

VCF格式

CHROM 染色体编号 POS 位置 ID 基因ID REF 参考基因组碱基 ALT 样本碱基 QUAL 变异可信度,越高越好 QUAL:Phred格式(Phred_scaled)的质量值,表 示在该...
阅读全文
Genomics

VCF格式解析

VCF是用于描述SNP,INDEL和SV结果的文件,下面所记录的是以GATK软件结果的VCF文件,与SAMtools的结果有点不同 VCF文件可以分为两部分看,最上面#号注释的的部分是对一些参数的解释...
阅读全文
Genomics

NGS 实验中的错误来自哪里

尽管测序技术在不断发展,但不论是哪种测序平台,测序过程中都不可避免地存在一些错误。《Nature Review Genetics》近日发表了一篇很有意思的综述,谈论了NGS实验中错误的来源,以及如何利...
阅读全文