GenomicsGATK4基本概念整理 GATK 是 Genome Analysis ToolKit 的缩写,是一款从高通量测序数据中分析变异信息的软件,是目前最主流的snp calling 软件之一。GATK 设计之初是用于分析人类的全外... 09月13日9,3521 GATK GATK4 阅读全文
GenomicsGATK中如何计算Inbreeding coefficient(近交系数) 关于近交系数是什么的定义,除了英文资料,中文上也给出了清晰的定义,这里引用一下: 近交系数(inbreeding coefficient)是指根据近亲交配的世代数,将基因的纯化程度用百分数来表示即为近... 02月27日2,662评论GATK 近交系数 阅读全文
GenomicsGATK4.0和全基因组数据分析实践(上) 前言 在前面的一系列WGS文章中,我讲述了很多基因数据分析的来龙去脉,虽然许多同学觉得很有帮助,但是却缺了一个重要的环节——没有提供实际可用的数据来实战完成具体的流程,不能得到直观的体会。许多读者也纷... 01月27日8,8887GATK VCF 阅读全文
Bioinformatics快速入门GATK GATK,全称是Genome Anlysis Toolkit,顾名思义,是一套用于分析基因组的工具箱。主要功能是寻找变异位点和基因分型,但是实际上功能超多,导致初学者都不知道从何学习GATK。 最近因... 01月07日5,262评论GATK GATK使用 阅读全文
Bioinformatics没有root管理员权限安装常用群体遗传学分析软件 由于生物信息的大部分工作都是在没有 root 权限的集群上进行的,本期主要介绍一下非 root 用户怎么安装群体遗传常用的软件。工欲善其事,必先利其器! 准备工作 1、首先我们建一个文件夹,用来存储我... 03月08日2,262评论GATK Trimmomatic 阅读全文
BioinformaticsGATK使用方法详解(变异检测) 1. Variant Calling GATK在这一步里面提供了两个工具进行变异检测——UnifiedGenotyper和HaplotypeCaller。其中HaplotypeCaller一直还在开发... 04月14日35,4413GATK GATK使用 阅读全文
BioinformaticsGATK使用方法详解(初步分析) 这一步主要是对上面所得到的最终vcf中的结果进行一些初步的分析,比如计算这些变异位点在dbsnp中的比例、Ti/Tv的比例、每个样本中的snp数量……。此外,还可以对变异位点的同义/非同义突变进行统计... 04月14日8,0421 GATK GATK使用 阅读全文
BioinformaticsGATK使用方法详解(相关参数和参考文件说明) VariantRecalibrator参数详解 VariantRecalibrator -badLodCutoff 当LOD得分低于这个值的时候,就用于构建高斯混合模型的bad variants。默认... 04月14日8,736评论GATK GATK使用 阅读全文
BioinformaticsGATK使用方法详解(实例:对INDEL结果进行校正) 对INDEL结果进行校正,与SNP基本一致,只不过INDEL需要使用的known resource不一样 第一步: 同SNP 多选择一些注释类型,但是不用选择tranche值,tranche值是专门为... 04月14日6,716评论GATK GATK使用 阅读全文
BioinformaticsGATK使用方法详解(实例:对SNP结果进行校正) 第一步: java -jar GenomeAnalysisTK.jar -R hg19.fa --maxGaussians 4 -numBad 10000 (这个参数在最新的GATK版本里面已经没有了... 04月14日13,6602GATK GATK使用 阅读全文