Average Nucleotide Identity (ANI) 计算

  • A+
所属分类:Evolution

ANI概念

Average Nucleotide Identity (ANI) 是在核酸水平,两两基因组之间所有直系同源蛋白编码基因的相似性,常用于研究基因组之间的进化距离。相较于传统的 DNA-DNA hybridization (DDH),ANI指标计算简单省时。且ANI指标有助于构建结构性数据库,方便生物信息学者的后续研究。还有一种计算ANI的方法是基于俩俩基因组的共同同源蛋白编码基因的相似性。接下来介绍几款计算ANI的在线工具和本地软件(Jspeciespyani)。

ANI在线工具

Kostas lab:http://enve-omics.ce.gatech.edu/ani/index

MicrobeTrakr 的 ANI Calculator:http://www.microbetrakr.org/ani/

Ezbiocloud:http://www.ezbiocloud.net/tools/ani

ANI本地软件

Jspecies

http://imedea.uib-csic.es/jspecies/  DOI: 10.1073/pnas.0906412106
Jspecies是可视化操作,用户体验简单。但输入基因组相对麻烦,不方便较多基因组之间的两两计算ANI。

Jspecies安装

Jspecies运行

  • 打开软件图形界面后,点击 Edit 下的 preferences,添加 blast、nucmer、formatdb、fastacmd路径;
  • 设置 ANIb (基于blast得到的ANI值)

  • ANIm (基于MUMmer得到的ANI值)参数

  • 导入数据并运行:File -> New  File -> Import FASTA(S) from files -> 选择 Tetra、ANIb、ANIm -> Start

ANI命令行软件

pyani

pyani是用于计算ANI的python3模块,其依赖包有numpy、scipy、matplotlib、biopython、pandas、seaborn。0.1.3.2及以上版本的其他依赖包不用另外安装,0.1.3.2以下版本 pip install -r requirements.txt 安装依赖包。pyani 包括average_nucleotide_identity.py (计算ANI) 和 genbank_get_genomes_by_taxon.py (从NCBI下载数据),并提供四种不同算法:

  • ANIm:使用 MUMmer (NUCmer) 比对序列
  • ANIb:使用 BLASTN+ to 比对序列的 1020nt 片段
  • ANIblastall:使用老版的 BLASTN 比对序列的 1020nt 片段
  • TETRA:计算每个序列的四核苷酸的频率

pyani安装

pyani运行

pyani参数

pyani自带绘图,若不满意,可以调用ggplot2绘制热图

示例图效果

24种不同 shewanella 属菌种ANI比较热图

Average Nucleotide Identity (ANI) 计算

参考:

http://imedea.uib-csic.es/jspecies/

https://github.com/widdowquinn/pyani/

http://www.a-site.cn/article/300418.html

https://github.com/rprops/MetaG_lakeMI/wiki/

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: