利用Biperl获取序列基本统计信息(Bioperl HOWTO翻译9)

获取序列基本统计信息

英文原文

除了前面讲的可通过序列对象的不同方法来获取序列文件中已有的序列信息,也可以利用bioperl获取序列的其他一些信息。例如,SeqStats对象可以获取序列的分子质量,单个氨基酸或核苷酸频率,核苷酸序列所包括的密码子频率,等等。

use Bio::Tools::SeqStats;
$seq_stats = Bio::Tools::SeqStats->new($seqobj);
$weight = $seq_stats->get_mol_wt();
$monomer_ref = $seq_stats->count_monomers();
$codon_ref = $seq_stats->count_codons(); # for nucleic acid sequence
注:有些序列包含一些有歧义的code,get_mol_wt()会返回两个数组,一个是最大的分子质量,一个是最小的分子质量。

SeqWords对象可以统计氨基酸或核苷酸片段的频率。详见See Bio::Tools::SeqStatsBio::Tools::SeqWords

 

本文来自:http://bioops.info/2011/11/bioperl-howto-statistics/

avatar
  • 本文由 整理发表
  • 网站部分文章源自互联网,若未正确标注来源,请联系管理员更新。文章转载,请务必保留本文链接
匿名

发表评论

匿名网友