2012/10/301416,650

MISA，英文全称为MIcroSAtellite identification tool，即微卫星识别工具。虽然前段时间看到PLoB上已经有一篇文章《利用MISA鉴定简单重复序列(SSR)》来介绍MISA脚本的使用，今天在陈连福的博客上发现也有一篇介绍MISA的文章，所以转载过来，与大家一起分享。

MISA是使用 perl 编写的一支程序，能识别出序列中的微卫星和复合微卫星（两个微卫星之间由由不多于100bp的碱基对隔开），并给出其所在位点。

MISA下载网址：http://pgrc.ipk-gatersleben.de/misa/misa.html

MISA用法：

$ misa.pl filename
misa.pl <FASTAfile>

其中，fastfile是序列文件，同时在运行程序的工作目录下必须有一个名称为“misa.ini”的文件。该文件内容为：

definition(unit_size,min_repeats): 1-10 2-6 3-5 4-5 5-5 6-5
interruptions(max_difference_for_2_SSRs): 100

该文件指定了misa的参数，即1个碱基重复10次及10次以上；2个碱基重复6次及6 次以上； 3个碱基重复5次及5次以上；4个碱基重复5次及5次以上；5个碱基重复5 次及5次以上；6碱基重复5次及5次以上，这样的碱基重复序列才算是微卫星序列。同时，两个微卫星之间的距离小于100bp的时候，两个微卫星组成一个复合微卫星。

MISA的输出结果：

MISA会在 Fastafile 所在的文件夹下生成两个文件，分别是 “<FASTfile>.misa” 和 “<FASTfile>.statistics”

"<FASTfile>.misa" ：以表格的形式列出微卫星的类型和位点；
"<FASTfile>.statistics" ：统计微卫星的类型和频数。

在MISA的下载页面中，提供了3个附加的 perl 脚本，分别是：Get_est_trimmer.pl，p3_in.pl 和 p3_out.pl。

Get_est_trimmer.pl

针对EST序列，可以除去EST序列中短的序列和两端不明确的碱基。

p3_in.pl

输入 misa.pl 的输出结果，将引物设计的参数文件（模板，产物长度，目标区域等）导入到一个以“p3in”为后缀的文件中。

$ p3_in.pl filename.misa

调用 primer3_core

该软件详细解说见：《primer3引物设计详解》，生成结果文件 filename.p3in。

 $ primer3_core -default_version=1 -output=filename.p3out filename.p3in

p3_out.pl

对primer3产生的文件进行提取合，得到最后的结果文件 filename.result

$ p3_out.pl filename.p3out filename.misa

p2_in.pl 和 p3_out.pl 这两支程序需要修改才能正常使用。

p2_in.pl

[perl]
#!/usr/bin/perl

use strict;

open (IN,"<$ARGV[0]") || die ("\nError: Couldn't open misa.pl results file (*.misa) !\n\n");

my $filename = $ARGV[0];
$filename =~ s/\.misa//;
open (SRC,"<$filename") || die ("\nError: Couldn't open source file containing original FASTA sequences !\n\n");
open (OUT,">$filename.p3in");

my $in = join "", <IN>;
study $in;

#print "$in\n";

my $count;

while (<SRC>)
{
my $id = $_;
$id =~ s/^>(\S*)/$1/;
$id =~ s/\s+/_/;
$id =~ s/\n//;
# print "$id";
my $seq = <SRC>;
$seq =~ s/[\d\s>]//g;#remove digits, spaces, line breaks,...
# print "$seq\n";
while ($in =~ /$id\t(\d+)\t\S+\t\S+\t(\d+)\t(\d+)/g)
{
my ($ssr_nr,$size,$start) = ($1,$2,$3);
$count++;
print OUT "SEQUENCE_ID=$id"."_$ssr_nr\nSEQUENCE_TEMPLATE=$seq\n";
print OUT "PRIMER_PRODUCT_SIZE_RANGE=100-280\n";
print OUT "SEQUENCE_TARGET=",$start-3,",",$size+6,"\n";
print OUT "PRIMER_MAX_END_STABILITY=250\n=\n"
};
};
print "\n$count records created.\n";
[/perl]

p3_out.pl

[perl]
#!/usr/bin/perl

use strict;

open P3OUT, '<', "$ARGV[0]" or die ("\nError: Couldn't open Primer3 results file (*.p3out) !\n\n");
my $filename = $ARGV[0];
$filename =~ s/\.p3out//;

open IN, '<', "$ARGV[1]" or die ("nError: Couldn't create file !\n\n");
open OUT, '>', "$filename.results" or die ("nError: Couldn't create file !\n\n");

my $count = 0;
my $count_failed = 0;

print OUT "ID\tSSR nr.\tSSR type\tSSR\tsize\tstart\tend\t";
print OUT "FORWARD PRIMER1 (5'-3')\tTm(°C)\tsize\tREVERSE PRIMER1 (5'-3')\tTm(°C)\tsize\tPRODUCT1 size (bp)\tstart (bp)\tend (bp)\t";
print OUT "FORWARD PRIMER2 (5'-3')\tTm(°C)\tsize\tREVERSE PRIMER2 (5'-3')\tTm(°C)\tsize\tPRODUCT2 size (bp)\tstart (bp)\tend (bp)\t";
print OUT "FORWARD PRIMER3 (5'-3')\tTm(°C)\tsize\tREVERSE PRIMER3 (5'-3')\tTm(°C)\tsize\tPRODUCT3 size (bp)\tstart (bp)\tend (bp)\n";

my $in = join "", <IN>;
my $p3out = join "", <P3OUT>;

close IN;
close P3OUT;

study $in;

my @p3out = split /=\n/, $p3out;

#print $in;
#print @p3out;

foreach ( @p3out ) {
my ($id,$ssr_nr) = (/SEQUENCE_ID=(\S+)_(\d+)\s*?\n/);
# print "$id\n$ssr_nr\n"

$in =~ /($id\t$ssr_nr\t.*)\n/;
my $misa = $1;
# print "$misa\n";

/PRIMER_LEFT_0_SEQUENCE=(.*)\n/ || do {$count_failed++;print OUT "$misa\n"; next};
my $info = "$1\t";

/PRIMER_LEFT_0_TM=(.*)/; $info .= "$1\t";
/PRIMER_LEFT_0=\d+,(\d+)/; $info .= "$1\t";

/PRIMER_RIGHT_0_SEQUENCE=(.*)/; $info .= "$1\t";
/PRIMER_RIGHT_0_TM=(.*)/; $info .= "$1\t";
/PRIMER_RIGHT_0=\d+,(\d+)/; $info .= "$1\t";

# print "$info\n";

/PRIMER_PAIR_0_PRODUCT_SIZE=(.*)/; $info .= "$1\t";
/PRIMER_LEFT_0=(\d+),\d+/; $info .= "$1\t";
/PRIMER_RIGHT_0=(\d+),\d+/; $info .= "$1\t";

/PRIMER_LEFT_1_SEQUENCE=(.*)/; $info .= "$1\t";
/PRIMER_LEFT_1_TM=(.*)/; $info .= "$1\t";
/PRIMER_LEFT_1=\d+,(\d+)/; $info .= "$1\t";

/PRIMER_RIGHT_1_SEQUENCE=(.*)/; $info .= "$1\t";
/PRIMER_RIGHT_1_TM=(.*)/; $info .= "$1\t";
/PRIMER_RIGHT_1=\d+,(\d+)/; $info .= "$1\t";

/PRIMER_PAIR_1_PRODUCT_SIZE=(.*)/; $info .= "$1\t";
/PRIMER_LEFT_1=(\d+),\d+/; $info .= "$1\t";
/PRIMER_RIGHT_1=(\d+),\d+/; $info .= "$1\t";

/PRIMER_LEFT_2_SEQUENCE=(.*)/; $info .= "$1\t";
/PRIMER_LEFT_2_TM=(.*)/; $info .= "$1\t";
/PRIMER_LEFT_2=\d+,(\d+)/; $info .= "$1\t";

/PRIMER_RIGHT_2_SEQUENCE=(.*)/; $info .= "$1\t";
/PRIMER_RIGHT_2_TM=(.*)/; $info .= "$1\t";
/PRIMER_RIGHT_2=\d+,(\d+)/; $info .= "$1\t";

/PRIMER_PAIR_2_PRODUCT_SIZE=(.*)/; $info .= "$1\t";
/PRIMER_LEFT_2=(\d+),\d+/; $info .= "$1\t";
/PRIMER_RIGHT_2=(\d+),\d+/; $info .= "$1";

$count++;
print OUT "$misa\t$info\n"
}

print "\nPrimer modelling was successful for $count sequences.\n";
print "Primer modelling failed for $count_failed sequences.\n";
[/perl]

本文来自陈连福的博客:http://www.hzaumycology.com/chenlianfu_blog/?p=255

fengshl 0
2013/12/12 16:51:59 1F
回复
谢谢分享
另外我在用p3_in.pl处理misa结果的时候，生成的目标文件非常大，请问这个是正常的吗？
- smlyt413 0
  2014/08/19 12:36:13 B1
  回复
  @ fengshl 我也遇到了这种情况，生产的目标文件非常大，感觉是无限循环一样。请问您解决了吗？
  - 年小黑 0
    2014/10/27 10:48:19 B2
    回复
    @ smlyt413 恩，而且处理的结果是第一个序列的无限循环，跪求大神修改程序呀
凝曦-SSR 0
2016/05/24 22:06:08 2F
回复
为什么p3_in.pl运行后的结果文件.p3in没内容，0kb。运行时并没有错误提示
- 请输入您的QQ号 0
  2017/11/03 16:55:46 B1
  回复
  @ 凝曦-SSR 请问你后面是什么处理好的？
- 阿土 0
  2018/01/25 11:06:01 B1
  回复
  @ 凝曦-SSR 0字节是什么原因？我也遇到这种情况，怎样解决？
  - 周润南 1
    2018/03/09 09:37:55 B2
    回复
    @ 阿土同问
  - 4444 0
    2019/09/28 09:50:08 B2
    回复
    @ 阿土可能是misa文件的里面的名称与序列文件里面序列的名称不一致
- 周润南 1
  2018/03/09 09:53:31 B1
  回复
  @ 凝曦-SSR 请问您是怎么解决的啊
  - 请输入您的QQ号 0
    2018/06/04 13:23:32 B2
    回复
    @ 周润南你好！你解决了P3-in的问题了？
    - wtw 0
      2018/09/16 15:49:18 B3
      回复
      @ 请输入您的QQ号你解决P3in问题了吗，一直都是输出空文件
- Sunny 1
  2019/11/01 10:20:13 B1
  回复
  @ 凝曦-SSR 您好，请问“p3_in.pl运行后的结果文件.p3in没内容，0kb。运行时并没有错误提示”这个问题您是怎么解决的呢？我也遇到了同样的问题，期待您的回复，谢谢您
Sunny 1
2019/10/31 09:49:06 3F
回复
请问这一步p3_in.pl filename.misa Perl脚本运行不了是怎么回事呢？
llll 0
2025/07/24 08:32:13 4F
回复
麻烦问一下各位大佬，p3_in.pl这个脚本问题解决了吗

使用Misa结合Primer3来批量设计SSR引物

MISA用法：

MISA的输出结果：

Get_est_trimmer.pl

p3_in.pl

调用 primer3_core

p3_out.pl

p2_in.pl 和 p3_out.pl 这两支程序需要修改才能正常使用。

p2_in.pl

p3_out.pl

发表评论