批量开发SSR标记软件:MISA的介绍

MISA工具提供批量识别和定位简单重复序列(SSR),EST序列或是基因组序列都可以。另外,还提供一个与批量设计引物Primer3的接口工具,通过这个工具,可以把MISA识别出来的SSR,转为Primer3需要的格式,从而方便批量设计引物。

ssr

 

网址:http://pgrc.ipk-gatersleben.de/misa/
注:要运行MISA,首先要确保已经装了Perl

下面分别介绍一下几个工具(.pl是perl文件的后缀名):

1,misa.pl
用法:perl misa.pl <FastaFile> (注:<>要去掉。下同)
FastaFile是放序列的一个文件名,全路径,注意不要有中文名或空格。Fasta格式。
另外配套一起的还有一个文件misa.ini,这是一个配置文件,设置识别SSR标记的标准。注意路径。路径错了就会提示错误,找不到该文件。
2,est_trimmer.pl
这是对EST序列而言的,可以去除EST序列中短的序列和两端不明确的碱基。
用法(例子):perl est_trimmer.pl ESTs -amb=2,50 -tr5=T,5,50 -tr3=A,5,50 -cut=100,700
3,Primer3 的接口工具
p3_in.pl – 创建 Primer3的输入文件。
用法:perl p3_in.pl <FASTAfile.misa>
p3_out.pl – 解析Primer3设计引物后的输出文件。
用法:p3_out.pl <FASTAfile.p3out> <FASTAfile.misa>

注:FASTAfile.misa文件是MISA的输出文件
        FASTAfile.p3out是primer3的输出文件

大概就是这些,很不错的软件。具体问题具体分析,一些细节问题这里就不讲了。需要的话就琢磨琢磨。

28 回复
  1. 陈金 says:

    您好,我刚学这个,不是很清楚,请问是否可以发一个有更详细步骤的帖子?从您这学到很多东西,非常感谢您。

  2. 风儿飘飘 says:

    您好!EST序列或是基因组序列都可以设计SSR,这里的基因组序列指的是什么?是包括内含子的基因序列吗?我这现在有基因组测序得到的基因(是通过基因预测软件得到的基因),其中有些基因表达谱数据支持。请问我应该用含有内含子的基因还是用去掉内含子的基因来找SSR呢?这样找到的叫基因组SSR还是叫EST-SSR呢?基因组SSR是不是得包含内含子的基因啊?谢谢了 [抱拳]

    柳城 回复:

    基因组序列肯定是包含内含子等等的了。 EST是没有内含子的了。。
    哪个好。。我也不是太清楚。。

  3. zheng says:

    运行MISA时,出现“specifications file doesn’t exist”
    ,将fasta文件放在bin目录下后,问题依然存在,问题可能出在什么地方,急求,谢谢。

    柳城 回复:

    misa.ini的路径不正确。。

    zheng 回复:

    恩,请问misa.ini路径应该怎么修改,我把misa.ini、misa.pl以及fasta文件均放在c:\perl里面,路径应该就一致了,可是还是出现这个问题。
    在misa.pl中调用配置文件的语法如下:
    open (SPECS,”misa.ini”) || die (“\nError: Specifications doesn’t exist !\n\n”);
    my %typrep;
    my $amb = 0;
    while ()
    {
    %typrep = $1 =~ /(\d+)/gi if (/^def\S*\s+(.*)/i);
    if (/^int\S*\s+(\d+)/i) {$amb = $1}
    };
    my @typ = sort { $a $b } keys %typrep;
    ,是不是要从这里更改路径,如果是,如何更改? 非常感谢!本人没有接触过这方面的语法。

  4. yxq says:

    你好,我刚接触这个东西,在运行时我把misa.pl和misapl和fasta文件都在一起了,在执行的时候出现了这个错误,use of uninitialized value $total in concatenation(.) or string at D:\misa.pl line 224, chunk 3.意思大概说total这个变量没有初始化于是我就把程序里面$total=undef 这一行放在前面用到total变量的所有语句的前面并修改为$total=””给初始化了,之后程序倒是没提示错误了,但是输出文件里面什么都没有,并没有找到ssr。请问大侠们该怎么办,你们都是下载下来直接执行就没错误吗?折腾了一天了头疼大家帮帮忙小弟感激不尽

    chopstick 回复:

    你的问题就是提交的序列里面确实没有SSR,你手工加一个重复序列试一下就好了

    琥珀 回复:

    怎么加重复序列呢?
    我的程序运行了,但没有输出文件?求解

    Longxiao 回复:

    各位大侠,当输入perl misa.pl file.fasta 后,出现了
    use of uninitialized value $total in concatenation(.) or string at D:\misa.pl line 224, chunk 255.然后程序就停止了,怎么解决啊?急求解答,需要怎么做啊,我刚接触这方面。谢谢

  5. Yu Zhou says:

    请问我使用primer3与FASTAfile.misa文件运行后不输出FASTAfile.p3out文件。是什么原因呢??????? [疑问]

  6. 老钟 says:

    您好,我目前遇到一个棘手问题,我下载了一个2.2G大小的全基因组序列,用MISA运行后得到“.misa” 和 “.statistics”两个文件;然后我找不到设置引物设计参数的文件;所以我直接没有设计就运行下一步,可是用p3_in.pl运行p3_in.pl文件名.fasta.misa的时候得到的结果超过了400G,导致硬盘容量不足而结束了。现在实验无法继续下去,不知道我哪里出了问题。求助啊!谢谢!

    柳城 回复:

    这个要有一定的perl基础。p3_in.pl里有些代码要根据实际情况改改。

评论已关闭。