两个在线基因预测工具Glimmer和ORF Finder比较

ORF FinderGlimmer两个都是基因预测的NCBI在线工具:

ORF Finder的主页是http://www.ncbi.nlm.nih.gov/projects/gorf/

Glimmer在线的主页是http://www.ncbi.nlm.nih.gov/genomes/MICROBES/glimmer_3.cgi

关于ORF Finder的详细介绍看:ORF Finder使用说明及基因预测
关于Glimmer的详细介绍看: 微生物基因组注释和基因预测工具:Glimmer

Glimmer和ORF Finder比较

1,用大肠杆菌的一个序列(Escherichia coli) : FJ598057

结果:

Glimmer为0

ORF Finder为6(其中一个是准确的,与NCBI原基因的注释一样) 

2, 用A型流感病毒(Influenza A virus): CY046940

结果:

Glimmer为0

ORF Finder为9(其中一个是准确的,与NCBI原基因的注释一样)

3, 大肠杆菌的全基因组序列Escherichia coli plasmid pColE8, complete sequence : NC_012882(5个基因)

结果:

Glimmer为 4/5 (预测5个中有4个正确)

ORF Finder为 4/结果较多 (其中也是有4个正确) 

总结

1,Glimmer的预测比较严格。ORF Finder的干扰结果较多,但都比较容易区分。

2,Glimmer适合微生物基因组的基因预测。ORF Finder任何DNA序列都可以。

3,除去Glimmer的限制条件,两个工具预测的准确度都挺高。

总的来说,ORF Finder还是好用好多,这是对在线而来的。如果需要对单个序列的基因预测,当然是推荐ORF Finder。当然Glimmer还有批量的功能。这里所说是在线的功能哦。

10 回复
  1. JUN says:

    转DXY一位站友对此分析的评价:

    “第二个例子中,序列中有一个真正的ORF.
    Glimmer没有找到,而ORF finder找到了9个。

    那么Glimmer假阳性为0%,而ORF finder假阳性高达89%,即使它找到了那个对的。

    这还仅仅是一条序列,如果是整个基因组,复杂性远远高于一条短序列。那么ORF finder的假阳性恐怕会超过95%。

    任何杂志能接收具有这么夸张的假阳性的算法?”

    柳城 回复:

    这本来就是一篇没啥看头的文章。
    再加上这个不知哪来的 大师级 般的分析。
    真是太不搭了啊。 我都汗死了。。

  2. JUN says:

    最后一个例子中,你已经知道其中有4个是真正的ORF。
    可是在绝大多数的情况下,在得到一个基因组之后,根本没有饱和的转录组学数据支持。

    现实中面临问题是,给你100个ORF,那么你知道是哪几个是真的?
    就算告诉你其中只有4个真的,你知道是那四个?

    即,如果是glimmer,虽然出来的结果少,但起码大部分是真实的。
    如果是ORF finder,大部分都是假的。

    好比一个人,滔滔不绝的人,10句中9句在撒谎。
    而另一个人,沉默寡言,只挑关键的说,而且句句都是真话。

    现在LZ您通过测试,得出的结论是前者更靠谱,这对吗?

    柳城 回复:

    这个。 当然没有高手你想得那么周到。

    个人观点。。 对不对自己去判断嘛。
    话说这些只是预测工具而已。。

评论已关闭。