BLAST 2 Sequences,在很早前NCBI就有提供这种工具的了。最近在2008年底又重新改版了,改版后的功能更加强大。有许多非常实用,但你可能不是太清楚的功能。这里大概提一下,具体的详细用法,还是要靠你自己慢慢摸索。
功能介绍:
- 1,两个序列之间的比对(BLAST 2 Sequences),这是最初的功能
- 2,BLAST 多个序列。
- 3,BLAST 2 Sequences时,还能用点矩阵图(Dot Matrix)查看
- 4,BLAST 多个序列时,还能进一步做进化树分析。
BLAST主页:http://blast.ncbi.nlm.nih.gov/
现在在任何一个Blast界面都可以直接切换到BLAST 2 Sequences,只要把Align two or more sequences的选项勾上就可以了。看下图。
1,2个序列的比对
下图是NP_000680.2和NP_004170.1的2个序列比对。结果看Dot Matrix View。但这两个序列有匹配到时,在图中用线条表示。标示各自起始和终止的位置,匹配的长度中。就在图中一目了然。如下图,仅有两个小片段blast上。
2,多个序列的比对
看第一张图,可以直接输入多个Accession Number,或是直接输入多个FASTA格式的序列。或是用本地的文件上传也行。有时需要对一个未知的序列在一些目标序列里作一些比较。这个方法很有用。
如下图,用人苯丙氨酸羟化酶(NP_000680)与其它不同物种的羟化酶进行多个BLAST,最后看它们的进化树。详细如下:
human phenylalanine hydroxylase (accession NP_000680) with a set of 34 other vertebrate aromatic amino acid hydroxylases. The portion shown here contains the tryptophan hydroxlase 1 homologs from human (Homo sapiens), NP_004170; rabbit (Oryctolagus cuniculus), NP_001093425 and NP_001075741; mouse (Mus musculus), NP_033440; rat (Rattus norvegicus), NP_001094104; chicken (Gallus gallus), NP_990287; Xenopus laevis, NP_001080923; zebrafish (Danio rerio), NP_001001843 and NP_840091; and pufferfish (Takifugu rubripes), NP_001027848.
《“NCBI工具:BLAST 2 Sequences的用法”》 有 12 条评论
又是专业性的~~看不懂~~只管踩~~
呵呵。都不够你博客人气旺啊。
[…] http://www.liucheng.name/?p=791 Loading… @import […]
你好,请教那么多个序列比对呢,如5000个蛋白质和1000个蛋白质值来比较,怎么速度可以加快。
噢。这个问题才看到。真是不好意思了~
要找好的机器吧。多CPU的。没试过这么多的。估计很困难。 :gg:
请教:我用你的例子做,怎么树的图形不一样啊?
请教一下,我跟上面的同学一样,用这些例子做出来的树也不是这个样子呢,为什么会这样呢
那个图是NCBI给出来的。不一样就是你们的问题了。呵呵。
可能只是参数不一样而已了。
如何用BLAST去搜索 水稻AK106814蛋白序列
您好,我想问一下,氨基酸比对结果中的:和.代表次保守和次次保守吗,如果是的话次保守和次保守具体什么意思呢?谢谢
我也觉得是这样。具体什么意思嘛就没去想过。可到yunbio.com问问
写得太专业了,搞不清楚