序列的Fasta格式是最经常看到的格式之一。下面简介说明一下什么是FASTA格式。
Fasta格式开始于一个标识符:”>”,然后是一行描述,下面是一行行的序列。每一行最好不要超过80个字母。
如:
>gi|532319|pir|TVFV2E|TVFV2E envelope protein ELRLRYCAPAGFALLKCNDADYDGFKTNCSNVSVVHCTNLMNTTVTTGLLLNGSYSENRT QIWQKHRTSNDSALILLNKHYNLTVTCKRPGNKTVLPVTIMAGLVFHSQKYNLRLRQAWC HFPSNWKGAWKEVKEEIVNLPKERYRGTNDPKRIFFQRQWGDPETANLWFNCHGEFFYCK MDWFLNYLNNLTVDADHNECKNTSGTKSGNKRAPGPCVQRTYVACHIRSVIIWLETISKK TYAPPREGHLECTSTVTGMTVELNYIPKNRTNVTLSPQIESIWAAELDRYKLVEITPIGF APTEVRRYTGGHERQKRVPFVXXXXXXXXXXXXXXXXXXXXXXVQSQHLLAGILQQQKNL LAAVEAQQQMLKLTIWGVK
下面再说一下每个字母或字符所代表的含义。
核苷酸序列:
A --> adenosine M --> A C (amino) C --> cytidine S --> G C (strong) G --> guanine W --> A T (weak) T --> thymidine B --> G T C U --> uridine D --> G A T R --> G A (purine) H --> A C T Y --> T C (pyrimidine) V --> G C A K --> G T (keto) N --> A G C T (any) - gap of indeterminate length
氨基酸序列:
A alanine P proline B aspartate or asparagine Q glutamine C cystine R arginine D aspartate S serine E glutamate T threonine F phenylalanine U selenocysteine G glycine V valine H histidine W tryptophan I isoleucine Y tyrosine K lysine Z glutamate or glutamine L leucine X any M methionine * translation stop N asparagine - gap of indeterminate length
《 “Fasta格式的详细说明” 》 有 9 条评论
[…] http://www.liucheng.name/?p=770 喜欢本文,那就收藏到: 相关文章No Related Post […]
[…] 看第一张图,可以直接输入多个Accession Number,或是直接输入多个FASTA格式的序列。或是用本地的文件上传也行。有时需要对一个未知的序列在一些目标序列里作一些比较。这个方法很有用。 […]
顶一个!!
博主你好,请问你有fasta格式的转换软件吗?能不能给我传一份
我在barcoding是需要用
谢谢
没有软件阿~ 这个写个小脚本就行了
我写的不知道为什么老是出问题,转换以后的文件上传服务器老是报错
[…] 和FASTA. DNA sequence:使用它来选择输入的数据DNA […]
amino,keto等括号里都代表什么,能回答下吗
cn84rtxw4dcwn4xnc4rwif
[…]Here are a number of the web-sites we suggest for our visitors[…]