Categorized | 生物信息学

Fasta格式的详细说明

Posted on 07 七月 2009 by 柳城 ,阅读 2,788

序列Fasta格式是最经常看到的格式之一。下面简介说明一下什么是FASTA格式。

Fasta格式开始于一个标识符:">",然后是一行描述,下面是一行行的序列。每一行最好不要超过80个字母。

如:

>gi|532319|pir|TVFV2E|TVFV2E envelope protein
ELRLRYCAPAGFALLKCNDADYDGFKTNCSNVSVVHCTNLMNTTVTTGLLLNGSYSENRT
QIWQKHRTSNDSALILLNKHYNLTVTCKRPGNKTVLPVTIMAGLVFHSQKYNLRLRQAWC
HFPSNWKGAWKEVKEEIVNLPKERYRGTNDPKRIFFQRQWGDPETANLWFNCHGEFFYCK
MDWFLNYLNNLTVDADHNECKNTSGTKSGNKRAPGPCVQRTYVACHIRSVIIWLETISKK
TYAPPREGHLECTSTVTGMTVELNYIPKNRTNVTLSPQIESIWAAELDRYKLVEITPIGF
APTEVRRYTGGHERQKRVPFVXXXXXXXXXXXXXXXXXXXXXXVQSQHLLAGILQQQKNL
LAAVEAQQQMLKLTIWGVK

下面再说一下每个字母或字符所代表的含义。

核苷酸序列:

        A --> adenosine           M --> A C (amino)
        C --> cytidine            S --> G C (strong)
        G --> guanine             W --> A T (weak)
        T --> thymidine           B --> G T C
        U --> uridine             D --> G A T
        R --> G A (purine)        H --> A C T
        Y --> T C (pyrimidine)    V --> G C A
        K --> G T (keto)          N --> A G C T (any)
                                  -  gap of indeterminate length

氨基酸序列:

    A  alanine                         P  proline
    B  aspartate or asparagine         Q  glutamine
    C  cystine                         R  arginine
    D  aspartate                       S  serine
    E  glutamate                       T  threonine
    F  phenylalanine                   U  selenocysteine
    G  glycine                         V  valine
    H  histidine                       W  tryptophan
    I  isoleucine                      Y  tyrosine
    K  lysine                          Z  glutamate or glutamine
    L  leucine                         X  any
    M  methionine                      *  translation stop
    N  asparagine                      -  gap of indeterminate length

转载请注明 : 来源于 Fasta格式的详细说明 | 柳城

赞助商

7条评论 于 “Fasta格式的详细说明”

  1. 成都论坛 成都论坛 Says:

    顶一个!!

    [回复]

  2. David David Says:

    博主你好,请问你有fasta格式的转换软件吗?能不能给我传一份
    我在barcoding是需要用
    谢谢

    [回复]

    柳城
    柳城 回复:

    没有软件阿~ 这个写个小脚本就行了

    [回复]

    David
    David 回复:

    我写的不知道为什么老是出问题,转换以后的文件上传服务器老是报错

    [回复]

3 Trackbacks For This Post

  1. Fasta格式的详细说明 | sci123|生信博客 Says:

    [...] http://www.liucheng.name/?p=770 喜欢本文,那就收藏到: 相关文章No Related Post [...]

  2. NCBI:Blast 2 Sequences | sci123|生信博客 Says:

    [...] 看第一张图,可以直接输入多个Accession Number,或是直接输入多个FASTA格式的序列。或是用本地的文件上传也行。有时需要对一个未知的序列在一些目标序列里作一些比较。这个方法很有用。 [...]

  3. MEGA4的中文使用说明(转) - BIRD Nest Says:

    [...] 和FASTA. DNA sequence:使用它来选择输入的数据DNA [...]

Leave a Reply

广告招租

[强] [握手] [可爱] [ok] [呲牙] :) [偷笑] [流泪] [疑问] [亲亲] [擦汗] [得意] [衰] [可怜] [抱拳] [坏笑] more »

无觅相关文章插件,快速提升流量

adobe free

adobe free

winrar 3 download

winrar 3 download freedownload

windows 7 free

windows 7 crack

key office 2010

office 2010 key

download photo shop free

photo shop serial

corel dvd moviefactory 6

corel dvd moviefactory 6 downloads

free corel photoshop download

free corel photoshop download keygen

photoshop key

photoshop key

free corel downloads

free corel downloads cracked

free winrar download for xp

download winrar for xp for free

serial corel draw 11

serial corel draw 11 serials

windows 7 key

windows 7 key

photo shop key

photo shop key

winrar password cracker serial

wirar password cracker

serial winzip 11

serial winzip 11 key

cs5 serialz

cs5 serialz free

office 2010 professional key

office 2010 key

office 2010 free

office 2010 key

windows key

windows key