序列的标识符：GI number和Accession.Version

GI number及Accession.Version就像是序列的身份证号码一样。通过这个号码，我们能在NCBI/DDBJ/EMBL等数据库查到该序列的数据。

问题：
为什么会有两种类型的序列标识符（GI number、Accession.Version），两者之间又有什么不同呢？

回答：

两种类型的序列标识符（GI number、Accession.Version），有着不同的格式，并且开始使用的时间也不同。

1，GI number（有时用小写字母”gi”），由一系列的数字组成，是NCBI在处理序列时连续分配的。跟序列的Accession number是没有关联。

在GenBank数据中，核苷酸序列的GI number放在Version的区域。
蛋白序列的GI number，如果核苷酸序列存在CDS区，在CDS/db_xref 区有蛋白序列的GI number。在蛋白数据库，GI number同样放在Version区。

2，Version区，通常我们都可以看到是Accession.Version，如NM_008261.1

核酸序列的Version区，由两个字母，接着6位数字，再一点，后面跟着版本号。（旧的记录是一个字母，5位数字，一点，再版本号）
蛋白序列的Version区，三个字母，5位数字，一点，版本号。（注，这是原文的说法，但好像不是太准确，这可能是旧的记录。我觉得是二个字母，6位数字，版本号。如NP_032287.1）

GI number作为序列的唯一标识符已经在GenBank使用多年，其它相关的数据库仍然保留这个号码。1999，随着国际核酸序列数据库同盟（NCBI/DDBJ/EMBL，International Nucleotide Sequence Database Collaboration）的成立，Version系统也开始启用。

这两种不同系统的标识符是平行运行的，即当序列的数据改变或升级时，将会分配一个新的GI number，Accession number后的版本也会随着增加。如NM_008261.1–>NM_008261.2(GI number:6680238–>46575915)。

大概的历史是这样子的，一开始在GenBank及相关的数据库中使用的是GI number，GI是”GenInfo Identifier” 的缩写。后来国际核酸序列数据库同盟成立后，考虑到GI number不适合作为国际性的通用序列标识符，所以就弄了一个新的词叫NID，代表核酸序列，PID代表氨基酸序列。但到了1999年12月，这个叫法就中断了，全部统一改为用”GI“表示。

详细查看GenBank格式的详细说明：http://www.ncbi.nlm.nih.gov/Sitemap/samplerecord.html

同时在1999年2月，NCBI/DDBJ/EMBL启用了Accession.Version系统，确保了国际的通用性，并且对序列的标识性与追踪性更加地方便，同时跟GI number平行运行。

更多的内容，请看 current GenBank release notes。

原文链接：http://www.ncbi.nlm.nih.gov/Sitemap/sequenceIDs.html

19 4 月, 2009

柳城

生物信息学

Accession, GI, NCBI, 历史, 序列

《 “序列的标识符：GI number和Accession.Version” 》有 8 条评论

511597842说道：

2009年10月12日 23:04

受益匪浅，谢谢博主。请教一下为什么有的基因位点的单核苷酸多态性用阿拉伯数字表示，而有的则用氨基酸的代码表示，如SP-B1580C/T，同一个位点有的人却表示为Ile/Thr。能否教教小弟如何用阿拉伯数字表示，感激涕零地先谢了，期盼您的佳音。
- Lc.说道：
  
  2009年10月13日 08:29
  
  你看我的博客都没SNP的文章.就知道我不懂这个了. 以后学会了再说咯 :ka:
shaojing wang说道：

2009年11月16日 11:08

您好，现在我遇到个很头疼的问题：我用自己的序列文件比对nr库，得到很多比对结果，花了很多时间，但是现在想得到比对结果的核酸序列，不想再次和nt库比对了，所以想请教下，怎样根据蛋白序列的gi号关联出对应的核酸序列的gi号？我的邮箱x13072919850501291@126.com ，请把解决方案发到邮箱，万分感激。
- Lc.说道：
  
  2009年11月16日 11:36
  
  要学会搜索嘛。
  http://liucheng.name/768/
  - shaojing wang说道：
    
    2009年11月17日 13:31
    
    [ok] thanks，我仔细看下。
糯米说道：

2009年11月16日 11:26

主题不错哦
热门事件说道：

2010年07月14日 22:23

thanks

thanks
dora说道：

2011年11月24日 17:07

请教一下，我知道一个菌的全基因组序列，怎么能批量导出这个菌的所有基因对应的gi number？
谢谢

序列的标识符：GI number和Accession.Version

《 “序列的标识符：GI number和Accession.Version” 》 有 8 条评论

《 “序列的标识符：GI number和Accession.Version” 》有 8 条评论