EMBL核酸序列数据库简介及数据统计图


EMBL核苷序列数据库(http:// www.edi.ac.uk/embl/)是欧洲主要的核苷序列收集单位。这个数据库是由欧洲生物信息中心EBI(欧洲分子生物学实验室(EMBL)在德国 Heidelberg 的站点)维护的。

核苷数据来自基因组测序中心、个别科学家、欧洲专利局、以及跟合作伙伴DDBJ (Japan)和GenBank (USA)交换的数据。为了达到最佳的同步性,每天在DDBJ/EMBL/GenBank之间都要交换最新的数据。用户只要进入任意一个数据库都能得到最新数据。这三个数据库之间坚持统一的文件指导方针,它规范了数据库登录的内容和语法。这种指导方针确保了这些数据库的信息以一种格式便捷的交换,它与当今的生物信息学软件兼容,反映了分子生物学领域的发展。

EMBL建立于1980年,它保存的数据信息是发表在科学文献上序列信息的两倍。普通的文章可以通过互联网提交电子版本。现在,大量的数据是由主要的测序中心提交的,比如:Sanger测序中心。在过去的11个月中,EMBL的数据库信息增长了两倍,在2009年4月29号它保存了248,758,013,991条记录。通过网址(http://www.ebi.ac.uk/Services/DBstats/)可以看到数据库统计信息。

EMBL Database Growth

Total nucleotides
(current 248,758,013,991)

growth_nucl

 

Number of entries
(current 156,955,546)

growth_entries

 

Graphs created on 29 April 2009 (2009年4月29号更新)