Bioinformatics,生物信息学

知道基因名(Symbol)怎样查找基因的序列?

上一次讲解了知道一个酶的英文怎样在NCBI上查找基因?,今天再来讲解另外一种情况,知道了基因名(即Symbol),怎样在NCBI上查找该基因的序列。 阅读更多

DDBJ/EMBL/GenBank Accession的命名规则

The format for GenBank Accession numbers are:

GenBank Accession numbers命名的规则是:

Nucleotide: 1 letter + 5 numerals OR 2 letters + 6 numerals 1个字母+5个数字 或 2个字母+6位数字 
Protein: 3 letters + 5 numerals 3个字母+5位数字
WGS: 4 letters + 2 numerals for WGS assembly version + 6-8 numerals 4个字母+2位数字+WGS的版本+6-8位数字
MGA: 5 letters + 7 numerals 5个字母+7位数字

阅读更多

NCBI参考序列(RefSeq)常见问题回答

1,什么是参考序列RefSeq?

NCBI的参考序列(RefSeq)计划,为多种生物提供序列的数据信息及相关资料,用于医学、基因功能和基因功能比较研究。RefSeq数据库中所有的数据是一个非冗余的、提供参考标准的数据,包括染色体、基因组(细胞器、病毒、质粒)、蛋白、RNA等。 阅读更多

NCBI RefSeq命名格式的详细说明

  NCBI RefSeq (美国国立生物技术信息中心参考序列库) 是目前世界上最具有权威性的序列数据库。NCBI的参考序列计划(RefSeq)将为中心法则中自然存在的分子,从染色体到mRNA到蛋白提供参考序列标准。RefSeq标准为人类基因组的功能注解提供一个基础。它们为突变分析,基因表达研究,和多态发现提供一个稳定的参考点。 阅读更多

GenBank序列修订版历史查询工具

NCBI提供了一个序列修订版历史查询的工具。用序列的GI Number或Accession Number,通过这个工具就能查到该序列的历史记录,最早提交的时间,修订的时间等等。非常的棒。 阅读更多

最近ftp登陆NCBI出现No route to host的问题

最近一段时间在linux下,我用ftp命令登陆NCBI的ftp地址ftp.ncbi.nih.gov,有时会出现ftp: connect: No route to host的提示,再退出重新登陆,经过多次测试之后,发现有时正常,有时不行,即提示ftp: connect: No route to host。 阅读更多

GenBank数据库格式的详细说明

GenBank是美国国立卫生研究院维护的基因序列数据库,汇集并注释了所有公开的核酸以及蛋白质序列。每个记录代表了一个单独的、连续的、带有注释的DNARNA片段。这些文件按类别分为几组:有些按照系统发生学划分,另外一些则按照生成这些序列数据的技术方法划分。 阅读更多