文章

生物信息学作业(一):生物信息数据库信息检索

实验内容:

1、了解NCBI、DDBJ、EMBL上网的方法自学各网站相关介绍。

2、了解北大生物信息学中心等几大中文生物信息学网站。

3、了解一些生物论坛中有关生物信息学的部分。如:Biooo和Bioon。

4、利用NCBI的Entrenz查询系统和EBI的SRS检索文献和核酸或蛋白质序列。(phyA)并对照所学复习各字段的含义。

5、将所得记录的ID或Accession记录下来备用 阅读更多

MoKCa:癌症相关突变激酶信息数据库

MoKCa:癌症相关突变激酶信息数据库

当人类罹患癌症时,蛋白激酶家族成员是发生基因突变最多的一类基因。这些发生突变的激酶基因和被激活的激酶基因也是抗癌治疗最有效的作用靶点。

MoKCa数据库http://strubiol.icr.ac.uk/extra/mokca)是一个有关癌症相关突变激酶信息的数据库,库中收录了大量与突变激酶基因相关的结构注释信息和功能注释信息,以及当这些激酶发生突变时会产生怎样的结果的预测信息。肿瘤组织和肿瘤细胞系体细胞突变数据被标记在相应的蛋白质晶体结构域上。在蛋白质结构域象形图上以及蛋白质3D结构图上还对发生突变的氨基酸位点进行了突出标记。 阅读更多

转录因子数据库

小鼠转录因子(Transcription Factor)数据库:TFdb

介绍

小鼠转录因子数据库(mouse Transcription Factor Database: TFdb),是一个非冗除的小鼠转录因子数据库。目前共收集了1675个Entrez Gene。

参考文献:”A genome-wide and nonredundant mouse transcription factor database”, Kanamori et. al, (BBRC 322/3 pp. 787-793). 阅读更多

蛋白质结构预测的方法及相关数据库

蛋白质结构预测的基本思想

蛋白质结构预测的问题从数学上讲,是寻找一种从蛋白质的氨基酸线性序列到蛋白质所有原子三维坐标的一种映射。典型的蛋白质含有几百个氨基酸、上千个原子,而大蛋白质(如载脂蛋白)的氨基酸个数超过4500。所有可能的序列到结构的映射数随蛋白质氨基酸残基个数而呈指数增长,是天文数字。然而幸运的是,自然界实际存在的蛋白质是有限的,并且存在着大量的同源序列,可能的结构类型也不多,序列到结构的关系有一定的规律可循,因此蛋白质结构预测是可能的。 阅读更多

NCBI新的数据库和工具(2009年05月)

NCBI News, May 2009

H1N1流感资源

流感病毒最新数据和序列的页面:www.ncbi.nlm.nih.gov/genomes/FLU/SwineFlu.html
PubMed里关于流感的最新文献:
http://www.ncbi.nlm.nih.gov/pubmed?term=swine+AND+(flu+OR+influenza+OR+h1n1)+AND+%22last+1+year%22%5bedat%5d 阅读更多

多序列比对及蛋白质功能及结构预测(3)

  多序列比对数据库

多序列比对的意义在于它能够把不同种属的相关序列的比对结果按照特定的格式输出,并且在一定程度上反映它们之间的相似性。多序列比对结果所提供的信息对于提高数据库搜索灵敏度也具有很大帮助。因此,方便实用的多序列比对数据库也就应运而生。    阅读更多

NCBI在线blast数据库的简要说明

Peptide Sequence Databases蛋白序列的数据库

nr
All non-redundant GenBank CDS translations + RefSeq Proteins + PDB + SwissProt + PIR + PRF
所有非冗余的的GenBank CDS区的翻译序列 + 参考序列的蛋白 + PDB数据库 + SwissProt蛋白数据库 + PRF蛋白数据库 阅读更多

entrez

Entrez所有数据库的最新数据统计

Entrez总共有35个数据库,包括 NCBI的站点内容和FTP的内容等。通过all[filter]命令就能查到所有数据库最新的数据记录。常用的数据库有(统计时间:2009/05/04):
Pubmed:        18832968个记录;
Nucleotide: 76750026个记录;
Protein:         26369028个记录;
Gene:              5798947个记录;
UniGene:      3633531个记录; 阅读更多