文章

CGAP:NCBI癌症基因组剖析计划

CGAP:NCBI癌症基因组剖析计划

CGAP,The Cancer Genome Anatomy Project

CGAP简介

The goal of the NCI’s Cancer Genome Anatomy Project is to determine the gene expression profiles of normal, precancer, and cancer cells, leading eventually to improved detection, diagnosis, and treatment for the patient. By collaborating with scientists worldwide, CGAP seeks to increase its scientific expertise and expand its databases for the benefit of all cancer researchers.

CGAP计划是一项由NCI建立和主持的交叉学科的计划,用来产生用于解码肿瘤细胞的分子结构所需的信息和技术工具。CGAP被分为五个互补的自主部分,每一个都有它自己的目的,信息学工具和资源。The Human Tumor Gene Index (hTGI)人类肿瘤基因索引指明了在人类肿瘤发生过程中的基因表达。Molecular Profiling (MP)分子表达谱展示了用前列腺作为例子来从分子水平分析人类组织样品的概念。The Cancer Chromosome Aberration Project (CCAP)癌症染色体变异计划(CCAP)描述了同恶性转移相关的染色体改变。The Genetic Annotation Index (GAI)遗传注解索引指明和描绘了同癌症相关的多态性。The Mouse Tumor Gene Index (mTGI)小鼠肿瘤基因索引(mTGI)确定了在小鼠肿瘤发生过程中的基因表达。 阅读更多

用Sequin向NCBI提交序列

用Sequin向NCBI提交序列

如果你要用BankIt在线提交序列请看如何向NCBI提交序列?。这里再简单介绍一下如何用SequinNCBI提交序列

Sequin下载

(下载页面:http://www.ncbi.nlm.nih.gov/Sequin/index.html

Sequin介绍

  1. 提交的是批量而且比较复杂的序列
  2. you are submitting mutation, phylogenetic, population, environmental, or segmented sets
  3. 喜欢图形的界面,有更的选项和功能,可以批量修改
  4. 获得相关的分析工具
  5. 随时可以保存

  阅读更多

Plot of NP_004170

NCBI工具:BLAST 2 Sequences的用法

BLAST 2 Sequences,在很早前NCBI就有提供这种工具的了。最近在2008年底又重新改版了,改版后的功能更加强大。有许多非常实用,但你可能不是太清楚的功能。这里大概提一下,具体的详细用法,还是要靠你自己慢慢摸索。

功能介绍:

  • 1,两个序列之间的比对(BLAST 2 Sequences),这是最初的功能
  • 2,BLAST 多个序列。
  • 3,BLAST 2 Sequences时,还能用点矩阵图(Dot Matrix)查看
  • 4,BLAST 多个序列时,还能进一步做进化树分析。

阅读更多

用Perl下载NCBI的Blast库(Blastdb)

有时你要构建本地的Blast,需要用到NCBI已经构建好的Blastdb。可以用FTP下载。这里NCBI还提供一个Perl程序来下载NCBI的blast库。

update_blastdb.pl – Download pre-formatted BLAST databases from NCBI。右键另存为 阅读更多

NCBI查找基因序列实例分析-羊GAPDH基因

之前也发过几篇关于在NCBI查找序列的,你可以在本博客里搜索一下。这方面问的人比较多。通过一些实例的分析,帮助大家更好的理解。

这里再讲解一下查找GAPDH基因的例子。

1,进入NCBIhttp://www.ncbi.nlm.nih.gov/

2,选择Gene数据库(注,Gene数据库收录的基因序列相对较少。你也可以选择Nucleotide数据库,用相同的关键词搜索一下试试看)。 阅读更多

三种分析蛋白结构域(Domains)的方法

三种分析蛋白结构域(Domains)的方法

1,SMART入门,蛋白结构和功能分析

详细: http://www.liucheng.name/?p=738

2,Sanger的Pfam数据库

网址:http://pfam.sanger.ac.uk/

目前的版本:Pfam 23.0 (July 2008, 10340 families)

The Pfam database is a large collection of protein families, each represented by multiple sequence alignments and hidden Markov models (HMMs). 阅读更多

如何在NCBI实现大批量数据的一一对应

有时我们手头会有一批数据,或者是只有大量的某些id。比方说:accession number、gi、geneid、symbol、gounigene、pubmed、taxid等等。事实大部分数据库都会有提供一些专门的文件或工具来实现这些数据间大批量的一一对应。

先来讲讲NCBI的。

用FTP登陆ftp.ncbi.nih.gov(windows下可以直接打开或是用迅雷/Flastget等下载工具)。cd gene/DATA(windows下依次找到gene/DATA这个文件夹)。ls一下,里面的文件大概有: 阅读更多

NCBI新的数据库和工具(NCBI News, June 2009)

BioSystems

BioSystemsNCBI新的数据库,收集合作的公共数据库中所有生物系统的数据。BioSystems是一个集中的生物系统知识库,联合Entrez系统的文献,分子,和化学等的数据。

目前的BioSystems包含有来自KEGG和BioCyc的生物信号通路,未来将会容纳更多其它类型的生物系统数据库。生物系统的明细图和注释在来源的数据库网站可以找到。在NCBI的Gene, HomoloGene, OMIM, 和 Protein Clusters 数据库的记录将会有链接到BioSystems。详情更登陆BioSystems的主页:www.ncbi.nlm.nih.gov/biosystems/ 阅读更多