Bioinformatics,生物信息学

人类基因组 我们的DNA  人类基因组入门(一)

人类基因组入门(一)

2 人类基因组 我们的DNA  人类基因组入门(一)

人类基因组序列被描述成人们所能想像得到的最珍贵的信息集合。但是,

  • 基因组究竟是什么?
  • 它有什么用?
  • 它究竟独特到什么程度?
  • 在揭示了基因组序列后,我们学到了什么?

你–作为一个独一无二的基因组版本的主人–对这些问题可能很好奇,很想知道答案。

人类基因组 我们的DNA  人类基因组入门(一) 阅读更多

人类基因组 我们的DNA 前言

人类基因组 我们的DNA 前言

人类基因组 我们的DNA

最近在看《人类基因组 我们的DNA》这本书。详细介绍了人类基因组计划的前前后后。首先对基因组作了定义,接着是测序指导,然后是一个时间表。还有一篇关于序列分析中产生的主要发现的概述。在最后,还讨论了遗传信息对个人的和社会的含义,以及媒体关注的焦点。

在这里,我将里面的内容总结概括一下,把大众性的内容展示给大家,也就是你无须是一个生物专业的人员,只需要你对人类基因组充满着浓厚的兴趣,你可以像阅读小说一样阅读这些内容。

就像《人类基因组 我们的DNA》所提到的,把这些喜悦渗透到普通大众之中。 阅读更多

即将到来:15分钟,100美元测人类基因组

即将到来:15分钟,100美元测人类基因组

测完一个人的全基因组序列预计只需要100美元的费用,测序的速度比目前市场上第二代测序的快20,000倍。

美国太平洋生物科学公司(Pacific Biosciences)的首席技术执行官StephenTurner透露,实时单分子DNA合成测序仪(Single Molecule Real-Time DNA Sequencers)将在2010年投放市场使用。

你能想象得到嘛,在10前,人类基因组计划用了约一年的时间测完人类的全基因组序列,花费300million美元。到后来的历时9个月花费30million。技术不断进步,成本也在逐渐降低。

即将到来:15分钟,100美元测人类基因组

阅读更多

Uniprot,GO,GenBank,IPI等ID的一一对应

上次讲解了NCBI各种的ID号的一一对应,比方说:accession number、gi、geneid、symbol、go、unigene、pubmed、taxid等等。事实大部分数据库都会有提供一些专门的文件或工具来实现这些数据间大批量的一一对应。

详情请看如何在NCBI实现大批量数据的一一对应

现在再提供一下关于Uniprot,GO,GenBank,IPI等ID的一一对应。详细的用法还是看上面。下面只是提供在EBI和GO的FTP地址。

下面是方法:

阅读更多

Compute pI/Mw:计算序列等电点和分子量的工具

Compute pI/Mw:计算序列等电点和分子量的工具

EXPASY简介

ExPASy网站上有很多生物信息学相关的分析工具。

EXPASY是由瑞士生物信息研究所(SIB)维护的蛋白组学分析平台,侧重于蛋白序列,结构及2-D 电泳数据的分析。

Compute pI/Mw tool

下面先来介绍其中一个小工具,

Compute pI/Mw tool,计算序列的等电点分子量/theoretical pI (isoelectric point) and Mw (molecular weight)。 阅读更多

PubMed使用指南之:如何获取PubMed全文?

PubMed使用指南

PubMed简介

PubMed是美国国家医学图书馆 (NLM) 所属的国家生物技术信息中心 (NCBI) 开发的因特网生物医学信息检索系统,位于美国国立卫生研究院(NIH)的平台上。该系统通过网络途径免费提供包括MEDLINE在内的自1950年以来全世界70多个国家4300多种主要生物医学文献的书目索引和摘要,并提供部分免费和付费全文链接服务。

  • PubMed是美国家医学图书馆(NLM)下属的国家生物技术信息中心(NCBI)开发的、基于WWW的查询系统。
  • PubMed是NCBI Entrez 数个数据库查询系统下中的一个。
  • PubMed 是提供免费的MEDLINE、PREMEDLINE与其他相关数据库接入服务,MEDLINE是一个拥有1亿字条以上的巨大数据库。
  • PubMed也包含着与提供期刊全文的出版商网址的链接,来自第三方的生物 学数据,序列中心的数据等等。
  • PubMed提供与综合分子生物学数据库的链接与接入服务,这个数据库归NCBI所有,其内容包括:DNA与蛋白质序列,基因图数据、3D蛋白构象,人类孟德尔遗传在线。 阅读更多
CGAP:NCBI癌症基因组剖析计划

CGAP:NCBI癌症基因组剖析计划

CGAP,The Cancer Genome Anatomy Project

CGAP简介

The goal of the NCI’s Cancer Genome Anatomy Project is to determine the gene expression profiles of normal, precancer, and cancer cells, leading eventually to improved detection, diagnosis, and treatment for the patient. By collaborating with scientists worldwide, CGAP seeks to increase its scientific expertise and expand its databases for the benefit of all cancer researchers.

CGAP计划是一项由NCI建立和主持的交叉学科的计划,用来产生用于解码肿瘤细胞的分子结构所需的信息和技术工具。CGAP被分为五个互补的自主部分,每一个都有它自己的目的,信息学工具和资源。The Human Tumor Gene Index (hTGI)人类肿瘤基因索引指明了在人类肿瘤发生过程中的基因表达。Molecular Profiling (MP)分子表达谱展示了用前列腺作为例子来从分子水平分析人类组织样品的概念。The Cancer Chromosome Aberration Project (CCAP)癌症染色体变异计划(CCAP)描述了同恶性转移相关的染色体改变。The Genetic Annotation Index (GAI)遗传注解索引指明和描绘了同癌症相关的多态性。The Mouse Tumor Gene Index (mTGI)小鼠肿瘤基因索引(mTGI)确定了在小鼠肿瘤发生过程中的基因表达。 阅读更多

Fastq格式的详细说明

看清楚,这里所说的是Fastq格式,不是Fasta格式,要了解Fasta格式,请看Fasta格式的详细说明Fastq格式也是序列格式中常见的一种。下面简单介绍一下FASTQ格式,

A FASTQ file normally uses four lines per sequence. Line 1 begins with a ‘@’ character and is followed by a sequence identifier and an optional description (like a FASTA title line). Line 2 is the raw sequence letters. Line 3 begins with a ‘+’ character and is optionally followed by the same sequence identifier (and any description) again. Line 4 encodes the quality values for the sequence in Line 2, and must contain the same number of symbols as letters in the sequence. 阅读更多