Bioinformatics,生物信息学

Figure 1: Chromosome 4 record from the GRCh37 primary reference assembly

(译文)NCBI发布版本37的人类基因组序列

原标题:The Genome Reference Consortium Human Genome Build 37 now Available。其中“The Genome Reference Consortium”,找了好久都找不到正确的翻译。按我的理解,可译为基因组参照序列联盟(The Genome Reference Consortium,简称GRC)。

 在2009年8月份,NCBI发布了版本37的人类基因组序列(build 37 of the human genome)。这个版本包含了由GRC提供的新测序的序列和新组装的序列。

 GRC联盟

 GRC联盟是由英国Wellcome Trust Sanger研究中心(the Wellcome Trust Sanger Center)、华盛顿大学基因组中心(The Washington University Genome Center)、欧洲生物信息研究所(the European Bioinformatics Institute)和美国国家生物技术信息中心(NCBI)联合组成。 阅读更多

用NCBI提供的Graphics工具来查看,就能知道基因的内含子和外显子的序列了

如何确定基因的内含子和外显子序列及基因结构图

这标题最长。哈哈。好吧,进入正题。

问题如下:

我想在NCBI上找猪KIT(FJ938289)基因的结构图以及其内含子外显子的序列? 阅读更多

酵母菌的txid=4932

NCBI查找基因序列:酵母菌的细胞色素C与异柠檬酸裂解酶

又是一个NCBI查找基因序列的实例分析。虽然我已经写过很多篇了,不过,这方面的需求还是挺大的。其实只要去google一下,就能找到我以前写的文章,看一看就会了。

一般而言,大多数人的问题是:在NCBI上面总是出来太多结果,无法筛选。

这次的NCBI查找基因序列的例子

菌名:酵母菌 (yeast、Saccharomyces cerevisiae)
基因:细胞色素C (Cytochrome C)、异柠檬酸裂解酶  (isocitrate lyase)

阅读更多

Blastp/PSI-BLAST/PHI-BLAST 的详细介绍

Blastp/PSI-BLAST/PHI-BLAST都是蛋白序列与蛋白序列之间的Blast比对。

1,Blastp: 标准的蛋白序列与蛋白序列之间的比对

Standard protein BLAST is designed for protein searches.

Blastp用于确定查询的氨基酸序列在蛋白数据库中找到相似的序列。跟其它的Blast程序一样,目的是要找到相似的区域。 阅读更多

BlastN/MegaBlast/Discontiguous MegaBlast 的区别

三者之间的共同之处就是 BlastN/Megablast/Discontiguous megablast 都是BlastN,就是核酸序列比对核酸序列的算法。

简单而言

BlastN : 应该是出现较早的算法。比对的速度慢,但允许更短序列的比对(如短到7个碱基的序列)。

MEGABLAST : 主要用来鉴定一段新的核酸序列,它并不注重比对各个碱基的不同和序列片断的同源性,而只注重被比对序列是否是数据库未收录的,是否为新的提交序列或基因。 速度快。同一物种间的。

Discontiguous MEGABLAST : 灵敏度(sensitivity)更高,用于更精确的比对。主要用于跨物种之间的同源比对。 阅读更多

BLAST 核酸/氨基酸序列相似性比较的工具

 BLAST (Basic Local Alignment Search Tool)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似性序列比较。BLAST结果中的得分是对一种对相似性的统计说明。

  BLAST 采用一种局部的算法获得两个序列中具有相似性的序列。如果您想进一步了解BLAST算法,您可以参考NCBI的BLAST Course ,该页有BLAST算法的介绍。 阅读更多

两个在线基因预测工具Glimmer和ORF Finder比较

ORF FinderGlimmer两个都是基因预测的NCBI在线工具:

ORF Finder的主页是http://www.ncbi.nlm.nih.gov/projects/gorf/

Glimmer在线的主页是http://www.ncbi.nlm.nih.gov/genomes/MICROBES/glimmer_3.cgi

关于ORF Finder的详细介绍看:ORF Finder使用说明及基因预测
关于Glimmer的详细介绍看: 微生物基因组注释和基因预测工具:Glimmer 阅读更多

Glimmer的在线运行

微生物基因组注释和基因预测工具:Glimmer

Glimmer简介

Glimmer用于微生物DNA的基因预测,特别是细菌、古细菌、和病毒等的基因组。Glimmer(Gene Locator and Interpolated Markov ModelER)采用内插马尔可夫模型(interpolated Markov models,IMMs)来识别编码区域和从非编码的DNA中区分出来。 阅读更多