文章

如何用COBALT构建本地的多序列比对(Linux系统)

COBALT是一个蛋白的多序列比对工具,也用到RPS-BLAST, BLASTP, 和PHI-BLAST等工具,并且也用到了conserved domain database (CDD) 和PROSITE protein-motif database来保证COBALT比对结果的质量。关于在线COBALT的用法看另一篇文章”  COBALT:NCBI在线蛋白多序列比对(比ClustalW还强大的工具) ”。

这里再讲解如何构建本地的COBALT多序列比对,在Linux系统的配置步骤如下: 阅读更多

COBALT:NCBI在线蛋白多序列比对(比ClustalW还强大的工具)

COBALT:NCBI在线蛋白多序列比对(比ClustalW还强大的工具)

COBALT is a multiple sequence alignment tool that finds a collection of pairwise constraints derived from conserved domain database, protein motif database, and sequence similarity, using RPS-BLAST, BLASTP, and PHI-BLAST.
Pairwise constraints are then incorporated into a progressive multiple alignment.

COBALT是一个蛋白的多序列比对工具,其实用法跟ClustalW是很像的。算法应该是不一样的。在我看来,COBALT是应该更加精确的。因为COBALT在多序列比对的同时,也用到RPS-BLAST, BLASTP, 和PHI-BLAST等工具,并且也用到了conserved domain database (CDD) 和PROSITE protein-motif database来保证COBALT比对结果的质量。最后比对的结果可以生成系统进化树。COBALT算是NCBI在线Blast功能的一个的延伸。 阅读更多

图1 根据序列预测蛋白质功能的技术路线

多序列比对及蛋白质功能及结构预测(4)

  蛋白质功能预测

  一、根据序列预测功能的一般过程

 如果序列重叠群(contig)包含有蛋白质编码区,则接下来的分析任务是确定表达产物–蛋白质的功能。蛋白质的许多特性可直接从序列上分析获得,如疏水性,它可以用于预测序列是否跨膜螺旋(transmenbrane helix)或是前导序列(leader sequence)。但是,总的来说,我们根据序列预测蛋白质功能的唯一方法是通过数据库搜寻,比较该蛋白是否与已知功能的蛋白质相似。有2条主要途径可以进行上述的比较分析: 阅读更多

多序列比对及蛋白质功能及结构预测(3)

  多序列比对数据库

多序列比对的意义在于它能够把不同种属的相关序列的比对结果按照特定的格式输出,并且在一定程度上反映它们之间的相似性。多序列比对结果所提供的信息对于提高数据库搜索灵敏度也具有很大帮助。因此,方便实用的多序列比对数据库也就应运而生。    阅读更多

多序列比对及蛋白质功能及结构预测(2)

  比对方法

  1.手工比对方法

手工比对方法在文献中经常看到。因为难免加入一些主观因素,手工比对通常被认为有很大的随意性。其实,即使用计算机程序进行自动比对,所得结果中的片面性也不能予以忽视。 阅读更多

多序列比对及蛋白质功能及结构预测(1)

多序列比对 简介:

双序列比对是序列分析的基础。然而,对于构成基因家族的成组的序列来说,我们要建立多个序列之间的关系,这样才能揭示整个基因家族的特征。多序列比对在阐明一组相关序列的重要生物学模式方面起着相当重要的作用。 阅读更多