SWISS-MODEL同源建模快速入门


以下是对SWISS-MODEL(http://swissmodel.expasy.org),一个同源建模服务器和已注释的蛋白质三维结构同源模型的知识库的介绍。

本指南帮助读者快速浏览SWISS-MODEL的功能。我们希望读者已经掌握了关于蛋白质结构和同源建模方法的基础知识。

同源建模

同源建模(比较建模)是目前唯一能够从蛋白质的氨基酸序列(目标序列)出发,建立3D模型的计算方法。建立一个成功的模型需要至少一个已经通过实验测定的蛋白质3D结构(称为“模板”,即template),并且该蛋白质的氨基酸序列应与目标序列有显著的相似性。以模板作为台架(scaffold)基础,对目标序列(target sequence)进行建模,其步骤是:选择模板,目标与模板的联配,建立模型,评估,循环重复,直到得到一个满意的模型为止。

SWISS-MODEL:提交方式

SWISS-MODEL 是一个自动化的蛋白质比较建模服务器,可以通过ExPASy服务器的web界面免费访问:
http://swissmodel.expasy.org

或通过程序DeepView(Swiss Pdb-Viewer)访问。DeepView是一个整合工具,用于观察和分析蛋白质结构和模型。( http://www.expasy.org/spdbv )

该服务器提供用户三种模式可选择:

First approach mode(简捷模式): 用于建模的氨基酸序列或是Swiss-Prot/TrEMBL (http://www.expasy.org/sprot )编目号(accession)可以直接通过web界面提交。服务器会完全自动地为目标序列建立模型。用户可以选择指定模板结构,模板可以来自由PDB数据库( http://www.pdb.org)抽取得到的内建模板库,也可以上传PDB格式的坐标文件。

Alignment mode(联配模式): 这个模式需要多序列联配的结果,序列中至少包括目标序列和模板。服务器会基于比对结果建模。用户需要指明哪一条序列作为目标序列,哪一条又作为模板。

Project mode(项目模式): 这种模式允许用户提交经过手工优化的请求给服务器。DeepView被用来建立一个项目文件,它包含了模板结构,以及目标序列与模板的联配结果。这个结果也要上传到服务器。这种方式提供对建模过程中细节的控制,例如选择不同的模板,手工编辑目标序列和模板的联配结果,以便正确地定下插入和删除的位置。项目模式还能够用于重复改进First Approach mode的结果。

复合蛋白的模型在SWISS-MODEL可以以项目模式创建。复合模板结构(带不同链的ID)被载入DeepView。FASTA格式的目标序列被导入DeepView,格式中包含的序列顺序,应该与原聚体的模板中以分号隔开的序列顺序保持一致:

>ModelName
PROTOMERSEQUECE;PROTOMERSEQUENCE

在DeepView中对目标序列和模板进行联配,并手工编辑初始的联配结果后,完整的项目文件被提交给服务器。

SWISS-MODEL:结果和评估

SWISS-MODEL通过电子邮件返回一份日志文件,它记录了服务器的所有行为和模型的坐标。有两个输出选项可供指定:

DeepView( Swiss Pdb-View ) mode(DeepView模式):以DeepView项目文件的方式返回模型和模板;

Normal mode (通常模式):以PDB文件格式返回模型的坐标(可用其它工具查看,如Rasmol)。

模型的精确度可能有显著不同,甚至在同一蛋白质的不同区域也是如此。有几个工具可以用来评估模型的可靠性:

结果文件中包含一个C-score(类似晶体结构中的B-factors),它是对当前位置上模板结构变异率的估计。模型中的某些部分如果没有可用于建模的模板信息(插入/删除部分),则C-score赋值为99。而且,日志文件记录了整个结构以及每一个残基的力场能量。这有助于确定那些有明显的构象或电性问题的区域。可选择在结果中包含一份蛋白质较验工具WhatCheck (http://www.cmbi.kun.nl/gv/whatcheck ) 的报告。另外也可以利用服务器上的ANOLEA原子平均势能的web界面( http://swissmodel.expasy.org/anolea)检查模型的质量。

目标序列和模板不准确的联配结果是模型中错误最大的来源。如果观察到隐含的结构信息,如正确的结构上gaps的位置,DeepView允许手工调整比对结果。

微调模型,例如对能量的检验,重建loop结构,以及搜索侧链旋转异构体,都可以利用DeepView实现,并通过项目文件从服务器返回。

SWISS-MODEL知识库:编目

SWISS-MODEL知识库是一个已注释的3D比较蛋白质结构模型数据库,它的内容来自完全自动的SWISS-MODEL同源建模流程。
这个知识库包括的3D模型,它们的序列来自Swiss-Prot和TrEMBL数据库,有合适的模板。这些注释,以及模型与其他数据库如Swiss-Prot和InerPro的链接,实现了在蛋白质序列信息和结构信息之间方便的浏览转换。

SWISS-MODEL知识库可以通过交互的web站点查询:
http://swissmodel.expasy.org/repository

快速搜索知识库中的结构,可以通过提交一个Swiss-Prot/TrEMBL 蛋白编目号(accession number)或识别号(ID)来完成。
高级搜索界面可以通过不同的关键字进行联合的复杂查询,例如 蛋白质的名称,基因的名称,生物学的描述,或是物种。

SWISS-MODEL知识库:组成部分

模型浏览器可以访问目标序列的信息,还允许在给定蛋白质序列的几个模型之间进行浏览。

对每一个模型,都提供下列信息:

模型信息部分:可以通过这个部分显示模型,并且下载它的坐标。到结构数据库的链接提供了用于建模的模板信息;

联配结果部分:显示了目标序列和模板序列的联配结果,该结果用于建模流程和二级结构的确定;

ANOLEA和GROMOS部分:包含了一个GROMOS经验性的力场和ANOLEA平均势能图,用于评估模型的质量;

建模日志部分:建模日志给出了每一个建模步骤的细节描述,例如模板的选择和loop区域的确立。

对每一条目标序列的各种生物学信息,例如基因名称,分类,蛋白质的描述,都在目标序列信息部分提供。

InterPro 映射:InterProt的描述符被映射对应到目标序列和可用的模型上,指出了目标蛋白质的各个domain和特定的生物学特性;( http://www.ebi.ac.uk/interpro

——————————————————————————————–

本文档由瑞典EMBnet 结点的Lorenza Bordoli 和 瑞典生物信息学研究所的Jurgen Kopp和Torsten Schwede合作撰写和设计,由EMBnet的P&PR发布委员会发布。EMBnet —-欧洲分子生物学网络 —- 是欧洲领先的生物信息学中心拥有的的生物信息
学支持网络。许多国家设有国家节点,为生物信息学软件的使用者提供培训课程和其它形式的帮助。


《 “SWISS-MODEL同源建模快速入门” 》 有 3 条评论

  1. 没想到博主也同是wp和生物的爱好者
    我研究生的课程正好要做同源模建和分子对接,所以来学习啦~
    只是对模件好后的结果评价看不太懂 呵呵 [可怜]

  2. 你好,我现在也想做同源建模与分子对接相关的,但是现在遇到了一点问题,能请问一下您的联系方式好请教一下相关知识吗?谢谢!