乳癌数据库(Breast Cancer Database)

The database contains comprehensive listing of “molecular alterations associated with Breast Cancer”.

It includes information related to molecular alterations at the genome, mRNA and protein levels. The data can be queried or browsed at DNA, mRNA and Protein levels.

The entries are linked to the Human Protein Reference Database (HPRD) for manually curated protein annotation; as well as to ONCOMINE, OMIM, Swiss-Prot and GeneCards.

http://www.breastcancerdatabase.org/ 阅读更多

三种分析蛋白结构域(Domains)的方法

三种分析蛋白结构域(Domains)的方法

1,SMART入门,蛋白结构和功能分析

详细: http://www.liucheng.name/?p=738

2,Sanger的Pfam数据库

网址:http://pfam.sanger.ac.uk/

目前的版本:Pfam 23.0 (July 2008, 10340 families)

The Pfam database is a large collection of protein families, each represented by multiple sequence alignments and hidden Markov models (HMMs). 阅读更多

批量序列拼接工具:CAP3/PCAP下载

CAP3 is for small-scale assembly of EST sequences with or without quality values.用于少量的序列拼接

PCAP is for large-scale assembly of genomic sequences with quality values and with or without forward-reverse read pairs.用于大批量的基因组序列拼接.

注: 下载前是要到这里填写资料才可以下载的:http://seq.cs.iastate.edu/

Download

CAP3

PCAP

1,在线的CAP3,少量的序列拼接 阅读更多

Fasta格式的详细说明

序列的Fasta格式是最经常看到的格式之一。下面简介说明一下什么是FASTA格式。

Fasta格式开始于一个标识符:”>”,然后是一行描述,下面是一行行的序列。每一行最好不要超过80个字母。

如: 阅读更多

如何在NCBI实现大批量数据的一一对应

有时我们手头会有一批数据,或者是只有大量的某些id。比方说:accession number、gi、geneid、symbol、gounigene、pubmed、taxid等等。事实大部分数据库都会有提供一些专门的文件或工具来实现这些数据间大批量的一一对应。

先来讲讲NCBI的。

用FTP登陆ftp.ncbi.nih.gov(windows下可以直接打开或是用迅雷/Flastget等下载工具)。cd gene/DATA(windows下依次找到gene/DATA这个文件夹)。ls一下,里面的文件大概有: 阅读更多

BioPerl指南:Unix/Linux/Windows下的安装

BioPerl安装指南:Unix/Linux/Windows下的安装

其实BioPerl的功能很强大。但是用的人却不多。最根本的原因可能是,太多数人都还是新手,相对而言Perl很难懂,不懂Perl的人根本搞不懂BioPerl。而且BioPerl安装也很复杂。又不像Perl一样打包成一个安装包,一键安装。

到现在,我前前后后安装过BioPerl好几次,每次都觉得很复杂,很难懂。我又不是计算机专业出身的,真的是连最基本的计算机算法或原理都是不懂的。我学BioPerl的确感到吃力。所以,接触了BioPerl这么久,都只是用BioPerl从NCBI上拿序列。其它的功能还没真正接触。

接下来可能花些时间慢慢学习。首先先安装好Perl(http://www.perl.org/get.html阅读更多

生物信息学作业(四):未知蛋白质序列的功能预测

一、 实验内容

已知一段蛋白质序列,请对其功能进行预测:

点击这里看这段蛋白的序列

1、检查其基本属性及跨膜螺旋

2、利用BLASTp程序检索高同源序列。并比较结果。 阅读更多

生物信息学作业(三):核酸序列分析

核酸序列分析(一)

一、 实验内容

1、使用DNAMAN进行核酸基本信息分析

2、利用Internet中的资源对测序的核酸序列进行载体序列的识别与去除

3、核酸序列的电子延伸及电子表达谱分析 阅读更多