跳转到内容

生物信息学数据库(简略概要,欢迎补充)

来自osm&bio

一.核酸数据库(一下三个数据库合作,每日交换信息,组成INSDC)

1.GenBank数据库(由NCBI提供)

 核苷酸序列数据库:EST数据库,GSS数据库

 蛋白质结构数据库:PDB

 参考序列数据库:RefSeq数据库

 第三方注释数据:TPA

2.欧洲核酸档案EDA(由EMBL提供,原EMBL-Bank发展而来)

 序列片段归档SRA,Trace归档(收录高通量测序获得的短读段及测序质量)

 EMBL-Bank(收录核酸序列及相关信息)

3.DDBJ数据库(由NIG日本国立遗传学研究所提供)

4,Ensembl和UCSC数据库,比较类似,提供常用模式生物的基因组数据信息。

二.蛋白质序列数据库

  1.PIR数据库(由NBRF创建)

iProClass数据库(整合各种蛋白质数据,是一个全面的蛋白质信息数据库)

PIRSF数据库(提供蛋白质家族分类信息,反应蛋白质进化关系)

  2.Swiss-Prot数据库(由EBI创建,并入UniProt)

    Swiss-Prot数据库(高质量的,手工注释的,非冗余的蛋白质序列数据库)

    TrEMBL数据库(计算机注释的蛋白质数据库,包含编码序列翻译的蛋白质序列)

3.UnitProt数据库(universal protein resource通用蛋白质资源库,整合了上文三个数据库)

 1.UnitProt知识库(UnitProtKB)

  UnitProtKB/Swiss-Prot(手工注释,已检查)

  UnitProtKB/TrEMBL(计算机注释,未检查)

2.UnitProt档案(UnitParc)

综合性非冗余数据库,包含所有主要的,公开的蛋白质序列

3.UnitProt参考资料库(UnitRef)                                                                                                          

对UnitProtKB与UnitParc中一些数据提供聚类信息

三.蛋白质结构数据库

  1.蛋白质结构数据库PDB

存储实验测定的生物大分子三维结构(90%蛋白质,也包括核酸,核酸复合物)

  2.蛋白质结构分类数据库SCOP

对已知三维结构的蛋白质分类,描述结构与进化关系,工作需人工完成

基于类(class),折叠(fold),超家族(superfamily),家族(family),蛋白质结构域(protein domains),物种(species)

  3.蛋白质二级结构数据库DSSP

4.蛋白质相互作用数据库STRING

5.CATH

6.Pfam

7.InterPro

8.ProSite

对蛋白质结构中的氨基酸残基进行二级结构构想分类的标准化算法,根据PDB数据库中的三维结构推导出二级结构

from:彧