生物信息学数据库(简略概要,欢迎补充)
一.核酸数据库(一下三个数据库合作,每日交换信息,组成INSDC)
1.GenBank数据库(由NCBI提供)
核苷酸序列数据库:EST数据库,GSS数据库
蛋白质结构数据库:PDB
参考序列数据库:RefSeq数据库
第三方注释数据:TPA
2.欧洲核酸档案EDA(由EMBL提供,原EMBL-Bank发展而来)
序列片段归档SRA,Trace归档(收录高通量测序获得的短读段及测序质量)
EMBL-Bank(收录核酸序列及相关信息)
3.DDBJ数据库(由NIG日本国立遗传学研究所提供)
二.蛋白质序列数据库
1.PIR数据库(由NBRF创建)
iProClass数据库(整合各种蛋白质数据,是一个全面的蛋白质信息数据库)
PIRSF数据库(提供蛋白质家族分类信息,反应蛋白质进化关系)
2.Swiss-Prot数据库(由EBI创建,并入UniProt)
Swiss-Prot数据库(高质量的,手工注释的,非冗余的蛋白质序列数据库)
TrEMBL数据库(计算机注释的蛋白质数据库,包含编码序列翻译的蛋白质序列)
3.UnitProt数据库(universal protein resource通用蛋白质资源库,整合了上文三个数据库)
1.UnitProt知识库(UnitProtKB)
UnitProtKB/Swiss-Prot(手工注释,已检查)
UnitProtKB/TrEMBL(计算机注释,未检查)
2.UnitProt档案(UnitParc)
综合性非冗余数据库,包含所有主要的,公开的蛋白质序列
3.UnitProt参考资料库(UnitRef)
对UnitProtKB与UnitParc中一些数据提供聚类信息
三.蛋白质结构数据库
1.蛋白质结构数据库PDB
存储实验测定的生物大分子三维结构(90%蛋白质,也包括核酸,核酸复合物)
2.蛋白质结构分类数据库SCOP
对已知三维结构的蛋白质分类,描述结构与进化关系,工作需人工完成
基于类(class),折叠(fold),超家族(superfamily),家族(family),蛋白质结构域(protein domains),物种(species)
3.蛋白质二级结构数据库DSSP
对蛋白质结构中的氨基酸残基进行二级结构构想分类的标准化算法,根据PDB数据库中的三维结构推导出二级结构
from:彧