KEGG:Kyoto Encyclopedia of Genes and Genomes
生物信息科学与技术学院
药物基因组信息教研室
刘磊
数据库简介
数据库背景
存储内容
注释与检索
代谢(Metabolism)是指细胞内发生的各种化学反应的总称。一个代谢途径(Metabolic
Pathway)包括一系列互相联系的反应(react ion),反应中的酶(enzyme)以及反应中的前体或者产物(substrate) 。
随着现代生物信息学的进展,我们可以通过计算机来展示,以至预测细胞内的代谢途径。
KEGG是系统分析基因功能的数据库,它将基因组的信息与基因功能联系起来,旨在揭示生命现象的遗传与化学蓝图。
如何借助计算机全面地展示细胞和生物所包含的生物学信息是后基因组时代的重大挑战之一。科学家期望能够根据基因组中的信息,用计算机计算或者预测出比较复杂的细胞中的通路或者生物的复杂行为。出于这个目的, 1995年5月,日本的教育、科学、体育和文化部携手建立了KEGG数据库。
KEGG可以用来查询代谢途径、酶(或编码酶的基因)、产物等,也可以通过 BLAST 比对查询未知序列的代谢途径信息。
KEGG 主要通过 Web 界面进行访问,同样也可以通过本地运行的Perl 或 java 程序进行访问,使用很方便。
KEGG是系统地分析基因功能、链接基因组信息和功能信息的数据库。数据库的维护人员不定期的根据最近出版的一些学术论文和生物学实验得到的数据对该数据库进行更新,来保证数据库的信息与最近的科研成果同步。
KEGG数据库更新频繁,几乎每1~2天更新一次
KEGG包含的信息
KEGG存储内容
KEGG目前共包含了19个子数据库,它们被分类成系统信息、基因组信息和化学信息三个类别。常用的如:
基因数据库(GENES database)、
通路数据库(PATHWAY database)、
配体化学反应数据库(LIGAND database)、
序列相似性数据库(SSDB)、
基因表达数据库(EXPRESSION)、
蛋白分子相互关系数据库(BRITE)
KEGG数据库的注释与检索
KEGG通常被看作是生物系统的计算机表示,它囊括了生物系统中的各个对象与对象之间的关系。在分子层面、细胞层面、组织层面都可以对数据库进行检索。每个数据库中的检索条目按照一定规律被赋予一个检索号,也就是ID。表中列出了KEGG的核心数据库的检索号。
网络生物医学资源-KEGG2012 来自淘豆网www.taodocs.com转载请标明出处.