NCBI站点的一般介绍及其它资源库的介绍
GenBank Overview
生物信息学站点地图
其它资源库的介绍
国际核苷酸序列数据库合作组织
GenBank由位于马里兰州Bethesda的美国国立卫生研究院下属国立生物技术信息中心建立,与日本DNA数据库(DNA Data Bank of Japan ,DDBJ)以及欧洲生物信息研究所的欧洲分子生物学实验室核苷酸数据库( European Molecular Biology Laboratory, EMBL) 一起,都是国际核苷酸序列数据库合作的成员。
GenBank,DDBJ,and EMBL,所有这3个中心都可以独立地接受数据提交,而3个中心之间则逐日交换信息,并制成相同的充分详细的数据库向公众开放。因此他们是相等的。
什么是GenBank?
GenBank是美国国立卫生研究院维护的基因序列数据库,汇集并注释了所有公开的核酸序列。GenBank属于一个序列数据库的国际合作组织,包括EMBL和DDBJ。
每个记录代表了一个单独的、连续的、带有注释的DNA或RNA片段。
这些文件按类别分为几组:有些按照系统发生学划分,另外一些则按照生成DNA序列数据库的直接提交。这些作者将序列数据库作为论文的一部分来发表,或将数据库直接公开。
GenBank
GenBank是一个有13亿碱基,来自于100,000多种生物的核苷酸序列的数据库。每条纪录都有编码区(CDS)特征的注释,还包括氨基酸的翻译。
遗传密码- 15个遗传密码的概要。用来确保GenBank中纪录的编码序列被正确的翻译。
访问GenBank
通过Entrez Nucleotides来查询。
ession number,作者姓名,物种,基因/蛋白名字,还有许多其他的文本术语来查询。
关于Entrez更多的信息请看下文。
用BLAST来在GenBank和其他数据库中进行序列相似搜索。
用E-mail来访问Entrez和BLAST可以通过Query和BLAST服务器。另外一种选择是可以用FTP下载整个的GenBank和更新数据。
纪录样本
每个记录代表了一个单独的、连续的、带有注释的DNA或RNA片段。
这些文件按类别分为几组:有些按照系统发生学划分,另外一些则按照生成DNA序列数据库的直接提交。这些作者将序列数据库作为论文的一部分来发表,或将数据库直接公开。
关于GenBank的各个字段的详细描述,以及同Entrez搜索字段的交叉索引。
DDBJ/EMBJ/GenBank特性表(见讲义或网络课件)
特性表格式和标准被合作数据库用在序列记录的注释上,使得数据共享成为可能,包括详细的描述生物特性和特性限定语的附录,以及IUPAC规定的核苷酸和氨基酸的代号。
数据纪录的格式和搜索方式可能会不一样,ession number,序列数据和注解都是一模一样的。即,ession number U12345在GenBank,DDBJ或EMBL中查找相应纪录,得到的结果是完全一样的序列数据,参考内容等等。
GenBank普通文件格式
参见GenBank记录样本和在GenBank公布通知中的详细描述,下载大多数最近的完全公告和日常积累或非积累更新数据。
—摘要句法记号1,国际标准组织(ISO)数据表示格式,下载大多数最近的完全公告和日常积累或非积累更新数据。
NCBI introduction 来自淘豆网www.taodocs.com转载请标明出处.