发布网友 发布时间:2024-10-04 09:27
共1个回答
热心网友 时间:2024-10-31 02:15
GenBank是一个由美国国立卫生研究院(NIH)维护的基因和蛋白质序列数据库,它集中收录并详细注释了所有公开的核酸和蛋白质序列。每个记录代表一个单独、连续的DNA或RNA片段,并附有注释信息。它的起源可以追溯到60年代初的蛋白质序列收集,随后在1982年欧洲分子生物学实验室(EMBL)创建了核苷酸数据库,引发了数据库增长的热潮。GenBank与日本的DDBJ和EMBL合作,遵循国际DNA序列数据库合作计划的规定,共同管理和更新数据。CDS(编码序列)大部分是通过DNA序列推导出的,依赖于实验、计算和序列比对,提供了对蛋白质功能的推测。数据库包含原始数据和附加信息,如FASTA格式的序列,广泛用于生物学软件包。GenBank还提供NCBI的信息检索系统,如Entrez,用于访问和分析这些数据。每个记录有其独特的ACCESSION和gi号码,后者标识核苷酸序列,当序列更新时,gi号会变,但检索号不变。记录还包括定义、关键词、来源、物种信息、引用、作者、标题、期刊等详细元数据。