-
生物信息
(bioinformation)
数
据库大全
摘要
:
[
生
物信息
(bioinformation)
数据库大全
] http: smartli77 cctrblog net
cmd html?do=blogs&id=548&uid=1511
生物信息
(bioinformation)
数据
库
一.数据库目录
2000
年,出版《核酸研究》的牛津大学出版社设立了一个
数据库目录网页,
p>
这个网页把数据库分成
18
类在郝柏林、<
/p>
张淑誉编著的
《生物
信息
(bioin
……
[
关键词
:
数据库
序列
基因
基因组
蛋白质
蛋白质序列
基因
图谱
]
……
关键词
:
数据库
序列
基因
基因组
蛋白质
蛋白质序列
基因图谱
/?do=blogs&id=548&uid=1511
生
物
信息
(bioinformation)
数据库
一.数据库目录
2000
年,出版《核酸研究》的牛津大学出版社设立了一个数据库目
录网页,这个
网页把数据库分成
18
类
在郝柏林、张淑誉编著的《
生物
信息
(
bioinformation)
学
手册》中,他们进行了合并
,又把数据库目录、农林牧有关数据库、医学数据库
和文献单独列出,分成以下
16
类:
1.
数据库目录
2.
综合数据库包括
DNA
序列阵
:
EMBL
、
GenBank
、
DDBJ
、
GSDB
、
TDB
和
U
niGene
序列数据库主要是与基因结构和认定有关的数据
库,
如密码子使用频度表、
真核生物启动子库、内含子和外显子
库等
序列和核糖体数据库
5.
基因图谱数据库
6.
人类基因组数据库
7.
其他物种基因组数据库
8.
基因表达数据库
9.
基因突变、病理和免疫数据库
10.
蛋白质序列数据库
11.
蛋白质结构数据库
12.
比较基因组学
(comparative
genomics)
和蛋白质组学
(Proteomics)<
/p>
数据库
13.
代谢途径和细胞调控数据库
14.
与农林牧有关数据库
15.
医学数据库
16.
其他数据库
二.综合数据库
INSD,
国际核酸序列数据库(
International
Nucleotide Sequence Databank
)
由日本的
DDBJ
、欧洲的
EMBL
和美国的
GenBank
三家各自建立
和共同维护
EMBL
库,欧洲分子生
物学实验室的
DNA
和
RNA
序列库
/
GenBank
,美国国家生物技术信息中心
(
p>
NCBI
)所维护的供公众自由读取的、
带
注释的
DNA
序列的总数据库
/Web/Genbank/
DNA Databank
of Japan (DDBJ)
,日本核酸数据库
/
GSDB
是由美国国家基因组资源
中心(
NCGR
)维护的
DNA
序列关系数据库
(
Genome
Sequence DataBase
)
/gsdb/
TIGR DATAbase,
是世界上最大的
cDNA
数据库,还有大量的
EST
序列和人类基
因索引(
< br>HGI
)
/tdb/hcd/
三.
DNA
序列和结构数据库
包括与
DNA
的复制
、转录、修复等有密切关系的蛋白质因子
BioSino
p>
是中国自主开发的核酸序列公共数据库
/
CUTG,
密码子使用频度表
/~nakamura/
/codon/
/~nakamura/
EPD,
真
核生物启动子数据库(
Eukaryotic Promotor
Database
)
/
TRANSFAC,
真核生物基因表达调控因子的数据库
< br>
/TRANSFAC
TRRD.
真核生物基因组转录调控区数据库
/mgs/dbases/trrd4/
OOTFD,
转录因子和基因表达数据库
/
RepBase,
真核生物
DNA
中重复序列数据库
/~server/
MicroSatellite,
微卫星重复序列数据库
< br>
/gopher-menus/
ALU
数据库是人及其他灵长类代表性的
Alu
重复片段<
/p>
(/pub/jmc/alu/)
Simple
Repeats,
简单重复序列库
/
COMPEL,
复合元件数据库
ftp://(/pub/compel/)
MPDB,
分子探针数据库
/interlab/
HvrBase,
灵长类
mtDNA
调控区序列库,主要是人的
HVI
和
HVII
两个高变
异区
的序列
/hvrbase/
Pl
antCARE,
植物顺式作用
(cis-
acting)
调控因子数据库
.
:8080/PlantCare/
PLACE
是从文献中搜集的植物顺式作用调控元件
DNA
模体
的数据库
,
只涉及维管
植物
.
/htdocs/PLACE/
ftp://(/pub/dna_place/)
Mend
el
数据库
,
搜集植物
STS
和
EST
序列
.
/
HOX Pro
同源异型盒
(homeobox)
基因数据库
.
/hox_pro/
OPD,
< br>寡核苷酸探针数据库
(Oligonucleotide Probe
Database).
/OPD/
dbSTS,
序列标记位点
(Sequence Tagged
Sites)
数据库
.
/dbSTS/
ftp://(/repository/dbSTS)
db
EST.
这是
GenBank
的重要组
成部分
,
它包含若干物种的已表达的序列标记信息
.
/dbEST/
ftp://(/repository/dbEST)
Am
mtDB,
后生动物线粒体
DNA
多序
列联配数据库
,
搜集了脊椎动物
(ve
rtebrates)
线粒体中编码蛋白质和
tRNA
的多
DNA
序列对比数据
,
以及哺乳动物
(mammal;mammalian)mt
DNA
主调控区序列联配数据
.
:8000/BioWWW/#AMMTDB
HOVERGE
N,
脊椎动物
(vertebrates)
同源基因数据库
(HOmologous VERtebrate
GENes)
/
ftp://(/pub/db/acnuc/hovergen)
DNA
结构参数库
.
ftp://(/pub/structure_library)
< br>NUCLEOSOME
数据库
,
收集实验测定的核小体数据
,
用于预测
DNA
中与组蛋白八
聚体结合的位点
.
ftp:///pub/databases/nucleosomal_dna/
SELEX_DB,
随机化序列库
.
/mgs/systems/selex/
ASDB,
交替剪接基因的数据库
.
:8888/
Intronerator,
< br>秀丽线虫内含子和交替剪接数据库
/~kent/intronerator/
IDB
和
IEDB
前者是内含子序列数据库,后者是内含子演化数据库
/intron/
EID,
外显子、内含子数据库
/gilbert/EID/
ExInt,
外显子、内含子数据库
/rint/
NDB,
核酸晶体结构数据库
ftp:///
/NDB/
VectorDB,
载体数据库
/
Vector
和
Vector-ig,
包分子生物学常用的许多载体的注释和序列信息
ftp://(
/repository/vetcor-ig)
ftp://(/repository/vector)
四
.
RNA
序列和核糖体数据库
1993
年成立的
RNA
学会,在出版
RNA
刊物同时,还维护着两个信息网页:<
/p>
/~rna1/
/Journals/JNLSCAT/rRNA/
snoR
NA,
小核仁
RNA
数据库
/biochem...
Small
RNA
数据库
/smallRNA/
RNAse P
数据库,包含
RNA<
/p>
水解酶
P
的
RN
A
亚基序列、联配、二级结构和三维
模型
/RNAseP/
tmRNA
网点包含
tmRNA
序列、
公认蛋白质水解标记、
序列联配、
确定新
tmRNA
的导引,以及简要综述等
/~tmrna/
tmRDB.
已经联配好的、加有注释的、按亲缘关系排列的
tmRNA
序列数据
/dbs/tmRDB/
gRNA,
导引
RNA
数据库
/~goeringe/
SRPDB,
信号识别粒子数据库
/dbs/SRPDB/
TransTerm,
信使
RNA
的组分和翻译控制信号数据库
/Transterm/
类病毒和类病毒样
RN
A
数据库
/~jpperra/ <
/p>
UTRdb
和
UTRsiteUTRdb
是真核生物
mRNA
的
5
’端和
3
’端非翻译区序列
的
非冗余数据库,
UTRsite
搜集
这些非翻译区序列中的功能片段
:8000/EmbIT/UTRHome/
ncRNA,<
/p>
似
mRNA
的非编码
RNA
数据库
/5Sdata/ncRNA/
RNAmods,RNA
修饰数据库
/RNAmods/
ftp://(/library/RNAmods)
AAR
SDB,
酰氨基
tRNA
合成酶数据库
/aars/
tRNA
序列和基因、结构与功能数据库
/departments/biochemie/trna/
PLMItRNA
基于
FastA
的
绿色植物线粒体
tRNA
分子和
tRN
A
基因的数据库
:8000/srs6/
/services/
16SMDB
、
16S-likeMDB
、
16SMDBexp
、
23SMDB
、
23S
-likeMDBexp
数据
库,是一批
16S
和
23S
核糖体
RNA
突变数据库
/departments/biology/databasee/
ftp://(/nar/)
RNA
www,RNA
二级结构网页,也有
16S
RNA
和
23S
RNA
的数据
:8080/RNA/
uRNADB,
已经联配好的、加有注释的、按亲缘关系排列的
uRNA
序列数据
/dbs/uRNADB/
U-insertion/del
etion,
编辑序列数据库,包含
5
个无脊椎动质体目物种的线粒体
基因和编辑后的
mRNA
序列
/RNA/trypanosome/
PseudoBase,
假扭结数据库
/~Batenburg/
RDP,
核糖体数据库计划包含小亚基和大亚基的两部分
rRNA,
由已
联配的
RNA
序
列以及亲缘树组成
p>
/RDP/
/
(/pub/)
SSU rRNA
欧
洲核糖体小亚基
RNA
结构数据库
/ssu/
LSU rRNA
欧洲核
糖体大亚基
RNA
结构数据库
/lsu/
5S
rRNA
数据库
/5Sdata/
DRC,
核糖体交链数据库
/~ag_ribo/ag_brimacombe/drc/
ACTIVITY,DNA
和
RNA
中功能位点数据库
/systems/Activity/
RNA
非正则配对数据库
/bp_type/
五.基因图谱数据库
Rhdb,
辐射杂交数据库
/RHdb
/Rhdb/species/HUMAN/
ftp://(/pub/databases/RHdb)
Mouse RH
数据库
/mouse_rh/
GDB,
人类基因组数据库
/
ftp:///
GeneMap
’
99,
人类基因图谱
1999
年版
/genemap/
HuGeMap,
人类基因遗传图谱和物理图谱的分布式集成数据库
ftp://(/pub/databases/RHdb/)
六.人类基因组有关数据库
人类染色体数据网址:
eller/chr1/
/HGP/chr1
/HGP/chr2
/
/
/HGP/chr4
/
/HGP/chr6
..ca/chrdb
:8080/chr8/
/chr9
/HGP/chr9
/htdocs/chr10-mapping/
/HGP/chr10/
/
/datapage/
/
/chr12/
/~genome/
/HGP/chr13/
/HGP/chr15/
/HGP/chr15/
/
/tdb/humgen/
/
/HGP/chr18/
/
/bbrp/genome/
/cgi-
bin/lists?
/HGP/chr20/
/cgi-
bin/lists?
/chr21/
/
/
/cgi-bin/lists?
/hum22/HGP/chr22/
/gifs/
/cgi-bin/lists?humchrx..txt
:8080/chrX/
/HGP/chrX/
/cgi-bin/lists?
/
1
.人类基因组测序中心
HUGO
是人类基因组组织的缩写
/
HUGO Pacific GENOME
Newsletter
是
HUGO
在
太平洋部分,其中反映中国情
况的短文在:
/3_2contents/
美国能源部支持的人类基因组计划
(genome
project)
/production/ober/hug_
美国国家卫生署对人类基因组计划
(genome proje
ct)
的支持,通过
NHGRI
即国<
/p>
家人类基因组研究所(
National Human
Genome Research Institute
)体现
/
英国
Wellcome
Trust
是人类基因组计划
(genome
project)
的另一个主要资助者
/
百慕大原则:测序的中间和最终结果都必须迅速的公开
/hugo/
世界上主要人类基因组测序中心的名单
/inf/
/hgmis/
NCB
I
的
GenBank
数据库从
1999
年
10
月起,
建立了智人基因组子目录,
其下按
染色
体编号设子目录
/genbank/genomes/H_sapiens/
英国的
Sanger
中心的人类基因组计划
(genome project)
网页,不仅有它们负责
测序的染色体数据,还有到其他染色体数据的链接
/HGP/
日本的
DDBJ
和信息生物学中心(<
/p>
CIB
)联合建立了一个
Human
Genomics
Studio
,可以按染色体编号检索和查
找基因序列
/
Sanger
p>
中心是世界上最大的
DAN
测序中心之一承
担人类基因组计划
(genome
project)
的三分之一,集中在
1
、
6
、
9
、
1
0
、
13
、
2
0
、
22
和
X
/HGP/
LBNL
,
Lawrence
Berkeley
国家实验室
/
LLNL
,
Lawrence
Livermore
国家实验室
/bbrp/genome/
LANL
,美国洛斯阿拉莫斯国家实验室
/
JGI
,由美国能源部支持的,
依托
LBNL
、
LLNL
和
LANL
三个国家实验室的人类基
因组研究部门建的联
合基因组研究所(
Joint Genome
Institute
)
/
UWGC
,华盛顿大学基因中心,是国际上最活跃的测序中心之一
/
ftp:///
SHGC
,斯坦福大学人类基因中心,主要做高分辨率辐射杂交图谱,以及人类第四
号染色体
BAC
克隆的测序
/
美国哥伦比亚大学基因中心,
主要研究和人类疾病有关的基因和第
13
号染色体图
谱
/~genome/
//~legion/
GENETHON
,法国人类基因组研究中心
/genethon_
2
.人类基因组有关数据
GenBank
、
EMBL
、
GSDB
、
GDB
等综合数据库的主要内容都来自人
UniGene,
人类基因序列集合,搜集了
GenBank
中不同基因产物的序列
/UniGene/
HIB
数据库,
是德国人类基因组计划
(genome project)
中基
因分析项目所建立的
自动注释的基因集团数据库
/proj/human/
dbSNP,
设在美国国家生物技术信息中心
NCBI
的单核苷酸多态性
数据库,收录单
核苷酸置换,以及短的删除和插入所导致的多态性
/SNP/
Whitehead
的生物医学研究所的人类单核苷酸多态性(
SNP
)数据库
p>
/SNP/human
HGBASE<
/p>
是人类双等位基因序列
(
Human
Genic Bi-Allelic Sequences
)
的
缩写,
这是人类基因从启动子到转录终点,即基因及其前后所发现的所有单核苷酸多态<
/p>
性和其他变化的数据库
/
/
位于
的华
盛顿大学的
SNP
数据库
/SNP/
I.M.A.G.E
协作
组,他们共享高质量的
cDNA
克隆库,并把有关序列、图谱和
表达
数据公开
/bbrp/image/image/html
美国菌种保藏中心(
American Type
Culture Collection
)
/
GenMapDB,
实验室维护的
一个
BAC
图谱数据库
/vcheung/
BAC Ends,
人类
BAC
末端数据库
/tdb/humgen/bac_end_search/
HUGE,
人类未经实验证实的编码基因的数据库
/huge/
IXDB,
集成的人类
X
染色体物理图谱数据库
/
Genotype,
法国人类多态
性研究中心的基因型数据库
/cephdb/
VIRGIL,
专门为
GDB
中的人类基因和
GenBank
中的
DNA
序列提供对应链接关系
的数据库
/services/birgil/
ftp://(/pub/db/viogil/)
KinM
utBase,
人类致病蛋白质激酶突变数据库
/imt/bioinfo/KinMutBase/
CpG
Isle,
人类基因中
CpG
岛数据库
ftp://(/cpgisle)
ftp://(/pub/db/cpgisle/)
ftp://(/pub/databases/cpgisle)
< br>p53
数据库研究人类肿瘤及肿瘤细胞系
p53
基因突变的数据库,包括:
p53
库、
体细胞突变库、种系突变库和细胞系突变库
/tsoussi/
IARC p53
数据库法国国际癌症
(cancer)
研究会的肿瘤和细胞系
P53
基因突变数据
库
/p53/
/
p53<
/p>
数据库具有癌症
(cancer)
倾向家
族
P53
种系突变数据库
/projicts/germline_mu_
ftp://(/pub/doc/medical/)
人类
P53
基因突变及软件
/dnam/des_
人类
hprt
即次嘌呤磷酸核糖基转移酶基因突变数据库和在
PC
视窗下运行的分析
软件
/dnam/des_
转基因啮齿动物
LacI
数据库
/dnam/des_
转基因啮齿动物
LacZ
突变库基因突变数据库及分析软件
/dnam/des_
WRN
基因突
变与遗传病
Werner
综合征有关
/werner/
OMIM,
在线人类孟德尔遗传数据库
/omim/
STACK,
南非国家
信息中心
SANBI
维护的一个序列标记联配和代表序列知识库
/
SANIGENE
是与
STACK
密切相关的一个数据库它包含所有经
过计算机处理联配
过的人类基因
EST
的集团
/
七.其他物种基因组数据库
DOGS
,基因组尺寸数据库
/
GenBank
的
/genomes/
子目录:
ftp://(/pub/databases/genband/genomes/)
EuGenes,
真核生物基因综合知识库,
< br>目前包括果蝇、
人、
小鼠、
拟南
芥
(Arabidopsis
thaliana)
、线虫、酵母、和斑马鱼的数据
/eugenes
1.
原核生物基因组
细菌基因组计划
(genome
project)
的进展情况,可从以下网站查询:
/PMGifs/Genomes/
MOT
,欧洲生物信息
(bioinformation)
研
究所
EBI
的基因组测序进展表
/~sterk/genome-MOT/
GIB
,日本
DDBJ
设立的
G
enome Information Broker for microbial genomes
的缩写
/gib/
MAGPIE
测序计划清单也可以参考
/~gaasterland/
EMGLib,
增补微生物基因组库
/emglib/
大肠杆菌
(Escherichia coli)K12
菌株的完全基因组序列,
可由
GenBank
的子目录
/genomes/
获取,或
从华盛顿大学大肠杆菌
(Escherichia coli)
基因组中心,即
Blattner
实验室的网页读取:
/pub/sequence/
ECDC,
大肠杆菌
(Escherichia coli)
菌株
K12
的基因序列库,包括基因、读框、调
p>
控区、启动子、终止子、
tRNA
和
rRNA
等
/ecdc/
ftp://)/pub/databases/ecdc)
EcoGene
和
EcoWeb,
大肠
杆菌
(Escherichia coli)K12
菌株基因组
数据库,
包括基
因、蛋白质、基因间蛋白质组信息
/EcoGene/EcoWeb/
Regul
onDB,
大肠杆菌
(Escherichia
coli)
转录调控和操作子数据库
/Computational_Biology/regulondb/
NRSub,
非冗余枯草芽孢杆菌
DNA
数据库,包括完全基因组、密码子使用表、基
因图谱和基因家族
/nrsub/
ftp://(/pub/db/nrsub)
HIDB,<
/p>
流感嗜血菌完全基因组的原始数据库
/tdb/mdb/hidb/
ftp:///pub/data/h_influenzae
HIDC,
流感署血菌基因序列库
/ecdc/
CyanoBase,
蓝细菌数据库,实际上是集胞蓝细菌的基因组数据库蓝细菌具有氧化
和光合作用所需的全
套基因
/cyano/
MJDB,
詹氏甲烷球菌基因组数据库
ftp://(/pub/data/m_jannaschii)
/tdb/mdb/mjdb/
MycDB,
分枝杆菌数据库
/
RsGDB,
类球红细菌基因组数
据库第一作者联系:
mailto:/madhu@
PGI,
疫霉属基因预研究计划的数据库
/pgi/
2.
真菌基因组
SGS,
酿酒酵母基因组数据库
/Saccharomyces/
ftp://(/pub/yeast)
LISTA,LISTA-
HOP
和
LISTA-HON
是酿酒酵
母基因组中蛋白质编码序列及其同源
性的数据库
/
ftp:///
MYGD,
p>
酵母基因组、蛋白质和同源关系的数据库
/proj/yeast/
YIDB,
酵母内含子数据库
/ExternalInfo/seraphin/
MNCD
B,
由德国
MIPS
所维护的粗糙链孢
霉基因组数据库
/desc/neurospora/
真菌基因组资源的网址:
:5080/
FGSC,
真菌遗传学信息中心
/
3.
原生生物和线虫基因组
欧洲生物信息
(bioinformation)
研究所
EBI
的原生生物网页:
/Projects/Protozoa/
AceDB,
线虫综合数据库
ftp://(/pub/acedb)
ftp://(repository/acedb)
ftp://(/pub/acedb)
关于线虫发育特别是化学感觉神经的研究
/
4.
昆虫基因组
斯坦福大学的果蝇基因组中心
/ <
/p>
FlyBase,
果蝇基因和分子数据库
/
ftp:///
FlyNets
,
果蝇分子和遗传相互作用数据库
/FlyNets/
GIF-DB,
果蝇胚胎发育过程中基因相互作用的
WWW
数据库
/~lgpd/GIFTS_home_
哈佛大学的果蝇网页
/
MsqDB,
蚊子基因数据库
/acedb/
ftp:///
5.
鱼类数据库
美国国家卫生署
1997
年建立的斑马鱼网页
/science/models/zebrafish/
ZFIN,
斑马鱼基因组、发育突变和野生种系数据库
/ZFIN/
Fugu
是河豚的数据库
/
6.
啮齿动物基因组
下面是有关家鼠的数据库