-
UCSC Genome
Browser
是由
University of
California Santa Cruz (UCSC)
创立和维护的,
该站点包含有人类、小鼠和大鼠等多个物种的基因组草图,并提供一系列的网页分析工具。
p>
站点用户可以通过它可靠和迅速地浏览基因组的任何一部分,
并且同
时可以得到与该部分有
关的基因组注释信息,如已知基因,预测基因,表达序列标签,信
使
RNA
,
CpG
岛,克隆
组装间隙和重叠,
染色体带型,
< br>小鼠同源性等。
用户也可以因为教育或科研目的加上他们自
己的注释信息。
UCSC Genome
Browser
目前应用相当广泛,比如
Ensembl
p>
就是使用它的
人类基因组序列草图为基础的。
用户在使用数据库及其工具(
Genome
Browser
、
Table
Browser
、
Gene
Sorter
、
Proteome
B
rowser
、
VisiGene
、<
/p>
Genome Graphs
、
BLAT
等)
时可以从以下站点获得大量的适时帮助,
< br>包
括
.
edu/golden
Path/help
、
/FAQ
、
p>
等。还可以写邮件到
genome@
获得帮助。
1
新物种信息
目前,
< br>GBD
新增了
13
个新物种的基
因组序列信息,包括猩猩、绒猴、豚鼠、斑胸草雀、八
目鳗、文昌鱼和三种线虫品种
p>
——
brenneri
、
< br>remanei
、
japonica
在内的
9
个以前没有收录
的物种信
息,以及牛、斑马鱼、海胆、秀丽隐杆线虫(
s
)这
4
个已收录物种的更
新信息。
GBD
为每一个新信息都提供了注释,也将这些信息和
Ge
nBank
中的其它物种序
列进行了比对。此外,他们还对上述
9
种新物种信息中的
7
个物种进行了多重比对注释,
还将
6
< br>种蠕虫的序列和最新的秀丽隐杆线虫序列进行了比对。
2
UCSC
基因组数据库的新注释信息
除了收录新物种序列之外,
GBD
还在去年新增了
200
多条注释信息。可以点击
Genome
p>
Browser
上的相应按钮获得更多新注释信息。
对人类基因组集合
(数据库)
hg18
和基因及基因预测组
(
Ge
nes and Gene Prediction Track
Group
)中的
Pos Sel
p>
基因进行新的注释后发现了承受正向选择压力(
positive
selection
)
的基因。网站上显示了通过对人类、黑猩
猩、猕猴、小鼠、大鼠和狗基因组进行多基因组比
对后筛出的全基因组范围内承受正向选
择压力的基因。同时,还使用了
9
种基于
Yang
和
Nielsen
发明的<
/p>
branch-site
framework
< br>模型的似然比检验法(
likelihood
ratio
test
,
LRT
)
对一些直系同源基因进行了检测来验证上述
结论的正确性。
开放的调控元件注释项目(
Open
Regulatory
Annotation
,
OregAnno
)的研究已经取得了
一定成果,
获得了人类、
小鼠、
黑腹果蝇和酵母这四种模式生物调控元件的注释信息。
每一
条
OregAnno
的注释信息包括
经过试验验证后公开的基因调控序列
(如启动子、
增强子等)<
/p>
、
转录因子结合位点以及调控区域的多态性
(
regulatory polymorphism
)
p>
等信息,
同时每一条
OregAnno
p>
的注释信息也都会链接到
OregAnno
数据库。
数据库中,人类目录下现在还收录了
Kidd
等人对国际人类基因组单体型图计划(
Hap
Map
Project
)里
8
个人的序列同参考序列比对后获得的注释信息(
HGSV
Discordant Track
)
。
这些注释信息显示了那些人类序列中与参考序列的不符之处,
表明该处可能存在着大段
的缺
失或插入序列,这对寻找人类基因组中的变异具有非常重大的意义。
小鼠
mm9
集合(数据库)
现在提供了小鼠与其它
30
种脊椎动物的比对信息。这些比对信
息是通过多重比对和
phastCons
计算(
phastCons computation
)之后
得出的,它们有助于
了解不同物种之间在进化上的相关性。
GB
D
还在小鼠
mm9
集合(数据库)中新
增了一个
子数据库用来收录从维尔康姆基金会桑格研究所(
We
llcome
Trust
Sanger
< br>Institute
)
miRBase
< br>数据库中获取的
microRNA
信息。
在大鼠
rn4
集合(数据库
)中
GBD
还提供了从
RGD
中获取的数量性状基因座(
QTL
)信
息。这些
QTL
信息与大鼠基因组中
1000
多个与血压、血糖等处于持续动态波动之中的表
< br>型特征相关基因座有关。
在
d
m3
基因组数据库中收录有黑腹果蝇基因组中超过
7500
p>
个基因插入突变的注释信息。
通过网站上提供的这些注释信息加上与
位于美国布鲁明顿的信息储存中心之间的链接,
可以
发现果蝇基
因组中由
P
元件和
Minos
元件导致的插入。
3
UCSC
基因组数据库新收录的基因
2008
年
9
月,最新版的
UCSC
基因数据
——
h
g18
人类基因数据集发布。
UCSC
基因注释
信息包括参考各种数据库(
RefSeq
、
UniProt
、
Gen
Bank
)后使用比较基因组学方法得出的
已知编码基因和非编
码基因的多种异构体信息。
在
CCD
S
信息和
RefSeq
信息不一致时,最新的
UCSC
基因注释信息就会使
用
CCDS
蛋
白质信息来选择最合适的
比对结果。
GBD
做出这个选择是因为他们相信国际公认的蛋白
质
信息比随便比较一下基因串联重复序列和转录体
RNA
p>
5’
端所获得的差别更有意义。例如在
对<
/p>
人
类
基
因
IFI35
(
位
于<
/p>
hg18
chr17:38,418,889-38,419,
044
上
,
/cgibin/hgTracks?db=hg18&
po
sition=chr17:38418889-38419044&knownGene=pack&refG
ene=pack
)
第四号外显子和
第
五号外显子之间的剪接情况进行注释时,他们选择的就是
CCDS
信息。
新的
UCSC
基因库中包括
66,803
个基因(包括异构体)信
息,其中
13,767
个基因是非编
码
基因,这些基因共组成
26,570
个基因簇(表
1
)
。
这次更新还在
Genome
Browser
中新增了与外部数据库中几种模式生物内直系同源基因
之
间的链接。
这些模式生物数据库包括小鼠基因组数据库
(
MGD
)
、
大鼠基因组数据库
(
RGD
< br>)
、
斑马鱼信息库(
ZFIN<
/p>
)
、线虫信息库(
WormBase
p>
)
、果蝇信息库(
FlyBase
)和酵母基因组
数据库(
Saccharomy
ces Genome Database
)
。他们还计划继续
定期更新,以保证人类基
因组数据和小鼠基因组数据都是最新最全面的。
使用
Genome
Bro
wser
浏览
UCSC
数据库中某一个
基因的注释信息,只需要在
Genome
Browser
p>
网页的搜索框中输入该基因的名称等关键词就可以了。
同时,
可以使用各种基因标
识符来进行搜索,例如
H
GNC
名称、
UniProt ID
、
即使是
GenBank
或
UniPro
t
中对该基因
的一些描述性关键词都行。
通过搜索还可以发现与目的基因产物间有相互作用的基因,
对这
些基因的注释以
RefSeq
形式给出。
UCSC
Gene
trac
k
页面还包括与网站内资源之间的链接,例如与
GeneSor
ter
、
Proteome
Brow
ser
、
VisiGene
、
in situ hybridization image archive
< br>等页面的链接。今年还新增了与艾
伦脑科学研究所(
Al
len Brain Institute
)的
Human
Cortex Gene Expression
data
数据库、
Human
Genome
Epidemiology
(
HuGE
)
data
数据库、
Comparative
Toxicogenomics
Database
(
CTD
)等外部数据库之间的链接。
4
基因变异信息
<
/p>
hg18
人类基因库提供了大量人类基因变异信息,其中有一些信
息是去年才新增的。尤其值
得一提的是他们从
dbSNP
129
中补充了一些以前
dbSNP
128
和
dbSNP 126
中没有的
SNP
信息。
Genome
Browser
中可以
查询到这些
SNP
信息的详细情况,包括
SNP
的类型(例如编码
区、非编码区、同义突变等等)
p>
。
GBD
现在还能将包含这些
SNP
位点的序列与参考序列进
行比对。
此外,
为了用户比较的方便,
他们还给出了几种灵
长类动物
(黑猩猩、
猩猩、
猕猴)
p>
的直系同源基因供大家使用。图
1
就显示了
SNP 129
网页查询
SNP rs
1128456
的部分结
果。
此外,他们还从
dbSNP
128
中获取信息更新了
mm9
SNP
注释信息,从
dbSNP 127
中获
取信息更新了
bosT
au3<
/p>
牛数据库信息。
-
-
-
-
-
-
-
-
-
上一篇:常用的生物信息学软件的介绍和文献依据
下一篇:2018版省建设工程计价依据