关键词不能为空

当前您在: 主页 > 英语 >

UCSC Genome Browser

作者:高考题库网
来源:https://www.bjmy2z.cn/gaokao
2021-02-27 21:58
tags:

-

2021年2月27日发(作者:alerting)


UCSC Genome Browser


是由


University of California Santa Cruz (UCSC)


创立和维护的,


该站点包含有人类、小鼠和大鼠等多个物种的基因组草图,并提供一系列的网页分析工具。


站点用户可以通过它可靠和迅速地浏览基因组的任何一部分,


并且同 时可以得到与该部分有


关的基因组注释信息,如已知基因,预测基因,表达序列标签,信 使


RNA



CpG

岛,克隆


组装间隙和重叠,


染色体带型,

< br>小鼠同源性等。


用户也可以因为教育或科研目的加上他们自


己的注释信息。


UCSC Genome Browser


目前应用相当广泛,比如


Ensembl


就是使用它的


人类基因组序列草图为基础的。



用户在使用数据库及其工具(


Genome Browser



Table Browser



Gene Sorter



Proteome


B rowser



VisiGene


、< /p>


Genome Graphs



BLAT


等)


时可以从以下站点获得大量的适时帮助,

< br>包



.


edu/golden Path/help



/FAQ




等。还可以写邮件到


genome@


获得帮助。



1


新物种信息



目前,

< br>GBD


新增了


13


个新物种的基 因组序列信息,包括猩猩、绒猴、豚鼠、斑胸草雀、八


目鳗、文昌鱼和三种线虫品种


——


brenneri


< br>remanei



japonica

在内的


9


个以前没有收录


的物种信 息,以及牛、斑马鱼、海胆、秀丽隐杆线虫(


s


)这

< p>
4


个已收录物种的更


新信息。

GBD


为每一个新信息都提供了注释,也将这些信息和


Ge nBank


中的其它物种序


列进行了比对。此外,他们还对上述


9


种新物种信息中的


7


个物种进行了多重比对注释,


还将


6

< br>种蠕虫的序列和最新的秀丽隐杆线虫序列进行了比对。



2 UCSC


基因组数据库的新注释信息



除了收录新物种序列之外,


GBD


还在去年新增了


200


多条注释信息。可以点击


Genome


Browser


上的相应按钮获得更多新注释信息。



对人类基因组集合


(数据库)


hg18


和基因及基因预测组



Ge nes and Gene Prediction Track


Group


)中的


Pos Sel


基因进行新的注释后发现了承受正向选择压力(


positive selection



的基因。网站上显示了通过对人类、黑猩 猩、猕猴、小鼠、大鼠和狗基因组进行多基因组比


对后筛出的全基因组范围内承受正向选 择压力的基因。同时,还使用了


9


种基于


Yang



Nielsen


发明的< /p>


branch-site


framework

< br>模型的似然比检验法(


likelihood


ratio


test



LRT



对一些直系同源基因进行了检测来验证上述 结论的正确性。



开放的调控元件注释项目(


Open


Regulatory


Annotation



OregAnno


)的研究已经取得了


一定成果,


获得了人类、


小鼠、

黑腹果蝇和酵母这四种模式生物调控元件的注释信息。


每一




OregAnno


的注释信息包括 经过试验验证后公开的基因调控序列


(如启动子、


增强子等)< /p>



转录因子结合位点以及调控区域的多态性



regulatory polymorphism



等信息,


同时每一条


OregAnno


的注释信息也都会链接到


OregAnno


数据库。



数据库中,人类目录下现在还收录了


Kidd


等人对国际人类基因组单体型图计划(


Hap Map


Project


)里


8


个人的序列同参考序列比对后获得的注释信息(


HGSV Discordant Track




这些注释信息显示了那些人类序列中与参考序列的不符之处,


表明该处可能存在着大段 的缺


失或插入序列,这对寻找人类基因组中的变异具有非常重大的意义。



小鼠


mm9


集合(数据库) 现在提供了小鼠与其它


30


种脊椎动物的比对信息。这些比对信


息是通过多重比对和


phastCons


计算(


phastCons computation


)之后 得出的,它们有助于


了解不同物种之间在进化上的相关性。


GB D


还在小鼠


mm9


集合(数据库)中新 增了一个


子数据库用来收录从维尔康姆基金会桑格研究所(


We llcome


Trust


Sanger

< br>Institute



miRBase

< br>数据库中获取的


microRNA


信息。



在大鼠


rn4


集合(数据库 )中


GBD


还提供了从


RGD


中获取的数量性状基因座(


QTL


)信


息。这些


QTL


信息与大鼠基因组中

< p>
1000


多个与血压、血糖等处于持续动态波动之中的表

< br>型特征相关基因座有关。




d m3


基因组数据库中收录有黑腹果蝇基因组中超过


7500


个基因插入突变的注释信息。


通过网站上提供的这些注释信息加上与 位于美国布鲁明顿的信息储存中心之间的链接,


可以


发现果蝇基 因组中由


P


元件和


Minos


元件导致的插入。



3 UCSC


基因组数据库新收录的基因



2008



9


月,最新版的

< p>
UCSC


基因数据


——


h g18


人类基因数据集发布。


UCSC


基因注释


信息包括参考各种数据库(


RefSeq



UniProt



Gen Bank


)后使用比较基因组学方法得出的


已知编码基因和非编 码基因的多种异构体信息。




CCD S


信息和



RefSeq


信息不一致时,最新的


UCSC


基因注释信息就会使 用


CCDS



白质信息来选择最合适的 比对结果。


GBD


做出这个选择是因为他们相信国际公认的蛋白 质


信息比随便比较一下基因串联重复序列和转录体


RNA


5’


端所获得的差别更有意义。例如在


对< /p>






IFI35




于< /p>


hg18


chr17:38,418,889-38,419, 044



,


/cgibin/hgTracks?db=hg18&


po sition=chr17:38418889-38419044&knownGene=pack&refG ene=pack



第四号外显子和


第 五号外显子之间的剪接情况进行注释时,他们选择的就是


CCDS


信息。



新的


UCSC


基因库中包括


66,803


个基因(包括异构体)信 息,其中


13,767


个基因是非编


码 基因,这些基因共组成


26,570


个基因簇(表


1






这次更新还在


Genome


Browser


中新增了与外部数据库中几种模式生物内直系同源基因 之


间的链接。


这些模式生物数据库包括小鼠基因组数据库



MGD




大鼠基因组数据库



RGD

< br>)



斑马鱼信息库(


ZFIN< /p>



、线虫信息库(


WormBase



、果蝇信息库(


FlyBase


)和酵母基因组


数据库(


Saccharomy ces Genome Database



。他们还计划继续 定期更新,以保证人类基


因组数据和小鼠基因组数据都是最新最全面的。



使用


Genome


Bro wser


浏览


UCSC


数据库中某一个 基因的注释信息,只需要在


Genome


Browser


网页的搜索框中输入该基因的名称等关键词就可以了。


同时,


可以使用各种基因标


识符来进行搜索,例如


H GNC


名称、


UniProt ID


、 即使是


GenBank



UniPro t


中对该基因


的一些描述性关键词都行。


通过搜索还可以发现与目的基因产物间有相互作用的基因,


对这


些基因的注释以


RefSeq


形式给出。


UCSC


Gene


trac k


页面还包括与网站内资源之间的链接,例如与


GeneSor ter



Proteome


Brow ser



VisiGene



in situ hybridization image archive

< br>等页面的链接。今年还新增了与艾


伦脑科学研究所(


Al len Brain Institute


)的


Human Cortex Gene Expression data


数据库、


Human


Genome


Epidemiology


HuGE



data

< p>
数据库、


Comparative


Toxicogenomics


Database

< p>


CTD


)等外部数据库之间的链接。

< p>


4


基因变异信息


< /p>


hg18


人类基因库提供了大量人类基因变异信息,其中有一些信 息是去年才新增的。尤其值


得一提的是他们从


dbSNP 129


中补充了一些以前


dbSNP 128



dbSNP 126


中没有的


SNP


信息。



Genome


Browser


中可以 查询到这些


SNP


信息的详细情况,包括


SNP


的类型(例如编码


区、非编码区、同义突变等等)



GBD


现在还能将包含这些


SNP


位点的序列与参考序列进


行比对。

< p>
此外,


为了用户比较的方便,


他们还给出了几种灵 长类动物


(黑猩猩、


猩猩、


猕猴)


的直系同源基因供大家使用。图


1


就显示了


SNP 129


网页查询


SNP rs 1128456


的部分结


果。




此外,他们还从


dbSNP 128


中获取信息更新了


mm9 SNP


注释信息,从


dbSNP 127


中获


取信息更新了


bosT


au3< /p>


牛数据库信息。


-


-


-


-


-


-


-


-



本文更新与2021-02-27 21:58,由作者提供,不代表本网站立场,转载请注明出处:https://www.bjmy2z.cn/gaokao/676355.html

UCSC Genome Browser的相关文章