关键词不能为空

当前您在: 主页 > 英语 >

UCSC-操作步骤

作者:高考题库网
来源:https://www.bjmy2z.cn/gaokao
2021-02-27 21:40
tags:

-

2021年2月27日发(作者:lather)


启动子区含有丰富的转录因子结合位点(


transcription factor binding


sites,TFBS



,


启动子序列基本上是由这些短序列组合而成,主要在


TSS


上游


1kb


的范围内 。



TSS


附近


-60bp



+40bp


是核心启动 子



区,


它对


于精确转录是必须的最小单元。对于一个已知基因的启动子可以在


NCBI


上查到其转录起始位点


,


并通过网上软件初步分析该 基因启动子


的大致序列及一



些顺式调 控元件


(


分析时应把包括整个基因包括在内

).


常见的在线预测工具有:



软件神经网络启动子预测器




NNPP


,)


,


Promoter scan (),


Dragon Promoter Finder (),


Promoter2.0 Prediction Server ()


Soft Berry (),



网上还提供了一些常见基因的数据库:



真核启动子


数据库第


85


版(


The Eukaryotic Promoter Database Current


Release 85



EPD


,)



转录起始位点数据库:该数据库主要包括人,


小鼠等常见生物的 基因转


录起始位点及该基因启动子的可能情况。



通过初步分析后


,


还应通过实验的方法加以确认


.


包括


PCR


步查 法


(


对于


一些短的启动子来说


).


如果预测目的启动子为长启动子,


PCR< /p>


步查较难


时,也可采用



筛选基因组文库的方法,筛选阳性克隆子并送长的克隆


去测序。


对一些关键的顺式调空元件可以通过凝胶阻滞试验


(蛋白基因

< br>作用)来加以确认。



查询启动子的更多方法:



1.



UCSC



1


)网址:




Genome


里选择物种,比如


human



search


里输入你的基因名


PTEN


,点击

Go



2


)出现新的页面,看到


“Known Gene Names”


下面的


PTEN



吧,点它




3


)又回到了和(


1


)类似的页面,此时,点击


sequence



4


)出现一个新的页面,选中

promoter


,同时可以输入数值修改


具体的序列区域 ,


比如


Promoter including 2000 bases upstream and


100 downstream


,即表示启动子


-2000


~+

100


区域



< br>5


)点击


“get sequence”


,出现页面中最上面的序列


“>uc001kfb.1


(promoter 2000 100) PTEN -


phosphatase and tensin homolog”

< br>就是


你要的人


PTEN


启动子< /p>


-2000


~+


100

< br>区域的序列了



2



Ensembl



1


)网址:




“Search Ensembl“


标题下


search


后的下拉框中选中物种名

< br>homo


sapiens


(人),

for


框中输入基因名


PTEN


, 点击


Go



2


)出现的新页面中比较乱,但不要管它,直接寻找


“Ensembl


protein coding gene ”


字样的,对,也就是第二个,点击它




3



新出现的页面也很乱,


不过依然不用管它,


看到左侧有点肉


色(实在 不知道怎么描述了)的那些选项了吗,对,就是


“Your


E nsembl”


下面那一堆,在里面找


“Genomic sequence”


,点它




4


)现在的界面就一目了然了,在


“5' Flanking sequence”


中输入


数值确定启动子 长度(默认为


600


),比如


1000


,点击


update





5


出现的序列中,


标为红色的就是基因的外显子,


红色之间黑


色的序列就是内含子,而第一个红色自然就是第一外显子了,那


么从开始的碱基一直到第一个红色的碱基间自然就是启动子


-1000~+1

< p>
的序列啦



这样,你不仅查到了启动子,连它的外 显子、内含子序列也全部


搞定了



3



SIB-EPD



1


)网址:




2


)具体使用方法大同小异,就是输 入物种名、基因名,限定启


动子序列区域



不过有了前两个,我想已经足够用了,个人感觉


SIB- EPD


的库容


量太小,很多基因查不到




总结一下:








ensembl


一般也和

< p>
NCBI


的一致,你的情况可能例外。这就不清楚了。

ensembl


有七个外显子可能有它自己的理由。



另外,


NCBI


的基因中

< br>gene


库中同时有


ensembl


genbank


的链接,不


如从 这个链接看看。



此外,还可以看一看这个基因在物种间的同源 性,


以及其它物种有几个


外显子,做为参考。综合考虑一下。< /p>




给你提供几个启动子区域查找的网站,慢慢摸索会学到更多的。




果蝇的



PROMOTER 2.0


通常确定启动子的算法可以分 成两种


,


一种根据启动子区各种转录信号


,



TATA


盒、


CCAAT


< br>,


结合对这些保守信号及信号间保守的空间排


列顺序的识 别进行预测。如


PROMOTER 2.0,


用神经网络方法确定


TATA


盒、< /p>


CCAAT


盒、


加帽位点


(cap site)



GC



(GCbox)


的位置和


距离


,


识别含


TATA


盒的启动子。



PROMOTER SCAN


根据转录因子结合部位在基因组中分布的不平衡性


,


将转录因子结合部


位分布密度与


T ATA


盒的权重矩阵


(weight matrix)


结合起来


,


从基因组


DNA


中识别出启动子区


[3 ]


。但上述程序预测的假阳性率较



,PROMOTER 210



23kb


出现一个假阳性


;PRO2MOTER SCAN



均每


19kb


出现一个假阳性。



PromoterInspector


另一种方法根据启 动子区序列的特征进行预测。


Promo2terInspector



一组训练序列中提取出启动子区的环境特征


,


并将外显子、内含子和


3’


端非翻译区的特征 与启动子区加以区分


,


从而在基因组中确定启动子位

< p>



初来乍到,发个技术贴了!!



1


、获取目的基因的


mRNA


序列,并且在< /p>


NCBI


的数据库中查获转录起


始点



2



截取转录起 始点为中心,


上下约各


1000bp



若在此范围内出现


CDS


< p>
可到翻译起始点终止



3


、利用在线软件进行分析



PromoterInspector


PromoterScan


Promoter 2.0


NNPP


EMBOSS Cpgplot


CpG Islands Prediction


本人是采 取多种软件结合的方法,由于


proscan



promoter 2.0


的假阳


性率较高,仅作为参 考,而


promoterinspector


的特异性较高,结 果比较


可信。同时,利用


CpG


岛预测 ,作为辅助参考



4


、最后,可以找到 小鼠的同源区,进行同源性比较,启动子区域一定


是高保守区



5


、到此,可以初步预测启动子区域的范围了。



请高手多多指教!!



启动子预测:



转录因子预测:



此处亦有好多,自己挑吧!




以下内容转自



启动子及转录因子结合位点数据库及预测工具



PROMOTER FINDING AND ANALYSIS PROGRAMS ON THE


INTERNET


----------- -------------------------------------------------- -------------------


TRANSPLORER (TRANScription exPLORER)


Dnanalyze (TF mapping)


Dragon Promoter Finder 1.2 (TSS finder and promoter region analysis)


FunSiteP 2.1


HCtata (TATA signal prediction)


McPromoter Ver.3


MatInspector (Search for TF binding sites)


ModelGenerator and ModelInspector


NNPP2.1 (TSS finder)


PromoterInspector (Strand non-specific promoter region finder)


Promoter2.0 (TSS finder)


Promoter Scan II (Promoter region prediction)


RGSiteScan


Signal Scan (Search for Eukaryotic Transcriptional Elements)


TESS (Search for Transcription Elements)


TFSEARCH (Predicts TF binding sites based on TRANSFAC data)


TRANSFAC (TF database and a number of associated programs)


TSSG and TSSW


PROMOTER 2.0


通常确定启动子的算法可以分 成两种


,


一种根据启动子区各种转录信号


,



TATA


盒、


CCAAT


< br>,


结合对这些保守信号及信号间保守的空间排


列顺序的识 别进行预测。如


PROMOTER 2.0,


用神经网络方法确定


TATA


盒、< /p>


CCAAT


盒、


加帽位点


(cap site)



GC



(GCbox)


的位置和


距离


,


识别含


TATA


盒的启动子。



PROMOTER SCAN


根据转录因子结合部位在基因组中分布的不平衡性


,


将转录因子结合部


位分布密度与


T ATA


盒的权重矩阵


(weight matrix)


结合起来


,


从基因组


DNA


中识别出启动子区


[3 ]


。但上述程序预测的假阳性率较



,PROMOTER 210



23kb


出现一个假阳性


;PRO2MOTER SCAN



均每


19kb


出现一个假阳性。



PromoterInspector


另一种方法根据启 动子区序列的特征进行预测。


Promo2terInspector



一组训练序列中提取出启动子区的环境特征


,


并将外显子、内含子和


3’


端非翻译区的特征 与启动子区加以区分


,


从而在基因组中确定启动子位

< p>



FirstEF


近来还有一些程序将上述方法与


CpG



(CpG islands)


信息 相结合。


CpG


岛是一段


200 bp


或更长的


DNA


序列


,


核苷酸


G + C


的含量 较高


,


并且


CpG

双核苷酸的出现频率占


G+ C


含量的


50 %


以上。许多脊椎动


物的启动子区都与


CpG


岛的位置重合。< /p>


FirstEF ( http :/ / rulai1cshl1org/


tools/ FirstEF/ )


搜索通过


5’UTR


定位技术构建的 第一外显子数据库


,



别第一剪切点< /p>


(first splicing donor site) ,


结合


CpG


岛信息


,


确定启动子区。


这种方法使预测的敏感性和特异性都 明显提高。该程序预测含


CpG



的启 动子的敏感性和特异性都高于


90 % ,


预测不含

< p>
CpG


岛的启动子的


精确性相对略低。

< p>


TRRD


数据库



收录了真核基因调控区结构和基因表达方式的信息


,

< p>


个条目对应一个基因。



应用权重矩阵数据库搜索转录因子结合部位的程序包括



SIGNAL SCAN


MatInspector


转录因子搜索程序


( transcriptional factor search ,


TF2 SEARCH )


等等。尽管基于


PWM


的搜索比较敏 感


,


但它最大的缺点就是假阳性率


过高


,


在预测的结果中有很多结合部位并不真正具有生物学功能。< /p>



COMPEL


数据库



经实验确定的复合元件不多


,COMPEL


数据库中收录了近


200


条经实


验确定的复合元件的信息。


如果转录因子结合部位的预测结果中包含 复


合元件


,


显然比单个元件更有可能具 有生物学功能。


Co - Bind


程序通过


建立两个转录因子结合部位的


PWM


及其复合作用的 模型


,


可以预测序


列中的复合元件。还 有一些程序利用


COMPEL


数据库中已知的复合元


件去搜索基因组序列。



Consensus


AlignACE


等是用来搜索高含量基序


(overrepresented motif finding)


的一些算法


,



以对一组基因簇中的基因调控区进行比较


,


以发现其中存在的高含量的


基序


,


调控元件可能就存在于这些基序之中。




UCSC


查找可能的启动子



1


、进入网站






2



点击


Tables


菜单,



position


后面的搜 索框内写入待查的基因名称,


点击


getoutput





3



出现一系列候选序列。


当搜索用词不特异的时候会 出来太多的结果,


只显示


500


条。< /p>




4



点击自己目的基因的结果链接,


会出现该基因在染色体上的位置



(



时候会直接跳 到选择


genome



protein



mRNA


那一页面,可能是在搜


索词比较特异的情况写


)


,继续

< p>
getoutput





5


、选择


genome


这一项。




6



promoter/upstream


前面的框中 打勾,一般的启动子长度大约为


2kb


左右,这个数字可以修改 。为便于观察,可继续修改下面的几个选项。


这里选择


CDS< /p>


大写。


-


-


-


-


-


-


-


-



本文更新与2021-02-27 21:40,由作者提供,不代表本网站立场,转载请注明出处:https://www.bjmy2z.cn/gaokao/676228.html

UCSC-操作步骤的相关文章