-
认为
RNA
仅是
DNA
与蛋白质之间的过渡的时代已经终结,
microRNA
的发现使科研
界再次聚焦
RNA
。
microRNA(miRNA)
是一类长
22 nt
左右的内源非编码小
RNA
,广泛存在于动物、植物
和病毒等物种中。
1993
年,
Lee
< br>等人首先在秀丽线虫体内发现了首个
miRNA lin-4
,进一步
研究表明,
lin-4 RNA
< br>通过与
lin-14
基因
3′
UTR
特异性结合降低
LIN-14
蛋
白的表达水平。
miRNA
基因通常位于基因间或内含子区域,
由
RNA
聚合酶Ⅱ转录产生
pri-
miRNA
,
pri-
miRNA
具有帽子结构和多聚腺苷酸尾巴,
pri-miRN
A
在核酸酶
Drosha
作用下切割生
成
70nt
左右的
pre-miRNA
,
核酸酶
Dicer
< br>切割
pre-miRNA
最终生成
22nt
左右的
miRNA
单链分<
/p>
子。
成熟的
miRNA
< br>分子与
Argonaute
等蛋白形成
< br>RNA
诱导的沉默复合体
(RISC)
< br>抑制靶基因
表达。
miRNA
通过与靶基因
mRNA
部分互补配对在
转录后水平抑制靶基因表达,
研究表明,
miRNA
参与包括细胞增殖、
凋亡、
分化、
代谢、
发育和肿瘤转移等各种生物学过程。
但
miRNAs
与其靶基因并非完全匹配,这给确定
miRNA
靶基因带来难度。科研人员通过分析已知
miRN
A
及其靶基因,发现如下重要特征:靶基因
3′
UTR
区具有与
miRNA 5′
端至
少
7
个连
续核苷酸的完全配对区域
p>
(2-8nt)
,
miRNA
的该部分序列称为
“
种子
”
序列,
mRNA
与
miRNA
种子序列互补的区域在物种中经常具有保守性。研究人员根据对
miRNA
及其靶
mRNA
特
征的认识,开发了相应的计算机软件推断
miRNA
p>
的靶基因。下文对
miRNA
靶基因预测软
件做几个简要的介绍。
一般用于
p>
miRNA
靶基因预测的软件遵循如下几个原理:
< br>
1
序列互补性
位于
miRNA 5′
端所谓种子序列
(
第
2-7nt)
与靶基因
3′
UTR
可形成
Watson-Crick
配对是
所有
miRNA
靶基因预测的
最重要因素。配对包括如图所示几种形式:
多数情况下为
p>
7nt
匹配:第
2-7nt
与靶基因呈互补配对,外加在靶基因对应
miRNA
第
一位核苷酸处为
A(7mer-1A site)
,或是
miRNA
第
2-8
nt
与靶基因完全配对
(
7mer-m
8 site)
;
而对于
miRNA<
/p>
第
2-8nt
与靶基因完全配对,且外加
靶基因对应
miRNA
第一位核苷酸处为
A
(
8mer site
)
这种类型,其特异性更高;而对于仅
miRNA
第
2-7
核苷酸与靶基因完全配对
(<
/p>
6mer site
)
这种方式,其用于
搜索靶基因的敏感性更高,但特异性相应下降。另外,还有种
子序列外的
3’ supplementary site
和
3’
complementary site
两种形式。
2
序列保守性及其它因素
除了序列互补
性外,靶基因预测较关注的还包括序列保守性、热动力学因素、位点的
可结合性
(
accessibility
)
和
UTR
碱基分布等多个因素。
序列保守性:
miRNA
结合位
点在多个物种之间如果具有保守性,则该位点更可能为
miRNA
的靶位点。
热动力学因素:
miR
NA:target
对形成的自由能,自由能越低,其可能性越大。
位点的可结合性
(
access
ibility)
:
mRNA
的二级结
构影响与
miRNA
的结合形成双链结构
的能力。
UTR
碱基分布:
miRNA
结合位点在
UTR
区的位置和相应位置的碱基分布同样影响
miRNA
与
靶基因位点的结合和
RISC
的效率。
另外,
诸如
miRNA
的分布与靶基因组织分布的相关性也是在做靶基因预测时要考虑的
重要因素。<
/p>
用于
miRNA
靶基因预测的软件种类较多,
包括
miRanda,
EMBL, PicTar, TargetScan(S),
DIANA-
microT 3.0, PITA, ElMMo, rna22, GenMiR++, TarBase,
miRBase, miRGen-Targets
等。
软件侧
重点不同,
预测能力可谓各有千秋。
选择靶基因预测软件时可以
重点选取两个,
辅助
添加一两个。
一般
而言,
不同软件的预测交集具有更好的特异性。
下面列出几个较
常用软件
及其出处,应用软件可登陆相应网站,了解其特性及其细节,可参看相应文献:
预测软件
miRBase
,
为最常用
miRNA
数
据库,
其靶基因预测功能现在已交
microCosm(EBI
),
关于
miRBase
请参考:
p>
Griffiths-Jones S, Grocock
RJ, van Dongen S, Bateman A, Enright AJ. 2006.
miRBase:
microRNA sequences, targets
and gene nomenclature. Nucleic Acids Res.
34:D140-4.
Abstract: The miRBase
database aims to provide integrated interfaces to
comprehensive
microRNA sequence data,
annotation and predicted gene targets. miRBase
takes over
functionality from the
microRNA Registry and fulfils three main roles:
the miRBase Registry acts
as an
independent arbiter of microRNA gene nomenclature,
assigning names prior to publication
of
novel miRNA sequences. miRBase Sequences is the
primary online repository for miRNA
sequence data and annotation. miRBase
Targets is a comprehensive new database of
predicted
miRNA target genes. miRBase
is available at /.
TargetScan
由
Lewis
等人开发,请参考:
Lewis, B.P., Shih, I.H., Jones-Rhoades,
M.W., Bartel, D.P., Burge, C.B. 2003. Prediction
of
mammalian microRNA targets. Cell.
115, 787-798.
Abstract: MicroRNAs
(miRNAs) can play important gene regulatory roles
in nematodes, insects,
and plants by
base-pairing to mRNAs to specify
posttranscriptional repression of these messages.
However, the mRNAs regulated by
vertebrate miRNAs are all unknown. Here we predict
more
than 400 regulatory target genes
for the conserved vertebrate miRNAs by identifying
mRNAs
with conserved pairing to the 5’
region of the miRNA and evaluating the number and
quality of
these complementary sites.
Rigorous tests using shuffled miRNA controls
supported a majority of
these
predictions, with the fraction of false positives
estimated at 31% for targets identified in
human, mouse, and rat and 22% for
targets identified in pufferfish as well as
mammals. Eleven
predicted targets (out
of 15 tested) were supported experimentally using
a HeLa cell reporter
system. The
predicted regulatory targets of mammalian miRNAs
were enriched for genes involved
in
transcriptional regulation but also encompassed an
unexpectedly broad range of other functions.
PicTar
由
Krek
等人开发,有关
PicTar
情况请参考:
-
-
-
-
-
-
-
-
-
上一篇:脑控技术的秘密发展史
下一篇:老外聊天缩写