-
如何寻找
miRNA
靶基因?
microRNA
(
miRNA
)是一类能够调节基因表达的短单链內源非编
码
RNA
(约
22nt
p>
)
,通过与互补的
mRNA
选择性地结合抑制蛋白的产
生,广泛存在于动物、植物、病毒等多种有机体中。
miRNA
通常位于基因间或者内含
子区域,在细胞核内有
RNA
聚
合酶Ⅱ
转录产生具有帽子结构多聚腺苷酸尾巴的
pri-miRNA
。
在核酸
酶
Drosha
及其辅助因子<
/p>
Pasha
的作用下,
pri-miRN
A
被处理成
70
个
核苷酸组成具有茎环结构的
pre-
miRNA
,然后由
Exportin
5
等转运至
细胞质。
Dicer
p>
将
pre-miRNA
切割成约
22nt
的双链
miRNA
,
双链
miRNA
讲解形成单链的成
熟
miRNA
。
成熟
< br>miRNA
还需要与
Argonaute
蛋白等
组装形成
RNA
诱导沉
默复合体
(
RISC
)
,
RISC
作用于特异
mRN
A
的
3
’
UT
R
,
从而抑制翻译过程或者直接讲解
m
RNA
。整个过程如图所示。
尽管对
m
iRNA
功能的认识还不是非常清楚,但
miRNA
在许多生
物过程中起关键作用,包括发育、细胞分化、增殖、凋亡、肿瘤转
移
等。准确快速地预测
miRNA
靶基
因对于研究
miRNA
功能以及分析
m
iRNA
参与的生物学过程具有十分重要的意义。目前寻找
mi
RNA
靶
基因的方法主要有生物信息学以及生物实验方法。
p>
1
、生物信息学方法
生物信息学方法主要是利用某种算法对靶基因样本进行评分及
筛选。
生物信息学的方法只是通过算法为研究人员提供可能性最大的
参考信息,还
需要通过实验进行验证。
使用计算机预测植物
miRNA
靶基因比较简单,因为在植物中
miRNA
与靶基因几乎还是以完全互补配对的方式结合,
预测不需要复<
/p>
杂的算法。而预测动物
miRNA
靶基因
则存在一定的困难,主要是目
前已知的
miRNA
靶基因及其确切靶点不多,在算法编写时没有足够
的已知样本可供参考。
p>
但是,
miRNA
与靶基因间的相互作用仍
然具有
一定的规律性。目前常规的算法主要遵循以下几个常用原则:
(
a
)
miRNA
与靶基因的互补性;
(
b
)<
/p>
miRNA
靶位点在不同物种之间的保守
性;
(
c
)
m
iRNA-mRNA
双链之间的热稳定性;
(
< br>d
)
miRNA
靶位点不会
p>
有复杂的二级结构;
(
e
< br>)
miRNA
5
’
端于靶基因的结合能力强于
3
’
< br>端。
除了这些基本原则以外,
不同的预测方法还会根据各
自总结的规律对
算法进行限制和优化。
(
1
)
miRanda
p>
miRanda
是最早利用生物信息学对
m
iRNA
靶基因进行预测的软
p>
件,由
Enright
等人
[1]
于
2003
年开发设计
。其对
3
’
UTR
的筛选依据主
要是从序列匹配、
miRNA
与
mRNA
双链的热稳定性以及靶位点的保守
性三个方面进行分析。综合这
3
条原则,
miRanda
选取每条
miRNA
相对的
3
’
UTR
p>
中排名前十位的基因,作为
miRNA
的候
选靶基因,对
于多个
miRNA
对应于
同一靶位点的情况,
miRanda
使用贪心算法
(
Greedy Algorithm
)选取其中得
分最高且自由能最低的那一对。
[2]
(
2
)
TargetScan
和
TargetScanS
TargetS
can
是
Lewis
等人
[3]
在
2003
年开发的
一款用于预测哺乳动
物
miRNA
靶基
因的软件,该软件将
RNA
间相互作用的热力学模型与
序列比对分析相结合,预测不同物种间保守的
miRNA
结合位点。
TargetScan
还引入了信号噪声比
来评估预测结果的准确度,所谓信号
噪声比即用已知(信号组)和随机生成的
miRNA
(噪声组)分别对
mRNA
的
3
’
UTR
进行预测,所得靶基因数目的比值。随着物种数目的
增多,预测得到的靶基
因减少,但准确性得到了相应的提高。
后来,
Lewis
等人
[4]
又对<
/p>
TargetScan
进行了优化,
即<
/p>
TargetScanS
。
Target
ScanS
在人、小鼠、大鼠的基础上增加了狗(
Canis
familiaris
)
和鸡(
Gallus
gallus
)的基因组数据,同时在算法上做了改动。
p>
(
3
)
RNAhy
brid
RNAhybrid
是
Re
hmsmeier
等人
[5]
在
2004
年开发的一种基于分析
miRNA<
/p>
和靶基因间形成双链的二级结构,从而预测
miRNA
靶基因的
软件。
RNAhybrid
在实质上是一种经典
RNA
二级结构预测软件的扩展
,
能够快速、
准确地计算一条短链
RN
A
和一条长链
RNA
杂交
(如
miRNA
和
mRNA 3
’
UTR
)时的自由能,并基于此来预测果蝇中
miRNA<
/p>
的靶基
因。
RNAhybrid
的算法禁止分子内、
miRNA
分子间及靶基
因间形成二
聚体,根据
miRNA
和靶
基因之间结合自由能探测最佳的靶位点。
(
< br>4
)
DIANA-microT
DIANA-microT
是
Kiri
akidou
[6]
等人于
2004<
/p>
年开发的一款结合了
生物信息学和实验学方法的靶基因预测软件。
DIANA-microT
主要考虑
单
一结合位点的
miRNA
靶基因。
此外
在寻找结合位点时,
除了必需的
5
’<
/p>
端种子区外,典型的中央突起以及
miRNA
在
3
’
端与
mRNA
的结合也得到
了考虑。在算法方面,
DIANA-microT
主要基于以下两点原则对
m
iRNA
靶基因进行判断:
首先,
通过
动态规划算法计算经典的
Watson-Crick
碱基对及<
/p>
G
:
U
错配的自
由能,
进而衡量
miRNA
与靶基因间
的结合能力;
其次,
miRNA
相关蛋
白影响
miRNA
与靶基因结合时形成的中央突起的大
小与位置,进而影响
miRNA
与靶基因的结合
。
(
5
)<
/p>
PicTar
Krek
等人
[7]
在
2005
年采用
一种更先进的算法来预测脊椎动物、线
虫和果蝇中
miRNA<
/p>
的靶基因,并通过实验方法进行了验证,这种算法
就是
PicTar
,即组合靶位点的概率识别
(pro
babilistic
identification of
combinations of target sites)
。
PicTar
的算
法包括两个方面
:
识别单个
miRNA
的靶位点;
p>
为组合的靶位点评分。
通
过生物信息学和实
验方法的分析,
PicTar
算法估计会有
30%
左右的假
阳性率。
(
6
)
RNA22
RNA22
是由
Miranda
等人
[8]
p>
于
2006
年开发的一种识别
miRNA
靶位点
以及相应
miRNA-mRNA
异源双链的软件。
RNA22
与其他
miRNA
靶基因预测
软件不同。首先,
RNA22
的预测不依赖于物种间的保守
性,而是认为
即使近亲物种不存在
miRNA
< br>结合位点,
仍有可能是
miRNA
的靶基因;
其
次,
RNA22
与其他软件的预测方向不同,
RNA22
不是
从
miRNA
入手寻找
它的靶基因,而
是首先从感兴趣的序列入手,寻找假定的
miRNA
结合
位点,再进一步确定其被哪条
miRNA
调控
。
动物中
miRNA
靶基因预测方法
预测方法
miRanda
TargetScan/Tar
getScanS
RNAhybrid
DIANA-microT
PicTar
RNA22
网址
/
/
-
/rnahybrid/
/
/
.c
om/
检索范围
人,果蝇,
斑马鱼
人,小鼠,
大鼠,狗
哺乳动物
人,小鼠,
大鼠,
果蝇
脊椎动物
哺乳动物
算法特点
序列匹配
,
双链结合自由能
,
物种
间保守性
提出
“miRNA
种子区
”
的概念
快速准确计算
miRNA-
mRNA
二聚体
自由能
考虑
miRNA
调控单个靶位点的情况
区分
“
完全匹配种子区<
/p>
”
与
“
不完全匹
配种子区
”
不考虑保守性
,
由
< br>mRNA
入手预测
相关
miRN
A
上述不同算法各有其特点,主要还是依据
miRNA
与其靶位点的互
补性、
miRNA
靶位点的保守性、
miRNA-mRNA
双链之间
的热稳定性及附
近序列的二级结构等原则设计的。其中,
miR
anda
是将
miRNA-mRNA
之
间的序列匹配,
保守性及热稳定性作为计算参数,
有比较好的检出率,
但是假阳性率也较高;
Targ
etScan
提出了“种子区”的概念,增加了
预测的精确度;
RNAhybrid
的研究重点在
RN
A
二级结构预测方面,
能够
更快速准确
地计算
miRNA-
mRNA
双链的自由能,降低了假阳性率;
DIANA-mic
roT
则主要考虑
miRNA
调控单个
靶基因的情况,同时考虑中
-
-
-
-
-
-
-
-
-
上一篇:顾客接待的三个阶段
下一篇:启动子生物信息学分析软件