-
microRNA
靶基因预测算法概述
从《科学》杂志公布
2007
十大科技进展(
)
看
p>
,miRNA
这个
2002
年的
明星分子
记得
92
还是
96
年也有个明星分子
仍将成为今后一段时间内生物医
学领域的研究热点。
现越
来越多的
<
/p>
医务工作者、基础医学工作开始关注
miRNA
< br>潜在的临床应用,但
miRNA
靶基因
< br>实验证实现还没有统一规范的操作方案,大多仍依赖于计算预测的方法,现就
<
/p>
目前常用的
miRNA
靶基因预测算法归
纳如下:
1.
第一代靶基因预测软件
1.1 miRanda
miRanda
是
John
等
[12]
于
2003
年
5
月开发的第一个
miRNA
< br>靶基因预测软件。
miRanda
适用
< br>范围广泛(见表
1
)
,不受物种
限制,同时提供了
windows, linux,
和
macintosh
多平台版本,
可以下载到
本地运行。碱基互补方面,
miRanda
算法和
Smith-Waterman
算法
[13]
相似,但它
以碱基互补(如
A=U,
G≡C
等)代替
Smith-Wate
rman
算法中的碱基匹配
(
如
A-A,U-U
等
)
来
构建打分矩阵,允许
G=U
错配,
为了体现
miRNA 3’
端和
5’<
/p>
端和靶基因作用过程中的不对称
性,软件给出了
< br>scale
参数(
5’
端
11
个碱基得分值乘以该值,然后和
3’
p>
端
11
个碱基得
分值
相加作为碱基互补得分)
。同时强调
miRNA
第
2
到
< br>4
位碱基和靶基因精确互补,第
3
到
12
位碱基和靶基因错配不得多于
5
个,
9
到
L
- 5
(
L
为
miRNA
总长)位碱基至少一个错配,最
后
< br>5
个碱基错配不得多于两个。在热力学方面,
miRan
da
利用维也纳软件包中的
RNA
二级
结构程序包
RNAlib
(
Vienna 1.3
RNA secondary structure programming library
)评估
miRNA-
靶基因二聚体的结合能,对于潜在
的杂交位点,
miRanda
也给予打分。靶位点的跨物种保守
性,要求靶位点在多物种
3’UTR
比
对中相同位置碱基相同。对于多个
miRNA
对应于同一靶
p>
位点的情况,
miRanda
使用贪婪算法
贪心算法取得分最高且自由能最低的那对。
1.2
DIANA-microT
DIANA-
microT
是
Kiriakidou
M
等
[14]
基
于实验和计算生物学方法开发的
miRNA
靶基因预
测软件。和
miRanda
预测结果中可能出现一个
miRNA
对应多个靶位点或
多个
miRNA
对应
一个靶位
点而丢掉了
miRNA
调控单个靶位点不同的是,
DIANA-microT
考虑了
miRNA
调
控单个靶位点的情况。<
/p>
DIANA-
microT
预测算法基于以
下两点
来判别
miRNA
靶基因:①
miRNA
和靶基因间的高亲和力,主要通过结合能来衡量。②
影
响
miRNA
和靶基因所形成
二聚体茎环结构环部位
置和环大小的
miRNA
相关蛋白可能指导
miRNA
和靶基因的相互作
用。
对于前者,
DIANA-
microT
用动态规划算法计算经典的
Watson-Cri
ck
碱基配对及
G-U
错
配的自由能,开一个
38nt
的窗口扫描
mRNA
序列,通过计算
miRNA
和靶基因的自由能来
寻找靶位点。对于后者都主要
是通过实验的方法验证过滤前者预测的结果。
1.3
RNAhybrid
RNAhybrid
是
< br>Behmsmeier M
等
[15]
< br>基
于
miRNA
和靶基因二聚体二级结构开发的
miRNA
靶
基因预测软件。
RNAhybrid
预测算法
禁止分子内、
miRNA
分子间及靶基因间形成二聚体,
根
据
miRNA<
/p>
和靶基因间结合能探测最佳的靶位点。尽管随着靶基因序列长度增加,运算复杂
度也相应增加,但
RNAhybrid
和其它
p>
RNA
二级结构预测软件
诸如
mfold,
RNAfold,
RNAcofold
和
pairfol
d
相比,仍具有明显的速度优势。此外,
RNAhybrid<
/p>
允许用户自定义自
由能
阈值及
p
值,
也允许用户设置
杂交位点的偏向,
如杂交位点必须包含
miRNA 5’
端
2-7nt
等。像
miRanda
一样,
RNAhybrid
也提供有单机版供下载(见表
1
)
。
由于
RNAhybrid
实质上是经典
RNA
二级结构预测软件的扩展,
从
miRNA
和靶基因形成稳
定的二聚
体这一视角入手,
为
miRNA
靶基因
预测开辟了新的天地。
但
Behmsmeier M
通过用
RNAhybrid
扫描果蝇
3’UTR
发现,
RNAhybrid
仅能预测到少数的
miRNA
靶基因,这个可能
p>
与
miRNA
长度较短,而所用
3’UTR
数据集较大有关,然而由于它不需要考虑靶基因的物种
保守性,仍然有自己的优势。