-
Alu
元件研究进展
摘
要:
Al
u
序列是灵长类动物特有的且最重要的短散在元件,
在基因组中
约有
120
万份拷贝,
占基因组
11%
以上。这一基因家族曾被认为是垃圾序列,但随着对
Alu
序列研究的深入,
Alu
< br>在基因调控表达网络中的
功能逐渐被发现,
Alu
与人类的疾病密切相关,并且可能影响人类衰老,在人类多样性中也发挥重要作用,
根据
Alu
序列发展起来的多种技术,为
Alu
相关的医学遗传学研究提供了重要帮助。
关键词:
Alu
元件
< br>;
基因调控
;
疾病机制
;
遗传;分析技术
The progress in Alu elements research
Abstract:
Alu
elements are
the most important short interspersed elements
(SINEs) in primates, having a copy
number in excess of
1.2
million in the human
genome. Alu contributes almost 11% of the human
genome in size.
They were considered
as “junk DNA”,
but their
functions in gene regulation and expression have
been found in
recent years. Alu
families are
also associated with
human’s diseases, aging
, and genetic
diversity. Quite a few new
technologies
targeting Alu elements have important impact on
the research and clinical practice of biomedicine.
Keywords:
Alu
elements
;
gene
regulation
;
disease mechanism
s
;
genetics
;
analysis techniques
?
Alu
家族是灵长类动物特有的且最
重要的短散在元件
(short interspersed
elements, SINEs)
,经过长达
6500
万年的进化,
Alu
序列在基因组中已经累积到约
120
万份拷贝,占基因组的
p>
11%
以上。
Alu
序列的结构由左右两个单体组成,右侧
单体比左侧单体长
31
bp
,每个单体含有一个
RNA
聚合酶
Ⅲ启动子序列,然而只
有左单体中的启动子才具有活性。
Alu
元件没有转录终止子,转录终止是使用一
个附近基因的
TTTT
终止序列
[1]
。
Alu
序列的两翼存在长为
7~2
0 bp
的正向重复序
列。
在
Alu
序列的
3’
端存
在一个长几十
bp
的
poly(A),
它在
Alu
的复制中起到了关键
的作用。
在两单体之间有一个富含
A
的区域,同时
Alu
序列中还存在较多的
CpG
二联核苷
[
2
]
。
Alu
序
列的
25bp
区
(
第
23
位到
47
< br>位
)
和
16bp
区
(
第
245
位到
260
位
)
是高度
保守区。
Alu
序列
拷贝的平均间隔约
4 kb
[
3
]
。典型的
Alu
的
结构如图
1
所示。
图
1
p>
:典型的
Alu
结构
划直线为
A
富含区,方框中为右单
体存在而左单体不存在的
31bp
。
Alu
家族通过反转录转座机制扩增
,
哺乳动物反转录转座子有
3
种类型<
/p>
:
病毒
超家族,长散在元件
(long
interspersed elements, LINEs)
和不编码功能蛋白质的
非
病毒超家族。
Alu
家族属于非病毒
超家族的
SINEs
,
复制机制是非自
发的,需要
依赖唯一自发的人类逆转录元件家族
LINE-1<
/p>
的逆转录酶和其生成的反式作用因
子来完成复制
< br>,
可能的机制是首先由
RNA
聚
合酶Ⅲ转录产生
Alu RNAs,
这些
RNAs
与信号识别颗粒
SRP<
/p>
(
signal recognition particle<
/p>
)
9/14
异质二聚体和
poly(A)
结合蛋白(
PABP
< br>)组装成核糖核蛋白颗粒,并且与至少一个未知蛋白结合(如
图
< br>2
)
。
LINE-1
翻译生成的开放阅读框
2
蛋白
(
open reading frame 2 protein,ORF2p
p>
)
可能与核糖体某一处相连,
然后
SRP9/14
蛋白和
PABP
帮助
Alu
RNA
与该核糖体相
结合,最后
Alu
RNA
利用
ORF2p
进行逆转录完成
复制
[1,4]
。
Alu
元件的反转录转座
机制会介导基因组
DNA
序列的缺失,可能在灵长类动物的进化过程中起到了重
要作用
[5]
。
图
2
:
Alu
RNA
与
SRP9/14
和
PABP
组装成的核糖核蛋白颗粒
蓝色实线为
Alu RNA,
“
p>
?
”
处为与
RNA
结构结合的未知蛋白。
1.
Alu
元件与基因调控
1.1
Alu
元件与转录前基因调控
Alu
序列富含
CpG
二核苷酸,这为人类基
因组提供了甲基化位点,与基因组
大概
25%
< br>的甲基化相关
[
6
]
,
较年轻的
Alu
元件中
甲基化的密度更高
。
Alu
元件在不<
/p>
同组织中甲基化程度不同,而且似乎在肿瘤中会减少。已经证实
A
lu
元件似乎是
新的
CpG
二联核苷
的来源,并且影响附近基因的调控。而
G
C
富含区较其他区域
更易启动
DNA<
/p>
复制
,
故
Al
u
序列富含区容易启动
DNA
复制
p>
[
7
]
。
Alu
元件也能与许多转录因子的结合来达到
调控基因的目的。有些结合区域
是与特定的
Alu
亚科对应的,
有些在
Alu
元件插入发生后会有所增强。
已发现了几
十种转录结合因子与<
/p>
Alu
元件结合发生作用,例如核受体家族,
细胞核因子酉乙
蛋白
(
nucle
ar factor
Κ
B,
NF-k
appaB)
和
p53
。
Bolotin
等
[
8
p>
]
发现,
肝细胞核因子
4
α
(
hepatocyte
nuclear factor 4
α
,
HNF4
α
)
结合序列广泛存在于<
/p>
Alu
元件中,
HNF4
α
不仅可以通过高亲和力结合区域调控基因表达,也可以通过与
Alu
元件中的低
亲和力区域来调节转录。
Cui F
等
[
9
]
发现
Alu
在构建
p53
调控网络时起到了很重要的
作用
。他们分析了目前已知的
160
种
p5
3
结合区域,发现
24
种出现在重复序
列中,
而其中的半数以上都出现在
Alu
元件中,
另外他们还在全基因组的
Alu
元件中发现
了超过
40
万个潜在的
p53
结合位点。
因此,
Alu
元件至少有一个很强的结合转录因
子的能力,
并且能在一些特定情况下影响附近基因的表达。
1.2
Alu
元件与转录后基因调控
Alu
元件可以通过
RNA
聚合酶Ⅲ转录生成
Alu RNAs
参与
Alu
元件的复制,也
可以嵌入蛋白质编码基因然后通过
RNA
聚合酶Ⅱ转录生成
不均一核
R
NA
(heterogeneous nuclear RNA, hnRNA) <
/p>
的一部分。
Alu
相关的非编码
RNAs
在转录后
过程中对基因调控发挥
重要作用
。
RNA
聚合酶Ⅲ启动子可能在
Alu
元件的开
始启动转录,并产生用来复制的
RNAs
。
每个由
RNA
聚合酶Ⅲ生成的
Al
u
RNA
都具有各自的特征,主要表现在以
< br>下三个方面:(
1
)
Alu
p>
元件自身的累积突变;(
2
)在它
3’
末端的富含
A
的<
/p>
序列
,
长度和累积序列的异质性;(
p>
3
)每个
RNA
的
独特
3’
末端是从相邻基因组位点转
录
的。
Alu RNA
能与
SRP9/1
4
结合形成
Alu RNA-
蛋白质复
合物
(
ribonucleoprotein ,
RNP
)
[10]
,
p>
通过减少翻译的始动来达到抑制翻译的目的
[11-12]
。
Alu
RNAs
能
够抑
制
RNA
聚合酶Ⅱ介导的管家基因
对热休克反应的转录表达
[13]
。在各种细胞应力
下,例如热休克或者病毒转染,
Alu
RNAs
的表达水平可能会升高,过度表达的
Alu RNAs
刺激哺乳动物细胞中共转化的报道基因翻译
[14]
< br>。
Alu RNP
和
Alu R
NA
对翻译截然相反的作用可能是由于结合
SRP9/14
p>
蛋白之后
Alu
RNA
< br>构象发生改变
造成的。
大多数
的核转录子,即
hnRNAs
在一个或者两个方向有
Alu
元件,
Alu
元件
也
通常存在于
mRNA
外显子
3’
端的非编码部分,
5%-10%
的
mRNAs
3’
端存
在
Alu
元
件。
以上的
hnRNAs
和
mRNAs<
/p>
是由
RNA
聚合酶Ⅱ转录的,
不参与
Alu
的复制过程,
但是广泛参与基因表达。
Alu
元件嵌入
hnRNAs
中可以提供多聚腺苷酸位点,
可以
构成选择性剪接的结构网,也可以形成作为
A-to-I
< br>编辑靶标的双链,最终导致剪
接
mRNA
产物的核滞留
[15]
。在
h
nRNA
内含子内合成的最初的
Alu
转录子的右臂是
被加工成代谢稳定的小分子
RNA
,即为内含子编码的
Alu
RNAs,
也叫
AluACARNAs,
被加工和包装成
Wdr79
基因相关的
H/ACA RNA-
蛋白质复合物
(
H/ACA
RNP
)
,
AluACA
RNPs
在核质中积累,
AluACA
RNAs
是
H/ACA RNAs
的一
种新型的大亚科,并且仅存在于人类和灵长类动物细胞中。这些基因间的
Alu
元件可能由还未被发现的
RNA
聚合酶Ⅱ转录,
或者是在人类基因组序列中放
错了位置
[16]
。
3’
非编码区的反向
Alu
序列可以促使
mRNA
翻译抑制和应力
颗粒积
累,突变分析显示反向
Alu
序
列的二级结构,而不是主要的核苷酸序列,起到了
抑制的关键作用
[17]
。人类基因组上少数的蛋白质编码基因大多数都会产生长非
< br>编
RNAs
(long non-coding
RNAs, LncRNAs)
,
有报道指出
< br>mRNA
的
3’
非编码区的
p>
Alu
元件与
LncRNAs
结合作用可以缩短
mRNA
的半衰期,
通过转录活化
RNA
结合蛋白
Staufen1
介导的
mRNA
降
解,从而导致基因沉默
[13]
。
<
/p>
在转录时,
两个不同方向的
Alu
序列可以产生
双链
RNA(double-
stranded RNA
,
dsRNA),
虽然细胞中存在的
dsRNA
以前被认为只存在在病毒
感染中,但是目前已
知细胞表达很多调节基因表达的内源性小
d
sRNA
,
如短干扰
RNA
(
short interfering
RNA
,
siRNA
)和小分子
RNA(
mircoRNA
,miRNA),
而由
Alu
元件构成的长
dsRNA
也有可能影响基因表达。
Capshew
等发现,人类含有反向
Alu
元件的
mRNAs
存在
于的细胞质中,这些在
3’
非编码区内存在的长双链
RNA
分子可以降低翻译效率,
虽然这些结构在体内经过大量的编辑,
例如
A-to-I
编辑
,
但是其对翻译的作用是
不受影响的
[1
8]
。
由于反向
Alu
序列存在于大于
5%
的人类蛋白质编码基因上,
因此
这些双链
RNA
结构是基因表达的重要调节因子。
另外,与转录因子一样,<
/p>
miRNA
也参与基因调控,人类基因组中的
Alu
元件
大概有
0.5%
存在于
mRNA
的
3
’
非编码区,这为高度保守的
miRNA
提供了大约
3
万
个潜在的靶点,已经
证实有一小部分
Alu
元件能与
miR
NA
结合
[19]
。
< br>Hoffman
等检
查了这些潜在
miRNA
靶标的功能,但是他们发现在
Alu
元件内的
miRNA
靶标对
miRNA
的反应比在
mRNA
不是<
/p>
Alu
元件内的相同靶标要明显小很多
[
20]
,这说明可
能
miRNA
并不主要通过
Alu
元件来调控基因表达。<
/p>
2.
Alu
元件与人类衰老
Alu
元件最近被发现可能与人类细胞的衰老密切相关。体细胞基因组的不稳
定性是造成衰老的一个重要原因。而
Alu
元件的反转录转座造
成的基因组的不稳
定性特别值得注意
[21]
< br>。
Alu
元件通过反转录转座复制
,
但是大多数的
Alu
元件都没
p>
有反转录转座活性,只有一些位点是产生新的
Alu
元件的来源。在每个细胞中有
数以千百计的
mRNA<
/p>
分子,所以有成千上万的
RNA
聚合酶Ⅱ
转录的
RNA
含有
Alu
序列。因此,细胞中只有一小部分包含
Alu
序列的
RNAs
是由
RNA
< br>聚合酶Ⅲ转录
的,这就对观察
Alu
的复制进程产生了困难。因此近年许多研究开始着手解决这
个困难,
鉴别有活性的
Alu
来源的第一步就是鉴别
RNA
聚合酶Ⅲ的转录位点。
Oler
-
-
-
-
-
-
-
-
-
上一篇:肾病各种化验正常值及临床意义(修正版)
下一篇:化验单正常值参考范围