-
拼起来的课程论文
主干部分忘了是哪个高人写的了
- -
高等真核生物中重叠基因研究进展
〔摘要〕
基因重叠是高等真核生物中
一种普遍存在的基因组排现象.综述了高等真核生物中的
重叠基因的分类、数量、互补或
自然反义转录本(NATs)可能的生物特性和功能及重叠基因与人
类疾病的关系.
p>
〔关键词〕
真
核生物;重叠基因;反义转录本;双链RNA(dsRNA);基因调控
真核生物的细胞内含有成形的细胞核,因此以真核来命名这一类细胞。许多真核细胞中还含有其
它细胞器,如线粒体、叶绿体、高尔基体等,是所有单细胞或多细胞的、其细胞具有细胞核的生
物的
总称,它包括所有动物、植物、真菌和其他具有由膜包裹着的复杂亚细胞结构的生物
。[1]
重叠基因是指两个或两个以上的基因共有一段DNA
序列,或指一段DNA序列为两个或两个以
上基因的组成部分.
1976年在噬菌体
Φ
Χ
174中第一
次发现重叠基因
[
2
]
.
这种单链噬菌体中,
相同的DNA序列通过不同的阅
读框被识别,产生不同的多肽.随后的几年中,在病毒和原核生物基
因组中又发现了几对
具有不同互补编排的重叠基因.在
Φ
Χ
174中发现基因重叠10年后,真核生
物(果蝇和小鼠)中也发现了转录引起的重叠单
位,植物中也鉴定出一些重叠基因.由于新基因对是
在研究特殊位点时偶然发现的,重叠
基因对的增长相对稳定而缓慢.同时,仅有能够产生自然反义转
录本(NATs,Nat
ural
Antisense
p>
Transcripts)的少数基因对
被进一步研究并确定其特性
.
由于数据库和查找标准不同,真核生物重叠基因出现的频率
约为:人类基因组中4%~9%,鼠
类基因组中1.7%~14%,蝇类基因组中达到2
2%,重叠长度从20到3
400bp,平均
为372bp.重叠基因在真核生物中普遍存在并已有很多报道,但直到最近它的重要性才被认识
到.笔者从高等真核生物重叠基因在分类、数量、NATs可能的生物特性和功能,以及这些基
因与
人类疾病等几方面进行阐述.
1
重叠基因的种类和数量
重叠基因(
everlapping gene
):指两个或两个以上的结构基因共同一段
DNA
顺序
的现象重叠基
因原核生物和一些病毒或噬菌体的基因组比较小,核苷酸对是极其有限的,
那么怎样有效地利用这些
有限碱基来编码更多的遗传信息呢?在生物中存在着一种十分巧
妙的机制——重叠基因
(overlapping gene
)
。重叠基因中不仅有编码序列也有调控序列,说明基因的重叠不仅是为了节约碱
基,能经济和有效地利用
DNA
遗传信息量,
更重要的可能是参与对基因的调控
.
[
23
]划分重叠基因
可以有不同的标准,包括基因方向(如尾
对尾、头对头)、重叠区域(5′UTR,3′UTR,编
码区,内含子)和重叠程度(
全部或部分).根据基因相互的组织编排方式,庞大的重叠基因家族可
被分成3种主要类
型(图1):第一,反向排列,即反方向的基因转录而来.它们可以是会聚的(两
条链的
3′端交汇),也可以是分离的(两条链的5′端交汇);第二,同向排列,由同一条DNA
链上的基因编码而来;第三,嵌套排列,即一基因完全位于同向或是反向的另一基因的内含子之中
< p>.
从果蝇(Drosophila)常染色质基因组的资料来看,反向重
叠基因是最具代表性的类
型,大约15%(2
054)的基因含有反向重叠的mRNAs,7.5%(1
<
/p>
038)是嵌套
模式,同向重叠基因较少.
1.1
反向排列
已知的重叠基因大部分都是
相反方向两条链的反向重叠基因.一般地,重叠位点位于5′或3′
端非编码基因序列,
例如UTRs,
内含子和启动子元件的末端区域,
同时重叠区域也包括编码区.
基
因反向排列可能会形
成反义RNA,通过形成双链RNA,反向重叠基因参与各种生物学过程,包括
转录、R
NA编辑、mRNA剪接、稳定性和翻译[
3
].
1.1.1
会聚型
各种生物信息学分析结果均表
明,会聚型反向重叠模式
(即头对头)是最普遍的一种[
4
p>
].人类
基因AB-HD1和Sec12在3′端重叠,这段42b
p的保守序列为它们均提供多聚腺苷化信
号
[
< br>5
]
.
在MKRN2/RAF1
、
Nab2/Stat6和MARS/DDIT3汇聚型基因对中
[
6
]
,
3
′UTRs重叠形成的RNA-RNA双链,
通过掩蔽富含AU的元件,
可调节转录本的稳
定性.3′端重叠还可以干扰基因的剪接,在蟾蜍、小鸡和人
类中有一对保守的重叠基因,FGF2
和NUDT6,它们是会聚型重叠基因参与转录后
调控的一个典型例子.FGF2mRNAs具有多
聚A
位点,产生的转录本在3′UTR长度上有所不同,它可翻译产生5种不同生物特性的蛋白亚<
/p>
基.
FGF2较长的3′UTR
和NUDT6mRNAs的相互作用会干扰FGF2的翻译,
从而调<
/p>
控不同蛋白亚基的产生[
7
].
1.1.2
分离型
10%以上的人类基因属于分
离
型重叠基因(即尾对尾),它们与其反
方向DNA链的5′端
重叠,重叠区域
小于1kb.其中,较多的基因对共用
双向启动
子和其他调控元件,少数情况
下转录单位也出现重叠.分离型反向重
叠基因的生物功能目前还不清楚.然
而,共用5′端的基因可能会利用这种
编排,通过公共的启动子元件来使他们
协同表达.共用双向启动子的基因
具有
相同的表达模式,在一些情况下,他们
的结构或功能也相互
关联.PPAT和
PAICS是具有相似生物功能但结
构不相关
的重叠基因.这两个基因编码
脊椎动物中嘌呤核苷酸从头合成途径
中的两个酶,共用一个含有可使其协同
表达的顺式作用元件的双向启动子
[
8
].5′端重叠结构相关的基因包
括CAPN2/CAPN8和NPY
1R/NPY5R[
9
].钙蛋白酶超
家族(calpain
< br>
superf
amily)中的成员CAPN2和C<
/p>
APN8,是人类分离型反向重叠基
因,共用第一个外显子,分别
对应的是CAPN8的非编码区,CAPN2的非编码区和编码区.
1.1.3
其他
一些其他反向重叠基因不能被划
分为会聚型或分离型,他们的特征是较短的基因完全位于另一较
长的基因中,且共用内含
子和外显子序列.例如,Msx1,是颅面骨骼发育中编码mammali
an
factor的基因,其重叠基因是反义非编码RNA基因(Msx-
AS),长度横跨Ms
x1内含子1和外显子2.
Msx-AS
RNA
表
达与Msx1蛋白的合成呈负相关.
此外,
正义
和反义转录本合成水平的平衡在体内可以调节Msx1蛋白的合成,这是因为互补RNAs的互相作
p>
用可以保护Msx1防止剪接[
10
].<
/p>
1.
2
p>
同向排列同向排列的重叠基因指位于同一条DNA链上,
方向相同而
且相互重叠的基因,
已被报道数量并不多,仅有上百个.尽管通过生物信息学基因组筛选
可以查找出更多的同向排列重叠
基因,但这种类型可能是最少的一种.这也与在果蝇基因
组中观察到的比例一致.同向排列,往往是
在其终止区重叠或者一个基因完全嵌于另一基
因(包括外显子和内含子)之中.
人类基因对RABGGTA
/TGM1是平行排列但不在转录水平表现的重叠基因.重叠区域包
括TGM1的启动子
和包括3′UTR,
部分CDS的3′端RABGGTA
[1<
/p>
1
]
.
此外,<
/p>
MYO
1A/PPT-B和CAPN3/GANC是包括转录单位
的3′-5′重叠基因.一些情况下,两
个基因的编码序列均参与重叠,并由不同的阅读
框来识别.
1.3
嵌套排列
嵌套排列表示基因序列完全
位于另一较长基因的内含子之中.由于重叠区域对于其中一个基因仅
限于内含子,
因此将不会出现重叠的mRNAs.
在果蝇中,
这种类型占7.
5%.
其中有大约85%
的基因可以编码蛋白质.此外,大多数的嵌套基因相对于寄主基因是反向排列.
2
反义转录本的生物功能
生物基因组中
不在同一位点的基因,
其mRNA有互补重叠的现象称为互补或自然反义转录本.
I
nouye和Delihas
[1
2
]
已报道原核生物中的互补转录本的存在有很
多作用.
虽然真核生
物反义RNAs相对正义RNAs的作用还
未明确确定,但研究已表明,它们可能在基因表达的多个
水平发挥作用,例如转录、mR
NA加工、剪接、稳定性、运输和翻译.互补转录本一般不会编码蛋
白质,而是与被调控
基因杂交从而调控其表达.目前,3种可能的机理可用于解释这些转录本如何调
控基因的
表达,分别是:转录水平的干扰、RNA
masking和双链RNA依赖的机理.
2.1
转录水平的干扰RNA聚合酶
Ⅱ催化的转录需要双链DNA的解螺旋和大分子蛋白复合
物的参与互相重叠的转录单位,
不论是否共用外显子,都不大可能同时开始转录.通过对酿酒酵母中
GAL10和GAL
7基因重排的研究
[1
3
]
,
发现当两基因排列方向相向,
且不重叠时,
p>
二者转录
均为正常水平;但若二者发生重叠,则转录减弱.此外,编
码人类eIF2alpha蛋白的基因与
一反义RNA相关,
且
正义和反义RNA的转录过程也是负相关的
[1
4
]
.
这些资料表明顺式自然反
义转录本(cis-NAT)的表达受到竞争性转录水平干扰的调控.然而,在其他一些位点,正义
和反义转录也不是总是互相排斥制约的.例如,组氨酰-tRNA合成酶基因与其反义基因HO3,
目前虽然还不清楚转录水平的干扰是否存在,但它们却在不同的器官中表达.P5cr和
Prp18
是果蝇中3′端重叠两个基因[1
5
],它们都具有“持家”(housekeeping)功能,
说
明转录本虽然互补但并没有表现出干扰.
2.2
RNA
masking
正义和反义RNA形
成的双链体可能会掩蔽一些作用于RNA的调控信号,并且阻止反式作用因
子的结合.甲
状腺激素受体基因c-erbAlpha(THRA)以尾对尾的方式与RevErb
(
NR1D1)重叠.c-erbAlpha基因有2个亚型,alpha2亚型的表达会受到互补
的RevErb
mRNA
反义干扰的负调控[1
6
].这说明由
于阻止了顺式调控元件的结合,反
义RNA特异性抑制了mRNA
的可变剪接
.
2.3
dsRNA依赖(dsRNA-depend
en
t)的机理和RNA干扰(RNA
interference
)研究表明,重叠基因的相互作
用可以通过dsRNA依赖的途径来影响基因表达,
p>
包括RNA编辑或依赖RNA干扰的基因沉默.
正
< br>义和反义RNA
可能形成dsRNA,较长的双链区域可能通过RNA
编辑被修饰.Kimelm
an和Kirschner
[1
7
]
描述了编码非洲蟾蜍
(Xenopus)
生长因子bFGF基因与
< br>其反义链形成尾对尾的互补转录本.这个反义基因NUDT6也编码一个蛋白,但同时直接影响正义
RNA,可将部分腺嘌呤残基转换为次黄嘌呤核苷,从而改变正义RNA的信息,导致RNAs
的快
速降解.此外,dsRNAs可能会通过RNA干扰机理被消化成21-23bp的
小片段(sma
ll
interfering
RNAs,
siRNAs).siRNAs可以识别mRNA长链
上的同源区域,并将其特异性降解
.对于果蝇Stellate家族(一种酪蛋白激酶Ⅱ)重复基因
的研究可以说明正义反
义RNA可以通过RNAi依赖机理导致基因沉默.脊椎动物内源NATs是