-
1.
基因家族(
Gene
family
)
又叫多基因家族(
Multigene family
)
,系指同一生物体中,从同一祖先基因经过复制、突变
而来的一组具有相似的核苷酸序列结构、相似产物、相似功能的基因群体。从广义上讲,同一基
因家族的各个成员也可看作是重复基因。
但两者相比,
< br>基因家族不同成员之间的序列差异毕竟要
比重复序列的大一些,也就是说序列一致
性程度还是较低一些。
2.
基因簇(
Gene
cluster
)
系指原核生物基因
组中,由不同的或相关的一组相邻基因组成的一种特殊的排列组合方式。
3.
基因家族与基因簇二者的区别
<
/p>
属于同一多基因家族的各个成员,可以存在于不同的染色体上,也可以是存在于同一条染色
体上。同一基因家族成员的判断标准:
a
.多重性;
b
.紧密的连锁性;
c.
核苷酸序列同源性;
d.
相关的表型与功能。
基因簇的特点:
< br>a
.同一基因簇的不同成员,在遗传上往往是紧密连锁的;
b
.
同一基因簇的不同成员,
p>
可以是同属于同一个操纵子的不同结构基因,
也可以是属于不同
p>
操纵子的不同结构基因。
c
.
同一基因簇的不同成员,
可以是来自同一基因家族
的不同成员,
也可以是来自不同基因家
族的不同成员。
4.
基因图(
Gene map
)
:是描述染色体或
DNA
大分子上,不同基因的
排列顺序及其间隔距离的
一种线性图。
5.
基因作图
(
Gene mapping
)
:
按照遗传学的方法或者是物理学的
方法绘制基因图的过程,
叫做
基因作图。基因作图有时也叫做基
因定位。它涉及如下两个具体的内容:
a.<
/p>
其一是确定被研究的目的基因与细胞染色体之间的关系,
也就是说
将目的基因定位在某条
特定的染色体分子上。
p>
b.
其二是测定目的基因与所在染色体的其它基因之间的间隔距离,
以及它们之间的线性排列
顺序,亦即是确定目的基因在染色体上
的位置。
基因图包括遗传图和物理图两种。
< br>两者之间的本质差别在于前者表示的是以重组率为单位的基因
间的相对距离,而后
者表示的是以碱基对(
bp
)为单位的基因间的实际距离。
p>
6.
基因增加
(Gene addit
ion)
:与基因扩增概念不同,它是通过将一种或一群外源基因导入受体细
胞,从而使受体细胞中基因种类增加,用以观察并研究其功能作用的一种基因工程策略。< p>
7.
基因扩增
(Gene ampli
fication)
:
特指基因拷贝数增加的过程,包括如下<
/p>
5
种不同情况:
①在体外,应用
< br>PCR
技术和适当的引物,可使特定基因的拷贝数得到成功的扩增。②克隆,
p>
将基因插入到高拷贝数的质粒分子上,于是在体内情况下该基因的拷贝数也变的相应富裕起来
。
③一些外界环境的压力因素可以使真核细胞产生适应性反应,
从而导致相应的保卫基因发生明显
扩增。例如,高剂量的氨甲喋呤可导致二氨叶酸还原酶
基因发生扩增。④程序基因扩增。包括全
基因组扩增和选择性扩增两种模式。
前者是指通过增加细胞基因组的拷贝数,
而使特定基因的拷
贝数得以增加;后者是指因特定发育需要而偶尔增加对其产物需求量高的基因的拷贝数。例如,
非洲爪蟾在发育过程中
rRNA
基因的扩增。<
/p>
⑤进化扩增,
在生物进化过程中发生基因加倍和扩增,
结果使相关的基因在基因组上聚集成簇。
8. 5'-
侧翼序列区和
3'-
p>
侧翼序列区
(1)
5'-
侧翼序列区(
5'-flanking
sequence region)
位于<
/p>
mRNA
转录起点之前的一段长度有限的
DNA
序列区,
叫做
5'-
侧翼序列区,
或者泛称
为启动子区。在该区存在着
数种控制基因转录的信号:
a.
确定
mRNA
起点的信号
b.
决定最大转录起始速率的信号
c.
对环境刺激作出反应的信号
d.
对发育程序作出反应的信号
e.
增强子序列区
(2)
3'-
侧翼序列区(
3'-flanking
sequence region)
位于
mR
NA
转录终点之后的一段长度有限的
DNA
序列区,叫做
3'-
侧翼序列区,也叫做
< br>3'-
下游序列区。在该区存在着数种控制基因转录的信号:
a.
终止转录作用的信号
b.
mRNA3'-
末端的加工信号
c.
大多数真核基因的
3'-
末端还有一段
poly(A)
加尾信号,即多聚腺苷酸化信号
9.
前导序列区和尾随序列区
(1)
前导序列区(
leader sequence
region
)
指位于
mRNA 5'-
末端,起始密
码子之前的一段长达数百个核苷酸的不转译的
RNA
区段,也<
/p>
叫前导序列或
5'-
非转译区,简称
p>
5'-UTR
。它含有如下两种元件:
a.
核糖体结合位点(
Ribosome-binding
site ,RBS)
b.
转译起始信号
(2)
尾随序列区(
trailer
sequence region)
指位于
mRNA 3'-
末端,终止密
码子之后的一段非转译的核苷酸序列,叫做尾随序列区,也
叫做尾随序列或
3'-
非转译区,简称
3'-UTR
,其长度约为
100
个核苷酸左右,它含有一个转录终
止信号。
10.
真核基因和原核基因
真核基
因:真核细胞核基因组
DNA
编码的基因,以及感染真核细胞的
DNA
病毒和反转录
病毒基因组编码基
因,统称真核基因。
原核基因:由原核生物染色体基因组
p>
DNA
以及高等生物线粒体基因组
DNA<
/p>
和叶绿体基因
组
DNA
< br>编码的基因,都属于原核基因。
11.
真核基因与原核基因的共有组成部分
无论真核基因还
是原核基因,其结构都有如下
4
个部分:
a.
编码区(
coding
region
)
b.
非编码区(
noncoding region)
c.
启动区
(promoter region )
d.
终止区
(terminator region)
1.
编码区
(
1
)编码区的含义:在原核蛋白质编码基因的
< br>mRNA
分子中,以及在真核蛋白质编码基因的
成熟
p>
mRNA
分子中,从起始密码子(通常是
A
UG)
开始至终止密码子(
UAA,UAG
,UGA)
为止
的一段编码氨基酸的核苷酸序列,叫做编码
区,或称编码序列区。
(
2
)
不连续的编码序列区:
真核基因结构的主要特
征是,
许多真核蛋白质编码基因以及某些
tRNA
基因,它们的转录序列区都是被一种叫做间隔子(
intron)
的非编码序列所间断,形成不连续的
编码序列区。
(
3
)编码区段与读码框:
编码区与开放读码框(
open reading fram<
/p>
)在概念上是有差别的。开放读码框(
ORF)
< br>也有的
叫可读框,
是指由一系列氨基酸密码子组成的不具
有终止密码子的
DNA
序列区,
p>
或者说是可以
转译成蛋白质多肽链的一段
D
NA
序列区。它与编码区的差别在于它不包括终止密码子,而编码
区则包括终止密码子。
2.
非编码区
(
1
)
非编码区的定义:
基因中转录而不转译的核苷酸序列区。
尽管这些非编码序列区不转译成
蛋白质多肽链产物,但对基因的表达与调控却是必不可少的。
(
2
)非编
码区的类型
a.
5'-
末端非转译区(
5'-UTR)
b.
3'-
末端非转译区
(3'-UTR)
c.
间隔子序列区(真核蛋白质编码基因中存在)
3.
启动区(启动子)
(
1
p>
)启动区的定义:相应于原核的启动区(
promoter
)在真核基因中则往往译作启动子,特
指位于基因5
'-
末端上游紧邻转录起点外侧,一段具有特殊功能的非编码的核苷酸序列区。在有
关的文献中,启动区的定义似乎不那么严格,有时人们也把5
'
-
侧翼序列区泛称为启动区。从广
义的角度讲,控制基因转录的
各种信号的任何组合都可以称之为启动区。例如有人也把增强子
(
enhancer
)归为真核基因启动子的一个组成元件.
(2)
启动区的结构
原核基因启动区的结构:
a.
p>
-10元件,亦叫-10
box
或
Pribnow
box
,也可称之为
TATAAT
box
;
b.
-35元件,也叫做-35
box
,或TTGACA
box
。
真核基因启动子的结构:
a.
-25元件,亦叫TATA盒;
b.
上游激活元件:GC
box
和CAAT
box
。
(3)
启动区的类型:根据识别启动子的RNA聚合酶的类别
,可将真核启动子分成三种不同
的类型:
a.
I型启动子
b.
Ⅱ型启动子
c.
Ⅲ型启动子
4.
终止区
(1)终止区的定义:
(
terminator
region
)也叫做终止序列,一般特指位于原核生物操纵子
3
'-
末端,也是转录单位3'
-
末端转录终止位点之后的一段DNA序列,其功能是为RNA聚合<
/p>
酶提供转录终止信号。
终止子(
terminator
p>
)
,也叫做转录终止子或终止序列,是指位于真核基因3'
-
末端下游外侧
与转录终止位点相连的一段非编
码的核苷酸序列区。
它具有使RNA转录反应终止的转录终止信
号的功能。
(
2
)终止区的意义(功能)
:
a.
保证基因的转录反应在正确的位置终止;
b.
产生正确长度的mRNA分子;
c.
产生正确的蛋白质多肽链;
d.
避免产生通读现象。
12.
原核基因组的结构
(
1
)大肠杆菌基因组的组成:染色体基因组;
质粒基因组;噬菌体基因组。
(
2<
/p>
)大肠杆菌基因组的结构特点
(
有
4
点
)
:
*
1.高效的遗传信息利用率
a.
既没有不必要的额外重复序列,也极少存在无功能的冗余序列;
b.
基因组98%以上的核苷酸序列都是编码基因
c.
基因排列紧凑,
同一个操纵子不
同基因之间的间隔距离一般不超过
20
bp
,
而
且其中还存在着转录起始信
号和终止信号;
d.
存在着编码序列彼此重叠、编码不同蛋白质的重叠基因
*2.
双链DNA的编码功能
关于正义链和反义链的划分,文献中有两种不同的意见:
早期文献:
a.
< br>转录RNA转录本的模板链,叫做正义链,也叫做有义链或编码链,简称(+)链。
b.
与正义链互补的DNA链,叫做反义链,也叫无义链
或非编码链,简称(-)链。
现在的文献:
a.
双链DNA分子中转录RNA转录本的模板链,叫做反义链或非编码链,简称(-)链。
b.
双链DNA分子中模板链的互补链,叫做编码
链,又叫正义链,简称(+)链。除了以U取
代T之外,它与RNA转录本具有同样的核
苷酸序列结构。
E
.coli
基因的编码序列,并非都是位于基因组DNA中某一条固定的单链上。也就是说基
因组DNA的两条链,
并没有规定哪一条是正义链,哪一条是反义链。
而是在双链DNA
(基因
组)的任何一条单链
中,都同时存在着正义链和反义链
。对基因组是如此,但对单个基因则不
然。
*3.
多基因聚集排列的操纵子结构形式
大
肠杆菌基因组结构的另一个特点是,若干功能相关的基因往往聚集在一起形成独立的
操纵
子结构。
操纵子的一般结构:
a.
一个或数个调节基因
b.
若干个结构基因,
小的操纵子只有三个基因。
< br>大的操纵子有
11
个结构基因。
c.
上游控制单元,包括操纵单元和启动区。
*4.
染色体基因组的拷贝数
p>
大肠杆菌染色体基因组的拷贝数,也就是说究竟一个细胞同时能拥有几条染色体。这是
依细菌的生长条件而定:
a.
在营养富裕的培养基中,每个细胞可同时拥有3~4条染色体分子。
b.
在碳源供应不足的培养基中,平均每个细胞只拥有
1.1
条染色体
13.
原核基因的结构:
*1.
原核基因DNA序列的结构:
a.
启动区序列;
b.
转录序列区:
(
5’
-<
/p>
UTR;cDNA序列区-编码区;3’
-
UTR
)
;
c. :
终止序列区
*2.
原核基因mRNA的结构
:
(
a
)启动区
(
b
)转录序列区:①
5
’
-UTR
②
编码区,包括起始密码子和终止密
码子;
③
3
’
-UTR
(
c
)终止区
14.
真核基因的特点:
(
1
)与原核基因不同,真核基因往往含有内含子(
intron
)
,它是被包围在编码区之中
的非编码序列;
p>
(
2
)真核基因是单顺反子,编码单基因产物,而原核基因则往往组成大的转录
单位多顺
反子,即单一的
mRNA
分子
可编码多种基因产物;
(
3
)
p>
成熟的蛋白质基因的
mRNA
分子的
5
’
-
端有一个帽的
结构,
3
’
-
端有一个
Poly
(
A
)
尾巴。
15.
真核基因组的结构特点:
*1.
p>
包装成特定的染色体结构;
真核基因组
DN
A
不是裸露的,而是被包装成若干条甚至数十条
不同的染色体,
这是真核基因组的一大特点。
*2.
基因组的多倍性;
大多数真核生物都是二倍体,具有两套分别来自双亲的完整的基因组。
而且有些高等植物还是多倍体,拥有多拷贝的基因组。
*3.
具有大量的重复序列;
重复序列的类型
:低度~,中度~,高度~
重复序列的排列方式:①
串联重复排列
②
分散重复排列
*4.
高比例的非编码的
DNA
序列;
在真核生物基因组
DNA
中含有大量的非编码的
DNA
序列,
包
括
基因与基因之间的非编码的
DNA
序列
,以及
基因内部的非编码的
DNA
序列
。以人为例,非
编码序列占基因组总长的
p>
98%
以上,而蛋白质编码基因的序列还不到基因组总长的
2%
。
*5. <
/p>
庞大的基因数量;
拟南芥
25
,
000
种左右,水稻
4
0
,
000
种左右,人类
24
,
000
个左右。
p>
16.
隐蔽基因定义
:位于基因组蛋白质编
码基因之间的非编码的
DNA
序列中,只编码
< br>RNA
不编码
蛋白质的一类
RN
A
基因,叫做隐蔽基因。
17.
断裂基因:
在转录区的核苷酸序列区
中,
插入有与氨基酸编码无关的
DNA
间隔序列区,
使一个基因的编码
序列分隔成若干个不连续区段的
基因,
叫做断裂基因,
包括内含子
(<
/p>
intron
)
和外显子
(
exon
)
。
18.
真核基因的结构
(
< br>1
)真核基因
DNA
序列水平的
结构
:a.
启动子序列区
b.
转录序列区
c.
终止子序列区
(
2
)真核基因
pre-
mRNA
的结构:
a.
5
’
-UTR
b.
外显子
c.
内含子
d. 3
’
-UTR
序列
(<
/p>
3
)真核基因成熟
mRNA
的结构(五部分)
:
真核蛋白质
mRNA
前体(
pre-mRNA
)经过剪辑加工(去掉间隔子、加帽和加尾)成熟后,<
/p>
被输送到细胞质。
a.
5
’
-
帽的结构
b. 5
’
-UTR
序列
p>
c.
编码序列
d. 3
’
-UTR
p>
序列
e. 3
’
< br>-
端
poly
(
A
)尾巴
19.
增强子(
enhancer
)
< br>
又叫做增强子元件或增强子序列,是真核基因中发现的一种特异序列,能够在距
离目标基因
50kb
以上的位置,从上游或下游的不同位置及方
向增强该基因的转录活性。一般是位于真核基
因
5
’
-
侧翼序列区,但也有的是位于转录区和
3
’
-
侧翼序列区。<
/p>
增强子的功能作用:
①
成环作用;
增强子可影响模板附近的
DNA
超螺旋的密度
(结构)
,
诸如导致
DNA
超螺
旋弯曲,
或是在反式
作用因子参与下,以蛋白质之间的相互作用
为媒介,使增强子和启动子之间的
DNA
“成环”的连
接模式起始转录。
②
固定作用
将模板固定在细胞内特定位
置,如连接在核基质上,有利于拓扑异构酶改变
DNA
双螺旋结
构
张力,有利于促进
RNA
聚合酶在<
/p>
DNA
链上的结合与滑动。
③引导作用
可以为反式因子或
RNA
聚合酶
II
提
供进入染色体结构的“进入位点”
。
20.
基因的分类
(1)
按拷贝数分:
单拷贝基因,
多拷贝基因
(2)
按产物类型分:
结构基因,调节基因
(3)
按表达特性分:组成基因,诱导基因
(4)<
/p>
按实验用途分:选择基因,报告基因
(
5)
按排列组合特点分:基因家族,基因簇
< br>选择基因:
指可使被转化的细胞获得其亲本细胞所不具有的新的遗传特征,
从而使得人们能够使
用特定的选择培养基,将转化的新细胞
(
即转化子
)
,从其亲本
细胞群体中选择出来的一类特殊的
基因。
报告基因:
特指其编码产物能被快速检测,常用来判断外源基因是否已经成功地导入
寄主细胞、
器官或组织的一类特殊基因。
21.
基因工程诞生的理论基础
<
/p>
(1)20
世纪
40
年代确定了遗传信息的携带者
(
分子载体
< br>)
是
DNA
而不是蛋白质。
(2)20
世纪
50
年代的双螺旋结构模型与半保留复制机
理
(3)20
世纪
< br>50
末
60
初,科技工作者提出
中心法则和操纵子学说,遗传密码的破译,阐明了信息
流的方向。
22.
基因工程诞生的技术基础
(1)
核酸内切限制酶,
DNA
的体外切割与连接,
DAN
连接酶;
(2)DNA
核苷酸测序技术;
(
3
)基因
克隆载体的发展与应用;
(
4
)大肠杆菌遗传转化技术的建立;
(
5
)琼脂糖凝胶
电泳技术应用;
(
6
p>
)核酸杂交技术的应用。
23.
酶的分类
:
氧化还原酶类,转移酶类
,水解酶类,异构酶类,裂解酶类,连接酶类。
24.
共线性的概念
(
1
)位于同一条染色体
DNA
或<
/p>
DNA
分子上不同基因的位置排列关系;
(
2
)不同物种中
DNA
的排列关系;
(
3
)位于
DNA
分子及
其转录本
RNA
分子间的共线性;
<
/p>
(
4
)
mRNA
密码的顺序与蛋白质氨基酸顺序。
25.
切口
(
Nick
)
:
在双链
DNA
的某一条链上两个相邻核苷酸之间失去一个磷酸二酯键所出现的
单链断裂。
裂口(
G
ap
)
:
指双链
DNA
分子的某一条链上,失去一个或连续几个核苷酸时所出现的
DNA
单链断裂。
DNA
连接酶无法封闭裂口。
26.
核算内切限制酶:
是一类能够识别双链
DNA
分子中的某种特定核苷
酸序列,
并由此切割
DNA
双链结构的
核酸内切酶。
27.
Ⅱ型核酸内切限制酶的特点