-
第一章
基因的结构
第一节
基因和基因组
一、基因
(gene)
是合成一种功能蛋白或
RNA
分子所必须的全部
DNA
序列.
一个典型的真核基因包括
①编码序列—外显子
(exon)
②插入外显子之间的非编码序列—内合子
(intron)
③
5'-
端和
3'-
端非翻译区
(UTR)
④调控序列
(
可位于上述三种序列中
)
绝大多数真核基因是断裂基因
(split-
gene)
,外显子不连续。
二、基因组
(genome)
一特定生物体的整套
(
单倍体
)
遗传物质的总和,
基因组的大小用全部
DNA
的碱基对总数表示。
人基因组
3X1 0
9
(30
亿
bp)
,共编码约<
/p>
10
万个基因。
每种真核生物的单倍体基因组中的全部
DNA
量称为
C
值,与进化的复杂性并不一致
(C-Valu
e Paradox)
。
人类基因组计划(
human genome
project, HGP
)
p>
基因组学(
genomics
)
,
结构基因组学(
structural
genomics
)和功能基因组学(
functional
genomics
)
。
蛋白质组(
proteo
me
)和蛋白质组学(
proteomics
< br>)
第二节
真核生物基因组
一、真核生物基因组的特点:
,
①真核基因组
DNA
在细胞核内处于以核小体为基本单位的染色体结构中.
②真核基因组中,编码序列只
占整个基因组的很小部分
(2
—
3
p>
%
)
,
二、真核基因组中
DNA
序列的分类
·
(
一
p>
)
高度重复序列
(
重复次数
>lO
5
)
卫星
DNA(Satellite DNA)
(
二
p>
)
中度重复序列
1
.中度重复序列的特点
①重复单位序列相似,但不完全一样,
②散在分布于基因组中.
③序列的长度和拷贝数非常不均一,
④中度重复序列一般具有种属特异
性,可作为
DNA
标记.
⑤中度重复序列可能是转座元件<
/p>
(
返座子
)
,<
/p>
2
.中度重复序列的分类
①长散在重复序列
(long
interspersed repeated
segments
.
)
LINES
②短散在重复序列
(Short
interspersed repeated
segments)
SINES
SINES
:长度
< br><500bp
,拷贝数
>10
5
.如人
Alu
序列
LINEs
:长度
>1000bp(
可达
7Kb),
拷贝数
10
4
-10
5
,如人
LINEl
(
三
)
单拷贝
序列
(Unique Sequence)
包括大多数编码蛋白质的结构基因和基因间间隔序列,
三、基因家族
(gene family)
一组功能相似且核苷酸序列具有同源性的基因.可能由某一共同
祖先基因
(ancestral gene)
< br>经重复
(duplication)
和突变产生。
基因家族的特点:
①基因家族的成员可以串联排列在一起,形成基因簇
(gene
cluster)
或串联重复基因
(t
andemly repeated genes)
,如
rRN
A
、
tRNA
和组蛋白的基因;
②有些基因家
族的成员也可位于不同的染色体上,如珠蛋白基因;
③有些成员不产生有功能的基因产物,这种基因称为假基因
(Pseudogene)
.
Ψ
a1
表示与
a1<
/p>
相似的假基因.
假基因分类。加工过的假基因
(processed
pseudogene)
。
典型的基因家族
1
< br>.
tRNA
基因
单倍体人基因组中
1300
个
tRNA
基因,<
/p>
tRNA
基因簇.
2
.
rRNA
基因
>l00copy
p>
.
rRNA
基因簇
(
重复单元
28S
、
< br>18S
、
5.8s-rRNA)
3
.组蛋白基因
30-40copy
.定位:
7q32-q36
组蛋白基因簇
(
重复单位:
H1
,
H2A
,
H2B
,
H3
、
H4)
p>
特点:无
intron
,
< br>Poly(A)
-
RNA
.
4
.珠蛋白基因
α
类:<
/p>
16p13
,基因簇
(24Kb)
:
5
’
—
ζ
—
Ψ
ζ
—
Ψ
α
1
—
α
2
—
α
1
—
3
’<
/p>
β
类:
11p15
,基因簇
(60Kb)
:
5
’
—
ζ
—
< br>Gr
—
Ar
—
< br>Ψ
β
—
δ
—
β
—
3
’
四、超基因家族
(Supergene family
,
Superfamily)
由基因家族和单基因组成的大基因家族,结构上有程度不等的
同源性,但功能不同.
五、人类基因组中的重复序列标记
1
、
A1u
序列
单倍体人基因组
50
万
-100
万拷贝,平均每隔
3-6Kb
就有一个
Alu
序列,
p>
人
A1u
序列长
3
00bp
:
2X130bp
重复序列;
+31
bp
间隔序列
(
中间
< br>)
;
两侧<
/p>
7-21bp
正向重复
(direct
repeats)
,返座子
?
Alu
序列广泛散布于人基因组,约
90%
巳克隆的人基因合有
Alu
p>
序列
Alu
序列标志。
2
、可变数串联重复
·
,
·
Variable
number
tamdem
repeat
,
VNTR
.
又称小卫星
DNA(minisatellite DNA)
由短重复单位
(6-40bp)
串联重复
(6-100
< br>次以上
)
而成,多位于基因的非编码区,广泛分布。
p>
VNTR<
/p>
多态性
—
分子标记
—
DNA
指纹图(
fingerpr
int
)
.
小卫星
DNA
突变与肿瘤,
H-Ra
s
。
3
、短串联重复(
short
tandem repeat,STR
)
又称微卫星
DNA
< br>(
microstallite
DNA
)
2-6
个
核苷酸组成的重复单位串联重复
(10-60
次
),
两侧为特异的单拷贝序列,人基因组