-
RNA-Seq
名词解释
1.i ndex
测序的标签,用于测定混合样本,通过每个
样本添加的不同标签进行数据区分,鉴别测序样品。
2?碱基质量值
(Quality
Score
或
Q-score
)
是碱基识别
(Base Calling
)
出错的概率的整数映射。碱基质量值越高
表明碱基识别越可靠,碱基测错的可能性越小。
3.
Q30
碱基质量值为
Q30
代表碱基的精确度在
99.9%
4.
FPKM( Fragments Per
Kilobase of transcript per Million fragments
mapped
每
1
百万个
map
上的
reads
中
map
到外显子的每
1K
个碱基上的
fragment
个数。计算公式为
p>
FPKM =
cDNA
Fragments
Mapped Reads(Millions) x
transcript Length(kb)
公式中,
cDNA Fragments
表示比对到某一转录本上的片段数目,
即双
端
Reads
数目;
Mapped
Reads(Millions)
表示
Mapped
Reads
总数,
以
10
为单位;
Tran script Len
gth(kb):
转录本长度,以
kb
个碱基为单
位。
5.
FC ( Fold Change )
即差异表达倍数。
6.
FDR ( False Discovery Rate )
即错误发现率,定义为在多重假设检验过程中,错误拒绝
的原假设个数的比例的期望值。通过控制
(
拒绝真的原
(
零
)
假设
)
的个数占所有被拒绝
FDR
来决定
P
值的阈值。
7.
P
值
(P-value)
即概率,反映某一事件发生的可能性大小。
统计学根据显著性检验方法所得到的
为显著,
P<0.01
为非常显著,其含义是样本间的差异由抽
样误差所致的概率小于
P
值
,
一般以
P<0.05
0.05
或
0.01
。
8.
可变剪接
(Alternative splicing
)
有些基因的一个
mRNA
前体通过不同的剪接方式
(
选择不同的剪接位点
)
产生不同的
mRNA
剪接异
构体,这一过程称为可变剪接
(
p>
或选择性剪接,
alternative
splicing)
。可变剪接是调节基因表达和产生蛋白
<
/p>
质组多样性的重要机制,是导致真核生物基因和蛋
白质数量较大差
异的重要原因。在生物体内,主要存在
7
种可变剪接类型:
A)Exon skipping
;
B) Intron retention
;
C) Alternative 5' splice
site
;
D) Alternative 3'
splice
site
;
E)
Alternative first exon
;
F)
Alternativelast exon
;
G)
Mutually exclusive exon
。
9.
外显子跳跃
(Exon
skipping
)
外显子在前体
mRNA
剪接形成成熟
mRNA
过程中被跳过,最终没有出现在某些成熟
种剪接机制被称为外显子跳跃。
mRNA
上,这
10.
内含子保留
(Intron
retention
)
前体
mRNA
在剪接形成成熟
mRNA
的过程中,部分内含子被保留下来,这种剪接机制被称为内含子
保留。
11.5'
< br>或
3'
端可变剪接
前体
mRNA
在剪接形成成熟
mRNA
的过程中,
5'
端或
3'
端边界发生不同方式的剪接,
这种剪接机制
被称为
5'
或
3'
端可变剪接。
12.
基因结构优化
由于使用的软件或数据本身的局限性,导致所选参考基因组的注释往往不够精确,需要对
原有注释
的基因结构进行修正,这
一
过程称为基因结构优化。
13.
基因间区
(intergenic)
指基因与基因之间的间隔序列,不属于基因结构,不直接决定氨基酸,可能通过转录后调控影响性
状的区域。
14.
UTR:(U ntran slateRegio ns)
非翻译区域。是信使
RNA( mRNA
)
分子两端的非编码片段。
5'-U
TR
从
mRNA
起点的甲基化鸟嘌
p>
A
尾巴
(Poly-A)
吟核苷酸帽延伸至
AUG
起始密码子
,
3'-UTR
从编码区末端的终止密码子延伸至多聚
的前端。
15.
ORF ( open reading frame )
开
放阅读框或开放读码框。是结构基因的正常核苷酸序列,从起始密码子到终止密码子的阅读框可
< br>
编码完整的多肽链,其间
不存在使翻译中断的终止密码
子。
16.
CDS (
Coding sequenee )
是编码一段蛋白产物的序列,是结构基因组学术语。
译岀蛋白质,所谓
CDS
就是与蛋白质序列一一
对应的
DNA
转录成
mRNA
,
mRNA
经剪接等
加工后翻
DNA
序列,且该序列中间
不含其它非该蛋白质对应
的序列,不考虑
mRNA
加工等过程
中的序列变化,总之,就是与蛋白质的密码子完全对应。
17.
插入片段大小
(insert size )
通过检测双端序列在基因组上的起止位置,可以得到插入片段的实际长度,决定了测序的长度,是
信息分析的重要参数。
18.
分子标记
是遗传标记的一种,直接在
DNA<
/p>
分子上检测遗传变异。分子标记能对不同发育时期的个体、组织器
官甚至细胞作检测,数量
极多,遍及整个基因组,多态性高,遗
传稳定,不受环境及基因表达与否的影响。
目前常见分子标记主要有
SNP
、<
/p>
InDei
、
SSR
等。
19.
SNP
(Single Nucleotide Polymorphism )
即单核苷酸
多态性,主要是指在基因组水平上由单个核苷酸的变异所引起的
所表现的多态性只涉及到单个碱基的变异,这种变异可由单个碱基的转换
所引起,也可由碱基的插入或缺失所致。但通常所说的
DNA
序列多态性。
SNP
(transition)
或颠换
(trans
version)
SNP
并不包括后两种情况。
20.
SSR (Simple Sequenee
Repeat
,
SSR)
即简单
重复序列,又叫微卫星序列,指的是基因组中由
1-6
个核苷酸
组成的基本单位重复多次构成的
一段
DNA
,广泛分布于
基因组的不同位置,长度一般在
200bp
以下。
21.
转换
(transition)
同类
型
(
嘌呤和嘌呤,或嘧啶和嘧啶
)
p>
碱基之间的相互替换称为转换。
22.
颠换
(transversion)
不同类型
(
嘌呤和嘧啶
)
碱基之间的相互替换称为颠换。
23.
RNA
编辑
(RNA
editing )
是指在
mRNA
水平上改变遗传信息的过程。
具体来说,指基因转录产生的
mRNA
分子中,由于核苷
酸的缺失
,插入或置换,基因转录物的序列不与编码序列互补,使翻译生成的蛋白质的氨基酸组成,不同
< br>
于基因序列中的编码信息
现象。
24.
差异表达转录本
(Differe
ntiallyExpressed Tran script
,
DET)
指表达水平存在显著差异的转录本。
25.
差异表达基因
(Differentially
Expressed Gene
差异表达基因。
,
DEG)
指在两个不同条件
p>
(
如对照与处理、野生型和突变型、不同时间点、不同组织等
)
下,表达水平存
在显著差异的基因,称之为
26.
生物学重复
(Biological Replicates
)
可以定义为使用来自不同抽提的
RNA
样本进行杂交,例如,同一来源独立制备的样本,或者不同来
源的样本
(
不同组织或者一个细
胞系的不同培养物
)
。
-
-
-
-
-
-
-
-
-
上一篇:一篇作文一般是由四个部门组成
下一篇:发票抵税是什么意思-哪些发票可以抵税