-
在昆虫中序列相似蛋白组学:
Brazilian
Moth
Cerodirphia
speciosa
毒液的成分鉴定
使用串联质谱测序和序列相似性搜索
,
我们对
Brazilian
Moth Cerodirphia speciosa
的幼虫毒液
的成分进行了表征
,
此蛾属于天蚕蛾科鳞翅目。尽管可用的
数据库序列资源缺乏
,
这种方法使
我们
能够识别
58
点中的
48
个点并试图对其做二维凝胶电泳图
,
代表
37
独特的蛋白质
,
而只
有
13
种蛋白质可以被传统非容错数据库搜索方法识别。大多数
的跨物种采样数来自系统发育
相关的鳞翅类生物中桑蚕家蚕的蛋白质。
< br>幼虫毒液的蛋白质成分配方暗示
C. speciosa
的毒素
可能会通过其血淋巴接触引发毒害
,
类似于另一种有毒鳞翅目,巴西天蚕蛾。
关键词
:MS BLAST
?同源性搜
索?昆虫蛋白质组学?串联质谱?昆虫毒液
前言
Brazilian Moth
Cerodirphia speciosa
属于鳞翅目天蚕蛾科的新天蚕蛾亚科。
p>
Lepidopterian
幼虫
身体便面
的刚毛
,
如天蚕蛾科家族的幼虫
,
p>
对人类来说是危险的。偶然接触他们的刚毛和刺会
导致灼烧的疼痛感
,
肾功能衰竭
,
鼻衄
,
黑粪症
,
血尿
,
严重出血
,
有时会导致死亡。然而
,
无论是
Cerodirphia
属的毛毛虫的毒液构成
,
还是特定的毒液的介质尚未确定。蛋白质组学表征的有
毒液体来自于螫毛和
毛毛虫的刺
,
可能有助于阐明毒性机制和开发适当的药物。
p>
鳞翅目包含超过
150000
种蝴蝶和飞蛾。
目前
,
只有来自多个物种的
106
序列高度同
源蛋白质
在整个天蚕蛾科家族是已知的
,
新天蚕蛾亚科
,
其中包含分类学确认的
142
种。天蚕蛾科从蛋
白质数据库中没有蛋白质可被利用,
因此蛋白质识别只能依靠跨物种从其他鳞翅目物种序列
去匹配<
/p>
,
如丝绸蠕虫家蚕和烟草天蛾的幼虫或亲缘关系更远的昆虫序列<
/p>
,
比如黑腹果蝇或冈比
亚疟蚊。
基因组、
EST<
/p>
(表达序列标签)和蛋白质序列数据库通过质谱分析提供一个蛋白质鉴定的资
源。
在典型的蛋白质组学中
,
通过特定的蛋白酶
(
多数情况下
,
胰蛋白酶
)
进行蛋白质胶内酶切
,
或溶液内酶切。未分离的胰蛋白酶的水解液经过肽质量指纹谱技术<
/p>
,
完整的肽质量受它的精
度高低决定。<
/p>
另外
,
肽的序列是由串联质谱测定
,
要么直接从未分离的混合物测定
,
或通过纳米
微流反相色谱法在线分离
(
参照参考文献
10)
。
大量的完整的胰蛋白酶的肽
(
肽质量指纹识别
< br>),
或者加上大量的衍生片段通过离子化的串联质谱
,<
/p>
然后从数据库条目相应的质量计算的处理
序列。尽管有显著的不同
,
spectrum-to-sequence
相关性和得分算法及其程序实现
,
传统的蛋
白质识别软件
,
如
Ma
scot
与
SEQUESR,
主要是能
够分析多肽的精确匹配至数据库序列
(参照参
考文献
13,14
)。严格的匹配大大增加了特异性的数据库搜索
,
有助于克服串联质谱固有的缺
乏使用光谱识别的蛋白
质
,
使从只有少数片段获得肽前体。然而
,
任何分析肽序列对应的数据
库条目之间的差异
,
通常在失配和排除了识别结果的蛋白质。这代表了一个重要瓶颈表征与
p>
非序列蛋白质组的物种基因组
,
特别是对昆
虫的蛋白质组学影响,因为在生物与未定义的遗
传背景之间的系统发育多样性和蛋白质序
列的显著高种群差异。
我们在这里证明结合质谱分
析和序列数据
库相似性搜索有助于规避这些限制并且为高效的昆虫蛋白质组学勘探铺平了
道路
,
尽管缺乏可用的序列资源。
为了描述
C.
speciosa
配方的毒液
,
我
们通过二维凝胶电泳分离蛋白质并且蛋白质的识别通过
质谱,
M
ascot
联用和基于质的
BLAST
方法搜索驱动的。
MS BLAST
是一个序列相似性搜索工<
/p>
具
,
它利用多余、退化和部分序列错配的
备选序列
,
通过的串联质谱的翻译来获得。从所有获
得的串联质谱推导出所的有候选序列
,
以任意顺序
组装成一个查询。重要的是
,
许多备选序列
接受每个肽分析
,
因此
,
序列可以从低干度的
MS
/
MS
光谱推导明确的解释经不起实验的推
敲。与常规的
BLAST
搜索相比
,
采用
E
值和
p
值评估统计采样的置信度
, MS BLASTL
利用
另一
种得分方案中
,
基于预计算阈值的
分数有条件地设置在获取高比值片段对
(
高敏感人群
)
和碎
片的总数。
p>
根据超过
20 000 MS BLAST
搜索查询被组装的
4500
个蛋白质的计算评估结果得出
,
假阳性标识不超过
3%
。虽然对全面执行搜索总是对序列数据库执行全面的搜索,
,
但真正阳
性标识通常取决于系统的距离与相关参考生物
(s)
和不同的系统发育血统之间的显著不同。
MS BLAST
p>
方法成功的运用于鉴别非洲爪蟾
,
死海杜氏
盐藻
,
甲醇酵母属毕赤酵母属酵母,
圣
栎
硬木和其他物种的非序列基因组中的未知蛋白。
然而,
MS BLAST
从广布的昆虫中鉴定的性
能对系统发生的时间的测序参考物种尚不能被评估。
使用质谱和容错结合和严格的数据库搜索方法
,
我们鉴定了从毛毛虫毒液中以二维电泳检测
出的
58
个蛋白质斑点中的
48
个。序列相似性搜索启用两
倍的独特的蛋白质
,
通过严格的数
据库
搜索
,
与跨物种标识相比
,
通过昆虫蛋白质的自然多态性它的置信度并不会失去。在毒液
中大量的血淋
巴蛋白质指出
Cerodirphia
speciosa
p>
的毛毛虫和有毒生物
Lonomia
ob
liqua
之间
系统发育相关的毒液的分泌和产生机制之间的相
似性
。
材料和方法
C. speciosa
Caterpillarsc
.
C. speciosa Ca
terpillarscol
采集自巴西的巴西利亚的大学生物学试验
< br>站
,
并且以树叶喂养从他们被发现的地方。在提取毒液以
前,清洁和喂养每周进行三次。一
些毛毛虫被允许发育成飞蛾进行随后的分类学分类
p>
,
由巴西,巴西利亚的
Amab??lio
Jose?
Aires de Camargo at Centro de
PesquisaAgropecua?
ria dos
Cerrados
执行。
毒液提取
。
12
个一组的毛毛虫,约
6
厘米长
p>
,
在解剖前
20
分
钟保持在
-20
°
C
< br>。毛纤维,使用手术刀从他
们的基部去除。从缺口处漏出的几滴毛发分泌用巴斯德
吸管收集并且用真空离心干燥。
氨
基酸分析
。
在两个独立的实验中
,1m
g
和
150?g
的毛纤维分别溶解在<
/p>
100?L
和
75?L
< br>的
0.1M
的盐酸中。
毛发分泌
物的酸水解样本和蛋白质标准液标准被放在
109
°
C
6M
HCL
真空下
24
< br>h
。
在酸水解后,样品和标准液被溶解在在
75?L
的
0.1M HCl
中
,
其中
50?L
被注入到氨基酸分
析仪日立
L8500(
日本,东京
)
。总蛋白含量被总结计算确定恢复的氨
基酸。
通过二维凝胶电泳分离毒液蛋白
。
这是根据
Go¨
rg
等人的方法论的介绍执行
的
.
IPG
胶条购买自
Amersham Biosciences
(
乌普萨
拉
,
瑞典
)<
/p>
。等电聚焦是在一个带有
11cmIPG
胶条
,pH
值
3 -
10
的
IPG-
phor
系统(
Amersham
B
iosciences
)上完成的。等分的毒液
(150?g)
溶解在
250?L
包含
7 M
尿素
,2
M
硫脲
,1%DDT,2%
Triton x - 100,0.8%
两性载体
(Pharmalyte),1%
的蛋白酶抑制剂
(TLCK,PMSF TPCK,EDTA,
抑肽素
,
亮
抑酶肽
)
和的痕迹
溴酚蓝。样品在台式离心机中
10000r/min
离心
5
分钟。复水的
IPG
胶条在
20
°
C
条件下放置
13
个小时。
等电点聚
焦运行跟着一个程序
4
h
在恒定的每个胶条
75?A,
at
500V/
一小时
; 1000
V/
一小时
and 8000 V<
/p>
两小时。在那之后
,
他们将保温
20
分钟在一个包含
50mM PH8.8
p>
的胶条,
6M
尿素
,30% v / v
甘油
,2%w / v SDS
和
125mMDDT
的溶液中(
3ml
)紧
接着放入一个用
1
25mM
碘乙酰胺代替
DDT
的相同的
平衡液中
20
分种,
。
然后胶条在
37.5mM
包含
0.3 M
甘氨酸和
0.1MSDS
的
Tris
缓冲液中冲洗
5
分钟。
IPG
胶条被密封在包含
0.3%
琼脂
糖的
Tris SD
SPAGE
缓冲液中进行二维凝胶电泳
,
执行一个的梯度
(7%
到
15%
p>
的丙烯酰胺
-
双丙
烯酰胺
)
进行。电泳在
25mA,50
0 V
的限制电压和
15
°
C
条件下进行。包含
0.24 M Tris
HCl
pH8.8, 12%
蔗糖
, 2% SDS,1% DTT and
痕迹溴酚蓝的溶液作为样品缓冲液。凝胶着色考马
斯亮蓝。
< br>近负载蛋白质的近似数量估计通过有四个蛋白质斑点对应点的染色强度比较的强度
标准取决于氨基酸分析。
蛋白质质谱鉴定。
个体蛋白质斑点在
二维凝胶电泳被手动切除且蛋白质染液溶解于胰蛋白酶。
蛋白质消化第一
次受到肽质量指纹识别通过基质辅助激光解吸电离飞行时间质谱
(MALDI-
TOF)
配备
Scout384
离子源
。
探针准备方法如前所述。
简单的
,1
?L
等分的消化液混合在
AnchorChip 384
/
600
靶标表
面<
/p>
(Bruker Daltonics, Germany)
的饱
和溶液基质
(
α
-
氰
-4-
羟基肉桂酸
)
在
1:2 (v/v)2.5%
的
TFA:
乙
腈的溶液。混合物在室温下干燥和全部靶标
是用
5%
甲酸清洗。如果肽质量指纹没有识别蛋
白质
,
从含有
5%
甲酸和乙腈的凝胶块上肽并且提取物汇集在一起
,
真空干燥离心。
消化液带入
了
5%
p>
甲酸并且运用纳升电喷雾串联质谱分析
,
在
前面所描述的
MDS Sciex QSTAR Pulsar
四
极杆飞行时间
(QqTOF)
质谱上修改。
几个丰富度低的蛋白质斑点
(<
/p>
表
1
种显示
)<
/p>
通过
nanoLC-MS /
MS
p>
分析线性离子阱质谱仪
LTQ(
Therm
oElectron Corp
,
CA)
本质上所描述的。
32
质谱数据和数据库的处理搜索。
肽质
量指纹被用于数据库搜索使用
Mascot
软件
((Matrix Science Ltd, UK)
针对
< br>MSDB
数据库
从
NCBI
p>
下载
(9
月,
20
04)
。质量公差表被设置为
100
ppm,
光谱被外部校准和没有强加的限
制蛋白质分子量或物种
起源的蛋白质分析
。
粗略的串联质谱第一次搜索通过
Mascot
对上面
的数据库来识别蛋白质包含胰
蛋白酶的多肽组成相同的目前的数据库条目
,
在
0.1
Da
的前体
质量容差
和
0.05Da
碎片离子得质量容差。袭击被认为是重要的如果
他们的蛋白得分超过了
阈值吉祥物软件计算假设
p < 0.0
5,
取决于
-
荷兰国际集团
(ing)
在查询的大小
,
是
50-52
。
相应的
女士
/
女士光谱是手动检查确认的匹配连续的一系列
y,b -,-
碎片离子。
吉祥物查询
生成使用过
程——从
MS / MS
谱
荷兰国际集团
(ing)
脚本吉祥物
v
.1.6b2 BioAnalyst QS
的延伸软件应用生
物系统公司
(CA)
福斯特市。
串联质
谱收购
nanoLC-MS LTQ / MS
方法离子阱质谱
仪被吉祥物在
搜索以下设置
:
对前体和
质量碎片离子
2
和
0.5
Da,
尊重
;
碎片离子简
介
:ESI
陷阱。如果三跨物
种击中被
接受标准同时满足
:
蛋白质分数超过阈值计算为
p
<
0.01,
几个吉祥
物肽和至少一个
完全匹配的数据库条目肽与预计值低于
0.1<
/p>
。
如果没有串联质谱鉴定
,
或如果拟议的打击并没
有统计上的自信
(
他们的分数得分低于阈值提出了吉祥物
),
串联质
谱获得
QSTAR
脉冲星质谱
仪解释使
用
BioAnalyst
QS
新创软
件吗先前描述。
31
日多个序列的候选人允许每个解释串联
p>
质谱
,
肽序列不一定是完整的。所有的候选
人序列合并成一个单一的搜索字符串。女士爆炸
搜
索
18
日
31
日
进
行
反
对
nonredundant
蛋
白
质
数
据
库
(
nrdb95)/msblast/
在默认设置。
在爆炸女士解
析脚本操作网站
统计应用于识别和颜色代码自信的女士依法打击爆炸得分计划。
21
日爆炸女士得分方案中
详细讨论本文通过<
/p>
Habermann et al,
相应的
21
打——替换矩阵
PAM30MS
和表的意义岁的孩
子。女士爆炸搜索也执行对原始丝绸蠕虫家蚕的基因组序列
,
从
NCBI
下载。基因
组的女士爆
炸将详细描述。
结果与讨论
毒液的描述二维凝胶电泳和质谱分析。毒液的样本
,
总共包含
50?g
蛋白质材料
(
如估计氨基
酸分析
)
是由二维
凝胶电泳分离和蛋白质斑点被
Coomassie
染色
(
图可视化
1)
。
p>
总之
,58
点从凝
胶和
in-gel
被切除用胰蛋白酶消化。对蛋白质识别我们的
总和严格的和分层的
ap
-