〔美〕 D. C. 利布 莱尔著 张 继仁译 高 友鹤校 白质 组学导 一生 物学的 新工具 < ♦夺 达 麻社 S3 J www.sciencep.com 中科院 植物所 图书馆 圓圓 |_丨1_|丨丨 S0003888 现代 生物技 术前沿 ,/J^i t 〔美〕 D. C. 利布 莱尔著 张 继仁译 高 友鹤校 蛋 白质组 学导论 ——生 物学的 新工具 图字 : 01-2004-2025 内 容简介 本书 介绍了 分析蛋 白质和 肽的各 种方法 ,重 '点阐 述了不 同质谱 仪及相 关数据 库检索 算法的 基本原 理和使 用方法 ,详 细描述 了质谱 在蛋白 质组学 中 的应用 。蛋 白质组 学领域 最权威 的科学 家之一 John R Yates 教 授称本 书是 蛋白质 组学的 极好的 导论和 综述, 可供有 生物化 学背景 的学生 和科学 家使用 ,书 写流畅 ,深人 浅出。 本 书可用 作从事 生命科 学和医 学研究 的专业 人员的 参考书 ,也 可用作 学习 生命科 学和生 物技术 的本科 生和研 究生的 教材。 The original English language work has been published by HUMANA PRESS, Totowa, New Jersey , U. S. A. ©2002 by Humana Press. All rights reserved. 图书在 版编目 (cip) 数据 蛋白质 组学导 论:生 物学的 新工具 / ( 美) 利 布莱尔 (D. C. Liebler) 著 .张 继仁译 .一 北京: 科学出 版社, 2005 (现代 生物技 术前沿 ) ISBN 7-03-014258-6 I . 蛋… n. ①利… ②张… ID. 蛋白质 - 研究] V. Q51 中 国版本 图书馆 CIP 数 据核字 (2004) 第 098071 号 责任 编辑: 莫结胜 丁顺华 卢庆陶 / 责任 校对: 陈丽珠 责任 印制: 钱玉芬 / 封面设 计:王 浩陈敬 屙緣 * 糸 社出版 北京 东黄城 根北街 16 号 邮 政编码 :100717 http : // www . sciencep . com M 飧 奸别/ •印刷 科 学出版 社发行 各地 新华书 店经销 'k 2005 年 1 月第一 •版 开本: B5 (720X 1000) 2005 年 1 月第一 次印刷 印张 : 8 1/4 印数 : 1—3 000 字数 : 154 000 定价 : 30.00 元 (如有 印装质 量问题 , 我社负 责调换 〈环伟 >) 译 者的话 在 后基因 组时代 ,生物 学家正 在对基 因组的 功能进 行研究 。蛋 白质组 学是生 物技 术的最 新领域 ,它将 对基因 组功能 的研究 做出巨 大贡献 。基因 只含有 制造蛋 白质 的指令 ,而细 胞的各 种各样 的生理 功能是 由蛋白 质来完 成的。 蛋白质 组学将 组织 或细胞 中的蛋 白质作 为一个 系统来 研究, 而不像 在蛋白 质化学 中那样 只研究 蛋白质 的单一 组分。 在不同 的细胞 中会有 不同的 蛋白质 的表达 ,在 相同细 胞的不 同 状况中 (如处 在疾病 状态的 细胞中 ), 也会 有某些 不同的 蛋白质 的表达 。细胞 只 有一个 基因组 ,但 可能有 许多不 同的蛋 白质组 。蛋白 质组比 基因组 更复杂 。这 种复杂 性还表 现在蛋 白质有 很多难 以预测 的翻译 后修饰 、蛋 白质- 蛋白质 相互作 用以及 折叠成 各种形 状的三 维结构 。从 蛋白质 的氨基 酸序列 不一定 能推测 蛋白质 的功能 ,而 蛋白质 组学的 研究可 以揭示 蛋白质 的表达 和功能 。各国 科学家 目前正 在用 蛋白质 组学对 人类全 部蛋白 质进行 分类, 研究人 类蛋白 质的相 互作用 ,以便 开发更 有效的 药物。 蛋白质 组学面 临的挑 战是必 须研究 复杂的 蛋白质 体系。 这要求 我们分 析各种 各样的 蛋白质 ,这些 蛋白质 大部分 以修饰 的形式 存在并 且是低 丰度的 。《蛋 白质 组 学导论 —— 生物 学的新 工具》 一 书描述 了应对 这个巨 大挑战 的工具 和方法 。本 书介 绍了分 析蛋白 质和肽 的各种 方法, 重点阐 述了不 同质谱 仪及相 关数据 库检索 算法的 基本原 理和使 用方法 ,详细 描述了 质谱在 蛋白质 组学中 的应用 。本 书作者 D.C. 利 布莱尔 (Daniel C. Liebler) 教授是 有丰富 蛋白质 组学研 究和教 学经验 的 科学家 ,尤其 在使用 质谱技 术及相 关算法 鉴定蛋 白质方 面有很 高造诣 。他 特别 重视 蛋白质 组学的 应用, 发表了 一系列 用质谱 技术研 究蛋白 质修饰 的文章 。作者 力图 使本书 成为一 本可供 有生物 化学背 景的学 生和科 学家使 用的入 门教材 ,书写 流畅 ,深 入浅出 。蛋 白质组 学领域 最权威 的科学 家之一 J.R. 耶茨 (John R. Yates) 教授称 本书是 蛋白质 组学的 极好的 导论和 综述。 • 本 书共分 三部分 。第 I 部分用 两章描 述了蛋 白质组 学和蛋 白质组 的定义 ,阐 述了 蛋白质 组学诞 生和发 展的基 础以及 在新生 物学中 的地位 ,讨论 了蛋白 质组与 基因组 的关系 。第 n 部 分介绍 了蛋白 质组学 的工具 和方法 。在第 4 章和第 5 章讨 论了 蛋白质 和肽的 分离方 法以及 蛋白质 的消化 技术。 蛋白质 和肽的 分离包 括使用 二维 SDS 聚丙烯 酰胺凝 胶电泳 (2I>SDS~PAGE)、 制 备等电 聚焦、 HPLC、 串 联液 相层析 和毛细 管电泳 。第 6 章详细 描述了 MALDI-TOF 质 谱仪和 ESI 串联 质谱 仪的结 构和工 作原理 以及它 们的优 缺点, 讨论了 在蛋白 质组学 研究中 如何选 用 不同的 质谱仪 。第 7 章的 主题是 用肽质 量指纹 谱鉴定 蛋白质 ,讨 论通过 测定的 肽 质量与 数据库 理论肽 质量的 比较进 行蛋白 质鉴定 的方法 。第 8 章到第 10 章主 要阐述 如何用 串联质 谱分析 肽序列 ,描 述了从 串联质 谱谱图 鉴定蛋 白质的 软件工 具 (主 要介绍 Sequest), 也介 绍了如 何使用 SALSA 算法 采集串 联质谱 数据特 征 。第 ID 部分详 细介绍 了质谱 和相关 技术在 蛋白质 组学中 的应用 ,描 述了 在蛋白 质 采集和 在蛋白 质表达 谱的研 究中, 2I>SDS~PAGE 和 MALDI-TOF 质谱 以及肽 的多维 层析和 LC- 串联质 谱分析 的应用 (第 11 章 、第 12 章 ); 讨 论了在 鉴定蛋 白质- 蛋白质 相互作 用和蛋 白质复 合物以 及鉴定 蛋白质 修饰中 ,质 谱以及 Sequest 和 SALSA 算法 的应用 (第 13 章 、第 14 章 )。 最后 一章指 出了蛋 白质组 学的新 的发展 方向, 包括新 质谱仪 、自动 化和蛋 白质微 阵等。 相 信本书 将为从 事生命 科学和 医学研 究的专 业人员 ,以 及学习 生命科 学和生 物技 术的本 科生和 研究生 助一臂 之力。 张继仁 自 1958 年 克劳斯 •比曼 (Klaus Biemann) 教授 首先用 质谱仪 分析氨 基酸以 来, 质谱技 术已有 了长足 发展。 Biemarm 最初 的实验 所面临 的棘手 问题是 怎样将 非极性 分子引 人质谱 仪产生 离子。 1958 年以 后出现 的几种 新型电 离技术 和样品 导 人方法 ,促 进了生 物分子 的分析 ,如化 学电离 、电 场解吸 、场致 电离、 等离子 体 解吸以 及快原 子轰击 (FAB) 等 新型电 离技术 ,鉴 定肽和 蛋白质 的方法 也得以 发展。 1987 年 由于在 生物分 子中引 人了基 质辅助 激光解 吸电离 (MALDI) 以及 电喷 雾电离 (ESI), 质谱 技术有 了跃进 。这 两种电 离技术 也给肽 和蛋白 质分析 带来极 大飞跃 ,其 中一个 关键质 谱技术 是串联 质谱。 在 20 世纪 80 年 代早期 唐纳德 •亨特 (Donald Hunt) 教授开 始在肽 和蛋白 质 序列分 析中发 展和应 用串联 质谱。 FAB 是一 项软电 离技术 ,可 产生完 整的质 子 化分子 ,使得 用于肽 序列分 析的方 法得以 改进。 FAB 是 肽序列 测定的 主要突 破 ,该技 术可以 使肽稳 定电离 ,无 需通过 其他方 法增加 肽的挥 发性。 FAB 与串 联质谱 的联用 ,形成 了快速 肽序列 测定方 法学。 处理复 杂肽混 合物时 ,大 多数方 法采 用离线 HPLC 进 行分离 。人 们通过 这种方 法对许 多蛋白 质进行 了序列 测定, 并发 展了许 多重要 的方法 。然 而分离 方法与 FAB 的 在线结 合一直 未能发 展出可 靠易行 的方法 。直到 电喷雾 电离使 分离技 术与质 谱仪直 接联用 ,这 个问题 才得到 解决 。分析 灵敏度 的增加 以及样 品处理 的简化 和自动 化使肽 和蛋白 质分析 的各个 方面 都得以 提高。 质谱的 这些进 展与全 球协同 进行的 人类基 因组序 列测定 很好地 衔接在 一起。 基因组 序列测 定工作 包括人 类基因 组及许 多模式 生物的 基因组 ,并 已产生 大量的 序列 信息。 1993 年 ,几个 研究小 组发现 质谱数 据可用 来检索 数据库 ,以 鉴定所 研 究的蛋 白质。 1994 年发展 了用串 联质谱 数据检 索序列 数据库 的方法 ,使 研究 者 能在“ 书的后 面看到 答案” 。如 果“书 ”是已 得到序 列分析 的生物 基因组 ,答 案基 本上肯 定是在 书后面 的部分 。翻译 后修饰 和氨基 酸序列 改变等 复杂问 题可通 过 研究从 基因组 序列推 出的蛋 白质序 列得以 解决。 20 世纪 90 年代 在生物 科学中 人们对 质谱的 兴趣和 应用迅 速增长 ,质 谱在新 千年 将会像 SD&PAGE — 样普遍 和重要 。生物 学家将 依赖质 谱判断 其实验 结果。 如果 生物学 家需要 使用质 谱技术 来分析 实验, 那么他 们怎样 了解质 谱艺术 和蛋白 质组 学的方 法呢? D.C. 利 布莱尔 (DanielC. Liebler) 教授的 《蛋 白质 组学导 论 —— 生物 学的新 工具》 一书可 以指导 我们了 解质谱 并且在 蛋白质 组学研 究中使 用质谱 。这 本书描 述了通 常使用 的质谱 仪和基 本的电 离技术 ,这对 于确定 特定研 究 中如何 选用质 谱仪的 类型是 重要的 。对于 非专业 研究人 员来说 ,使 用质 谱数据 检索 数据库 是重要 的改进 ,这样 就不再 需要掌 握解释 质谱图 的技巧 。本书 描述了 对基础 检索算 法的基 本理解 ,并阐 述了其 局限性 ,最 后描述 了质谱 在蛋白 质组学 中的 应用。 本书为 研究生 和所有 对迅速 发展的 蛋白质 组学基 础知识 感兴趣 的生物 学 家提供 了极好 的蛋白 质组学 导论和 综述。 J.R. 耶茨 (John R. Yates) Scripps Research Institute La Jolla, CA 本书 是蛋白 质组学 这个新 领域的 导论, 侧重描 述怎样 分析研 究蛋白 质和蛋 白质组 。尽管 人们对 蛋白质 组学的 兴趣日 益浓厚 ,但 是对 蛋白质 组学的 工具和 技术 了解还 很少。 本书注 重向生 物学家 介绍新 工具和 新方法 ,对 生物学 学生和 有经 验的生 物学家 都适用 。任 何学过 研究生 生物化 学课程 的人都 可以很 容易地 理解 什么是 蛋白质 组学以 及如何 研究蛋 白质组 。有 经验的 生物学 家会发 现本书 大部分 内容是 熟悉的 ,但是 这些内 容被重 新整合 并围绕 蛋白质 组的研 究展开 阐述。 基 因组序 列测定 、分 析仪器 、计算 能力和 易于使 用的软 件工具 等方面 的重大 进展已 不可逆 地改变 了生物 学的发 展方向 。过 去我们 一直研 究生物 系统的 单个组 分, 而现在 可以综 合地并 且在精 确的分 子细节 上研究 生物系 统本身 。我们 面对的 任务 是有效 地利用 新技术 和处理 大量的 数据, 更重要 的是我 们需要 调整思 想去理 解与 单一组 分相对 的复杂 体系。 《蛋 白质组 学导论 —— 生物 学的新 工具》 这本书 最早是 用质谱 进行肽 序列分 析的短 期课程 讲义, 这门课 程是由 Donald F. Hunt 博士 1998 年在 北卡罗 来纳州 Durham 的生物 医学资 源设施 协会会 议上讲 授的。 那时我 的同事 Tom McClure 博士 和我在 亚利桑 那大学 毒理中 心和亚 利桑那 癌症中 心建立 了一个 新的蛋 白质组 学研究 机构。 Tom 参加了 Hunt 的课程 。他 回来后 ,将授 课内容 传授给 我们几 个。 我们于 1998 年 8 月 在亚利 桑那大 学开设 了一个 为期四 天的关 于质谱 和蛋白 质 组学的 训练班 ,共有 50 个学 员接受 了培训 ,学员 包括研 究生、 实验室 工作人 员和 教授。 对这个 训练班 的热烈 反响反 映了以 某些易 接受方 式将蛋 白质组 学的新 技术和 在研究 中的潜 在应用 介绍给 科学家 的需要 。这个 训练班 促进了 本书的 诞生。 本书是 写给初 学者的 。我 的目的 是让他 们熟悉 蛋白质 组学的 重要工 具和应 用, 所以对 某些仪 器和应 用的描 述并不 是非常 严谨的 。本书 不是实 验室手 册或最 新技 术汇编 。有 几本很 好的书 更详细 地描述 了蛋白 质分析 技术、 质谱仪 器和技 术, 以及这 些技术 的应用 。在这 个领域 中研究 方法的 发展和 应用是 非常迅 速的, 没有 哪本书 是真正 时新的 。在我 将蛋白 质组学 介绍给 同事后 令我兴 奋的是 同事们 创造 性地运 用这些 新技术 ,这 将促进 蛋白质 组学的 发展。 本 书分成 三部分 。第 I 部分 介绍蛋 白质组 学主题 ,描述 它在新 生物学 中的位 置, 分析蛋 白质组 的性质 。第 n 部分介 绍蛋白 质组学 研究的 工具, 解释它 们怎样 工作 。第 in 部 分解释 这些工 具怎样 用来解 决不同 类型的 生物学 问题。 感谢 Jeanne Burr、 Laura Tiscareno、 Julie Jones、 Dan Mason、 Beau Han- sen^ Hamid Badghisi、 Linda Manza、 Richard Vaillancourt、 Tom McClure、 ArpadSomogyi 和 GeorgeTsaprailis, 他们 提出 了很好 的建议 ,阅 读书中 各章的 草 稿并给 出评语 ,提供 某些图 解的样 品数据 。感谢 Elizabeth Hedger 杰出 的秘书 工作 。最后 ,感 谢我 的妻子 Karen 和儿子 Andrew 对我 写作的 支持。 D.C. 利 布莱尔 (Daniel C. Liebler), PhD 目 录 译 者的话 序 前目 I 蛋 白质组 学和蛋 白质组 1 1 蛋 白质组 学和新 生物学 3 2 蛋 白质组 9 D 蛋白 质组学 的工具 17 3 分析蛋 白质组 学概述 19 4 蛋 白质和 肽的分 析分离 21 5 蛋 白质消 化技术 33 6 分析 蛋白质 和肽的 质谱仪 37 7 用肽质 量指纹 谱鉴定 蛋白质 51 8 用 串联质 谱分析 肽序列 57 9 用串 联质谱 数据进 行蛋白 质鉴定 63 10 SALSA: —种采 集串联 MS 数 据特征 的算法 69 ID 蛋白 质组学 的应用 77 11 采集蛋 白质组 79 12 蛋白质 表达谱 86 13 鉴定 蛋白质 -蛋白 质相互 作用和 蛋白质 复合物 95 14 蛋白质 修饰谱 105 15 蛋白质 组学的 新方向 115 _弓1 121 , • . m 蛋 合质组 学和蛋 合质组 1 蛋 白质组 学和新 生物学 1. 1 新 生物学 蛋白质 组学是 研究与 基因组 相对应 的蛋白 质组的 学科。 术语“ 蛋白质 组学” (proteomics) 和“蛋 白质组 ” (proteome) 是 Marc Wilkins 及其 同事在 20 世纪 90 年 代早期 提出的 ,对应 于描述 生物中 全部基 因的术 语“基 因组学 ” (genom- ics) 和“ 基因组 ” (genome)。 这些 “-omics” 术语 代表了 对怎样 思考生 物学和 生 物体系 工作方 式的重 新定义 (图 1.1)。 直到 20 世纪 90 年 代中期 ,生 物化学 家、 分子生 物学家 和细胞 生物学 家还在 研究单 独的基 因和蛋 白质或 与生物 化学途 径相 关的少 量组分 。那时 可用的 技术有 Northern 印迹法 (用于 基因表 达分析 ) 和 Western 印迹法 (用 于蛋白 质分析 ), 利用 这些技 术研究 和分析 多基因 或多蛋 白质是 非常困 难的。 三项进 展形成 了新生 物学的 基础, 改变了 生 物学研 究前景 。第 一项是 20 世纪 90 年代基 因、 表达序 列标签 (EST) 和 蛋白质 序歹] J 数据 库 的发展 。作为 许多生 物基因 的部^ i 息 庫, 豆些资 源很有 价值。 20 世纪 90 年代后 期的基 因组 序列测 定工作 ,阐明 了细菌 、酵母 、线虫 和果 蝇的完 整基因 组序列 ,最近 阐明了 人类基 因组完 整序列 。植 物和其 他广泛 研究的 动物基 因组 的序列 最近也 已完成 或接近 完成。 这些基 因组 数据库 是我们 最终从 中获取 对生物 体系理 解的信 息库。 第二项 重要进 展是引 人易于 操作的 、基 于浏 览器的 §物 信息学 工 具 。利用 这些工 具从上 述数据 库中获 取信息 。现 在可以 在几 秒钟内 从完整 的基因 组内检 索特定 的核酸 或蛋白 质序列 。这样 的数据 库检索 工具与 其他工 具和数 据库结 合利用 ,根 据已存 在的特 定功能 结构域 和基序 可以预 测蛋白 质产物 的功能 。这 样一批 基于互 联网的 免费工 具使生 物学家 可以通 过台式 电脑检 测基因 和基因 产物的 结构与 功能, 探索大 量感兴 趣的生 物化学 问题。 第三 项重要 进展是 f 褒苷酸 微阵。 微阵含 有在玻 片上或 芯片上 的一系 列基因 专一 性寡核 苷酸或 cDN& 序列 。将 感兴趣 样品的 DNA 混合物 荧光标 记后与 微阵进 行杂交 ,可以 一次探 测几千 个基因 的表达 。一个 微阵可 以代替 几千个 ^Northern 印 DNA ►基 因组 “基 因组学 f mRNA 蛋白质 ►蛋 白质组 “蛋白 质组学 细 胞功能 图 1. 1 基因 组学和 蛋白质 组学的 生物化 学关系 迹法 分析, 可以在 做一次 Northern 印迹 的时间 内完成 。通过 使用双 色荧光 探针标 记 ,两个 不同样 品的基 因表达 谱可直 接在一 个玻片 或芯片 上进行 比较。 图 1. 2 是 一块含 有酿酒 酵母基 因组中 6 000 个基 因单一 序列的 玻片。 这样的 一个 微阵可 以测定 酵母基 因组所 有基因 的表达 。显然 ,这使 我们面 临新生 物学的 巨 大挑战 。我 们可以 观看整 个系统 ,但 这几千 个数据 点所包 含的信 息超出 了我们 直观 解释的 能力。 新的组 合算法 、自 组作图 和类似 ,的 工具等 最新的 方法有 助于生 物 学家理 解这些 数据。 图 1.2 酵 母基因 组芯片 该酵母 cDN A 微阵 由斯坦 福大学 Pat rick Brown 博士 的实验 室制作 ( ht tp : // crngiTL Stanford, edu/ pbrown/ ) 。 微 阵带来 的最重 要的变 化是使 生物学 家进行 “宏观 ”思考 。细 胞有成 千上万 的以不 同组合 方式进 行的基 因表达 。细 胞的生 死是由 这些基 因的表 达和其 蛋白质 产物 的活性 决定的 。无 论是跨 膜受体 、转 录因子 、蛋 白激酶 或是伴 侣分子 ,每种 蛋白 质所表 达的功 能只有 在同一 细胞内 其他蛋 白质的 功能和 活性同 时表达 时才有 意义。 因此生 物学家 正在努 力做宏 观思考 ,去 理解系 统而不 只是理 解组分 ,寻求 复 杂性的 意义。 1.2 蛋白质 组学? 它不 过是我 们过去 称之为 蛋白质 化学的 学科! 对 新思想 、术 语和方 法人们 通常说 它们其 实不是 新发展 来的, 因此解 释蛋白 质组 学与蛋 白质化 学的不 同是很 重要的 。表 1.1 对各自 的主要 特征作 了小结 。蛋 白质化 学包括 研究蛋 白质的 结构和 功能, 通常涉 及物理 生物化 学或机 械酶学 。研 究工作 通常包 括完整 列测定 、结 抅测定 以及进 行结构 控制功 能的模 型研究 。物 理生物 化学家 和酶学 v 蒙在 同一时 间内只 研究一 个蛋白 质或多 亚基蛋 白质复 合物。 表 1.1 蛋白 质化学 和蛋白 质组学 的不同 蛋白 质化学 蛋白 质组学 单一 蛋白质 复杂 混合物 全序 列分析 部分序 列分析 强 调结构 与功能 强 调通过 数据库 匹配进 行蛋白 质鉴定 结构 生物学 系统 生物学 蛋 白质组 学研究 多蛋白 质系统 ,重 点研究 作为一 个大系 统或部 分网络 的组成 的 多个不 同蛋白 质的相 互作用 。蛋 白质组 学需进 行复杂 混合物 的分析 ,不 是通过 完整 序列测 定进行 鉴定, 而是在 数据库 匹配工 具帮助 下进行 部分序 列测定 。蛋白 质组学 的内容 是系统 生物学 ,而不 是结构 生物学 。换 句话说 ,蛋白 质组学 的要点 是鉴定 系统的 行为而 不是任 何单一 组分的 行为。 1.3 我们能 测定基 因表达 ,为 什么 还要有 蛋白质 组学? 基因微 阵提供 了细胞 中大量 或全部 基因表 达的快 速检测 。然 而从 mRNA 水平 并不一 定能预 测细胞 中相应 蛋白质 的水平 。各种 mRNA 不同 的稳定 性和不 同的翻 译效率 能够影 响新蛋 白质的 产生。 蛋白质 形成后 ,在稳 定性和 转换速 度上有 很大不 同 。许多 参与信 号传导 、转 录因子 调节和 细胞周 期控制 的蛋白 质迅速 转换, 这是其 活 性调节 的一种 方式。 mRNA 水平没 有告诉 我们相 应蛋白 质的调 节状态 ,蛋 白质 的活性 和功能 常有一 些内源 翻译后 的改变 ,也 会因 环境因 素而改 变。、 1.4 蛋白质 组学: 对分析 的挑战 如 何同时 测定一 个生物 中大量 或全部 基因的 表达似 乎已通 过引入 cDNA 或 寡 核苷酸 微阵得 以解决 。用 DNA 微阵 和相关 方法分 析基因 表达依 赖于两 个重要 工具: 聚合酶 链反应 (PCR) 和 寡核苷 酸与互 补序列 的杂交 。但是 没有类 似的工 具用 于蛋白 质分析 。首先 ,没有 蛋白质 PCR 等价物 。目前 不可能 有多肽 分子以 类似 于核苷 酸通过 PCR 复 制的方 式复制 。少量 的寡核 苷酸可 以通过 PCR 进行扩 增 ,而 少量的 蛋白质 必须在 没有任 何扩增 的情况 下进行 测定和 分析。 第二 ,蛋 白质不 能专一 性与互 补氨基 酸序列 杂交。 Watson-Crick 碱 基配对 允许 寡核苷 酸与互 补序列 杂交。 一个特 定的互 补寡核 苷酸序 列可以 作为高 度专一 性探针 ,一个 特定的 mRNA 或 其他核 酸片段 可以与 之结合 。这种 专一性 允许在 微阵上 有一个 特定的 点以便 识别单 一序列 。尽 管抗 体和寡 核苷酸 结合子 (aptam- er, 也称 适体) 可以识 别特定 的肽或 蛋白质 ,但 是这 种识别 不能简 单地根 据序列 来预测 ,而 寡核苷 酸的杂 交则可 以根据 序列来 预测。 另一个 蛋白质 组学的 特有问 题是细 胞中每 一个蛋 白质产 物并不 一定只 有一种 分 子实体 。这是 由于蛋 白质有 翻译后 修饰。 修饰的 内容和 变化随 不同的 蛋白质 、细 胞的调 节机制 和环境 因子而 变化, 蛋白 ^ 以 _ 种? 在 。对任 何特定 基因的 多种蛋 白质产 物进行 检测和 区分的 使 蛋&质 析方面 更具挑 战性。 蛋白质 组的分 析需要 一套不 同于基 因表达 分析的 工具, 能够对 修饰和 非修饰 的蛋白 质进行 检测和 定量的 分析。 我们怎 样应对 这项任 务是这 本书的 主题。 1.5 蛋白 质组学 的工具 尽 管上面 描述了 分析蛋 白质组 学的不 利条件 ,但 是鉴定 蛋白质 组及其 组分实 际上可 以完成 。这 是由 于以下 4 种重要 工具的 发展和 结合使 用给研 究人员 提供了 灵 敏性和 专一性 较高的 识别和 鉴定蛋 白质的 方法。 第一 种工具 是数据 g 蛋 白质、 EST 和 基因组 序列数 据库共 同提供 了生物 表 达全部 蛋白质 的完整 fT 据 库目录 。例如 ,根 据对果 蝇的所 有编码 序列的 分析, 我们 知道有 110 个果蝇 基因编 码具有 EGF 类结构 域的蛋 白质, 87 个基因 编码具 有酪氨 酸激酶 催化结 构域的 蛋白质 。在 进行果 蝇蛋白 质组学 研究时 ,我们 检索大 量已知 的可能 蛋白质 结构域 。当 用限 定的序 列信息 ,甚至 原始质 谱数据 (见下 文) 进行检 索时, 我们可 以根据 质谱数 据与数 据库的 匹配情 况鉴定 蛋白质 组分。 第二 种工具 是质谱 (MS)。 质 谱仪的 使用在 过去十 年中有 了极大 的革新 ,在 发展 为分析 生物分 手~,# 别是 分析蛋 白质和 肽的高 灵敏度 和高可 靠性上 达到顶 点。 MS 仪器的 使用可 提供三 类分析 ,这 三类 分析在 蛋白质 组学分 析中都 非常有 用。 首先, MS 可 以进行 100 kDa 或更大 完整蛋 白质的 精确质 量测定 。估 计蛋白 质质量 的最好 方法是 MS 分析, 而不是 测定蛋 白质在 十二烷 基硫酸 钠-聚 丙烯酰 胺凝 胶电泳 (SD&PAGE) 的迁移 。高 精度蛋 白质质 量测定 的应用 有限, 因为它 们 往往不 够灵敏 。净 质量对 精确鉴 定蛋白 质往往 是不充 分的。 其次, MS 也能对 蛋白质 水解消 化产生 的肽进 行精确 的质量 测定。 相对于 完整蛋 白质质 量测定 ,肽 质量测 定可以 有高灵 敏度和 高质量 准确度 。可 以直接 用肽质 量测定 数据在 数据库 中进 行检索 ,这样 常常可 以确切 鉴定靶 蛋白质 。最 后, MS 可以对 蛋白质 水解消 化得 到的肽 序列进 行分析 。目 前认为 MS 是 肽序列 分析中 的最新 技术。 MS 序列 数 据为蛋 白质鉴 定提供 了最有 力和最 精确的 方法。 蛋白质 组学的 第三个 必要工 具是对 数据库 中特定 蛋白质 序列与 MS 数 据进行 比 对的各 种软件 。前面 提到从 MS 数据 可以测 定序列 ,但是 这种从 头开始 分析成 百上千 的谱图 时是一 项费时 费力的 任务。 蛋白质 组学软 件将未 分析的 MS 数据, 在特 定算法 的帮助 下与蛋 白质、 EST 和基因 组序列 数据库 的序列 相比对 ,自动 检测 大量用 于蛋白 质序列 匹配的 MS 数据 。然 后研究 人员检 查自动 检测的 结果, 估 计数据 的质量 ,所用 的时间 比手工 解释每 一张谱 图要少 得多。 蛋白质 组学的 第四种 必需工 具是蛋 白质的 g 析# 离技术 。在蛋 白质组 学中蛋 白质分 离有两 个目的 。第一 ,通 过将蛋 白质混 禽成单 一蛋白 质或蛋 白质小 组以简 化复杂 蛋白质 混合物 。第二 ,蛋 白质的 分离分 析可以 比较两 个样品 蛋白质 的不 「同 表观, 研究者 可以标 记用于 分析的 特定蛋 白质。 2I>SDS~PAGE 是 最广泛 用于 蛋白质 组学的 技术。 2D 凝胶 电泳 也许是 在复杂 样品中 分离蛋 白质的 最好单 项技术 。其 他的蛋 白质分 离技术 ,包括 1I>SDS~PAGE、 高效液 相层析 (HPLC)、 毛细 管电泳 (CE)、 等 电聚焦 (IEF) 和亲 和层析 ,也 都是分 析蛋白 质组 学的有 用工具 。最有 力的技 术是将 不同的 蛋白质 和肽分 离技术 结合为 多维技 术 。例如 ,离子 交换液 相层析 (LC) 与反相 (RP) -HPLC 的串联 是分离 复杂肽 混合物 的有力 工具。 这四种 工具的 结合形 成了蛋 白质组 学当前 的技术 ,每一 种工具 在技术 上都发 展迅速 。在 本书 的后面 几章我 们将讨 论每一 种分析 工具。 1.6 蛋白 质组学 的应用 蛋白质 组学技 术确实 很新颖 ,但是 鉴定蛋 白质组 究竟是 为了什 么呢? 根据目 前 的实践 ,蛋 白质组 学包括 4 项主 要应用 ,它们 是:① 采集; ②蛋 白质表 达谱; ③蛋 白质网 络谱; ④蛋 白质 修饰谱 。下面 对上述 每一项 进行简 短定义 ,在 本书其 后各章 将详细 讨论。 采 集是鉴 定样品 中所有 (或尽 可能多 ) 的 蛋白质 。采集 主要是 直接对 蛋白质 组进行 分类, 而不是 通过基 因表达 (如通 过微阵 ) 数 据来推 断蛋白 质组的 组成。 蛋白 质组学 中采集 需要耗 费大量 的劳动 ,以使 蛋白质 得到最 大程度 的分离 ,然后 使用 MS 和相 关的数 据库以 及软件 工具进 行鉴定 。有 几种采 集方法 ,每一 种都有 其优点 。这 些方法 的联用 可直接 分析证 实那些 只能从 基因表 达数据 推断的 数据。 蛋白质 表达谱 是鉴定 生物或 细胞特 定状态 ( 如分化 、发 育状态 或疾病 状态) 下 蛋白质 的表达 或药物 、化学 或物理 刺激下 蛋白质 的表达 。表 达谱其 实是特 殊的采 集形式 ,分 析中 比较一 个特定 系统的 两种不 同状态 。例如 ,比 较正常 细胞和 病理细 胞 中哪些 蛋白质 有不同 的表达 。这 种信息 对于检 测药物 治疗的 潜在靶 子极为 有用。 蛋白质 网络谱 是在生 物系统 中测定 蛋白质 之间相 互作用 的蛋白 质组学 方法。 大多 数蛋白 质在执 行功能 时与其 他蛋白 质密切 相关。 这些相 互作用 决定蛋 白质功 能网络 (如信 号传导 级联过 程和复 杂的生 物合成 或降解 途径) 的功能 。大 多数蛋 白质 -蛋白 质相互 作用是 通过体 外纯化 的蛋白 质和用 酵母双 杂交系 统获得 。通过 亲和俘 获配对 技术与 分析蛋 白质组 学方法 相结合 ,蛋 白质组 学可以 鉴定更 复杂的 蛋白 质网络 。蛋白 质组学 方法已 用来鉴 定多蛋 白质复 合物的 组分。 在细胞 中多蛋 白质复 合物与 点到点 的信号 传导途 径有关 。蛋 白质网 络谱可 以测定 途径中 所有参 与者的 状态。 蛋白质 网络谱 是蛋白 质组学 最具远 大前景 的应用 之一。 蛋 白质修 饰谱是 鉴定蛋 白质怎 样和在 何处被 修饰的 。许 多蛋白 质翻译 后的修 饰 控制着 蛋白质 的靶向 、结构 、功能 和转换 。此外 ,许多 环境化 学因素 、药 物和 内源 化学因 素可产 生修饰 蛋白质 的活性 亲电体 。研究 人员已 开发了 各种分 析工具 用以鉴 定修饰 蛋白质 和修饰 的性质 。修饰 蛋白质 可用抗 体测定 (如 用特定 磷酸化 氨基 酸残基 的抗体 ), 但是一 个特定 修饰的 精确序 列位点 往往是 未知的 。蛋 白质 组学 方法是 研究翻 译后修 饰的性 质和序 列专一 性的最 好方法 。这项 方法的 扩展允 许在一 个网络 中同时 鉴定调 节蛋白 质的修 饰状态 ,这 是蛋白 质组学 技术的 重要扩 充 。这 些方法 用新方 式回答 蛋白质 组的化 学修饰 怎样影 响生物 系统的 问题。 推 荐读物 Brown, P. O. and Botstein, D. (1999) Exploring the new world of the genome with DNA microarrays, Nat. Genet. 21 , 33 — 37. DeRisi, J. L. , Iyer, V. R. , and Brown, P. O. ( 1997) Exploring the metabo- lic and genetic control of gene expression on a genomic Science 278, 680 一 686. Eisen, MB., Spellman, P. T. , Brown, P. O. , and Botstein, D. (1998) Cluster analysis and display of genome-wide expression patterns. Pros. Natl. Acad. Sci. USA 95, 14, 863 — 14, 868. Fields, S. (2001) Proteomics in genomeland. Science 291, 1221 一 1224. Lander, E. S. , Linton, L. M. , Birren, B. , Nusbaum, C. , et al. (2001) Initial sequencing and analysis of the human genome. Nature 409, 860 — 921. Lashkari , D. A. , DeRisi, J. L. , McCusker, J. H. , Namath, A. F. , Gen- tile, C. , Hwang, S. Y. , et al. ( 1997) Yeast microarrays for genome wide parallel genetic and gene expression analysis. Proc. NatL Acad. Sci. USA 94, 13, 057 — 13, 062. Pandey, A. and Mann, M. ( 2000 ) Proteomics to study genes and ge- nomes. Nature 405, 837 一 846. Venter, J. C. , Adams, M. D. , Myers, E. M. , Li, P. W. , Mural, R.J. , et al. (2001) The sequence of the human genome. Science 291, 1304 — 1351. Wilkins, M. R. , Sanchez, J. C. , Gooley, A. A. , Appel, R. D. , Humphery- Smith, I. , Hochstrasser, D. F. , and Williams, K. L. ( 1996 ) Progress with proteome projects: why all proteins expressed by a genome should be identified and how to do it. BiotechnoL Genet. Eng. Rev. 13^ 19 一 50. • 8 • 2 蛋 白质组 2.1 蛋白 质组与 基因组 每 一个人 类细胞 中含有 制造一 个完整 的人所 需的全 部信息 。然而 ,并 不是全 部基因 在所有 细胞中 都表达 。编 码细胞 实现基 本功能 (如 葡萄糖 代谢、 DNA 合 成) 必需酶 的基因 在所有 细胞中 表达, 而具有 高度专 一功能 的基因 只在特 定类型 的细胞 中表达 ( 如视紫 红质在 视网膜 色素上 皮细胞 中表达 )。 一个 细胞中 表达两 类基因 :①必 f 功能 蛋白# 的 基因; ②行 使细 胞专一 性功能 蛋白质 的基因 。因 此 ,一种 生物有 一个基 因组, 但有许 多蛋白 质组。 任何细 胞的蛋 白质组 是所有 可能基 因产物 的某种 子集, 但这并 不意味 着蛋白 质组 比基因 组简单 。事实 正相反 ,任何 蛋白质 ,即 使只 是同一 个基因 的产物 ,也 可能存 在多种 形式。 在一个 特定的 细胞内 或在不 同的细 胞之间 ,蛋 白质的 存在形 式可 能不同 ,大多 数蛋白 质都以 几种不 同的修 饰形式 存在。 这些修 饰影响 着蛋白 质 的结构 、定位 、功 熊和 转换。 在这 一章从 5 个 5 •面 讨论蛋 白质组 。首先 ,扼 要讨 论蛋白 质的“ 生命周 期”, 从蛋白 质作为 翻译产 物在核 糖体上 出现, 到翻译 后的多 种修饰 ,再 到最终 降解。 第二 ,讨论 可根据 蛋白质 的序列 基序、 结构域 的结构 和生化 功能分 成具有 不同标 准组件 结构的 蛋白质 。第三 ,讨论 功能蛋 白质家 族在基 因组中 的分布 。第四 ,通 过基 因组序 列讨论 在生物 系统中 有多种 功能和 冗余功 能的蛋 白质组 。最后 ,讨论 在特 定时间 内影响 一个蛋 白质在 细胞中 存在数 量的各 种因素 ,并讨 论这些 因素给 蛋白质 组学分 析方法 带来的 困难。 2.2 蛋白 质的生 命周期 蛋白质 的合成 是通过 在核糖 体上将 mRNA 翻译成 多肽来 进行的 。大 多数情 况下 ,最初 的多肽 翻译产 物要进 行某种 类型的 修饰后 才具有 功能。 这些修 饰统称 为“ 翻译后 修饰” ,包括 各种可 逆和不 可逆化 学反应 。已 报告 有接近 200 种不同 类型 的翻译 后修饰 。图 2.1 表明 一个原 型蛋白 质的生 命周期 ,并总 结了一 些修饰 作用。 蛋 白质是 mRNA 序列通 过核糖 体翻译 产生的 。半 胱氨 酸的巯 基形成 二硫键 的折叠 和氧化 ,使 多肽随 机卷曲 具有二 级结构 。若干 “永久 ”修饰 ,如谷 氨酸的 羧化 和去除 N 端甲 硫氨酸 ,在 多肽生 成的早 期发生 。在高 尔基体 的进一 步加工 图 2.1 蛋白 质的生 命周期 产生 糖基化 。蛋白 质到特 定的亚 细胞或 细胞外 区域的 专一性 运送往 往需要 有前导 肽或 f 号 肽序列 ,这 些前导 肽或信 号肽在 完成定 位后被 蛋白水 解酶切 割除去 。某 些蛋 ^ 质上 还进行 辅基加 成作用 。一个 特定蛋 白质可 与其他 蛋白质 结合形 成多亚 基复 合物。 半胱氨 酸残基 的棕榈 酰化或 异戊二 烯化辅 助蛋白 质进入 膜内或 嵌在膜 上。 这些不 同程度 的“永 久”性 修饰和 寧 送使 功能蛋 白质进 人细胞 的特定 位置。 蛋白 质在细 胞内的 特定部 位执行 其功能 。翻译 后修饰 调控许 多蛋白 质的活 性 ,最重 要的和 研究较 深人的 翻译后 修饰是 丝氨酸 、苏 氨酸 或酪氨 酸残基 的磷酸 化。 磷酸化 可以使 酶活化 或失活 、改变 蛋白质 -蛋白 质相互 作用和 连接、 改变蛋 白 质结构 、引 起蛋白 质降解 。蛋白 质的磷 酸化以 各种形 式调节 蛋白质 的功能 ,是 信号传 导级联 反应、 细胞周 期调控 和其他 重要细 胞功能 的快速 调控中 的关键 开关。 蛋白质 也易受 损伤。 在生物 系统中 普遍存 在的自 由基和 其他氧 化剂导 致蛋白 质的氧 化损伤 。半 胱氨酸 巯基对 氧化特 别敏感 。甲硫 氨酸、 色氨酸 、组氨 酸和酪 氨酸 残基容 易发生 氧化。 氨基酸 也易受 脂类和 糖类氧 化产物 的攻击 ,这包 括活化 • 10 • 的 a, 不饱 和羰基 化合物 。除了 这些引 起蛋白 质修饰 的内源 因素外 ,辐射 、化 学和 药物等 环境因 素也能 引起蛋 白质的 共价修 饰或氧 化修饰 。许多 修饰作 用可引 起蛋白 质失活 。各 种修饰 因素都 可改变 某些蛋 白质的 结构。 蛋白质 修饰对 于引发 蛋白质 降解的 过程很 重要。 某些蛋 白质磷 酸化后 迅速与 泛 素连接 ,并被 26S 蛋白酶 体复合 物降解 。细 胞中其 他因素 也可导 致蛋白 质的泛 素化 ,包 括氧化 损伤和 蛋白质 的其他 修饰。 蛋白质 也可以 通过溶 酶体酶 降解。 图 2. 1 表明了 蛋白质 组的一 个要点 :在细 胞中任 何时间 任何蛋 白质都 可能以 多种形 式存在 ,从 而使蛋 白质组 变得异 乎寻常 地复杂 。另一 方面, 蛋白质 组的状 态反 映了细 胞的所 有功能 状态。 2. 3 具有标 准组件 结构的 蛋白质 另一种 研究蛋 白质的 方式是 把它们 想像成 具有标 准组件 或标准 组件拼 接的结 构 。某 些氨基 酸序列 倾向于 形成如 a 螺旋或 卩折叠 的二级 结构, 或随机 卷曲结 构 。特 定的氨 基酸序 列和从 这些序 列产生 的二级 结构具 有特定 的性质 和功能 。可 以认为 氨基酸 序列片 段是功 能的建 筑部件 或组件 。大 自然用 这些组 件建造 了工具 箱 ,通 过这个 工具箱 ,可以 建造多 种具有 相关功 能的蛋 白质。 具 有特定 性质和 功能的 蛋白质 标准组 件单位 称为“ 基序” 或“结 构域” 。不 同蛋 白质中 存在的 结构域 ,其可 识别序 列有类 似性质 或功能 。一 般在 使用时 ,这 些术 语往往 可替换 使用。 在某些 情况下 ,基序 或结构 域的氨 基酸序 列高度 保守, 不随 蛋白质 的不同 而变化 。还有 一些情 况下, 一个序 列中某 些关键 氨基酸 以重复 形 式存在 ,而另 一些氨 基酸可 有各种 变化。 即使某 些短序 列也能 赋予蛋 白质某 些专一 性修饰 。例 如, iV- 糖基化 的蛋白 质序 列中多 含有三 肽序列 “Asn-Xaa-Ser/Thr”。 在这个 序列中 ,靶 子天 冬酰胺 之 后可以 是任何 氨基酸 ,接 下来的 氨基酸 是丝氨 酸或是 苏氨酸 。如果 Xaa 是脯 氨酸 ,则 不能进 行糖基 化修饰 。尽管 这个三 肽序列 并不能 保证一 定进行 iV- 糖基 化修饰 ,但 是它提 供了一 种基序 ,这 种基序 提供可 能的生 物化学 作用。 较 长氨基 酸序列 常形成 结构域 ,赋 予蛋白 质特定 的性质 或功能 。某 些结构 域结 构只是 赋予一 个肽段 重要物 理性质 ,如 跨膜结 构域, 一般形 成跨脂 双层膜 的 a 螺旋 。另一 些结构 域能够 为重要 酶底物 和辅基 提供氢 键或其 他接触 。例 如 ,真核 丝氨酸 / 苏氨 酸蛋白 激酶有 一个富 甘氨酸 的核心 结构域 。这个 富甘氨 酸区域 位于与 ATP 结 合的赖 氨酸残 基和作 为催化 中心的 保守的 天冬氨 酸残基 周围 。在 许多情 况下, 结构域 由二级 结构单 位的结 合组成 ,如螺 旋-环 - 螺旋结 构域。 基序和 结构域 对蛋白 质组的 意义是 它们代 表从蛋 白质序 列到蛋 白质功 能的翻 译 。当 已知性 质和功 能的结 构域和 基序出 现在未 知功能 的蛋白 质中时 ,可 以推测 其细胞 功能。 简言之 ,分析 蛋白质 组学可 以确定 序列, 序列可 以确定 功能。 • 11 • 2.4 功 能蛋白 质家族 另一种 研究蛋 白质组 的方式 是将它 分成具 有类似 功能的 蛋白质 家族。 例如, 某些 蛋白质 具有结 构作用 ,另一 些蛋白 质参与 信号传 导途径 ,还有 一些蛋 白质调 控如 核酸合 成或糖 代谢等 必需代 谢途径 。根据 结构域 及其相 关功能 作用的 分类, Venter 及 同事推 测出人 类基因 组所编 码蛋白 质的功 能分布 (图 2. 2)。 细胞黏 着分子 (577, 1.9%) 混合 蛋白质 (1 318, 4 3%)' 病 毒蛋白 (100, 0.3%) 转移 / 载 体蛋白 (203, 0 7%) 转 录因子 (丨 850, 6 0%) 核酸 _ (2 308, 7 5%) 信 号分子 (376, 1 2%) 受体 (1 543, 5 0。/〇 激酶 (868, 2 8%) 选 择性调 节分子 (988, 3.2%) 转移酶 (610, 2 0。/〇> 合酶和 合成酶 (313, 氧化 还原酶 (656, 2.1%) 裂合酶 (117, 0 4%) 连接酶 (56, 0.2%) 异构酶 (163, 0.5%) 水解酶 ( 丨 277, 4 0°/。) 分 子伴侣 (159, 0.5%) 细胞 骨架结 构蛋白 (876, 2.8%) 细胞 外基质 (437, 1 4%) 免疫 球蛋白 (264 , 0 9% > 离 子通道 (406, 1.3%) 动 力蛋白 (376, 1.2%) 肌肉结 构蛋白 (296,1 0%) 原 癌荸因 (9〇229%) .选择 II 钙结 合畜白 (34, 0.1%) 细 胞内转 运蛋白 (350, 1 1%) 转 运蛋白 (533, 1.7%) GO 分类 未知分 子功能 蛋白质 (12 809, 41 7%> Panther 分类 图 2. 2 推 测的人 类基因 组蛋白 质产物 的功能 [Venter et al. (2001) Science, 291 : 1304 〜 1351] 与中间 @ 谢 和核酸 代谢有 关的酶 占蛋白 质组的 15%。 与结构 和蛋白 质合成 与转换 相关时 € 白质 ( 细胞骨 架蛋白 、核糖 体蛋白 、分 子伴 侣知蛋 白质降 解相关 因子) 总共占 15% 〜 20%。 信 号传导 蛋白和 DNA 结合 蛋白占 20% 〜 25%。 尽 管这 些数字 给由蛋 白质功 能来解 析基因 组提供 了有价 值的参 考数据 ,但我 们并不 能确 定在细 胞中某 一特定 时间某 一特定 蛋白质 或某类 特定蛋 白质的 表达量 。接近 40% 的 基因组 编码的 蛋白质 功能尚 属未知 。确 定这些 基因产 物的功 能是人 类功能 基因 组学面 临的最 基本的 挑战。 2.5 从 基因组 推算蛋 白质组 对鉴 定生物 基因组 的研究 人员来 说一个 最有趣 的问题 是“有 多少基 因?” 。这 个问 题的答 案可以 使我们 得到共 有多少 蛋白质 存在于 蛋白质 组中的 概念。 几种生 物的全 部基因 组序列 已经测 序完成 ,这 些数据 允许分 析家预 测所有 基因的 产物。 根据推 测的每 一个基 因产物 的氨基 酸序列 ,按 照蛋白 序列中 所含的 结构域 和序列 k • 12 • 基 序已对 它们进 行分类 。例如 ,酿酒 酵母有 119 个基 因编码 具有真 核蛋白 激酶结 构域的 蛋白质 ,另 外有 47 个 基因编 码具有 C2H2 类型 锌指结 构域的 蛋白质 。结 构域序 列特征 与基因 组序列 的比较 表明生 物基因 组为各 种类型 蛋白质 编码。 最 近对酿 酒酵母 、线 虫和果 蝇的分 析揭示 出这些 生物的 基因组 大小与 预测的 蛋白质 组容量 之间有 着非常 有趣的 关系。 Gerald Rubin 和同 事根据 已存在 的特定 的结 构域, 对通过 流感嗜 血杆菌 、酿酒 酵母、 线虫和 果蝇基 因组预 测的蛋 白质产 物进行 了分类 (图 2. 3)。 比较所 有预测 的蛋白 质产物 ,结 果表明 基因组 中存在 序列与 其他物 种蛋白 质序列 稍有不 同的蛋 白质。 通过对 这些冗 余蛋白 质产物 (称 为平行 进化同 源物) 的校正 可以计 算每一 种生物 的“核 心蛋白 质组” 。这 种核心 蛋白 质组代 表生物 的不同 蛋白质 家族的 汇集。 果蝇 秀 丽新小 杆线虫 酿 酒酵母 流感嗜 血杆菌 图 2. 3 根据 流感嗜 血杆菌 (1 709 个基因 )、 酿 酒酵母 (6 241 个基因 )、 秀 丽新小 杆线虫 (18 424 个基因 ) 和果蝇 (13 601 个基因 ) 基 因预测 的蛋白 质产物 实 心柱表 明为单 一蛋白 质编码 的基因 ,空 心柱表 示为平 行进化 同源物 编码的 基因。 对 这些生 物的核 心蛋白 质组的 研究揭 示出两 个令人 感兴趣 的方面 。首先 ,一 种 生物的 复杂性 和基因 组中基 因数量 之间的 关系是 复杂的 。当然 ,酵 母要 比细菌 的基因 数目多 ,比 蠕虫和 蝇类少 。然而 ,蝇类 (果蝇 ) 是 比蠕虫 (线虫 ) 要复杂 得多 的生物 ,它却 有较少 的基因 (蝇类 13 601 个 ,蠕虫 18 424 个 ), 有较 少的核 心蛋 白质组 ( 蝇类有 8 065 个特有 蛋白质 ,蠕 虫则有 9 543 个 )。 这 说明生 物复杂 性并不 是因为 数量较 大的基 因数目 ,而 更为复 杂的基 因调节 和蛋白 质产物 的功能 可用 以说明 蝇类的 更高的 复杂性 。第二 ,平行 _选化_旬的 数量在 蠕虫和 蝇类中 显 著增加 。这 反映了 蠕虫和 蝇类几 乎大约 l 的基 他基因 的复制 。含 有复 制基 因的基 因家族 常常形 成相同 染色体 上的基 因簇。 最 近完成 的人类 基因组 序列测 定表明 人类基 因组有 30 000 〜 40 000 个 基因。 人类 的复杂 性与蠕 虫相比 有极大 的不同 ,人类 基因组 仅是蠕 虫编码 基因的 两倍, 这确实 令人感 到惊奇 。人 类基因 组中的 单一基 因与平 行进化 同源物 的数目 还不能 5 000 10 000 15 000 20 000 • 13 • 确 切估计 。然而 ,已 经公 认的是 人类的 复杂性 在于人 类蛋白 质组的 多样性 ,而不 是 人类基 因组的 大小。 2. 6 基 因表达 、密码 子偏倚 和蛋白 质水平 研究蛋 白质组 的关键 课题之 一是细 胞中某 个特定 蛋白质 的表达 水平。 蛋白质 表达 水平变 化极大 ,从几 个拷贝 到多于 百万个 拷贝〗 但细胞 中蛋白 质表达 水平与 其意 义大小 无关。 中间代 谢的关 键酶或 结构蛋 白质在 每个细 胞中有 几千拷 贝或更 多, 而与细 胞周期 调节有 关的某 些蛋白 激酶在 每个细 胞中仅 有几十 个拷贝 。酿酒 酵母有 6 000 个基因 ,根据 mRNA 水平 推测, 有大约 4 000 个基因 在任何 时间都 表达。 细胞中 某一蛋 白质在 某一特 定时间 的表达 由下列 因素控 制:① 基因的 转录速 度; ② mRNA 翻 译成蛋 白质的 效率; ③细胞 中蛋白 质的降 解速度 。基因 表达确 实在 很大程 度上决 定蛋白 质水平 。然而 ,有些 研究表 明基因 表达自 身并不 与蛋白 质 水平紧 密相关 。这 一发现 也证明 了前面 提到的 mRNA 的 翻译效 率和蛋 白质降 解速度 对细胞 内蛋白 质表达 水平的 影响, 同时也 指出了 基因表 达分析 (如 微阵) 的局 限性。 . 许多基 因受可 诱导转 录因子 的调节 ,这些 转录因 子又是 受多种 外界环 境影响 因素 的调节 。许 多基因 表达水 平也受 内部决 定因素 —— “密 码子偏 倚”现 象的影 响。“ 密码子 偏倚” 描述了 一个生 物为相 同氨基 酸编码 时偏向 于使用 某些密 码子。 所以 ,含有 不常使 用的密 码子的 基因倾 向于较 低水平 表达。 根据酵 母基因 计算的 密码 子偏倚 值约从 0.2 到 1.0。 密 码子偏 倚值为 1.0 时 有最高 水平基 因表达 。大 多数酵 母基因 的密码 子偏倚 值小于 〇. 25, 表明这 些基因 在相对 低水平 表达。 比 较酵母 某些蛋 白质的 蛋白质 水平、 mRNA 表达和 密码子 偏倚值 ,尽 管在 某些方 面不完 全一致 ,但可 以概括 如下。 • 具有 低密码 子偏倚 g 的基因 倾向于 低水平 表达, 无 论根据 mRNA 表达或 蛋白 质水平 @ 分 析都是 •当基 因的密 码子偏 倚值为 0.25 或 更低时 ( 如大多 数基因 ), mRNA 水平 与蛋白 质水平 的相关 性很差 〇<0. 4)。 对 大多数 高表达 的基因 ( 密码子 偏倚值 大于 0.5 的基因 ), mRNA 水 平与蛋 白质水 平的相 关性要 高很多 (r>0. 85)。 •长寿 蛋白质 比短命 蛋白质 (迅速 降解的 蛋白质 ) 以明 显较高 的丰度 存在。 因 而尽管 基因表 达测定 可能表 明蛋白 质水平 的改变 ,但 很难从 基因表 达水平 推断蛋 白质的 水平。 2. 7 分 析蛋白 质组学 的结论 和意义 在任何 生物中 ,蛋 白质 组是所 有基因 产物的 30% 〜 80% 的汇集 。虽 然某些 蛋 白质以 较高水 平表达 (每 个细胞 1〇4 〜 1〇6), 但是 大多数 蛋白质 都以相 对低的 • 14 • 水 平表达 (每 个细胞 101 〜 1〇2), 与基 因表达 的绝对 量无关 ,大多 数蛋白 质以多 种翻 译后修 饰形式 存在。 这样就 给蛋白 质组学 提出了 巨大挑 战:我 们必须 找到测 定大 量不同 蛋白质 种类的 方法。 这些蛋 白质大 多以相 对低水 平存在 ,很多 以多种 修饰形 式存在 。本 书的下 一部分 描述可 以用来 应对这 个令人 生畏的 问题的 工具。 推 荐读物 Apweiler, R. , Attwood, T. K. , Bairoch, A. , Bateman, A. , Birney, E. , et al. (2001) The InterPro database, an integrated documentation resource for protein families, domains and functional sites. Nucleic Acids Res. 29, 37-40. Coghlan, A. and Wolfe, K. H. (2000) Relationship of codon bias to mRNA concentration and protein length in Saccharomyces cerevisiae. Yeast 16, 1131-1145. Gygi, S. P. , Rochon, Y. , Franza, B. R. , and Aebersold, R. (1999) Corre- lation between protein and mRNA abundance in yeast. Mol. Cell Biol. 19, 1720-1730. Rubin, G. M. , Yandell, M. D. , Wortman, J. R. , Gabor Miklos, G. L. , Nelson, C. R. , et al. (2000) Comparative genomics of the eukaryotes. Sci- ence 287 , 2204 — 2215. Venter, J. C. , Adams, M. D. , Myers, E. W. , Li, P. W. , Mural, R. J. , et al. (2001) The sequence of the human genome. Science 291 , 1304—1351. • 15 • * 晏 合 廣组学 的工具 3 分析蛋 白质组 学概述 在详 细讨论 分析蛋 白质组 学之前 ,我们 先概述 一些基 本方法 。蛋 白质 分析鉴 定 建立在 这样一 个基本 事实上 :大多 数含有 6 个或 6 个以上 氨基酸 的肽序 列在一 个生 物的蛋 白质组 中是惟 一的。 换句话 说 ,我 们可以 将一个 6 氨 基酸肽 定位于 单 一基因 产物中 。因而 ,如 果能 得到肽 的序列 ,或者 能精确 测定肽 的质量 ,就 可以 通过与 蛋白质 序列数 据库的 匹配来 鉴定 肽片段 的蛋白 质来源 (图 3.1)。 当 然某些 6 肽可 能定位 于多个 蛋白质 ,但 典型 的多次 “命中 ”来自 相关蛋 白质的 高度保 守区域 ( 如在第 2 章讨论 的平行 进化 同源物 )。 如 果可以 得到定 位于相 蛋白质 _ 混合杨 消化 肽混合 物_ 分离 分离 蛋白质 消化 MS 分析 图 3.1 数 据库检 索算法 MS 数据 鉴定’ 蛋白质 组分析 的基本 流程图 同 蛋白质 的几个 肽序列 ,这 将加强 匹配的 准确性 。因 而分析 蛋白质 组学的 本质是 将蛋 白质转 换成肽 ,得 到肽的 列 ,然 后根据 在数据 库中的 序列匹 配鉴定 相关的 蛋 白质。 图 3. 1 描 述了分 析蛋白 质组学 的要素 。大 多数分 析蛋白 质组学 的问题 始于蛋 白质混 合物。 混合物 中含有 不同分 子质量 、不 同修饰 作用和 不同溶 解度的 完整蛋 白质。 蛋白质 必须经 切割消 化成多 肽片段 ,因 为质谱 仪往往 不能直 接对完 整的蛋 白质进 行质量 和序列 6^泖[ 定 r 现代 ms 仪 器可以 分析复 杂的肽 混合物 ,但 是组分 相对简 化的肽 混合物 更有利 于收集 数据和 分析。 因而 ,利用 MS 分析蛋 白质混 合物时 ,需 将含 有多种 组分的 复杂混 合物分 离 ,以 获得组 分较少 的简单 混合物 。先 分离出 完整的 蛋白质 ,然 后消化 切割成 肽; 也可以 先将蛋 白质切 割成肽 ,在 分析前 分离肽 。第 4 章和第 5 章描述 了蛋白 质和 肽的分 离以及 将蛋白 质切割 成肽。 有 两种类 型的质 谱仪可 用于分 析多肽 。第 一种类 型属于 基质辅 助激光 解吸电 离-飞 行时间 (MALDI-TOF) 仪器 ,主要 用以测 定多肽 的质量 。第 二种 类型属 于电喷 雾电离 (ESI) - 串联 MS 仪器 ,用于 分析多 肽的序 列数据 。在第 6 章将对 这些仪 器进行 描述。 在特定 软件的 帮助下 ,将质 谱仪数 据与数 据库中 的肽序 列进行 比对以 鉴定肽 和肽 序列。 这样可 基本上 确定混 合物中 蛋白质 的特性 。进 行这种 类型的 匹配比 对 ,不 需经过 直接的 MS 数 据分析 。第 7 章至第 9 章 描述这 些软件 工具的 使用和 • 19 • 蛋白 质鉴定 方法。 分析蛋 白质组 学总的 来说是 一个测 定过程 。在测 定中, 蛋白质 混合物 转换成 肽混 合物, 得到肽 MS 数据 ,在 软件帮 助下进 行数据 库检索 ,鉴 定相关 的蛋白 质。 蛋白质 组学之 所以作 用强大 是因为 这种测 定可用 于从各 种实验 设计产 生的多 种不 同蛋白 质样品 。蛋白 质组学 之所以 是多用 途的是 因为通 过这种 测定可 以分析 用各 种“前 端”实 验得到 的样品 。这 些前端 实验和 它们的 应用是 本书第 m 部分的 主要 内容。 • 20 • 4 蛋 白质和 肽的分 析分离 4. 1 概 述 蛋白质 混合物 蛋白质 这 一章描 述用于 MS 分 析的蛋 白质样 品的分 离方法 。在 蛋白质 组分析 的这一 阶段必 须考虑 以下两 个方面 (图 4.1)。 首先 ,需将 完整蛋 白质转 换成肽 。常利 用蛋 白水解 酶对蛋 白质进 行消化 。第 分离 二, 需将高 度复杂 的蛋白 质和肽 混合物 分离 形成较 简单的 混合物 。这样 MS 仪 器能 更好地 获得混 合物各 组分的 有用数 据。 这两个 步骤没 有固定 的次序 。可以 先分离 蛋白质 ,然后 消化并 分析肽 。也 可以 先将复 杂的蛋 白质混 合物消 化成图 4.1 蛋白 质组学 分析中 蛋白质 的分离 和消化 肽 ,然后 分离肽 。在 这里将 讨论每 一种方 法的优 缺点。 消化 肽 混合物 消化 分离 肽 4. 复 杂蛋白 质和肽 混合物 在讨论 分离和 消化方 法之前 ,让 我们 先考虑 复杂蛋 白质混 合物的 问题。 MS 仪器能 够从相 对复杂 的混合 物样品 中获得 肽数据 。然而 ,当 样品混 合物的 复杂 程度降 低时, MS 能鉴定 很多的 肽片段 。样品 复杂性 和如何 处理样 品的复 杂性 可以比 作印刷 一本书 。假 如将书 中所有 的字都 印在一 张纸上 ,会产 生一张 被 油墨弄 得基本 上全黑 的纸; 而把要 印刷的 字分配 到多张 纸上, 降低复 杂性, 可以很 容易地 阅读每 一张纸 上的字 。对蛋 白质和 肽的分 离我们 采用类 似的方 法 ,基 本上是 以“一 次一张 纸”的 方式将 肽混合 物引人 MS, 让 仪器尽 可能地 阅读 纸上的 内容。 在分离 不同类 型的蛋 白质和 肽时, 应该先 考虑在 蛋白质 组分析 中需要 处理的 不 同蛋白 质和肽 的数量 。根 据已知 人类基 因组的 数量, 一个人 细胞中 含有约 20 000 个不 同表达 水平的 蛋白质 。假定 其平均 大小为 50 kDa, 含有 平均水 平的赖 氨酸和 精氨酸 ,那 么每个 蛋白质 产生约 30 个胰蛋 白酶肽 。这 样一 个细胞 的蛋白 质可 产生约 600 000 个胰蛋 白酶肽 。下 文中将 看到, 这一数 字即使 对最有 效的多 维蛋 白质和 肽分离 策略也 是一个 极大的 挑战。 4.3 从 生物样 品抽提 蛋白质 在实际 研究中 ,我们 首先是 收集生 物样品 :一块 组织、 一个平 板上培 养的细 • 21 • 胞 、一瓶 细菌、 一片叶 子等等 。样 品通常 经研磨 、匀浆 、超 声破碎 或其他 的破裂 方法 ,产生 在水缓 冲液或 悬浮液 中含有 细胞、 亚细胞 组分和 其他细 胞碎片 的羹汤 般黏稠 物质。 通过若 干技术 从这种 羹汤般 黏稠物 中抽提 蛋白质 。对 于蛋白 质组分 析 ,目 标是回 收尽可 能多的 蛋白质 ,并 尽可能 地减少 其他生 物材料 ( 如脂类 、纤 维素 、核 酸等) 的污染 。抽提 蛋白质 时常用 到以下 试剂: •去 污剂 (如 SDS、 3- [ (3- 胆 胺丙基 )’ 二甲 基氨] -1- 丙烷 磺酸酯 (CHAPS)、 胆酸盐 、吐温 ), 这 些试剂 有助于 溶解膜 蛋白质 ,并有 助于膜 蛋白质 与 脂类的 分离。 •还 原剂 [如 二硫 苏糖醇 (DTT)、 巯基 乙醇、 硫脲] ,用于 还原二 硫键或 防止 蛋白质 氧化。 •变 性剂 (如尿 素和酸 ), 用于 改变溶 液离子 强度和 pH, 破坏 蛋白质 -蛋白 质相 互作用 ,破坏 蛋白质 的二级 和三级 结构。 •酶 (如 DNase, RNase), 用于消 化污染 的核酸 、糖和 脂类。 上面列 出的这 些试剂 可以不 同的方 式结合 使用, 生物学 各个领 域的研 究者发 展了从 各种样 品类型 (如 叶子和 培养的 细胞) 中抽提 蛋白质 的方法 。在某 些方法 中 ,通常 使用蛋 白酶抑 制剂防 止蛋白 酶降解 蛋白质 。简 言之 ,有多 种从生 物样品 中 抽提蛋 白质的 方法。 必须注 意某些 试剂可 能干扰 蛋白质 组分析 。例如 ,丝氨 酸蛋白 酶抑制 剂苯甲 基 磺酰氟 (PMSF) 常 用来在 组织加 工时防 止蛋白 质降解 。然而 ,在 某些 蛋白质 样品中 残存的 PMSF 可能 抑制胰 蛋白酶 的消化 作用。 类似地 ,去 污剂可 能干扰 蛋白质 分离和 蛋白酶 解消化 。了 解样 品的制 备过程 ,对样 品分析 的成败 是很重 要的。 4.4 完整 蛋白质 的分离 广泛 使用的 ,用于 完整蛋 白质分 离的三 种主要 方法是 1I>SDS"PAGE、 21> SDS~PAGE 和 制备等 电聚焦 (IEF)。 还有一 些其他 方法, 特别是 HPLC [反相 (RP)、 大 小排阻 、离 子交换 或亲和 层析] ,也用 于完整 蛋白质 的分离 。分 离完整 蛋白 质是利 用了完 整蛋白 质的物 理性质 (特别 是等电 点和分 子质量 ) 的不同 。样 品 混合物 可以分 成较少 的组分 (如在 1I>SDS~PAGE 和制备 IEF 中 ), 或 分成多 种组分 (在 2EKSD&PAGE 中有 许多点 )。 这 些组分 分别进 行蛋白 酶消化 ,然后 进一 步分离 肽片段 或直接 进行肽 MS 分析。 4. 5 1D-SDS-PAGE 这种在 蛋白质 化学中 广泛使 用的单 向分析 分离方 法也可 用于蛋 白质组 分析。 在 ii>sds^page 中 ,蛋白 质样品 溶解在 通常含 有巯基 还原剂 (巯基 乙醇或 • 22 • DTT) 和 SDS 的 上样缓 冲液中 (图 4. 2)。 基本 原理是 SDS 与蛋白 质结合 ,以与 分子 质量约 恒定的 比例将 负电荷 (来自 SDS 硫酸 基团) 传递给 蛋白质 。高 电压 下, 蛋白质 -SDS 复合物 在交联 的聚丙 烯酰胺 凝胶上 迁移, 其速度 取决于 它们穿 越凝胶 孔基质 的能力 。蛋 白质 按照分 子质量 次序分 离形成 条带。 样品的 1I>SDS~PAGE 在交联 (即丙 烯酰胺 的聚合 ) 度为 5% 〜 15% 的凝胶 上电泳 ,较 大蛋白 质在低 度交联 凝胶中 较容易 通过。 可以根 据样品 中蛋白 质的预 测特征 来选择 交联度 。例如 ,含 有低分 子质量 蛋白质 的样品 可以在 较高交 联度的 • 23 • 凝胶上 得到较 好分离 。也 可以选 择梯度 凝胶, 交联度 从凝胶 的顶部 到底部 逐渐增 加 。梯 度凝胶 可对大 范围分 子质量 的蛋白 质进行 较好的 分离。 用 1I>SDS~P AGE 得到的 分离度 是相当 有限的 ,显 示含 有单一 蛋白质 的条带 实际 上可能 含有多 种蛋白 质分子 。细 胞粗提 物的电 泳凝胶 上一个 跨越约 5 kDa 范 围的 凝胶切 片可能 含有几 十到几 百个不 同的蛋 白质。 甚至一 个“纯 化的蛋 白质” 也可 能含有 多种蛋 白质分 子形式 。比较 蛋白质 样品的 1D 和 2I>SDS~PAGE 可以 很 明显的 看到这 一点。 1I>SDS>P AGE 分 析常显 示出看 上去纯 净的单 一条带 ,而 相同 样品的 2r>SD&PAGE 可将 相同分 子质量 条带分 解成具 有不同 等电点 的多个 点 。这可 能反映 蛋白质 的翻译 后修饰 ,而 化学修 饰几乎 不影响 SDS 结合 或在聚 丙烯 酰胺凝 胶上的 迁移。 由于 蛋白质 分离的 目的是 降低蛋 白质混 合物的 复杂性 ,据前 面提到 的 11> SDS~PAGE 的 局限性 ,使 其似乎 在蛋白 质组分 析中用 处不大 。而 实际上 这种分 离方法 的使用 取决于 样品的 复杂性 。大 多数 1I>SDS~PAGE 在 长度为 5 〜 15 cm 的泳道 分离蛋 白质。 这可以 很容易 将凝胶 切割成 5 〜 50 条凝 胶切片 。对于 高度复 杂的 蛋白质 混合物 ,如完 整细胞 抽提物 ,每一 凝胶切 片可能 仍含有 许多不 同的蛋 白质, 这样获 得的样 品仍不 够简化 。然而 ,用 于蛋白 质组分 析的许 多样品 并不是 完整 细胞抽 提物或 类似的 复杂混 合物。 例如研 究蛋白 质-蛋 白质相 互作用 (将在 后面几 章讨论 ) 的蛋 白质组 学方法 可能含 有相对 较少的 蛋白质 。同样 ,许 多生物 体液 [如 脑脊液 (CSF)、 肺 内衬液 (lung-lining fluid)] 含 有较少 蛋白质 ,对于 这些 混合物 的预先 分离, 1I>SDS~PAGE 可能是 相当合 适的。 4. 6 2D-SDS-PAGE * 这 种分离 方法与 蛋白质 组学是 同义的 ,一 直是分 离高度 复杂蛋 白质混 合物的 最好 方法。 2I>SDS^PAGE 实际上 是两种 不同分 离方法 的结合 。首先 ,根 据等电 点用 IEF 分离 蛋白质 。第二 ,在 聚丙 烯酰胺 凝胶上 电泳进 一步分 离聚焦 的蛋白 质 (图 4.3)/2!>SDS~PAGE 在第 一向电 泳根据 等电点 的不同 ,第 二向电 泳根据 分 子质量 的不同 分离蛋 白质。 尽管 2I>SD&P AGE 是分离 复杂蛋 白质混 合物的 最有效 方法, 但是在 20 世 纪 70 年代早 期采用 后的许 多年来 ,没有 得到广 泛使用 。这反 映了: ①进行 IEF 步 骤的技 术相对 困难; ②使等 电聚焦 的蛋白 质进入 SDS^PAGE 凝胶 的困难 。在 2I>SDS^PAGE 的 最初形 式中, IEF 步骤 依赖于 “管式 凝胶” ,这 种凝胶 需要许 多 技巧进 行操作 。而且 管式凝 胶中的 pH 梯度很 难重复 。细 软管式 凝胶中 含有的 等电聚 焦蛋白 质很难 有效地 转移到 SDS^PAGE 平板凝 胶上。 因而, 2I>SDS~ PAGE 难 于操作 ,重复 性差。 新式 2I>SDS~PAGE 系统 的引入 大大改 善了这 一状况 。新 系统使 用固相 pH 梯度 (IPG) 胶条 和相对 简易的 硬件, 能很容 易地从 IPG 胶 条将蛋 白质转 • 24 • 移到 SDS^PAGE 平板凝 胶中。 IPG 胶条使 用固相 pH 梯度。 在固相 pH 梯 度中, 聚羧酸 两性电 解质固 定在支 持物上 ,产生 可重复 的稳定 pH 梯度 。现在 可以从 主要 供应商 购买在 各种或 宽或窄 pH 范 围重复 分离的 IPG 胶条。 使用窄 pH 范 围有 助于分 离具有 相似等 电点的 蛋白质 。图 4. 3 总结了 IEF 分离 步骤。 胶条用 缓冲 液水合 ,蛋白 质在电 压下缓 慢加样 到胶条 。然 后增加 电压得 以聚焦 。商业 上 已有的 系统能 够提供 温度控 制以及 高精度 电压或 电流控 制以便 进行可 重复的 分离。 在 1PG 胶 条 上上样 电压 等 电聚焦 田 ■ ■酿 * 喔 ■藤 •Ml “蛋白 质样品 0 洗涤 ,加 SDS 还 原剂; 连接 到聚丙 烯酰胺 凝胶 电压 聚丙烯 酰胺凝 胶分离 在聚焦 步骤后 ,胶条 用含有 巯基还 原剂和 SDS 的缓冲 液处理 ,然后 连接到 SD&PAGE 平板 凝胶中 。在这 方面, 含有聚 焦的蛋 白质的 IPG 胶条 类似于 11> SDS~PAGE 的“浓 缩胶” 。蛋 白质在 SDS~PAGE 平 板凝胶 中以与 1I>SDS~PAGE 相同的 方式进 行分离 。通过 2D 凝胶 分离 蛋白质 的显色 使用通 常的染 色技术 ,包 括银染 、考马 斯亮蓝 和酰胺 黑染色 。银 染和较 新的荧 光染料 是最灵 敏的。 尽管可 采用 许多不 同的方 法进行 染色, 但不是 所有的 方法都 适用于 其后的 蛋白质 分析。 例如, 用甲醛 固定的 蛋白质 银染倾 向固定 胶中的 蛋白质 ,阻 止蛋白 质的消 化和所 • 25 • 形成肽 的回收 。凝 胶长时 间暴露 在乙酸 中也引 起类似 的问题 。因而 ,使用 适合于 消化 和洗脱 步骤的 染色方 法是重 要的。 4. 7 2D-SDS-PAGE 存在 的问题 尽管作 为分离 复杂蛋 白质混 合物的 方法, 2D-SDS-PAGE 相对 其他方 法有许 多优势 ,但这 项技术 也有某 些问题 。首先 是进行 可完全 重复的 2D-SDS-PAGE 分析是 困难的 。通 过比较 2D-SDS-P AGE 染 色凝胶 的图像 来比较 两个样 品时, 这个问 题就凸 显出来 。一 维蛋白 质迁移 的任何 不同可 能会被 误认为 是两个 样品中 某些蛋 白质的 不同。 2D-SDS-PAGE 的第二 个问题 是某些 蛋白质 不太适 于进行 第一维 IEF 步骤。 许多较 大的疏 水蛋白 质在这 种类型 的分析 中结果 不理想 。这 些蛋白 质的低 溶解度 导致 蛋白质 沉淀和 聚集, 造成在 IPG 胶 条中蛋 白质的 “成片 条带” ,而不 是形成 不连 续条带 的清晰 聚焦。 当这些 蛋白质 再进行 第二维 (SDS-PAGE) 电泳时 ,显 示 为横越 分子质 量区域 的条纹 (图 4. 4)。 还有另 一个相 关问题 ,它 或者 是这种 电泳 2D-SDS-PAGE 的优点 ,或者 是缺点 。由 于蛋 白质存 在不同 等电点 的多种 形式 ,蛋 白质的 IEF 常把蛋 白质分 离成许 多不连 续条带 。例如 ,使 中性 酰胺转 换成 阴离子 羧基的 脱酰胺 化可以 改变蛋 白质的 pi 和它在 IPG 胶条 的迁移 。其他 可 以影响 pi 的修 饰包括 糖基化 、磷 酸化、 氧化和 外源化 学修饰 。在 某些情 况下, 相同 多肽的 不同修 饰可能 显现为 “点横 向排列 ” ( 图 4. 5)。 尽管这 种分离 对建立 蛋白 质不同 的存在 形式是 有用的 ,但它 也可能 使通过 2D-SDS-PAGE 估 计两个 样品 中相关 蛋白质 表达的 问题更 复杂。 • 26 • 图 4. 4 在 IEF (水平 ) 方 向显示 蛋白质 “成片 条带” 的部分 2D 凝胶 等 图 4. 5 由于相 同蛋白 质的不 同修饰 / 电 荷显示 “ 点横向 排列” 的部分 2D 凝胶 2E>SDS~PAGE 的第 三个问 题是作 为检测 技术的 蛋白质 染色的 动态范 围相对 较小 。点密 度最多 能反映 100 倍的蛋 白质浓 度范围 。这 意味着 2D 凝胶的 染色能 看到高 含量的 蛋白质 ,而较 ^ 含量的 蛋白质 往往不 能检测 。一 个极 好的例 子来自 StevenGygi和RuediAbersold的工作,他们研究了酵母基因表达(通过测定 mRNA) 和蛋白 质水平 (通过 测定同 位素标 记的甲 硫氨酸 的掺人 ) 的关系 。酵 母 表达其 6 000 个基 因的三 分之二 ,然 而用银 染色的 2I>SDS~PAGE 的精 细分析 最多能 检测约 1〇〇〇 个蛋 白质。 换言之 ,在约 4 000 个 表达的 基因中 ,有 3 000 个在 2I>SDS~PAGE 中不 能检测 。大多 数检测 到的蛋 白质具 有高密 码子偏 倚值的 基因 (见第 2 章 ), 倾向 于较高 水平的 表达。 2I>SDS~PAGE 最适 宜用来 分析高 含量 的长寿 蛋白质 。不 幸的是 许多生 物学上 非常重 要的蛋 白质以 相对低 水平表 达 ,并迅 速转换 ,因 此引 人其他 分析方 法是必 要的。 4. 8 制备 IEF 这 项技术 类似于 2I>SDS~PAGE 的第 一步。 在制备 IEF 中 ,使用 IPG 胶条, 在一个 管胶中 或在溶 液中进 行分离 。后者 是最常 使用的 。用 可溶性 两性电 解质得 到 pH 梯度。 两性电 解质是 聚羧酸 化合物 ,当 电压加 到聚焦 池时产 生稳定 pH 梯 度 。然 后加入 蛋白质 样品, 加电压 ,蛋 白质通 过等电 点进行 分离。 商业上 已有的 装置 ,如 Bi〇RadR〇t〇f〇rTMcell, 聚焦池 由可渗 透膜分 成一系 列小室 。在聚 焦后, 用真空 吸人器 (vacuum sipper) 同时 迅速的 把小室 抽空。 真空吸 入器把 聚焦池 每 一部分 的物质 吸入一 个试管 。用 这种类 型装置 ,把整 个蛋白 质混合 物分成 12 〜 20 个 组分。 溶 液等电 聚焦的 优点是 相对较 大的样 品容量 (每 一次可 使用毫 克到克 的总蛋 白质) 和样 品在溶 液中比 在凝胶 中更容 易操作 。在进 一步处 理蛋白 质前, 可通过 透析 或凝胶 过滤把 两性电 解质从 分部的 样品中 除去。 蛋白质 从液相 IEF 的回收 • 27 • 率大于 85% 〜 90%。 可以用 去污剂 和促溶 剂保持 疏水蛋 白质的 可溶性 。和 2I> SDS~PAGE 的 IEF 步骤 一样, 这种分 离利用 完整蛋 白质物 理性质 (pi) 的多样 性 。操 作多种 完整蛋 白质也 有缺点 ,如在 溶液相 聚焦时 ,某 些蛋白 质易发 生聚集 和 沉淀。 4. 9 焉效液 相层析 改 良的固 定相材 料和硬 件的出 现极大 地改进 了用于 蛋白质 纯化的 IX 操作系 统 。对 分析蛋 白质组 学来说 ,尽管 完整蛋 白质的 HPLC 还 没有成 为广泛 使用的 技术 ,但 HPLC 仍可作 为分离 蛋白质 混合物 的最初 步骤。 HPLC 可进行 各种层 析分离 ,包括 RP、 阴离子 和阳离 子交换 、大 小排阻 和亲和 层析。 亲和层 析可以 从复 杂混合 物中分 离某种 蛋白质 组分, 这是其 很大的 优点。 HPLC 能把蛋 白质混 合物分 离成各 种组分 ) 这 与制备 IEF 的功能 相同。 HPLC 的优 点是有 各种分 离模式 。串联 HPLC 结合了 两种不 同类型 的层析 ,例 如强 阳离子 交换之 后连接 RP, 使 用两种 完全不 同的分 离模式 。正 如下面 将讨论 的有 关肽的 HPLC, 离子交 换可与 RP 连接获 取高效 率串联 LC 分离。 4. 10 肽分离 在这种 方法中 ,样 品中的 蛋白质 首先消 化成肽 混合物 ,然 后进行 肽分离 。这 种方法 应用的 极致是 把全部 细胞或 组织抽 提物消 化成肽 ,然 后进 行肽混 合物的 MS 分析。 这类分 析已取 得了极 大成功 。具有 特殊控 制的微 毛细管 HPLC 和自动 控制 MS 仪器 的使用 ( 本书后 面讨论 ), 可以 一次获 取几百 或几千 个肽的 MS 数 据。 这种方 法的基 本原理 是将非 常不均 一的蛋 白质混 合物转 换成更 容易分 析的较 均 一的肽 混合物 。如 果确实 选用这 个方法 ,分离 肽混合 物的方 法是很 少的。 11> SDS~PAGE 和 2I>SDSPAGE 被排除 ,因为 它们实 际上不 能用于 从消化 物中分 离肽 。消化 产物的 pi 和分 子质量 范围相 差很小 。尽 管制备 IEF 可 以用于 肽混合 物分离 ,但在 分离肽 混合物 方面的 用途可 能有限 。然而 ,评 估制备 IEF 作为肽 分离 工具的 工作做 得很少 ,它的 作用不 能完全 排除。 4. 11 肽分析 的串联 LC 方法 常 用的分 析肽混 合物的 方法是 HPLC。 如 前所述 ,固定 相和分 离模式 的多样 性使 HPLC 有很大 的分离 能力。 HPLC 分离 模式的 结合使 用是分 析蛋白 质组学 中最有 效的工 具之一 。连 续使 用各种 不同的 分离模 式称为 “串联 HPLC”。 串联 LC 原 理是不 同分离 模式的 结合使 用可使 混合物 中的肽 得到更 大程度 的分离 。考 虑以下 HPLC 主 要分离 模式和 特征。 • RP: 疏 水性。 •强 阳离 子交换 :净正 电荷。 • 28 • •强 阴离 子交换 :净负 电荷。 •大小 排阻: 肽大小 / 分子 质量。 •亲 和:与 特定功 能基团 的相互 作用。 在以 上列出 的分离 模式中 ,除 大小排 阻以外 其余都 能用于 肽分离 。已 有的大 小排 阻介质 的分离 能力不 能分离 分子质 量相近 的肽。 John Yates 和同 事开发 出分析 复杂肽 混合物 的串联 LC-MS。 其方法 使用连 续连接 的毛细 管柱, 直接洗 脱进入 质谱仪 (图 4. 6)。 他们 创造了 “MudPIT” 一 词 (多 维蛋白 质鉴定 技术) 来描 述这种 方法。 肽先用 强阳离 子交换 (SCX) 柱分 离。 SCX 柱作 为分析 系统的 “前端 ” ( 图 4. 7)。 肽 吸附到 具有亲 和力的 SCX 柱, 亲 和力与 每一个 肽的总 正电荷 (如 离子化 的氮) 数目 成比例 。通过 不断增 加的盐 浓度阶 梯梯度 洗脱肽 。每 一梯 度释放 一组肽 。这 组肽再 传递到 SCX 柱 下游的 RP 柱上 ,通过 RP-HPLC 梯度 分离。 RP-HPLC 梯 度根据 疏水性 分离肽 。肽 直接从 RP 柱传 递进入 MS 仪器 供进一 步分析 。在 RP 梯 度分离 完成后 ,另 一组从 SCX 柱 释放的 肽再经 RP 柱分离 ,直 接进人 MS 进 行分析 。这种 循环一 直持续 到所有 的肽从 SCX 柱 中洗脱 完成。 进样器 图 4. 6 串联离 子交换 (SCX) -RP-HPLC 系统 比较 MudPIT 串联 LC 方 法和单 独用于 LC-MS 的 RP-HPLC, 很明 显串联 方法大 大增加 了所鉴 定肽的 数量。 串联方 法用于 肽混合 物的进 一步“ 分散” ,以 便 MS 可 从更多 更细的 组分分 离中获 取数据 。此 外串联 LC 方法也 有助于 鉴定来 自 混合物 中低丰 度蛋白 质的肽 。用 MudPIT 方法分 析酵母 蛋白质 揭示这 种方法 可以更 好地鉴 定低丰 度蛋白 质的酶 消化肽 。这与 适于鉴 定较高 表达蛋 白质的 21> SDS~PAGE 明显 不同。 串联 LC 比 2I>SDS~PAGE 具 有更多 的优势 ,主 要是因 为以下 两点: 首先, 2D 凝胶是 对染色 显示的 蛋白质 点进行 消化和 MS 分析, 而许多 MS 仪器 测定的 范围 低于凝 胶上染 色显示 的水平 。在 2I>SDS~PAGE 上 ,如 果染色 不能显 示需收 集和分 析的蛋 白质点 ,就 收集 不到此 蛋白质 的数据 。第二 ,混 合物 中蛋白 质的处 理可 能提供 “载体 效应” ,即较 高丰度 肽的存 在可防 止低丰 度肽的 丢失。 来自相 对 较弱的 2D 凝胶 蛋白 质点的 样品浓 度很低 ,由于 与仪器 表面的 相互作 用等造 • 29 • 成样品 有比例 较大的 一部分 丢失, 而串联 LC 系统 分析的 是复杂 混合物 中的多 肽 ,在与 仪器表 面相互 作用时 由于其 他大量 组分的 存在, 会降低 低丰度 组分的 丢失。 肽离子 第 一盐梯 度洗脱 + 第二 盐梯度 洗脱 2+ 第三 盐梯度 洗脱 3+ 0 反相 LC 图 4. 7 肽混 合物用 线性强 阳离子 交换和 RP-HPLC 进 行的多 步分离 也 可以采 用其他 LC 分 离模式 的结合 ,包括 强阴离 子交换 /RP-HPLC 和亲和 /RP-HPLC 的结合 使用。 对蛋白 质组分 析来说 ,串联 LC 技 术仍是 新技术 ,其应 用前景 会加速 其发展 ,最 终将 成为广 泛使用 的方法 % 4. 12 毛细 管电泳 毛细 管电泳 (CE) 与 IEF 的 基本原 理相同 。置 于电场 中的蛋 白质迁 移到一 • 30 • 个 pH 梯度点 。在 这个 pH 梯度点 蛋白质 净电荷 为中性 。在 微毛细 管中的 分析操 作比前 面讨论 的制备 IEF 技 术有很 大提高 。在 所有肽 分析技 术中, CE 具 有最高 的分 离能力 ,可以 直接与 MS 仪器 连接。 CE 作为一 项分析 蛋白质 组学的 技术具 有极大 的潜力 。目 前由 于缺乏 用于分 析蛋白 质组学 的商业 上稳定 可靠的 CE-MS 仪器 ,使得 CE 的 应用受 到限制 。这方 面仪器 开发正 在继续 ,很快 CE-MS 将成 为蛋 白质组 学分析 中非常 有用的 工具。 4. 13 哪 种方法 最好? 先进行 蛋白质 分离, 然后进 行消化 和分析 是当今 最常用 的分析 蛋白质 组学方 法 。这很 大程度 上依赖 于进行 蛋白质 分离的 2!>SDS~PAGE。 这一 方法的 一个最 大 优点是 2D 凝胶可 作为图 像图谱 ,研 究人员 可根据 凝胶上 点的图 形变化 比较蛋 白质组 的变化 。如 前所述 ,虽 然仍有 一些因 素影响 2D 凝胶 点图像 的解释 ,然而 其他技 术都不 能进行 蛋白质 组的直 观“快 照”。 所以, 2I>SDSPAGE 可 能继续 作 为蛋白 质组学 的主要 方法学 。但 对于低 丰度蛋 白质, 2D 凝胶 发挥 的作用 有限, 因为不 能从凝 胶上看 到一些 重要的 低丰度 蛋白质 。在 这种情 况下, 其他的 分离方 法 ,特别 是串联 LC 是很好 的替代 技术。 鉴于 前面的 讨论, 蛋白质 组鉴定 的最好 方法可 能是各 种方法 的混合 。一种 常见 的混合 使用方 法见图 4. 8。 第一步 ,通 过制备 IEF、 制备 1D-SDS-PAGE 或 蛋白质 SDS-PAGE, 制备 IEF, HPLC 或其他 I 1 1 // 蛋白质 蛋白质 蛋白质 蛋白质 组分 1 组分 2 组分 3 组分 《 消化 r ^ 肽组分 1 肽组分 2 肽组分 3 肽组分 n 反相 LC 串联 LC 其他 LC MS 分析 i 图 4. 8 蛋白质 / 肽分 离的基 本方法 • 31 • HPLC 分离 完整蛋 白质, 然后对 分离得 到的组 分进行 酶消化 ,所 产生的 肽在进 人 MS 之 前进行 HPLC 分离 。由于 样品的 复杂性 或分析 目的的 不同, HPLC 分 离可 以是一 个单分 离模式 (如 RP) 或是一 个串联 LC 分离 模式。 这种方 法的一 个突 出优点 是其灵 活性和 易于适 合不同 实验室 的仪器 操作。 这种方 法的另 一个优 点是 前端蛋 白质分 离可以 处理量 较大的 蛋白质 (在 大多数 情况下 可处理 若干毫 克 ), 这样 提高了 MS 分析中 检测低 丰度肽 组分的 可能性 。最 近发 表了其 他几种 可用 的分析 方法, 但仍然 需要有 进一步 的工作 明确建 立哪些 方法是 最容易 、最有 效 和最可 靠的。 推 荐读物 Gygi, S. P. , Corthnls, G. L. , Zhang, Y. , Rochon, Y. and Aebersold, R. p% (2000 ) Evaluation of two-dimensional gel electrophoresis-based proteome analysis technology. Proc. Nat. Acad. Sci. 97 , 9390 — 9395. Link, A. J. ( 1998) 2-D Proteome Analysis Protocols. Humana Press, To - towa, NJ. Link, A.J. , Eng, J. , Schieltz, D. M. , Carmack, E. , Mize, G. J. , Mor- ris, D. R. , et al. ( 1999) Direct analysis of protein complexes using mass spectrometry. Nat. BiotechnoL 17, 676 — 682. Rabilloud, T. (2000) Detecting proteins separated by 2D gel electrophore- sis. Anal. Chem. 72, 48 A — 55A. Walker, J. M. (1996) Protein Protocols Handbook. Humana Press, Totowa^ NJ. Wall, D. B. , Kachman, M. T. , Gong, S. , Hinderer, R. , Parus, S. , misek, D. E. , et al. (2000) Isoelectric focusing nonporous RP HPLC: a two-dimensional liquid-phase separation method for mapping of cellular proteins with identification using MALDI-TOF mass spectrometry. Anal. Chem. 72, 1099 — 1111. Washburn, M. P. , Wolters, D. 9 and Yates, J. R. (2001) Large-scale analy- sis of the yeast proteome by multidimensional protein identification technolo- gy. Nat . BiotechnoL 19, 242 — 247. • 32 • 5 蛋 白质消 化技术 5. 1 为什 么需要 消化蛋 白质? 现代 MS 仪器能 高精度 地测定 完整蛋 白质分 子质量 。为 什么蛋 白质组 学不简 单 地测定 完整蛋 白质的 质量? MS 仪器 较少对 完整蛋 白质进 行质量 测定主 要有三 个原因 。第一 ,尽管 MS 仪器已 经相当 完善, 但是仪 器所进 行的测 定仍然 会发生 错误 。蛋白 质的质 量越大 ,绝对 误差值 越大。 这些误 差会引 人很高 的不确 定性, 使得 鉴定不 够准确 。而且 ,各 种翻译 后修饰 使质量 测定更 为复杂 。第二 ,不 是所 有的 蛋白质 都能进 行完整 蛋白质 的质量 测定。 MS 对 大分子 蛋白质 和疏水 蛋白质 很难 进行质 量测定 。第三 ,完整 蛋白质 质量测 定的灵 敏度远 低于肽 质量测 定和肽 串联 MS 分析的 灵敏度 。由 于这 些原因 ,通过 分析完 整蛋白 质来研 究蛋白 质组学 目前 是不现 实的。 进行肽 分析有 较好的 方法也 是不选 择对完 整蛋白 质进行 分析的 另一个 原因。 MS 仪器目 前非常 适合分 析肽。 如在下 一章将 看到的 ,现代 MS 仪 器可以 进行肽 的高 精度质 量测定 ,也 能得到 序列的 数据, 而且从 MS 分析 得到的 肽段数 据可直 接与 蛋白质 和核苷 酸序列 数据库 中的蛋 白质序 列进行 比较。 通过肽 MS 数 据与数 据库 信息的 比较以 鉴定蛋 白质, 这一检 索算法 的重要 基础是 某些蛋 白水解 酶在特 定位 点将蛋 白质切 割成肽 。在这 一章将 讨论可 切割蛋 白质产 生肽供 MS 分 析所用 的 酶及其 方法。 5. 2 消化 可以达 到什么 目的? 理 想的消 化方法 是在某 些特定 的氨基 酸残基 上切割 蛋白质 ,产生 最适于 MS 分析的 片段。 6 〜 20 氨基 酸的肽 片段对 MS 分析和 数据库 比较最 为理想 。一 般短 于 6 氨基 酸的肽 太短, 不能在 数据库 检索中 产生惟 一的序 列匹配 。另 一方面 ,在 串联 MS 分析中 (下 一章将 有较详 细讨论 ), 很难 从长于 20 个氨基 酸的肽 段上获 得序列 信息。 因而蛋 白质消 化的目 标是尽 可能多 的获得 合适长 度的肽 片段供 MS 分析。 5. 3 蛋白 酶概述 大 自然进 化产生 各种蛋 白酶以 便不断 对高等 生物进 行必要 的蛋白 质重建 。已 纯化和 鉴定了 上千种 不同的 蛋白酶 ,但 是大多 数酶在 生物体 中的含 量很低 。生物 • 33 • 表 5.1 蛋 白酶及 其切割 专一性 酶 切割 专一性 胰 蛋白酶 /K-./R-AP 胰凝乳 蛋白酶 /W-, /Y-,/F-,\P Glu-C(V8 蛋白酶 ) /E-,/D-*,\P LysC /K-,\P AspN /D- a 在磷 酸钠缓 冲液中 切割天 冬氨酸 和谷氨 酸 .在 其他情 况下只 切割谷 氨酸。 化 学家只 能获得 可以纯 化或表 达的蛋 白酶。 分 析蛋白 质组学 真正需 要的是 稳定的 、有确 定 专一性 并得到 很好鉴 定的酶 。这些 酶必须 可大 量得到 、纯 度高并 且稳定 性好能 在各种 情况 下使用 。有 些符合 这些要 求的蛋 白酶已 用于 蛋白质 组分析 。表 5.1 总 结了在 蛋白质 组 分析中 广泛使 用的蛋 白酶和 它们的 切割特 性。 下面给 出几种 酶主要 特征的 小结。 5. 4 胰 蛋白酶 胰蛋白 酶是蛋 白质组 学分析 中最常 用的蛋 白酶。 胰蛋白 酶主要 从猪或 牛的胰 脏 中获得 ,易于 纯化。 胰蛋白 酶被对 甲苯磺 酰基苯 丙氨酰 氯甲烷 (TCPK) 修 饰 ,抑制 残余的 胰凝乳 蛋白酶 。胰蛋 白酶在 赖氨酸 和精氨 酸残基 位点切 割蛋白 质 ,但若 在赖氨 酸或精 氨酸的 C 端方向 有脯氨 酸则不 能切割 。赖 氨酸和 精氨酸 在许多 蛋白质 中的距 离能产 生长度 很适于 MS 分 析的肽 。这 种“双 专一性 ”意味 着胰 蛋白酶 比只识 别一个 氨基酸 残基的 蛋白酶 更频繁 地切割 蛋白质 。一般 规律是 一个 50 kDa 蛋白质 产生约 30 个 胰蛋白 酶肽。 对 蛋白质 组学工 作来说 ,胰 蛋白酶 的一个 优点是 该酶在 溶液和 “在凝 胶中” 进 行消化 (见 下文) 都有 很好的 活性。 已经发 展了若 干胰蛋 白酶在 溶液中 、凝胶 中或 膜印迹 上消化 蛋白质 的方法 ,这些 方法已 被广泛 测试。 经常进 行蛋白 质组学 分析 的实验 室熟悉 胰蛋白 酶自溶 片段, 它作为 胰蛋白 酶消化 方法的 副产物 是不可 避 免的。 5. 5 Glu-C (V8 蛋白酶 ) Glu-C 是内切 蛋白酶 ,它在 醋酸氨 或碳酸 氢氨缓 冲液中 切割谷 氨酸残 基的羧 基侧 ,但 在磷酸 钠缓冲 液中切 割谷氨 酸和天 冬氨酸 残基。 Glu-C 的 一个优 点是与 胰蛋 白酶相 比有明 显不同 的切割 专一性 ,这提 高了得 到蛋白 质互补 肽片段 的可能 性 。这对 分析具 有高赖 氨酸和 精氨酸 区域的 蛋白质 可能特 别有用 ,这 些区 域能被 胰蛋 白酶充 分切割 产生没 有足够 序列信 息的极 短的肽 片段。 5. 6 其 他蛋白 酶和切 割试剂 还有几 种酶也 可用于 蛋白质 组分析 。这些 酶包括 LysC、 胰 凝乳蛋 白酶、 Asp-N 和几种 “非专 一性” 蛋白酶 。这 些酶 的切割 专一性 对大多 数蛋白 质组分 析 不理想 。这 些只在 一个氨 基酸位 点切割 的酶产 生几个 大片段 。这 些大片 段在串 联 MS 分析 中不能 提供有 用的序 列信息 。另 一方面 ,胰凝 乳蛋白 酶切割 太频繁 • 34 • ( 能切割 酪氨酸 、苯 丙氨酸 和色氨 酸位点 ), 产生 过多序 列太短 的小肽 。不过 ,当 一个感 兴趣的 蛋白质 序列, 特别是 在某些 感兴趣 的区域 ,不 能产生 令人满 意的胰 蛋白 酶肽时 ,可 以选择 使用这 些酶。 5.7 非 专一性 蛋白酶 非专一 性蛋白 酶也是 蛋白质 消化中 非常有 用的酶 ,如枯 草杆菌 细胞溶 素蛋白 酶 (subtilysin)、 胃蛋 白酶、 蛋白酶 K 和链霉 蛋白酶 。这些 酶或多 或少地 随机切 割蛋 白质产 生多个 重叠肽 。由于 专一性 较差, 消化必 须在相 对较短 的时间 内进行 以防 止消化 得太过 ,产 生多个 重叠肽 的优点 是能获 得较多 的蛋白 质序列 数据。 5. 8 溴化氰 蛋白质 也可用 某些化 学试剂 切割。 最常用 的化学 试剂是 溴化氰 (CNBr), 它 在 甲硫氨 酸位点 切割蛋 白质。 CNBr 的 反应具 有高度 专一性 ,但是 在大多 数蛋白 质 中甲硫 氨酸残 基含量 较少, CNBr 切割产 生数量 较少的 大片段 ,这 些大 片段在 串联 MS 分析中 不能产 生有用 序列。 5. 9 在凝胶 中消化 蛋白质 1D 或 2I>SDSPAGE 分离 蛋白质 的消化 通常使 用的方 法为“ 在凝胶 中”消 化 (图 5.1)。 从凝 胶中切 出感兴 趣的条 带或点 ,进行 脱色, 然后用 蛋白酶 (最 常用的 是胰蛋 白酶) 处理 。酶 进入凝 胶基质 ,将蛋 白质消 化成肽 ,然 后通 过漂 洗将肽 从凝胶 中洗脱 。这项 技术在 2I>SDS^PAGE 蛋 白质组 学方法 中必不 可少。 图 5.1 在凝胶 中消化 蛋白质 胰蛋白 酶是最 常使用 的酶, 其他的 蛋白酶 (包括 Glu-C 和胰 凝乳蛋 白酶) 也 可用于 这种基 本方法 。凝 胶中蛋 白质的 消化和 肽片段 的回收 率是受 许多因 素影响 的。 在凝胶 中能否 进行成 功消化 的一个 决定性 因素是 凝胶染 色技术 。使用 醛固定 和长 时间暴 露在酸 (如 醋酸) 中的 染色方 法会将 蛋白质 固定在 凝胶中 ,使 蛋白质 • 35 • 不 易消化 ,肽很 难洗脱 。高 度交联 的凝胶 阻碍蛋 白酶进 人凝胶 基质。 最后, SD&PAGE 技术 中残留 的组分 (如 SDS 或残留 的未聚 合的丙 烯酰胺 ) 对 蛋白酶 活性可 能有抑 制作用 。印迹 转移到 硝酸纤 维素膜 或聚偏 氟乙烯 (PVDF) 膜的蛋 白质也 可以进 行“在 膜上” 的消化 。与 在凝胶 中消化 类似, 切出含 有感兴 趣蛋白 质的 膜部分 ,用蛋 白酶进 行消化 ,然 后从 膜表面 洗脱肽 片段。 推 荐读物 、 Jensen, O. N. , Wilm, M. , Shevchenko, A. , and Mann, M. (1999) Sam- ple preparation methods for mass spectrometric peptide mapping directly from 2-DE gels. Methods Mol. Biol . 112, 513 — 530. Shevchenko, A. , Wilm, M. , Vorm, O. , and Mann, M. (1996) Mass spectro- metric sequencing of proteins silver-stained polyacrylamide gels* Am 厶 68 , 850 一 858. Walker, J. M. (1996) Protein Protocols Handbook. Humana press, Totowa, NJ. • 36 • 6 分析 蛋白质 和肽的 质谱仪 6. 1 引言 用 于大多 数蛋白 质组学 MS 分析 的仪器 有两种 类型: MALDI-TOF 仪器和 ESI 串联 MS 仪器。 这两种 类型的 仪器以 完全不 同的方 式工作 ,产 生不同 的但是 互补 的信息 。装备 最好的 蛋白质 组学实 验室应 该具备 这两种 仪器。 这一章 将描述 每 一种仪 器的工 作过程 ,产 生的数 据类型 ,比 较其优 点和局 限性。 在讨论 仪器之 前 ,先 看一下 MS 仪器 操作的 原理。 6. 2 MS 仪器怎 样工作 质 谱仪有 三个基 本部分 (图 6.1)。 第一 部分是 离子源 ,由样 品产生 离子。 第 二部分 是质量 分析器 ,根 据离子 的质量 / 电荷 (m/z) 比分 离离子 。第 三部分 是 检测器 ,检 测由质 量分析 器分离 的离子 。简 言之, 质谱仪 将混合 物的组 分转换 成离子 ,然 后根据 离子的 m/z 进 行分析 。数据 由数据 系统自 动记录 ,供 研究者 进行 手工或 计算机 辅助的 解释。 分离的 离子 检测器 离子、 离子源 — ► 质量 分析器 质谱 图 6.1 质谱仪 当然 ,运行 MS 系统还 需要更 多其他 的部分 。现代 MS 仪器由 复杂的 计算机 控制 ,仪器 产生的 数据由 同样复 杂的计 算机数 据系统 处理。 仪器装 备有真 空泵系 • 37 • r 统 ,保 证质量 分析器 和检测 器处于 高真空 ,这是 其行使 功能所 必须的 。与 早期的 MS 仪器 相比, 现在的 MS 仪器 体积相 对较小 、设计 更紧凑 、数据 更可靠 ,更易 于 操作。 6. 3 我们 希望从 MS 数 据得到 什么? 蛋白 质组学 的研究 需要有 肽质量 (MALDI-TOFMS) 的 良好数 据和描 述肽裂 解 (ESI 串联 MS) 的良好 数据。 怎样得 到良好 数据? 我们必 须注意 三点。 第一是 灵敏度 。如前 所述, 在大多 数蛋白 质组学 工作中 ,蛋白 质样品 的量是 有限的 。我们 需要 能分析 飞摩尔 (1(T15 摩尔) 或样品 量更低 的仪器 。第 二是 分辨率 ,它 是能在 多 大程度 上区分 m/z 相似 离子的 测量。 较高分 辨率的 MS 仪器 (磁 分区仪 器或傅 里叶变 换仪器 ) 能够可 靠区分 mA 仅相差 0.001 amu (原 子质量 单位) 的离子 。这 些昂贵 、难 操作的 仪器在 蛋白质 组学工 作中不 常使用 。在 MS 中通常 使用的 仪器能 至 少区分 m/Z 值有 1 Da (单个 氢原子 的质量 ) 不同的 离子, 某些质 量分析 器能提 供 较高的 分辨率 ,在特 殊情况 下需要 较高的 分辨率 ,这 将在后 面讨论 。第三 是质量 精确性 。肽 离子 或肽片 段离子 的测定 值必须 尽可能 接近其 真实值 。这 在使用 MS 数 据与 (真实 ) 数 据库数 据比较 鉴定肽 时特别 重要。 6.4 MALDI-TOF MS 仪器 MALDI-TOF 是基 质辅助 激光解 吸电离 飞行时 间质谱 的标准 缩写。 第一部 分 (MALDI) 指 离子源 ,而 TOF 是 指质量 分析器 。术语 “MALDI” 实 际上描 述电离 的一种 方法, 在蛋白 质组学 文献中 常作为 MALDI-TOF 的速记 。然 而, MALDI 离 子源和 TOF 分析 器也可 以在其 他仪器 结构中 使用。 6. 5 MALDI 离 子源怎 样工作 要理解 MALDI-TOF 仪器怎 样工作 ,最 简单 的是从 MALDI 离子 源开始 (图 6. 2A)。 待分析 样品与 化学基 质混合 。常用 的基质 含有一 小分子 有机物 ,具 有吸 收特定 波长的 生色团 。典 型的基 质化合 物包括 2, 5- 二羟基 苯甲酸 、芥 子酸 和 cr 氰基 -4- 羟基 肉桂酸 。将样 品和基 质的混 合物点 到一个 小板或 玻片上 ,在空 气 中气化 ,同时 将样品 分子带 人气相 。离 子源装 有激光 ,向混 合物发 射光束 ,基 质化 合物吸 收射线 光子形 成激发 电子。 多余的 能量转 移到样 品中的 肽片段 或蛋白 质, 使它们 从耙表 面射入 气相。 这种电 离过程 产生正 离子和 负离子 ,这 取决于 样品的 性质。 对于肽 和蛋白 质 ,正 离子常 常是我 们感兴 趣的离 子种类 。正 离子是 由于肽 或蛋白 质从基 质发射 时 接受一 个质子 而形成 。每个 肽分子 倾向于 获取单 个质子 。因 而产 生的大 多数肽 离子带 单电荷 。对 于一个 质量为 1 032 Da 的肽 ,接 受一个 质子并 带上正 电荷, 使 [M+H]+ 离子的 m/z 值为 1 033。 然后 提取在 MALDI 离子源 形成的 离子并 • 38 • 使离 子进入 TOF 质量分 析器。 检测器 图 6. 2 MALDI-TOF 质谱仪 的图示 A.MALDI 电离 过程; B. 线 性模式 操作的 MALDI-TOF 仪器; C. 装 备有反 射器的 MALDI-TOF 仪器。 6.6 T〇F 质量 分析器 TOF (飞行 时间) 质量 分析器 正如其 名字所 表示的 含义。 TOF 分析 器测定 离子 从分析 器的一 端飞行 到另一 端并撞 击检测 器所用 的时间 。离子 沿飞行 管向下 飞行的 速度与 它们的 m/z 值成反 比例。 m/z 越大, 飞行得 越慢。 第一个 TOF 分析器 工作方 式简单 (图 6. 2B)。 这种简 单的“ 开始到 结束” 分 析器的 工作方 式称为 “线性 模式” 。在 MALDI 离 子源形 成离子 ,连续 从离子 源提 取离子 ,沿 飞行管 飞行到 检测器 。但是 用连续 提取离 子的线 性模式 工作的 • 39 • r 5 700 5 720 5 740 5 760 5 780 m/z 图6.3用反射器模式(A)和线性模式(B)进行的胰岛素的MALDI-TOFMS分析 另 一个提 高线性 模式中 TOF 分析 器分辨 率的方 法是使 用延迟 提取的 脉冲激 光电离 。延迟 提取技 术在激 光脉冲 (电离 ) 和 沿飞行 管的离 子方向 之间建 立一个 微 小延迟 。这 使所有 离子有 一个“ 公平起 始”, 从而使 所有具 有相同 mA 的离子 种类在 相同时 间撞击 检测器 。对 许多激 光脉冲 (1〇 〜 1〇〇) 获得的 谱图进 行平均 来得到 谱图。 与反射 器类似 延迟提 取也可 以提高 谱图分 辨率。 TOF 分析器 技术的 开发产 生了某 些当前 最好的 质量分 析器。 最好的 TOF 分析 器的 分辨率 可以可 靠区分 m/z 有 0.001 amu 不同的 肽离子 。下 一章 将看到 ,在蛋 白质 鉴定中 ,高分 辨率和 质量精 确性对 MALDI-TOF 数据的 可靠应 用是必 需的。 a.i. 800 600 TOF 仪器分 辨率相 对不高 。质 谱的 分辨率 是指仪 器区分 m/z 值相 近的离 子的能 力。 MS 分辨 率可比 做是视 力聚焦 ,那么 低分辨 率就如 同近视 。线 性模式 仪器分 辨 率不高 是由于 有相同 m/z 的离子 沿飞行 管向下 飞行时 ,其速 度发生 变化。 两 个重要 的技术 发明解 决了低 分辨率 的问题 。第 一个是 反射器 。按照 视力比 拟, 它相当 于近视 TOF 的接 触镜片 。反 射器使 有相同 m/z 值的离 子聚焦 ,并使 它们在 相同时 间到达 检测器 (图 6. 20。 反射 器极大 提高了 TOF 分 析的分 辨率。 图 6. 3 的谱 图中生 动地表 明了反 射器对 分辨率 的影响 。图 6. 3B 是 在线性 模式中 得到的 胰岛素 的谱图 ,表 明所分 析的胰 岛素肽 的平均 爪夂值 。在图 6. 3A 中 ,有 反 射器仪 器的分 析很容 易分辨 胰岛素 肽所有 12C 和各种 13C 同 位素体 的单个 离子。 9 00 09, 寸 a S • 40 • 在 蛋白质 组学中 使用的 MALDI-TOF 仪 器主要 是获取 完整肽 离子的 质量测 定 ,某些 仪器也 能分析 肽离子 片段。 一种称 为“源 后衰变 ” (PSD) 的技 术可用 于装 备有反 射器的 TOF 分 析器。 PSD 调节反 射器的 电压, 以便能 探测肽 的裂解 和沿 飞行管 加速时 形成的 肽离子 片段, PSD 对完整 肽质量 的测定 是一个 有用的 补 充技术 。肽 PSD 谱图 中出现 具有基 本公式 H2N+=CHR (R 是氨基 酸侧链 ) 的肽亚 氨离子 ,这些 亚氨离 子是存 在特定 氨基酸 的标志 ,可 在某些 软件工 具的帮 助下用 来鉴定 肽序列 ,这是 PSD 谱图一 个很有 价值的 应用。 6.7 MALDI 的 优缺点 虽然 对于蛋 白质组 学分析 来说没 有十全 十美的 MS 仪器 ,但是 MALDI-TOF MS 在以 下四个 方面是 值得称 道的。 第一 ,易 于操作 。仪器 的主要 部分是 易于使 用和稳 定的。 MALDI-TOF 仪 器是 最容易 操作的 MS 仪器, 这主要 是因为 没有难 操作的 HPLC-MS 界面 。这些 仪器一 般很适 合于“ 随到随 用”或 “开放 使用” 。仪器 系统不 需预约 ,可 供若干 使 用者日 常使用 。这样 ,在 一个公 用蛋白 质组学 设施中 的一台 MALDI-TOF 仪 器每天 可很容 易进行 几百个 分析。 第二 ,目前 最广泛 使用的 MALDI-TOF 仪器适 合于自 动化样 品制备 装置, 这 种新型 自动化 装置有 利于高 通量蛋 白质的 分析。 2D 凝胶 的制备 和制图 、蛋白 质 的获取 和消化 、将消 化物放 置到供 分析的 多样品 MALDI 靶子等 工作都 可通过 自动 化装置 完成。 这种结 合不仅 简化了 高通量 蛋白质 组分析 的工作 ,而且 增加样 品分 析的速 度和重 复性。 第三 ,随着 TOF 分析 器的精 确性和 分辨率 的提高 ,所 产生有 用蛋白 质组学 数 据的效 率也得 以提高 。下 一章中 将看到 ,用 MALDI-TOF 数据 通过肽 质量谱 进行可 靠蛋白 质鉴定 的一个 基本要 求是对 肽的精 确质量 测定。 目前的 MALDI- TOF 仪器 完全符 合这项 要求。 最后, MALDI-TOF MS 灵敏 性高。 MALDI-TOF 仪器 能分析 飞摩尔 量的肽 并 提供高 质量的 MS 数据 ,更 好的仪 器在最 适条件 下能有 阿摩尔 (1(T18) 或更 高的 灵敏度 。仪器 操作的 发展将 提高其 灵敏度 、分 辨率和 质量精 确性。 上 文给出 了关于 MALDI-TOF 仪 器的各 种优点 ,似乎 没有什 么理由 考虑使 用其他 仪器了 。然 而, MALDI-TOF 也 确实存 在某些 缺陷。 首先, 这些仪 器最适 宜测定 肽质量 。这一 类信息 对蛋白 质鉴定 而言仍 有其局 限性 。肽 离子片 段可提 供有更 大内在 价值的 真实序 列数据 ,但是 MALDI-TOF 仪器 不适于 提供这 类信息 。如 前所述 ,某 些高端 MALDI-TOF 仪器可 进行的 PSD 分析能 够提供 肽序列 ,但 这不 是真正 的串联 MS 技术 ( 见下文 ), 不如 ESI 串联 MS 所提供 的肽序 列信息 可靠。 第二, MALDI-TOF 分析 能否成 功在很 大程度 上依赖 样品的 质量。 污染了 • 41 • 大量 变性剂 、缓 冲液盐 、金属 或有机 修饰物 (如 DTT、 尿素 、甘油 ) 的 肽消化 样 品极大 抑制在 MALDI 离子 源的肽 电离。 由于没 有在线 HPLC 系统从 样品中 去除污 染物, MALDI 对各种 污染相 当敏感 ,污 染因子 可以影 响所有 MS 分析。 幸运 的是研 究者们 使用固 相清理 工具已 能够从 分析样 品中清 除盐和 其他污 染物。 6.8 ESI 串联 MS 仪器 * i ESI 串联 MS (或 ESI-MS~MS) 是 电喷雾 电离串 联质谱 的标准 缩写。 ESI 是 指在仪 器离子 源中产 生离子 的过程 。串 联质 谱是指 可以进 行多级 质量分 析的仪 器 。在 ESI-MS~MS 仪器 中使用 几种不 同类型 的质量 分析器 ,最 常用的 是四极 杆 、离 子阱和 TOF 质量 分析器 。在 某些情 况下, 以不同 的组合 使用这 些分析 器 。在研 究分析 蛋白质 组学问 题中, ESI 离子 源与各 种串联 质量分 析器的 多重组 合 提高了 仪器的 灵活多 用性。 6.9 溶 液中的 肽离子 为 了理解 ESI 怎 样工作 ,我们 先讨论 肽段样 品溶液 的酸- 碱化学 。在 MALDI 中 ,样 品是肽 和基质 的结晶 混合物 。与 之相反 ,用 ESI 分 析的样 品为水 溶液中 的肽或 蛋白质 。肽 在溶 液中以 离子存 在是因 为肽片 段上的 某些功 能基团 在不同 pH 溶 液中发 生电离 。羧酸 在低于 PH3.0 时 质子化 (非 电离的 ), 溶液 pH 高于 5 时电离 。相 反, N 端胺 和组 氨酸氮 是弱碱 ,溶液 酸碱性 在低于 PH7.0 时 电离。 赖氨酸 和精氨 酸的氮 功能基 团通常 在低于 PH8. 5 时电离 。这 意味着 在酸性 pH (PH3. 5 或更低 ) 溶液中 ,胺的 质子化 使肽和 蛋白质 带有总 的净正 电荷。 在碱性 pH 溶液中 ,胺和 羧基的 去质子 化产生 总的净 负电荷 。肽离 子上的 正电荷 容易使 肽裂解 ,而且 在酸性 pH 下 可以提 高肽的 HPLC 层 析特性 。因 此肽的 ESI 大都 是 在酸性 样品的 正离子 模式中 进行。 6.10 ESI 中肽 离子电 荷状态 ESI 的一个 突出特 征是使 蛋白质 和肽产 生多电 荷离子 。许 多肽 具有多 质子接 受位点 ,在 溶液中 以单电 荷或多 电荷离 子存在 ,尤其 是由胰 蛋白酶 消化产 生的肽 片段, 因为这 些肽在 C 端有 赖氨酸 或精氨 酸残基 ,并有 N 端氨基 ,它们 在酸性 溶液中 质子化 。蛋 白质和 肽的“ 多电荷 ”使形 成的离 子处在 四极杆 和离子 阱分析 器质量 范围内 ,这些 分析器 的质量 范围比 TOF 分析 器的质 量范围 更小。 例如, 一 个单质 子化的 20 kDa 蛋白质 (m/z = 20 001) 的 绝对质 量超出 四极杆 质量分 析 器的质 量范围 ,四极 杆质量 分析器 的质量 范围为 2 kDa, 有时 4 kDa。 一般的 20 kDa 蛋 白质在 溶液中 可接受 10 〜 30 个质子 。溶 液中的 蛋白质 分子有 些接受 20 个质子 ,其 为 20 020/20 = 1 001; 某些 可接受 21 个质子 ,其 m/z 为 20 021/21 = 953; 某些 可接受 19 个质子 ,其 m/z 为 20 019/19 = 1 053 等等。 很明显 完整蛋 白质的 ESI 质谱是 所谓的 “多电 荷层” ,代表 溶液中 蛋白质 的所有 • 42 • 不 同状态 (图 6. 4A)。 电 荷简化 算法和 软件可 以将这 种谱图 转换成 代表实 际蛋白 质质量 的谱图 (图 6. 4B)。 蛋白 质存在 多种电 荷状态 是因为 这些大 分子有 多个可 接受质 子的受 体位点 ,每一 种受体 与溶液 平衡。 ib_200336_J_ab_95 «32-64 RT:0.79-1.54 AV 33 NL 7.94E5 图 6. 4A 牛脱辅 基肌红 蛋白的 ESI-MS 分析 来自蛋 白质不 同电荷 形式信 号的“ 多电荷 层”。 RT 0.00 P:+ NL1.17E7 图 6. 4B 牛脱辅 基肌红 蛋白的 ESI-MS 分析 去除 环绕的 谱图只 有单个 信号。 • 43 • 与完整 蛋白质 不同, 250 〜 2 500 Da 的肽 以单、 双和三 电荷离 子的混 合物存 在 ,这取 决于肽 的大小 和存在 的碱性 氨基酸 的数量 。在 这个 质量范 围的肽 主要是 双电 荷离子 ,但 也常可 观察到 单电荷 和三电 荷离子 。在图 6. 5 模型肽 AVAG- CAGAR 的谱 图中可 看到这 些离子 的分布 ®。 进入离 子源, 穿过有 持续高 电压的 不锈钢 锥体或 进样针 ,随 着液流 离开进 样针, 高压 进样针 样品流 图 6. 6 ESI 离子源 ① 原文表 述有误 ,图 6. 5 实际 上是肽 DAFLGSFLYEYSR 的 谱图。 —— 译者注 6. 图 6. 5 胰蛋 白酶肽 DAFLGSFLYEYSR 的 全扫描 ESI-MS 分析 展 示一个 m/j: 为 1567. 9 的单电 荷离子 和一个 m/z 为 784. 7 的 双电荷 离子。 .1 ESI 离 子源怎 样工作 ESI 离 子源的 力学相 对简单 (图 6. 6)。 样品 通过液 流流动 ( 通常从 HPLC) 0505050 50 5 o 5 0 5 0 5 0 5 0998877 66 55 4433 22 1 • 44 • 样品 分散为 细雾状 微滴。 微滴含 有肽离 子以及 HPLC 流动 相组分 (水、 乙腈、 醋酸等 )。 离子源 需进一 步从溶 剂组分 中分离 肽离子 ,将 离子 转移到 质量分 析器。 有 两种方 式可以 从溶剂 中分离 肽离子 。其一 ,在 某些离 子源中 ,微 滴穿过 一个加 热的 毛细管 ,完成 脱溶剂 化过程 。其二 ,可以 通过氮 气幕穿 过雾状 微滴引 起脱溶 剂化 。在这 两种情 况下, 肽离子 穿过离 子源进 人质量 分析器 ,微滴 中的大 量溶剂 通过真 空系统 泵出. 肽离子 被吸入 质量分 析器。 6. 12 串 联质量 分析器 有三 类串联 质量分 析器与 ESI 离 子源联 用进行 蛋白质 组分析 。这些 质量分 析器 是三级 四极杆 ( 常称为 “triple quad”)、 离子 阱和四 极杆飞 行时间 (Q_ TOF)。 这 些质量 分析器 在某些 工作细 节上有 所不同 ,但其 基本原 理相同 。串联 MS 分 析器从 ESI 离子 源产生 的肽离 子混合 物选择 m/z 相同的 肽离子 ,然 后进行 碰撞诱 导解离 (CID)。 CID 诱导使 肽成为 离子片 段和中 性片段 。根据 m/^分析 离 子片段 ,产生 产物离 子谱图 。从 串联或 M&MS 谱 图中含 有的信 息可以 推导肽 序列 ,也可 以确定 肽修饰 的性质 和修饰 位点。 6.13 三 级四极 杆质量 分析器 四极杆 质量分 析器由 4 个 平行的 金属圆 棒组成 (图 6. 7A)。 加 到金属 圆棒上 的直流 和射频 电压形 成磁场 ,使 肽离子 在圆棒 之间沿 轴方向 以螺旋 形轨道 前进。 圆 棒上施 加一定 的电压 允许某 一特定 m/z 值 的肽离 子通过 四极杆 ,而大 于或小 于这一 m/z 值的肽 离子向 外飞行 ,不 能通过 四极杆 。通过 迅速改 变圆棒 上的电 压 ,可 以分析 m/Z 值 不同的 离子。 三级四 极杆具 有两套 四极杆 (Q1 和 Q3, 图 6. 7B), 这 两套四 极杆由 一个只 受射 频电压 控制的 另一个 四极杆 (q2, Q 小写 是广泛 接受的 惯例) 分开 。中间 的 四极杆 q2 作为 碰撞池 。在碰 撞池中 肽离子 和中性 气体原 子的碰 撞导致 肽离子 裂 解成为 肽片段 。检测 器置于 Q3 之后。 三级 四极杆 以两种 基本方 式进行 工作。 第一种 方式, Q1 快速 扫描分 析来自 离子源 的离子 ,记 录在给 定时间 内来自 离子源 的全部 离子的 m/z 值 (图 6. 70。 这 称为“ 全扫描 ”分析 ,产生 离子源 的全部 肽离子 (如单 、双或 三电荷 离子) 信 号 ,这相 当于在 一定扫 描时间 (一般 时间为 1 秒) 进人离 子源的 肽离子 “快照 ”。 另一种 工作方 式使用 Q1 作 为质量 过滤器 。在 Q1 中固定 电压, 只允许 有特定 m/z 值的离 子通过 (图 6.7D)。 然后这 些肽离 子进人 q2, 在 q2 与氩 气原子 碰撞, 进行 裂解。 Q3 根据 产生 的片段 离子的 m/z 进行 分析。 Q3 对规定 质量范 围反复 扫描 检测片 段离子 。三 级四极 杆用这 种工作 模式获 取串联 MS 数据 。用三 级四极 杆进行 MS~MS 分析的 效率取 决于被 分析肽 离子的 性质和 仪器的 设定, 包括在 q2 的 At •气压 和用于 CID 的能 量设定 。在 大多数 三级四 极杆的 MS~MS 实验中 ,实 • 45 • r 际 上进人 q2 的前 体离子 只有部 分进行 裂解, 所发生 的裂解 范围有 时要比 在离子 阱 的裂解 更广泛 ( 见下文 )。 这样 ,三级 四极杆 的最佳 MS~MS 操 作需要 仔细调 试仪 器参数 ,以 便得到 最适程 度的肽 裂解。 ES 丨 离子源 Ql 、 q2 Q3 检测器 图 6. 7 三级 四极杆 MS 仪器 的图示 A. 四极杆 质量分 析器; B. 选定的 m/^值 肽离子 与其他 m/z 值肽 离子的 轨道; C. 三 级四极 杆在全 扫描模 式的 操作; D •在 MS^MS 模式中 三级四 极杆的 操作。 在 蛋白质 组学的 研究中 ,三 级四极 杆是用 于串联 MS 的最 早仪器 。四 极杆质 量 分析器 允许选 择特定 肽离子 (用 Q1), 通过 MS^MS (用 Q3) 进 行离子 片段的 分析 ,其精 确度达 到真实 m/Z 值的 ±0.5 amu, 这种 质量精 确程度 使得三 级四极 杆的 MS~MS 数据 可直接 用来解 释氨基 酸序列 ,也 可以用 MS~MS 谱图与 数据库 蛋 白质序 列相关 联的算 法得到 肽序列 ( 见下文 )。 6. 14 离子 阱质量 分析器 离 子阱质 量分析 器的设 计和操 作与三 级四极 杆有很 大不同 。三 级四极 杆是根 • 46 • 图 6. 8 离子阱 MS 仪器 的图示 A. 在 分析器 中捕获 离子; B •不同 m/z 值肽 离子的 连续“ 扫描逐 出”; C. 离子的 碰撞诱 导解离 (裂解 ); D. (C) 中前体 离子裂 解产生 的产物 离子的 连续“ 扫描逐 出”。 进行 M^MS 分析时 ,来自 离子源 的肽离 子填充 离子阱 。然后 选择某 一感兴 趣的 特定肽 离子, 通过调 节离子 阱电压 逐出所 有其他 m/z 值的 肽离子 (图 据肽 离子穿 过分析 器的“ 飞行” 来分析 ,而离 子阱是 收集和 储存肽 离子以 便进行 MS~MS 分析。 这种分 析器设 计简单 。来 自离子 源的肽 离子直 接进人 离子阱 。离 子阱由 一个顶 部电极 、一 个底 部电极 (端盖 ) 和中 间部位 的一个 环形电 极组成 (图 6. 8A)。 离子 阱本身 约为一 个葡萄 柚大小 。离 子阱中 收集到 的肽离 子通过 DC (直流 ) 和 射频电 压保存 在离子 阱中的 小窝中 。少量 的氦用 作“冷 却气体 ”帮助 控 制肽离 子的能 量分布 。在全 扫描模 式中, 调节电 极上射 频电压 ,根据 m/z 值 肽 离子从 离子阱 中被连 续逐出 (图 6. 8B), 这 产生了 在任何 给定时 间离子 阱中所 有肽 离子的 谱图。 检测来 自离子 源的肽 离子时 ,离子 阱连续 重复下 列循环 :①用 肽离子 填充离 子阱; ②根据 w/z 值 通过扫 描将离 子逐出 。与 三级四 极杆不 一样, 离 子阱产 生一系 列间断 的分析 ,而不 是连续 的分析 。与三 级四极 杆类似 ,只 要肽 离子的 m/z 值在分 析器的 质量限 定范围 ,离 子阱可 以检测 ESI 形 成的多 电荷肽 离子。 活化 (裂解 ) • 47 • 6. 8B)。 再 迅速增 加离子 阱电压 以便增 加存留 肽离子 的能量 ,导致 肽离子 与离子 阱 氦气原 子的能 量碰撞 ,诱 导离子 的裂解 (图 6. 80。 然 后捕获 离子阱 中的片 段 ,根据 不同的 m/z 值 将其扫 描逐出 (图 6. 8D)。 通 过离子 阱进行 MS 分析可 以恰当 比拟为 “罐头 盒中的 石块” 。可以 用这个 比 拟总结 离子阱 MS~MS 实验。 将一小 堆不同 大小的 石块放 人一个 罐头盒 。选定 其中 的一块 ,把其 余的石 块扔掉 。然后 迅速用 力摇动 罐头盒 ,使选 定的石 块片段 变成小 石子。 再依次 取出石 子进行 称重。 离子 阱的一 个显著 特征是 MS~MS 分析的 肽片段 离子可 以保留 在离子 阱中, 再 进行一 次裂解 。第二 次MシMS 分析 的肽片 段也可 以保留 ,并进 一步形 成更小 的 肽片段 。这 一类分 析称为 MSn, 在某 些情况 下可以 产生非 常详细 的裂解 信息。 然而 ,由 于以下 的两个 原因, 阻碍了 MSn 分析在 蛋白质 组学中 的应用 。第 一, 进行 MS~MS 分析时 ,由 于不能 确定在 一个肽 禽子的 MS^MS 分析 中会形 成什么 离子 ,也就 很难选 择用于 进一步 裂解的 片段, 因此目 前还不 能预期 需要进 行什么 MS^MS^MS 分析 。第二 ,总 肽离 子数随 MS 循环 的次数 增多而 减少。 在一个 MS~MS 分析后 ,离子 阱中往 往不能 有足够 的肽离 子进行 有用的 分析。 串联 MS •分析 的离子 阱和三 级四极 杆分析 的不同 之处还 表现于 以下几 方面: 第一 ,离子 阱中肽 离子裂 解类型 和三级 四极杆 产生的 肽裂解 类型有 一定的 差异。 在通 用操作 条件下 ,离子 阱比四 极杆更 倾向于 诱导前 体肽离 子的完 全裂解 。这意 味着 在离子 阱中更 多前体 肽离子 能有效 地转换 成产物 肽离子 (因此 可更有 效地转 换成序 列信息 )。 确实 ,在 离子阱 M^MS 谱 图中通 常看不 到前体 肽离子 信号, 而三级 四极杆 MS~MS 谱图 中却能 明显观 看到前 体肽离 子信号 。第二 ,三 级四极 杆在 M^MS 分析 中比离 子阱能 诱导更 大范围 的裂解 。离子 阱产生 的大多 数肽裂 解都可 直接用 于序列 测定, 而三级 四极杆 MS~MS 谱图 有另外 的特征 。这 些特征 可解析 意义不 明确的 数据, 并可提 供额外 的细节 。第三 ,离 子阱 MS~MS 分析中 的所 谓“低 w/z 限制” 。离 子阱的 MS~MS 分析不 能记录 m/z 值 低于前 体离子 25% 的 产物离 子质量 ,即 在一个 m/z 为 1 000 的前体 离子分 析中, 可以检 测的最 低片段 离子是 m/z 为 250 的离子 。对肽 MS~MS 分析这 通常不 是问题 ,因 为一般 可以 从相应 较大肽 片段的 m/Z 值 推出低 质量肽 片段的 特征。 另外, 离子阱 质量分 析极高 的质量 分辨率 随离子 扫描逐 出和检 测速度 的增加 而下降 。在 用于全 扫描和 MS~MS 分析 扫描速 度下, 离子阱 能准确 地解析 m/z 值 相 差至少 lamu 的离子 。在 自动 操作中 ,可 使用对 限定质 量范围 的慢全 扫描, 在 MS^MS 分析 前精确 测定离 子的电 荷状态 。下面 将看到 ,有 关前 体电荷 状态的 信 息对用 MS^MS 数据测 定肽序 列是非 常有帮 助的。 6. 15 自动数 据获取 某些 仪器控 制软件 允许三 级四极 杆或离 子阱在 全扫描 和串联 MS 模式 之间自 • 48 • 动切换 获取肽 MS^MS 谱图 。在 这种方 法中, 仪器默 认为全 扫描模 式来检 测从离 子源 出现的 肽离子 。在 检测时 ,仪器 选择信 号最强 的肽离 子进行 CID 以得到 MS-MS 谱图 ,然 后仪器 切回到 全扫描 模式, 选择下 一个信 号最强 的肽离 子并进 行 CID。 这种 切换反 复循环 ,自 动得到 多个肽 离子的 MS*MS 谱图 (图 6. 9)。 这 种自 动化仪 器控制 方法称 为数据 依赖扫 描或数 据依赖 MS~MS, 它 非常适 合在复 杂肽混 合物的 IX-MS^MS 分析中 获取大 量肽的 MS~MS 谱图。 图 6. 9 数 据依赖 扫描自 动收集 M&MS 谱图 6.16 其他 质量分 析器: Q-TOF 和傅 里叶变 换离子 回旋加 速共振 MS 仪器 有 两种新 质量分 析器影 响着分 析蛋白 质组学 的发展 ,这两 种仪器 都使用 ESI 离子源 。第一 个是四 极杆- 飞行时 间质量 分析器 ,通 常称为 Q-TOF, 这是 其两个 组分 的共同 缩写。 (应该 指出混 合缩写 “Q-TOF” 是 一种商 业仪器 的商标 名称。 我在这 使用缩 写只是 因为它 的简洁 和清晰 ,而不 是对产 品的认 可。) Q-TOF 仪器 在 结构上 TOF 质量 分析器 代替了 四极杆 Q3, 在功能 上与三 级四极 杆相同 。最近 TOF 技术 (前面 已讨论 ) 的改 进使这 些分析 器的速 度和分 辨率都 有很大 提高。 在 CKTOF 中 ,除了 MS~MS 中 的产物 离子由 TOF 质 量分析 器而不 是由三 级四极 杆 Q3 分析外 ,全 扫描和 MS~MS 实验其 他部分 与三级 四极杆 工作方 式相同 。 〇■ TOF 的一 个显著 优点是 TOF 的 质量分 辨率远 远高于 四极杆 ,可以 进行产 物离子 精 确的质 量测定 ,有 利于从 MS^MS 谱图得 到精确 的序列 测定。 此外, TOF 的 • 49 • r 较高分 辨率和 质量精 确性产 生的数 据可更 有效地 用于软 件辅助 的数据 解释。 傅 里叶变 换离子 回旋加 速共振 MS (称为 FT-ICR 或最 常称为 FT-MS) 某种 程度上 与离子 阱类似 。质量 分析器 使用强 大磁场 (典型 磁场为 3 〜 7 Tesla) 和傅 里 叶变换 算法同 时检测 所有在 离子阱 的离子 。这 些仪器 可以用 ESI 离子源 操作, 即使 分析非 常复杂 的肽混 合物也 能得到 极高的 分辨率 。对分 析蛋白 质组学 FT- MS 是潜在 的功能 强大的 工具。 然而, FT-MS 是非 常昂贵 、不太 容易操 作的仪 器 ,这 些因素 限制了 它们对 蛋白质 组学的 影响。 推 荐读物 Jonscher, K. R. and Yates, J. R. ( 1997) The quadrupole ion trap mass spec- trometer: a small solution to a big challenge. Anal. Biochem. 244, 1 — 15. Siuzdak, G. ( 1996 ) Mass Spectrometry for Biotechnology. Academic Press, San Diego- Stahl, D. C. , Swiderek, K. M. , Davis, M. T. , and Lee, T. D. (1995) Da- ta-controlled automation of liquid chromatography/ tandem mass spectrometry analysis of peptide mixtures. J. Am. Soc. Mass Spectrom. 7, 532 一 540. Yates, J. R. (1998) Mass spectrometry and the age of the proteome. J . Muss. Spectrom. 33, 1 — 19. • 50 • 7 用肽质 量指纹 谱鉴定 蛋白质 7. 1 什么是 肽质量 指纹谱 肽质 量指纹 谱是用 MS 测定 蛋白水 解肽片 段质量 的蛋白 质鉴定 技术。 用实验 测 得的蛋 白质酶 解肽段 质量在 蛋白质 数据库 中检索 ,寻 找具有 相似质 量的肽 ,从 而鉴定 蛋白质 。肽 质量指 纹谱很 适合分 析蛋白 质组学 ,因为 它将简 单的方 法与稳 定的高 通量仪 器操作 ( 特别是 MALDI-TOF MS) 相结合 。与其 他基于 MS 的分 析 蛋白质 组学技 术一样 ,用肽 质量指 纹谱进 行蛋白 质鉴定 的质量 取决于 MS 数据 的质量 、数 据库的 准确性 以及使 用的检 索算法 和软件 的功能 。在本 章将详 细讨论 肽质量 指纹谱 。我 们将描 述怎样 用测定 的肽质 量鉴定 蛋白质 以及使 鉴定过 程自动 化的 算法和 软件。 7. 2 肽质量 指纹谱 :概述 获得 某个生 物的整 个蛋白 质组后 ,用胰 蛋白酶 切割成 不同大 小的胰 蛋白酶 肽。 胰蛋白 酶专一 性较高 地切割 蛋白质 ,它只 在赖氨 酸和精 氨酸残 基切割 (当精 氨 酸后的 氨基酸 是脯氨 酸时不 能切割 )。 每一 个蛋白 质用胰 蛋白酶 消化产 生一定 数 量的有 特定长 度和序 列的肽 ,而且 这些肽 有特定 的质量 。只 要胰 蛋白酶 肽段混 合物 中的每 一个肽 与其来 源蛋白 质和氨 基酸序 列位点 相关联 ,蛋白 质组的 全部信 息就得 以保留 。当然 ,并不 一定要 在实验 中进行 胰蛋白 酶消化 。可 以通过 计算机 在数 据库中 虚拟消 化全部 蛋白质 ,产生 肽的总 目录, 通过将 核苷酸 序列信 息转换 成蛋白 质序列 信息然 后进行 消化也 可以达 到同一 目的。 理论上 ,测 序正确 的完整 基因 组序列 可以产 生完整 的蛋白 质目录 ,所以 也能产 生完整 的胰蛋 白酶肽 的 目录。 肽段的 这种超 级目录 已成为 很有价 值的参 考工具 。目录 按质量 大小从 低到高 排列这 些胰蛋 白酶肽 ,核 查这种 目录会 揭示长 度超过 6 氨 基酸的 某些肽 (约 700 Da) 在 目录中 有惟一 质量。 鉴定某 个生物 的未知 蛋白质 ,首先 用胰蛋 白酶消 化蛋白 质产生 胰蛋白 酶肽。 消化 后得到 的每一 肽段的 质量各 不相同 。如果 每一个 胰蛋白 酶肽消 化产物 的确切 质 量已知 ,那么 取一定 质量的 胰蛋白 酶肽段 与整个 目录进 行比较 ,我 们会 发现目 录中有 与之质 量完全 一样的 肽片段 (图 7.1)。 如果 在全部 肽质量 的目录 中这种 匹配是 惟一的 ,我们 几乎可 以肯定 这两个 肽段是 相同的 。在 目录中 与之匹 配的肽 段的 序列位 置和来 源已知 ,从而 可以肯 定我们 的胰蛋 白酶肽 与之来 自相同 的蛋白 质。 然后可 以用未 知蛋白 质的第 二个胰 蛋白酶 肽段以 相同方 式与目 录匹配 ,从目 • 51 • 录中 得到与 未知肽 段匹配 的已知 肽片段 和蛋白 质。 未知蛋 白质的 胰蛋白 酶肽段 质量与 目录中 胰蛋 白酶肽 段的多 个匹配 可说明 未知蛋 白质的 特性 。即使 肽质量 目录中 有多个 条目与 未知胰 蛋白 酶肽段 匹配, 可以根 据未知 蛋白质 的多个 肽段 与目录 中已知 的同一 个蛋白 质的多 个肽段 相匹 配来确 定未知 蛋白质 。只要 能使肽 质量与 一个 好的质 量目录 匹配, 就能简 单地通 过测定 胰蛋 白酶肽 质量鉴 定未知 蛋白质 。这是 用肽质 量指纹 谱鉴定 蛋白质 的基本 要点。 当然, 这是一 个高度 理想化 的例子 。以 下 两点决 定了肽 质量指 纹谱能 否成功 地用于 鉴定 蛋白质 。第一 ,必 须能够 精确测 定肽质 量 。第二 ,必须 有有效 且精确 的蛋白 质序列 数 据库。 7. 3 肽质 量指纹 谱:分 析方法 肽质量 指纹谱 方法相 对简单 。使 用以可 预测方 式切割 蛋白质 的特定 蛋白酶 (最 常用的 是胰蛋 白酶) 处理 蛋白质 样品。 除胰蛋 白酶外 ,其 他一些 蛋白酶 ,甚 至化 学试剂 也可特 异性地 将蛋白 质切割 成肽。 不管用 什么酶 消化蛋 白质关 键是产 生专一 性切割 ,因 为蛋白 质序列 数据库 中也进 行相同 的切割 ,产生 用于匹 配的肽 质量 目录。 然后用 MS 分析肽 ,进 行质 量测定 。通 常仪器 实际上 测定的 是肽段 m/z 值 ,它 可以被 转换成 质量。 理论上 ,任何 MS 仪 器都可 用来测 定肽的 m/z 值 ,但 是用肽 质量指 纹谱进 行可靠 的蛋白 质鉴定 时需要 高度精 确的质 量测定 。下 面 举一个 实际例 子来说 明这一 点的重 要性。 人血 红蛋白 a 链的胰 蛋 白酶消 化产生 14 个胰蛋 白酶肽 ,其中 序列为 VGA- HAGEYGAEALER 肽的单 个同位 素精确 质量为 1 528. 734 8 Da, 其单电 荷离子 的 mA 值为 1 529. 734 8, 这 个肽对 SWIS&PROT 数据库 中所有 小鼠和 人蛋白 质的 检索结 果如表 7.1 所示。 表 7. 1 质量 精确性 和质量 误差极 限对肽 质量指 纹谱检 索结果 的影响 a 检索 w/z 质量误 差极限 /Da 命中数 1 529 1 478 1 529. 7 0• 1 164 1 529. 73 0.01 25 1 529. 734 0.001 4 1 529. 734 8 0. 000 1 2 a •在 http: //prospector, ucsf. edu 网址用 MS~FIT 程 序进行 检索。 肽质 量目录 1 528.768 5 1 528.798 9 1 529.000 2 1 529.200 1 1 529.245 4 1 529.500 6 1 529.699 7 1 529.734 8 1 529.997 8 1 530.233 2 1 530.456 7 1 531.000 3 1 531.0107 1 531.300 4 1 531.565 6 <^= 1 529.734 8 测 定质量 图 7.1 肽 m/z 值 与蛋白 质序列 数据 库中肽 离子质 量目录 的匹配 • 52 • 如果质 量误差 极限为 1 Da (即 测定质 量在真 实值的 ±1 Da 范围内 ), 对最接 近 的整数 m/z 值 (即 测定的 m/z 值为 1 529) 进 行测定 ,有 478 个匹配 。换 句话 说 ,有 478 个来 自小鼠 和人蛋 白质的 胰蛋白 酶肽为 1 529±1 Da 。如果 能 对肽离 子 进行更 精确的 m/z 值 测定和 使用更 严格的 质量误 差极限 ,可以 把最终 匹配的 数目 缩小到 两个肽 。有趣 的是, 这两个 肽是来 自人血 红蛋白 《 的 VGAHAGE- YGAEALER 和来自 小鼠血 红蛋白 a 的 IGGHGAEYGAEALER。 虽然这 两个肽 有 4 个 氨基酸 的不同 ,但是 它们的 m/z 值都是 1 529. 734 8。 这里 要强调 的是更 精确的 w/z 值测定 为肽质 量指纹 谱提供 更可靠 的数据 。肽 质 量指纹 谱的质 量测定 所用的 MS 仪 器操作 必须能 测定在 实际值 ±0. 〇5 Da 范围内 的 肽质量 。具 有延迟 提取和 反射器 分析器 的现代 MALDI-TOF 仪器可 做到这 一点, 并已被 广泛应 用到这 一领域 。然而 用单一 m/z 值 1 529. 73 和 ±0. 01 Cte 的质 量误差 极限 仍产生 25 个与之 匹配的 蛋白质 (表 7.1)。 与 之匹配 的某些 蛋白质 列于表 7. 2。 表 7.2 与 m/z 值为 1 529. 73 的肽 的质量 指纹谱 匹配的 蛋白质 肽序列 鉴定 检索 质量中 匹配的 (差异 ) IGGHGAEYGAEALER 小鼠 Hb a 1 529.734 8 ( — 0.004 8) VGAHAGEYGAEALER 人 Hb a 1 529.734 8 (-0.004 8) MGTGWEGMYRTLK 小鼠晶 状体上 皮细胞 蛋白质 LEP503 1 529. 724 5 (0. 005 5) MADEEKLPPGWEK 人 PIN1 类蛋白 1 529.731 0 (-0.001 0) DTQTSITDSSAIYK 小 鼠信号 识别颗 粒受体 卩 亚单位 1 529.733 5 (—0.003 5) NDSSPNPVYQPPSK 小鼠过 氧化物 酶体组 装因子 1 1 529. 723 6 (0.006 4) MNLSLNDAYDFVK 人 双专一 性蛋白 磷酸酶 1 529. 731 0 (0.001 0) 所有 这些匹 配的蛋 白质完 全是在 〇.〇1 Da 的特定 误差极 限之内 。在这 个标准 上, 这些匹 配蛋白 质中的 任何一 个都可 能是我 们所要 研究的 蛋白质 。怎样 从这些 极为相 似的匹 配中鉴 定出正 确的蛋 白质? 答案 是准确 的蛋白 质鉴定 通常需 要多个 肽匹配 。在表 7.1 的例 子中, 即使最 精确 的质量 匹配也 不能确 定我们 所分析 的肽是 来自人 血红蛋 白或来 自小鼠 血红蛋 白 。蛋 白质样 品的胰 蛋白酶 消化能 产生多 个肽段 ,由 此得到 多个可 供数据 库检索 的 m/z 值 。表 7. 3 表 明增加 进行检 索的肽 值 数目的 优点。 表 7.3 多个 肽质量 对用肽 质量指 纹谱进 行蛋白 质鉴定 的影响 a 检索 m/zb 质量误 差极限 命中数 1 529. 73 0. 1 204 1 529. 73 1 252. 70 0• 1 7 1 529. 73 1 252. 70 1 833. 88 0. 1 1 a. 在 http: //prospector, ucsf.edu 网址用 MSFIT 程 序进行 检索。 b. 实际肽 w/z 值是 1 529. 734 8 (VGAHAGEYGAEALER), 1 252. 707 4 (FLASVSTV- LTSK) 和 1 833. 884 5 (TYFPHFDLSHGSAQVK)。 • 53 • 用人血 红蛋白 a 链 的一个 或两个 肽段进 行检索 产生多 个与之 匹配的 已知肽 段 。用人 血红蛋 白 《 链的 14 个胰 蛋白酶 肽中的 3 个肽的 m/z 值进 行检索 产生一 个与之 对应的 匹配。 7. 4 肽质 量指纹 谱:复 杂情况 前面用 一个非 常简单 的例子 解释用 肽质量 f 纹谱 鉴定蛋 白质的 概念。 用两个 或三 个肽的 m/z 测定 来鉴定 如人血 红蛋白 a 链 那样的 蛋白质 前体相 对简单 。当 然, 在这个 例子中 我们假 定肽质 量测定 是正确 的且误 差达到 〇.〇1 Da 或更 精确。 这些 例子证 明更精 确的和 对多个 肽的质 量测定 极大提 高了鉴 定的准 确性。 根据仅 仅 来自两 个或三 个肽的 数据可 以通过 “手工 ”成功 构建肽 质量指 纹谱。 在实 际工作 中有以 下几个 因素使 肽质量 指纹谱 变得较 为复杂 。首先 ,肽 的真 实数 据不像 前面的 例子那 样完美 。虽然 装备了 反辦器 或延迟 提取的 MALDI-TOF 仪器 能够在 〇. 005 单位或 更精确 的范围 内测定 肽离子 如 m/z 值, 但是误 差仍是 不 可避免 。第二 ,在 实际 样品的 MALDI-TOF 谱图 中经常 有多个 信号, 其中许 多信 号是由 于其他 蛋白质 的混人 。必 须考虑 2D 凝胶 的大多 数样品 点含有 2 〜 3 个 蛋白质 ,一个 典型的 50 kDa 蛋白 质产生 25 〜 40 个胰蛋 白酶肽 ,其 他样 品污染 (如不 小心操 作污染 的人角 蛋白) 也会 在谱图 中产生 信号。 这些因 素导致 产生复 杂的 、代 表多个 蛋白质 肽片段 的谱图 。第三 ,由 于偶 然因素 而不是 实际特 征导致 某 些数据 库匹配 的可能 性总是 存在的 。较 大蛋白 质的假 阳性匹 配可能 性更大 ,这 主要 是因为 它们比 较小蛋 白质产 生更多 胰蛋白 酶肽。 7.5 肽 质量指 纹谱的 软件工 具:寻 找匹配 面对大 量的相 关数据 和计算 似乎令 人不知 所措, 但我们 可以寻 求数据 缩减算 法 和软件 的帮助 。有若 干软件 工具用 于肽质 量指纹 谱鉴定 蛋白质 ,其 中有 些软件 列 在这一 章后面 。下面 简单介 绍这些 程序可 做哪些 工作。 程序使 用者首 先考虑 应选择 什么样 的检索 数据库 。可以 选择蛋 白质或 基因序 列 数据库 ( 如果选 择后者 ,要 翻译基 因序列 )。 SWISS~PR〇T 蛋白 质序列 数据库 已被广 泛应用 。其 他常用 蛋白质 序列数 据库有 OWL 和 NCBIm •数 据库。 程序使 用 者提供 有关样 品来源 的信息 ,限 定对相 关生物 的检索 。例如 ,来 自小鼠 蛋白质 的样 品可以 对所有 生物、 对哺乳 类序列 、对 啮齿目 或对小 鼠进行 专一的 序列检 索 ,这样 可以减 少与数 据进行 比对的 数目, 降低在 其他生 物中假 阳性匹 配的数 目。 除了这 些特点 ,程序 使用者 也可提 供要检 索蛋白 质的分 子质量 范围, 这也可 降低 需进行 比对的 数目。 第二步 ,使用 者表明 用来切 割蛋白 质的酶 ,指 定“漏 掉的切 割”的 可能数 目 ,这 些漏掉 的切割 来自酶 的不完 全消化 ,匹配 算法可 以产生 这类肽 的名单 ,以 防它们 在样品 中存在 。第 三步, 程序使 用者指 定在匹 配算法 中要考 虑的一 些肽修 饰 。例如 ,胰 蛋白 酶消化 方法通 常包括 用碘乙 酰胺或 碘乙酸 进行的 半胱氨 酸巯基 • 54 • 的还原 和烷化 ,这 种操 作会改 变肽的 半胱氨 酸残基 的质量 。此外 ,自 由半 胱氨酸 巯基 可能在 SD&P AGE 中被丙 烯酰胺 修饰。 程序使 用者也 可指定 一些常 见的蛋 白修饰 ,如 磷酸化 、硫化 、糖 基化和 N 端修饰 。所 定义的 这些修 饰允许 程序在 数 据库中 产生修 饰前和 修饰后 肽质量 的匹配 ,因 而使特 定肽段 在修饰 前后的 MS 数据与 数据库 中的条 目匹配 。第 四步 ,程 序使用 者输入 MS 测定的 m/z 值或自 动 指定要 估算的 MS 数据 文件夹 。然 后输人 要求的 质量误 差极限 以便控 制“命 中”所 需要的 MS m/z 值和 计算的 m/z 值 的接近 程度。 一旦程 序使用 者点击 “Go”, 软件 从预过 滤要使 用的数 据库开 始工作 。例 如 ,如果 指定小 鼠为检 索物种 ,所 有非 小鼠条 目都被 排除; 如果选 择的蛋 白质质 量 范围为 2 000 〜 100 000, 所有 在这个 质量范 围之外 的蛋白 质都被 排除。 然后软 件程序 用指定 的酶对 数据库 中保留 的序列 进行虚 拟消化 ,如果 允许漏 掉切割 ,肽 片段目 录中包 括酶不 完全消 化产生 的肽段 。软 件程序 根据所 指定的 修饰产 生相对 应的 肽片段 。接下 来程序 按质量 (或 m/z 值) 大小排 列整个 肽目录 ,用 谱图中 每个 m/z 信号与 这个目 录进行 比对。 在程序 使用者 指定的 质量误 差极限 内的所 有匹配 都被记 录为“ 命中” ,并 用来计 算相关 蛋白质 的得分 和进行 鉴定。 7. 6 肽质 量指纹 谱的软 件工具 :给结 果评分 在实际 样品的 MALDI-TOF 谱图中 一般有 几十个 m/z 信号。 肽质量 指纹谱 软件 通常将 所有的 m/z 信号 与数据 库中的 某些条 目匹配 。然而 ,由于 m/z 测定 误差、 常有的 样品污 染和意 料不到 的翻译 后修饰 ,不 是所有 匹配都 指向相 同的蛋 白质 。怎样 评价命 中以便 决定哪 一个蛋 白质与 谱图中 的数据 匹配得 最好? 最简单 的方法 是把最 高分给 这样的 蛋白质 :它的 预测的 胰蛋白 酶肽与 最大数 量 MS 数据的 m/z 信 号匹配 。如 果仅检 索一个 m/z 值 ,几 个蛋白 质会匹 配得同 样好 。然而 ,随 着检 索更大 数量的 m/z 值, 对一个 特定的 蛋白质 会有更 多的匹 配 ,使那 个蛋白 质相对 其他蛋 白质得 分更高 。使用 极好的 MS 数据 ,这个 相当简 单 的方法 很有效 。不 过它倾 向于给 较大蛋 白质较 高分。 如前面 提到的 ,较 大蛋白 质产 生更多 胰蛋白 酶肽, 因此较 大蛋白 质与这 些胰蛋 白酶肽 之一匹 配的机 会要大 于 较小蛋 白质。 为 解决这 些问题 ,几 个肽质 量指纹 谱程序 使用更 为复杂 的得分 算法。 这些算 法可 校正由 于蛋白 质大小 不同引 起的得 分偏倚 ( 较大的 蛋白质 产生较 多的肽 ), 也可校 正数据 库中较 小的肽 与用于 检索的 m/Z 值有较 多匹配 的倾向 ,另 外某些 算法使 用概率 统计以 便更好 地定义 蛋白质 鉴定的 意义。 在本书 写作时 ,用 于肽质 量指纹 谱的基 本工具 可分为 三组。 •第 一代 免费和 付费软 件工具 ,这些 软件根 据谱图 中与数 据库中 值 (在给 定质量 误差极 限之内 ) 相 匹配的 数目给 出得分 。包括 PepSea(http:// www. protana. com) 和 PeptIdent/MultIdent(http://www. expasy. ch/tools/pep- • 55 • tident. html) 0 •第 二代 免费和 付费软 件工具 ,这 些软件 使用的 得分算 法考虑 到蛋白 质大小 4 和肽 片段长 度对匹 配几率 的影响 。包括 MOWSE ( http: //srs. hgmp. mrc. a& uk/_ cgibn/mowse) ^0 MS-Fit (http: //prospector, ucsf. edu)〇 •第三 代软件 更多地 使用基 于概率 的得分 ,提 供得 分的统 计基础 ,估 计某些 匹配可 能反映 随机事 件而不 是真实 特性的 概率。 这些程 序包括 ProFound (http: // prowl, rockefeller, edu/ cgi-bin/ProFound) 和 Mascot(http: //www. matrixscienc& com) 。 7.7 肽质量 指纹谱 :评价 和展望 对 于蛋白 质鉴定 ,肽质 量指纹 谱方法 有很多 地方值 得推荐 ,它 在蛋白 质组学 中最接 近“高 通量” 。在 样品 制备、 MS 分析和 数据缩 减自动 化的帮 助下, 用单一 系 统一天 可鉴定 几百个 蛋白质 。仪 器操作 (典 型的如 MALDI-TOF) 简易、 稳定且 灵敏。 蛋白质 和核苷 酸序列 数据库 的迅速 发展为 数据库 检索算 法提供 了更可 靠的平 台 / 检 索算法 的改进 和复杂 统计学 方法的 应用提 高了蛋 白质鉴 定的可 靠性。 然而 ,肽 质量指 纹谱也 有一些 局限性 。首先 ,人 类和其 他研究 较为深 入和广 泛的 物种基 因组和 蛋白质 序列数 据库仍 不十分 完善和 准确, 这降低 了可获 得的匹 配数据 的质量 ,即使 极好的 MS 数据和 软件也 对此无 能为力 。这种 状况肯 定会改 进, 但在近 期仍是 主要限 制因素 。第二 ,高等 生物中 大量高 度同源 蛋白质 使得这 些蛋白 质的区 分变得 复杂。 这些同 源蛋白 质的肽 图谱非 常复杂 。肽 质量指 纹谱在 酵母中 可能较 容易, 但在小 鼠和人 中要复 杂得多 。第三 ,肽 质量指 纹谱主 要是一 种蛋 白质鉴 定技术 。我们 后面会 看到, 在蛋白 质组学 应用中 ,肽序 列和肽 修饰位 点的信 息是必 要的, 而我们 不能从 肽质量 测定推 出这些 信息。 尽管有 这些局 限性, 肽质量 指纹谱 仍是任 何正规 蛋白质 组学实 验室的 一项必 备的研 究技术 。基于 MALDI-TOF 的肽质 量指纹 谱的许 多局限 性可用 ESI 串联 MS 克服。 下面两 章我们 将讨论 ESI 串联 MS。 推 荐读物 Fenyo,D. (2000) Identifying the proteome: software tools. Curr. Opin. Biotechnol. 11, 391-395. Gras, R. , Muller, M. , Gasteiger, E. , Gay, S. , Binz, P. A. , Bienvenut, W. , et al. (1999) Improving protein identification from peptide mass finger- printing through a parameterized multi-level scoring algorithm and an opti- mized peak detection. Electrophoresis 20, 3535 — 3550. Jensen, 0• N. , Podtelejnikov, A. V. , and Mann, M. ( 1997 ) Identification of the components of simple protein mixtures by high-accuracy peptide mass mapping and database searching . Anal. Chem. 69, 4741 — 4750. • 56 • 8 用 串联质 谱分析 肽序列 8.1 图 型中有 什么? 上一 章我们 讨论了 用人血 红蛋白 a 链的 胰蛋 白酶肽 VGAHAGEYGAEAL- ER 的 m/z 值测定 来鉴定 蛋白质 。在检 索人和 小鼠蛋 白质序 列数据 库时, 有两个 肽与 之非常 匹配, 它们的 [M+H]+ 离子 m/z 值都是 1 529.734 8。 这两 个肽都 与在 小鼠和 人之间 高度保 守的血 红蛋白 a 肽 相关。 人: VGAHAGEYGAEALER 小鼠 : IGGHGAEYGAEALER 浏 览这两 个序列 会发现 “IGG” 和 “VGA” 是 不同的 。进一 步仔细 的观察 可发现 “HGA” 和 “HAG” 很接近 ,但 不相同 。我 们看到 的是一 个图型 ,它能 区 分在某 一方面 (质量 ) 一致, 但序列 明显不 同的两 个物种 。这一 章将讨 论串联 MS 分析如 何诱导 肽裂解 ,在 MS-MS 谱图中 肽裂解 如何产 生产物 离子和 怎样从 M&MS 谱 图的裂 解图型 测定肽 序列。 8. 2 肽序 列中有 什么? 使用字 母表示 法可以 表明两 个相同 质量肽 的图型 和结构 的不同 。然 而, MS 仪 器测定 肽及其 m/z 值 ,把结 构还原 成数字 图型。 理解肽 结构的 数字图 型系统 对理 解串联 MS 谱图含 有什么 信息是 必要的 。我 们以肽 AVAGCAGAR 为例, 解 释串联 MS 裂解 。图 8.1 是这个 肽的一 级结构 ,以 线性方 式描述 序列。 肽是通 A V AGC AG A R 72 99 71 57 103 71 57 71 168 72 171 242 299 402 473 530 601 累 积质量 769 图 8. 1 用 质量不 同的氨 基酸构 建的肽 AVAGCAGAR • 57 • 表 8.1 氨 基酸的 平均残 基质量 氨基酸 字 母符号 平均残 基质量 甘氨酸 G 57.05 丙氨酸 A 71.08 丝氨酸 S 87. 08 脯氨酸 P 97. 12 缬氨酸 V 99. 13 苏氨酸 T 101. 11 半 胱氨酸 C 103. 14 亮氨酸 L 113. 16 异 亮氨酸 I 113. 16 天 冬酰胺 N 114. 10 天 冬氨酸 D 115. 09 赖氨酸 K 128. 17 谷 氨酰胺 Q 128. 13 谷氨酸 E 129. 12 甲 硫氨酸 M 131. 19 组氨酸 H 137. 14 苯 丙氨酸 F 147. 18 精氨酸 R 156. 19 酪氨酸 Y 163. 18 色氨酸 W 186. 21 过氨基 酸末端 失水缩 合形成 肽键的 。图 8. 1 中 AVAGCAGAR 的 氨基酸 残基由 虚线表 7K。 每 一 '个 残基在 一 •端有 — ■个酸 胺 NH 基团 ,在 另一端 有一个 C=0 基 团 ,带 有一个 质子的 a 碳 在中间 。决定 每个氨 基酸特 定化学 性质的 侧链与 a 碳 连接 。含有 上述基 本组成 的氨基 酸单位 称 为残基 ,表 8.1 列出了 常见氨 基酸的 鉴别 和残基 质量。 通过这 种表格 将氨基 酸字母 名称转 换成氨 基酸残 基质量 ,我 们可以 将一系 列氨基 酸表示 为一系 列数字 ,这 些数字 与氨 基酸残 基的质 量一致 。另外 必须在 N 端残基 加上一 个额外 的质子 (1 amu), 在 C 端氨 基酸加 上一个 额外的 OH (17 amu)。 现在 可以将 AVAGCAGAR 表示 为 一系列 逐渐累 加的数 字序列 ,如图 8.1 下半部 分所示 。数 字系列 最确切 代表了 MS 仪器如 何处理 这个肽 和它的 结构。 8.3 MS-MS 中 的肽离 子裂解 当肽 离子在 三级四 极杆或 Q-TOF 的碰撞 池中或 在离子 阱中与 中性气 体原子 碰撞时 ,离 子吸收 动能诱 导裂解 。肽片 段中的 许多键 都有可 能断裂 ,但 主要是 肽骨架 的切割 (图 8. 2)。 一 般使 用被广 泛接受 的术语 来描述 肽离子 的裂解 。通常 观察 到的切 割中, 在羰基 氧和酰 胺氮之 间键的 裂解形 成一个 “y 离子” 和一个 “b 离 子”。 y 离子 是电 荷保留 在源 肽离子 C 端的 片段, b 离子 是电荷 保留在 源肽离 子 -N 端 的片段 。双 电荷离 子最有 可能在 分子的 两端带 电荷 。当 双电荷 肽离子 断裂成 片段时 ,形成 b 离子和 相应的 y 离子。 当单电 荷离子 断裂成 片段时 ,形成 b 离 子或者 y 离子 ,肽 的另一 半作为 中性片 段丢失 。很 明显 与单电 荷离子 相比, 从双电 荷离子 的裂解 可以得 到双倍 信息。 图 8. 2 也指 出了肽 骨架的 其他裂 解形式 。在离 子阱、 三级四 极杆和 Q-TOF 仪器 得到的 MS-MS 谱 图中偶 尔也能 观察到 a、 c、 乂和2 离子 ,但它 们不常 出现, 图 8. 2 肽 离子裂 解产生 的 各种碎 片离子 的图示 • 58 • 因为这 些裂解 需要的 能量多 于产生 b 和 y 离子 裂解时 所需要 的能量 。(在 磁分区 仪器 的串联 MS 分析中 常可观 察到这 些离子 。磁 分区 仪器在 肽离子 的碰撞 诱导解 离中 使用更 多的能 量。) 8. 4 MS-MS 谱图 要更好 地理解 b 和 y 离子 的裂解 怎样产 生特定 图型, 研究肽 谱图是 有帮助 的 。图 8.3指出了预测的模型肽八¥八00八0八1^的1)和乂离子裂解。图8.4是双 电 荷离子 AVAGCAGAR 的实际 M&MS 谱图 。从 N 端 (左侧 ) 逐渐向 C 端 (右侧 ), 可看 到裂解 产生了 一系列 m/r 值逐 渐升高 的肽离 子片段 (b 系列) 和一 系列 互补的 w/z 值逐 渐下降 的肽离 子片段 (y 系列 )。 图 8. 3 还指 出了由 G~C 键 裂解 产生的 1)4和75离 子片段 。每 个片 段带有 单电荷 。图示 片段中 的质子 化位点 与源 肽离子 片段的 质子化 位点略 有不同 。一般 认为这 些结构 很可能 是由于 碰撞诱 导肽裂 解而存 在于气 相的离 子种类 。然而 ,肽 链不同 位点质 子化形 成的多 种离子 形 式也共 同存在 。在碰 撞诱导 解离中 ,双 电荷 前体中 质子向 肽酰胺 氮的迁 移可能 帮 助邻近 肽键的 切割。 b】 bj b4 b5 b6 b7 b8 72.087s! 1 71. 219n|242.29^299.35Cs|401.487n) 472.566s! 529.61 ^600.696^ G ,NH 0 O I o CO,H k703.820 ^04.68^33.609^76.557^374.420^303.341^46.290^75.21 1 ^z299.350 /»^476.557 图 8. 3 肽 AVAGCAGAR 的 可能的 b 和 y 离子 片段 图为在 甘氨酸 和半胱 氨酸之 间切割 产生的 匕和 y5 离子 结构。 在 MS*MS 谱 图中从 b 和 y 离子系 列可以 确定出 源肽的 序列。 先讨论 y 离子 系列 ,在 以上的 例子中 ,在 标记的 %和%离 子之间 m/z 值 之差是 71amu, 这相 • 59 • 当于一 个丙氨 酸的残 基质量 。在 ys 和 ys 之间 w/z 值 之差是 57 amu, 这相 当于一 个 甘氨酸 。在 %和74 之间的 差值是 103 amu, 相 当于半 胱氨酸 。仅用 y 离子 系列 的一 小部分 就可以 建立在 肽中存 在一个 “AGC” 基序 。从 完整的 y 离子 系列 (%到力) 可 推测出 “VAGCAGAR” 基序。 b 离子 系列与 y 离子系 列互补 ,在 b7 和 1)6离 子之间 m/z 的 差值是 57 amu, 相当于 甘氨酸 。在 136和1)5 之间的 差值是 71amu,, 相当于 丙氨酸 。完 整的 b 离子 系列 (bjjbD 与 “AVAGCAGA” 基序相 对应。 y 和 b 离子 系列 从两个 不同方 向 描述相 同氨基 酸序列 ,因而 AVAGCAGAR 双电荷 离子的 MS~MS 谱图 (图 8. 4) 中 b 和 y 离子 的标定 可提供 准确的 序列。 dm_200392_TpepC_std #587 RT 20 55 AV 1 NL 1.95E7 图 8. 4 显示 b 和 y 离子的 AVAGCAGAR 的 [M+2H]2+ 离 子的加 注释的 M&MS 谱图 当然 ,我们 所用的 为已知 肽序列 的例子 。在 实际 实验中 ,我们 得到的 只是肽 序列 未知的 MS~MS 谱图 。然 后我们 需使用 谱图、 计算器 和氨基 酸残基 质量表 (表 8.1), 鉴定谱 图中的 b 和 y 离子以 便推定 肽序列 ,这称 为从头 测序。 由于研 究人员 经验的 不同和 数据质 量的好 坏不同 ,一 张谱 图需要 15 分钟 到几个 小时来 解释 。单个 LC 串联 MS 分析 往往产 生成百 上千的 MS^MS 谱图, 所有这 些谱图 可能 代表不 同的肽 序列, 因此这 种从头 测序不 是很好 的方法 ,这种 手工的 从头测 序无 法应对 所产生 的海量 数据。 为 解决这 一问题 ,已 经开发 出数据 缩减算 法和软 件工具 ,能将 MS-MS 数据 与数据 库中肽 序列进 行比较 ,鉴 定产生 肽的蛋 白质。 这些程 序包括 Sequest 和几 种 其他类 似工具 ,将在 后面详 细描述 。下 面我 们先对 MS~MS 谱图 的其他 特点以 • 60 • 及在肽 MS-MS 分 析中常 遇到的 问题和 异常情 况进行 讨论。 8.5 问题 、独 特性和 脯氨酸 图 8. 4 中 AVAGC AGAR 肽的 MS -MS 谱图与 LC 串联 MS 分析中 常见的 MS-MS 谱图 很接近 。然而 ,不 是所有 实验中 获得的 谱图都 有这么 理想。 受仪器 灵敏度 的限制 ,谱 图可 能是不 完全的 ,很难 解释的 。即 使需 要分析 的肽的 质量完 全在检 测极限 之内, 仍然有 一些影 响因素 使仪器 不能产 生具有 完整的 b 和 y 离子 系 列的“ 完美” MS~MS 谱图。 这些因 素包括 :①不 同肽键 产生片 段的倾 向性不 同; ②某 些氨基 酸独有 的裂解 特征; ③ 脯氨酸 对肽离 子裂解 的弱化 影响。 现在仍 不十分 清楚影 响不同 肽键断 裂难易 的因素 。但是 我们已 知道裂 解确实 依赖 于质子 化肽离 子中质 子迁移 到不同 肽链的 酰胺氮 的难易 程度。 容易质 子化的 位点最 容易发 生裂解 。酸 性氨基 酸侧链 对稳定 正电荷 也有一 定作用 ,因而 邻近谷 氨酸 或天冬 氨酸残 基的裂 解常产 生信号 强的离 子片段 。在 许多肽 MS-MS 谱图 中, 信号最 强的离 子片段 常常是 靠近源 肽中间 的裂解 产生的 。当肽 离子在 碰撞中 获得能 量时, 能量在 裂解过 程中产 生竞争 性分散 ,易 于裂解 的位点 会减少 其他位 点 的裂解 ,使得 某些片 段离子 减少或 缺失。 胰 蛋白酶 肽离子 的裂解 图型特 别重要 ,因 为蛋白 质组学 研究主 要采用 胰蛋白 酶 消化蛋 白质的 MS 分析 ,如 前所述 ,胰蛋 白酶肽 常带有 双电荷 ,因为 它们在 C 端有 赖氨酸 或精氨 酸残基 。在 胰蛋白 酶肽的 MS-MS 谱 图中, y 离子 系列 通常比 b 离 子系列 信号强 ,这是 因为赖 氨酸和 精氨酸 残基的 碱性侧 链有在 肽片段 C 端保 留正 电荷的 能力。 值得注 意的是 某些双 电荷肽 离子的 裂解产 生一个 双电荷 产物离 子和 一个中 性片段 。这样 ,某些 MS~MS 谱 图中的 产物离 子可能 来自双 电荷片 段 ,而不 是来自 单电荷 片段。 这些情 况不经 常发生 ,然 而它们 有时干 扰谱图 的 解释。 某 些氨基 酸侧链 产生与 肽骨架 无关的 特定裂 解切割 。例如 ,丝 氨酸和 苏氨酸 残基 很容易 在羟基 的侧链 上脱水 。脱水 后产生 的离子 有时会 比含有 完整丝 氨酸或 苏氨 酸的离 子片段 在谱图 中的信 号更强 。磷酸 丝氨酸 和磷酸 苏氨酸 残基可 发生类 似的 去磷酸 (H3P04) 化。 磷酸丢 失后形 成的离 子常常 可以在 MS^MS 谱 图中占 据多数 ,这经 常是判 断磷酸 肽的可 靠指标 。其 他的 特定侧 链丢失 包括半 胱氨酸 H2S 的丢失 以及谷 氨酰胺 和天冬 酰胺残 基的氮 丢失。 在肽裂 解中引 起信号 混淆的 另一个 因素是 脯氨酸 残基的 存在。 如在第 5 章提 到的 ,当脯 氨酸位 于赖氨 酸或精 氨酸的 C 端一 侧时, 会阻碍 胰蛋白 酶切割 。除 了对 消化的 影响, 脯氨酸 也影响 MS-MS 分析中 肽离子 的裂解 。脯 氨酸残 基肽键 相对 不易发 生裂解 ,这 是由于 腩氨酸 残基具 有特有 的结构 ,腩氨 酸有与 a 碳和二 级 酰胺相 连的环 状侧链 。在 肽链中 ,脯 氨酸残 基上的 氮没有 质子化 位点和 裂解位 点 ,这 极大地 阻碍了 裂解, 导致在 脯氨酸 不能裂 解的位 点缺少 b 或 y 离子。 • 61 • 8.6 最好 的方法 串联质 谱现已 成为测 定肽序 列的最 好方法 。许 多年来 Edman 降解作 为标准 的多肽 序列测 定方法 ,但这 种方法 有很多 局限性 。第 一, Edman 降解不 能分析 酰胺末 端被修 饰的肽 (Edman 试 剂不与 N 端被 修饰的 肽反应 ) 。 串联 MS 不仅能 分析 N 端修 饰肽 ,而 且能揭 示修饰 的性质 。第二 ,尽管 Edman 降 解可用 来找出 某 些翻译 后修饰 (如 磷酸化 ), 但其通 用性远 不如质 谱方法 ,因为 Edman 分析对 肽 N 端残 基进行 连续化 学切割 ,然后 用层析 法鉴定 切割衍 生物。 如果没 有各种 标准 修饰氨 基酸, Edman 分析 不能确 切鉴定 被修饰 氨基酸 。另外 某些修 饰可能 干扰 Edman 试剂与 修饰肽 之间的 反应。 现在 可以认 为串联 MS 是肽序 列分析 的最先 进方法 ,通 过比对 肽序列 与数据 库中蛋 白质序 列我们 可以鉴 定未知 蛋白质 。然而 ,实 际上仍 存在一 个问题 :分析 串联 MS 数据所 代表的 序列是 一项费 时费力 的工作 。下 一章 将描述 已开发 的新工 具 ,这 些新工 具可以 解决上 述问题 ,并 使串联 MS 数 据能实 际用于 高通量 蛋白质 鉴定。 推 荐读物 Roepstorff, P. and Fohlman, J. ( 1984) Proposal for a common nomenclature for sequence ions in mass spectra of peptides. Biomed. Mass Spectrom .11, 601—601. Yates, J. R. (1998) Mass spectrometry and the age of the proteome. J . Mass. Spectrom. 33 , 1 一 19. • 62 • 9 用串 联质谱 数据进 行蛋白 质鉴定 9.1 用 ESI 串联 MS 鉴定 蛋白质 有 两种可 利用肽 ms-ms 谱 图鉴定 蛋白质 的方式 。第一 种是从 谱图的 从头解 释得到 肽序列 ,然后 用得到 的肽序 列通过 序列数 据库的 BLAST 检索鉴 定蛋白 质 。如 果需要 处理的 谱图数 量较少 ,这种 方法是 可用的 。由 于谱图 的复杂 性不同 和分析 人员经 验上的 不同, 手工完 成一张 MS-MS 谱 图的从 头解释 需要半 小时到 几天 的时间 。如前 所述, 某些谱 图没有 完整的 b 或 y 离子系 列信息 ,因此 不可能 从这样 的谱图 中清楚 地解释 肽序列 ,需 要分析 人员在 缺少谱 图信息 的地方 猜测序 列 。当然 ,准 确的 MS^MS 从头 解释需 要技巧 和经验 。这个 方法可 以很容 易地在 一两天 内给出 样品中 几个肽 的序列 ,并 通过 BLAST 检索鉴 定前体 蛋白质 。这对 从 SDS 凝 胶条带 鉴定一 两个蛋 白质是 完全可 行的。 然而蛋 白质组 学领域 要求从 MS-MS 谱图 鉴定大 量的蛋 白质。 很清楚 ,从头 序列 分析及 BLAST 检索方 法不能 很快地 实现对 大规模 蛋白质 的鉴定 。这 种方法 中 的“缓 慢步骤 ”是用 以确定 序列的 MS^MS 谱 图的手 工解释 。第 二种用 MS- MS 数 据鉴定 蛋白质 的方法 在这方 面有很 大的优 越性。 第二 种蛋白 质鉴定 方法绕 过“缓 慢步骤 ” ( 手工 从头序 列解释 ), 运用 算法使 MS-MS 谱图数 据直接 与数据 库中肽 序列相 关联, 实际上 并不单 独解释 每一个 MS-MS 谱图 。下 面将描 述这种 工具怎 样工作 。第二 种方法 非常适 合使用 基因组 序列测 定产生 的数据 库资源 ,通过 肽 M^MS 谱图与 数据库 序列的 匹配来 鉴定蛋 白质。 使用这 种方法 的限制 因素是 MS-MS 谱 图的质 量以及 数据库 的完整 性和精 确性。 如果 得到一 个在数 据库中 存在的 肽序列 MS-MS 谱图, 正确的 算法能 够进行 匹配 。下 面讨论 的算法 可以使 MS-MS 数 据与蛋 白质序 列或与 从核苷 酸序列 (基 因组或 EST) 推导 出的蛋 白质序 列匹配 。人 和其他 生物基 因组序 列测定 的进展 使 数据库 更精确 和完整 。确实 ,在 已进 行基因 组序列 测定的 生物中 ,近期 将会出 现能 代表全 部基因 的完整 蛋白质 序列数 据库。 这样一 批数据 库信息 给分析 蛋白质 组 学带来 空前的 增长动 力和可 靠性。 • 9.2 从 ESI 串联 MS 数 据鉴定 蛋白质 的算法 和软件 工具: Sequest 使 MS~MS 数 据与数 据库序 列匹配 以鉴定 蛋白质 的第一 个算法 / 程序是 1995 • 63 • 年由 John Yates 和 Jimmy Eng 引人的 Sequest。 本书 在后面 也会介 绍另外 几个类 似的软 件工具 ,但这 里主要 描述具 有代表 性的一 类工具 Sequest。 Sequest 这类 程序 的价值 在于能 相对快 速地将 MS~MS 谱图指 定到数 据库中 特定的 肽序列 ,这 使得 蛋白质 组学分 析中的 LC-MS~MS 数据大 大减少 。然而 ,应 该强调 Sequest 和类 似程序 本身并 不实际 进行谱 图的从 头解释 ,所以 ,这些 程序的 运算结 果依赖 于所 获得的 M^MS 数据 的质量 和所用 数据库 的完整 性和准 确性。 下面简 要概述 Sequest 是怎样 工作的 。当 MS 仪器获 得一个 MS~MS 扫 描时, 仪 器记录 M&MS 扫 描信息 和前体 离子的 m/z 值 。这些 数据一 起保存 。分 析完成 后 ,打开 Sequest 程序 ,选择 含有要 分析的 MS^VIS 扫 描数据 文件夹 ,标 明对蛋 白质样 品进行 消化所 用的酶 (如胰 蛋白酶 ), 指 定用于 MS~MS 分 析的是 单电荷 离子还 是双电 荷离子 ,选 择要与 MS~MS 数据 进行比 对的数 据库。 一旦程 序开始 ,数 据库 中所有 的蛋白 质序列 通过指 定的酶 (如胰 蛋白酶 ) 进 行虚 拟消化 ,产 生用于 MS-MS 扫描 比对分 析的主 目录。 然后如 下分析 每一个 MS~MS 扫描 (图 9. 1)。 \ 将虚 拟谱图 \ 与实 际谱图 ~ 进 行比较 评分 肽 得分 1. 检 测理论 b 和 y 离子与 实际谱 图离子 的匹配 AVAGCAGAR 2.56 2. 计算相 关得分 CVAAGAAGR 0.57 3. 排 列命中 VGGACAAAR 0.32 图 9. 1 M&MS 谱图 与数据 库肽序 列相互 关联的 Sequest 算法 •用 每一个 M&MS 扫描 的前体 选择 数据库 中具有 相同质 量的肽 (在 指定 的质量 误差极 限之内 )。 如果 不指定 消化酶 ,程序 就选择 所有与 扫 描 分析中 肽离子 质量相 当的肽 序列。 • 64 • 图 9. 2 实际 M&MS 谱图 产物离 子与匹 配肽序 列推测 的 b 和 y 离子的 对应 关系的 Sequest 浏 览器输 出视窗 实际 谱图与 从匹配 肽序列 推测的 b 和 y 离子有 很好的 匹配。 应该 认识到 Sequest 不对 得到的 匹配质 量作出 判断。 即使匹 配情况 很差, 算 法也 将鉴定 出数据 库中与 每一个 MS-MS 扫描分 析数据 匹配得 最好的 肽序列 。因 而 ,使 用者需 有一定 的知识 、经 验和一 定程度 的直觉 来决定 哪些匹 配是可 用的, 哪些 匹配需 要舍弃 。在浏 览器视 窗中显 示的与 MS~MS 扫描 相匹配 的所有 数据库 ① 原文图 9. 2、 图 9. 3、 图 9. 4 标错 。图 9. 4 应是图 9. 2, 图 9. 2 应是图 9. 3, 图 9. 3 应是图 9. 4, 但 是译文 中未行 调整。 译者注 •从每 一个选 择的肽 序列产 生理论 MS~MS 谱图。 •将被 分析的 M^MS 谱图 与从数 据库产 生的所 有理论 M^MS 谱 图进行 比较。 •计 算在 MS~MS 扫描 和理论 M^MS 谱图之 间每一 个匹配 的相关 得分。 然后 Sequest 报告 每一个 MS~MS 扫描的 最合适 的单匹 配或多 匹配。 在一个 基于 互联网 浏览器 的视窗 中显示 在一个 数据文 件夹中 ( 如一个 LC-MS~MS 实验) 的全部 M^MS 扫 描分析 的结果 。在 结果中 显示与 M&MS 谱图匹 配的所 有特定 蛋 白质的 肽序列 (图 9. 2)。 我们 可以根 据报告 的相关 性得分 ,或 通过将 “最佳 匹 配”肽 可能的 b 和 y 离子叠 在实际 MS~MS 谱图上 进行直 观检查 ,来评 估一个 MS-MS 谱 图与数 据库条 目匹配 的情况 ,这样 可相对 容易地 区分可 靠匹配 与不可 靠匹配 。例如 ,一个 MS~MS 谱图 的主要 信号与 预测肽 大部分 b 离子和 y 离子相 匹配常 常是正 确匹配 (图 9. 3)。 另一 方面, 大多数 主要片 段离子 与推测 肽可能 的 b 或 y 离子 不匹 配的谱 图通常 是不正 确匹配 (图 9. 4)®。 *? *^ . (+ 1 12 11 10 93076 5 4321 '• l ii H 727.9 m 276J § I | 2J5678ul 1.3 i4 3.5 1.7 2 114. 242. 371 474. 577 692. 311 1144 1273 140 ■ww iaaj # ~12 3 456789wnn^ • 65 • 图 9. 3 实际 M&MS 谱图 产物离 子与匹 配肽序 列推测 的 b 和 y 离子 的对应 关系的 Sequest 浏 览器输 出视窗 实际 谱图与 从匹配 肽序列 推测的 b 和 y 离 子没有 很好的 匹配。 >gi|418694|pir||ABBOS serum albumin precursor [validated] - bovine [MASS=69270] MKWVTF1SLL LLFSSAYSRG VFRRDTHKSE IAHRFKDLGE EOFKGLVUA ESHAGCEKSL KTLFGDELCK VASLRETYGD MADCCEKQEP ERNECFLSHK YLYEIARRHP YFYAPELLVY ANKVNGVFQD CCQAEDKGAC LLRaETMRE FILSQKFPKAE FVEVTKLVrD LTKVHKECCH GDLLECADDR ADLAKY1CDN IPENLPPLTA ~ DFAEDKDVCK NYQEAKDAFL GSFLYEYSRR HPEYAVSVLL KHLVDEPQNL IKONCDOFEK LGEYGFQNAL iVRVTRKVPQ VSTFTLVEVS NRLCVLHEKT FVSEKVmCCC~'TESLVNRRPC FSALTPDETY VPKAFDEKLf KATEEQUCTV MENFVAFVDK CCAADDKEAC FAVEGPKLW STQTALA LOOCPF DEHVKLVWEL TEFAKTCVAD PDRsfTLCDEF KADEKKFWGK KVLASSARQR LRCASIQKFG ERALKAWSVA QDTlSSKUgE__CC〇!^y^ HCIAEVEKDA FOKEYEATL EECCAKDDPH ACVSTVFDKL RSLGKVGTRC CTKPESERMP CTEDYLSUL TFHADICTLP DTEKQIKKQT ALVEL1XHKP Mass(average): 69270.4 Identifier: gil 41 8694 Database:C:/Xcalibur/database/bovine.fasta Protein Coverage:232/607=38.2% by amino acid count,261 78.1/69270.4 = 37.8% by mass 1 卜 35 h 69270.4 •65234.6- I ll I I Mil il 图 9. 4 Sequest 浏 览器输 出视窗 16.07 16.07 1 Mill II 1 III ITI 视 窗显示 了由于 MSMS 谱图与 肽序列 的相关 性而得 到匹配 的蛋白 质的序 列覆盖 范围。 蛋 白质序 列以命 中数目 (即 MS~MS 扫描 匹配) 下降 的次序 列出蛋 白质, 这将有 助于 工作人 员做出 选择。 在不同 肽序列 中有几 个高质 量命中 的蛋白 质很可 能是鉴 定 正确的 蛋白质 。另 一方面 ,与 MS~MS 谱图 有一两 个弱匹 配的蛋 白质的 鉴定可 能 不正确 。最 可靠的 蛋白质 鉴定是 在被鉴 定的蛋 白质中 ,有 几个不 同序列 都与数 据文 件夹中 M&MS 谱 图有高 质量的 匹配。 有许 多复杂 情况使 Sequest 分析更 耗时或 预测不 准确、 不完全 。首先 ,许多 • 66 • 肽有共 价修饰 ,共 价修饰 会改变 实际分 析肽的 值。 Sequest 可 能选择 数据库 中错误 的肽进 行匹配 。在 这种 情况下 ,由于 这种质 量不同 ,在修 饰肽的 MS^MS 扫描和 数据库 序列之 间不会 有正确 匹配。 为了解 决这个 问题, Sequest 允 许使用 者指 定氨基 酸的特 定修饰 ,以便 算法能 够检索 修饰肽 和非修 饰肽, 这很适 合可预 测 的修饰 (如 丝氨酸 、苏氨 酸和酪 氨酸的 磷酸化 )。 然而, 不可预 测的修 饰也很 常见 ,可 能会被 遗漏。 Sequest 分析的 另一个 问题是 MS^MS 谱图 的前体 离子电 荷状态 (单 电荷离 子还是 双电荷 离子) 的错误 指定。 如果一 个单电 荷离子 被错误 设定 为双电 荷离子 ,它 将与数 据库中 错误肽 的理论 MS~MS 谱 图比较 。双 电荷离 子如 设定为 单电荷 离子也 会产生 同样的 问题。 虽然一 些问题 需要引 起注意 ,但不 应该分 散我们 对这样 一种极 具价值 工具的 关注。 Sequest 分析可 以在半 小时之 内完成 含有约 2 000 个 MS~MS 扫描数 据的文 件, 这取决 于使用 的数据 库和计 算平台 。由 Sequest 提供的 蛋白质 匹配的 质量有 时可在 数据检 查的几 分钟内 ,一 般可以 在一两 个小时 之内得 以评估 。这与 要花费 成百 上千小 时进行 手工从 头解释 和对推 测的序 列进行 BLAST 检 索相差 悬殊。 Sequest 和 类似的 程序给 使用者 提供了 迅速评 估大量 LC-M&MS 数据 的能力 。当 与自动 LC-MS~MS 仪 器控制 (如数 据依赖 扫描) 和 自动样 品制备 方法结 合时, Sequest 和 类似工 具可以 进行自 动和高 通量的 蛋白质 鉴定。 9. 3 从 ESI 串联 MS 数据鉴 定蛋白 质的其 他算法 和软 件工具 其他 算法和 软件工 具也可 用来对 M&MS 谱图 数据和 肽序列 的理论 MS^MS 谱图进 行比较 。最早 开发的 MS^Tag 程序 (http: //prospector, ucsf.edu) 用来 分 析肽在 MALDI-TOF 分析中 得到的 PSD 谱图 (见第 6 章 ), 但现 在已被 修改用 来分析 来自不 同类型 仪器的 MS^MS 数据 。程 序使用 者可以 输入待 分析的 MS~ MS 谱图的 m/z 值目录 、前体 离子的 值和电 荷状态 、用 于蛋 白水解 消化的 酶类 型和用 于得到 MS~MS 数据 的仪器 信息。 算法预 先过滤 数据库 找到与 待分析 的 MS*MS 谱图中 m/z 相匹 配的狀 。程 序的运 算结果 提供与 待分析 MS~MS 谱图 记录的 肽离子 相匹配 的所有 肽片段 的表格 目录。 M^Tag 特 别适合 含有亚 氨离子 (表明 单独氨 基酸存 在的低 m/z 片段) 的 MALDI-TOF PSD 谱图 分析。 Mascot 程序 (http: //www. matrixscience.com) 使 用基于 概率的 MOWSE 算法 (见第 7 章 )、 前体 肽离子 m/z 信息和 MS^MS 肽 片段离 子数据 鉴定蛋 白质。 Mascot 实 际上是 可用于 肽质量 指纹谱 (见第 7 章) 和 M&MS 数据 分析的 一组程 序 。在 Mascot 网站下 载的转 换程序 可帮助 LC-MS~MS 数 据文件 中的多 MS~MS 谱图 的自动 输人。 PepFrag 也是 一种类 似的软 件工具 ,可 以从下 面的网 址下载 ( http : //prowl, rockefeller. edu/PROWL/pepfragch. html) 。 • 67 • 推 荐读物 Clauser, K. R. , Baker, P. , and Burlingame, A. L. ( 1999) Role of accurate mass measurement ( +/ — 10 ppm) in protein identification strategies emplo- ying MS or MS/MS and database searching. Anal. Chem. 71, 2871 — 2882. Yates, J. R. , Eng, J. K. , and McCormack , » A. L. ( 1995) Mining genomes: correlating tandem mass spectra of modified and unmodified peptides to se- quences in nucleotide databases. Anal. Chem. 67 , 3202 — 3210. Yates, J. R. , Eng , J. K. , McCormack, A. L. , and Schieltz, D. ( 1995 ) Method to correlate tandem mass spectra of modified peptides to amino acid sequences in the protein database. Anal. Chem. 67 , 1426 — 1436. 10 SALSA: —种采 集串联 MS 数 据特征 的算法 10.1 超 出蛋白 质鉴定 的情况 前一章 描述的 Sequest 和 类似的 工具根 据肽的 MS^MS 数据, 分析“ 这些肽 来自什 么蛋白 质”的 问题。 Sequest 和类 似的程 序非常 适合于 通过肽 M^MS 数 据鉴定 蛋白质 。然而 ,除 了简单 鉴定样 品中存 在什么 蛋白质 ,如果 我们想 进行其 他研究 ,问 题就变 得有点 不同了 。考 虑下列 情形。 •样 品含 有多种 蛋白质 ,但 是仅希 望鉴定 其中带 有某些 特定修 饰的蛋 白质, 如翻译 后修饰 (如 鱗酸化 ), 或是药 物或其 他化学 试剂的 修饰。 •鉴 定混合 物中某 些序列 相同但 其他方 面不同 的肽。 这可能 是由于 蛋白质 存 在野生 型和突 变型。 •已知 或猜测 样品中 含有一 个特定 蛋白质 ,但 是推测 蛋白质 以多种 修饰形 式存在 。希 望测定 所有这 些修饰 形式。 如 将在下 面几章 讨论的 ,在 实际蛋 白质组 分析中 常常会 遇到这 些问题 。在每 种 情况下 ,我们 不是只 想鉴定 混合物 中所有 的东西 ,而 是要 找出样 品中特 定组分 的信息 。我 们的 目的是 从样品 的大量 M&MS 谱 图中鉴 定出感 兴趣的 MS^MS 谱 图 。在 第一种 情形中 ,需要 寻找表 明存在 特定功 能基团 (如磷 酸化的 氨基酸 ) 的 谱图 。在第 二种和 第三种 情形中 ,需 要寻找 代表特 定氨基 酸序列 基序的 b 或 y 离 子 系列的 M&MS 谱图, 这些氨 基酸序 列基序 可能存 在于几 个不同 的肽中 。使用 SALSA (谱 图分析 的评分 算法) 算 法可以 解决以 上三种 问题。 10.2 SALSA 算法 SALSA 检测 MS~MS 谱图 特征并 根据所 显示的 谱图特 征和在 谱图中 的强度 给谱图 评分。 SALSA 可 以检测 MS~MS 谱图的 四种不 同类型 的特征 (图 10.1)。 第 一种是 在特定 w/z 值出 现的产 物离子 。例如 肽丢失 化学修 饰成为 带电荷 片段, 这 个带电 荷片段 然后在 MS~MS 谱图 特定的 m/z 值 处出现 ,与 产生 化学修 饰丢失 的肽 本身的 m/z 无关 。第二 种是中 性丢失 。前 体离子 的一段 中性片 段丢失 ,产 物 离子与 前体的 电荷状 态相同 ( 如一个 双电荷 离子丢 失一个 中性片 段产生 一个双 电荷产 物离子 )。 测定的 前体离 子和产 物离子 质量的 差值等 于丢失 的中性 片段的 质量 。第 三种特 征是电 荷丢失 。多 电荷前 体离子 丢失一 段带电 荷片段 。例 如从双 电荷 前体丢 失一个 单电荷 片段。 最普遍 的例子 是在双 电荷肽 离子的 M&MS 中形 成 单电荷 b 和 y 离子 。然而 ,这 个过程 也可以 是某些 化学修 饰的显 著特征 。第四 • 69 • 心 离子 A 中 性丢失 i 电 荷丢失 个 特征是 离子对 ,即由 MS~MS 谱图 任何位 置的一 个特定 m/z 值分 开的任 意两个 信号。 离子对 的出现 可以表 示在肽 序列中 存在一 个特 定组分 。例如 ,肽 中含 有半胱 氨酸残 基的 y 系列由 于半胱 氨酸的 质量可 能会有 一对由 1Q3 m/z 单 位隔开 的产物 离子。 以上 M&MS 谱图 中的一 个或几 个特征 的出现 可以成 为前体 肽中特 定结构 特征的 指标。 理论上 可以从 某些分 析中检 查单一 谱图 ,决定 是否存 在某些 特定特 征 。但 是大量 MS~MS 谱图的 解释使 得这样 做并不 现实。 我们面 临的问 题与尝 试从复 杂肽混 合物的 LC 串联 MS 分 析中鉴 定蛋白 质 的问题 相同。 SALSA 算法 可满足 通过快 速的 计算机 辅助筛 选大量 MS^MS 谱图的 需要。 当然 ,仅检 测谱图 特征是 不够的 。从 大批 M&MS 扫 描数据 中鉴定 一小部 分含有 特定 特征的 M&MS 谱 图的算 法必须 能排列 出 最优的 匹配。 SALSA 根据 指定特 定离子 的信号 强度对 M&MS 扫 描评分 。指 定的中 性丢失 (如从 磷酸丝 氨酸丢 失磷酸 ) 产生 强信号 离子的 M&MS 扫描 得分高 。相反 ,与相 同中性 丢失相 关的较 低丰度 产物离 子的扫 描得分 偏低。 SALSA 的一个 重要特 性是其 灵活性 。我 们可以 指定检 测和评 估一些 感兴趣 的结 构特征 。如将 在后面 几章看 到的, 中性丢 失是某 些翻译 后修饰 (如磷 酸化) 的重 要指标 ,离 子对是 某些其 他修饰 的特征 ( 某些稳 定氨基 酸修饰 ), 产 物离子 则表明 另外一 些修饰 (某些 药物和 化学试 剂修饰 )。 SALSA 评分 灵活性 的另一 个方面 是我们 可以建 立特征 重要性 的不同 等级。 某些谱 图特征 可设定 为初级 特征, 另一些 特征设 定为二 级特征 。一 旦检测 到初级 特征 ,就得 以评分 。二 级特征 与某些 初级特 征相连 ,只有 检测到 相关的 初级特 征 ,'二 级特 征才得 以评分 。例如 ,修 饰肽的 某些化 学组分 (如糖 ) 会有水 的中性 丢失 ,在某 些情况 下这可 以是特 定特征 的指标 。然而 ,对 显示肽 前体有 18 质量 单位 的中性 丢失的 MS^MS 扫描中 ,其 SALSA 检索 很可能 有很多 命中, 因为许 多肽 离子即 使不含 有感兴 趣的结 构特征 ,也极 有可能 以这种 方式形 成片段 (如含 有丝 氨酸或 苏氨酸 残基的 肽离子 )。 可以将 水的中 性丢失 (18 amu) 的得 分定为 二 级特征 ,以便 检测某 些更少 见的初 级特征 ,如 产物 离子或 其他更 少发生 的中性 • 70 • 丢失。 18 fflmi 的 丢失只 有在同 时含有 其他初 级特征 的扫描 中得分 ,这两 种特征 都 对扫描 的得分 起作用 。在初 级-二 级得分 等级中 ,多 重得 分标准 的使用 增加了 SALSA 选择 性检测 肽及其 衍生物 MS~MS 扫 描的专 一性。 10. 3 用 SALSA 检索氨 基酸序 列基序 通过 SALSA 检测 MS^MS 谱图的 一个重 要特征 是在谱 图某处 出现离 子对, 这一离 子对被 m/Z 轴上的 某个特 定距离 分开。 MS~MS 谱图 中离子 对通常 的来源 之一是 b 和 y 离 子系列 。例如 ,第 八章 讨论的 AVAGCAGAR 肽的 y 系列 含有在 m/z 为 477 和 m/z 为 374 的一对 离子, 它们是 y5 和 y4 离子。 这两个 离子在 m/z 轴上由 103 个 m/z 单位距 离隔开 ,这 表明存 在一个 半胱氨 酸残基 。与其 类似, y4 和 y3 离子之 间由 71 个 m/z 单 位隔开 ,这相 当于一 个丙氨 酸残基 。如果 检测由 103 个单位 分开的 一对离 子对的 MS~MS 扫描, SALSA 能够 检测到 AVAG- CAGAR, 也可能 检测样 品中其 他含有 半胱氨 酸肽的 MS*MS 扫描 。如果 集中在 y5 和 y3 的间距 ,相当 于半胱 氨酸和 丙氨酸 ,长 度为 174 个 m/z 单位 ,这 可能更 具 选择性 ,会挑 出含有 CV 或 VC 二肽的 MS^MS 扫描 。然而 ,单 个离子 对绝不 能成 为将任 意一个 MS^MS 扫 描与其 他所有 M&MS 扫描进 行区分 的很好 方式。 寻找 某个特 定肽的 MS~MS 谱图 的最好 方式不 是仅测 定一对 离子, 而是测 定一系 列离子 。例如 ,为 了找 到与部 分特定 b 或 y 离子系 列匹配 的一个 离子系 列的 MS~MS 谱图 ,而去 检索一 个数据 文件夹 中所有 MS~MS 谱图 ,就 有可能 检 测到相 关肽的 MS~MS 谱图。 SALSA 确 实可用 来检测 MS~MS 谱图中 的离子 系列。 为了 较详细 地了解 离子系 列评分 ,我们 再以肽 AVAGCAGAR 为例子 。假 定有 几百个 MS-MS 扫 描数据 ,其 中之一 是双电 荷离子 AVAGCAGAR。 怎样使 用离 子系列 检索找 到它? 首先我 们会想 到在大 多数肽 MS^MS 谱图中 ,最 强的离 子是 靠近肽 中部切 割产生 的离子 ,因此 我们的 检索应 集中在 肽中部 裂解产 生的离 子系列 。用 与三 肽序列 GCA 对应的 4 个 离子进 行检索 (图 10. 2)。 以质 量最高 的离子 作参考 ,离子 系列中 第二个 离子比 第一个 离子低 57 个 m/z 单位 ( 甘氨酸 残 基质量 )。 第三个 离子比 第二个 离子低 103 个 m/z 单位 (半胱 氨酸残 基质量 )。 第四个 离子比 第三个 离子低 71 个 m/z 单位 (丙 氨酸残 基质量 )。 这类离 子系列 与肽 中含有 GCA 基序的 y 离子 系列 相对应 。如图 10. 2 所示 ,指定 的离子 系列成 为 带标记 刻度的 “尺” ,可 用它来 度量数 据中的 每一个 MS^MS 谱图 。在图 10.2A 中, “GCA” 尺与 AVAGCAGAR 的 MS^MS 谱 图的信 号匹配 。应 该强调 的是 在离子 系列中 “GCA” 尺只 能检测 连锁在 一起的 GCA, 而不 能检测 G、 C、 A 相互 分离的 离子对 。肽 中含有 甘氨酸 、半胱 氨酸和 丙氨酸 ,但如 果不是 GCA 序列, 不会发 生匹配 。这 可在图 10. 2B 中得 到解释 。在图 10. 2B 中 ,肽 AVA- CAGGAR 的 MS~MS 谱 图不与 “GCA” 尺匹配 ,尽管 这个肽 中含有 G、 C、 A, 在肤的 中部有 一 * “CAG” 基序 而不是 “GCA” 基序 ,在 y3wy5-y6 系列 中两个 离子 (即 y4 和 ys) 发生 改变, 以致它 们不与 “GCA” 尺 匹配。 y3 和 y6 离子 能够 匹配 ,它们 确定了 系列的 两端, 而且重 排的基 序和起 始基序 的氨基 酸组成 相同。 •I ■画 ' '1^ 150 200 I I I I I I I I I I I I 250 300 350 400 m/z 450 500 550 600 图 10. 2A GCA 的 4 离 子系列 “虚拟 尺”与 AVAGCAGAR 的 MS^MS 谱图 的匹配 AVACAGGAR 图 10. 2B GCA 的 4 离 子系列 “虚拟 尺”与 AVACAGGAR 的 MSMS 谱图 的匹配 • 72 • 用离 子系列 检索短 序列肽 的问题 是含有 GCA 基序 的其他 肽也可 被检测 。而 用 VAGCAGA 基序 (8 离子 系列) 的检 索极有 可能选 择性地 鉴定出 AVAG- CAGAR 的 MS~MS 扫描。 应该 明确, SALSA 的一个 惯例是 从最高 m/z 到最低 m/z 输人 一个系 列中的 离子 。用 VAGCAGA 基序 的检索 从相差 99 个 m/z 单位的 最前面 两个离 子开始 ( 缬氨酸 ), 然后是 到相差 71 个 m/Z 单位的 下一 个离子 ( 丙氨酸 ), 之后 是到相 差 57 个 m/Z 单位的 再下一 个离子 ( 甘氨酸 ), 等等 。这 个系列 的离子 相当于 AVAGCAGAR 肽的 y 离子 系列 (图 10.3)。 质量最 高离子 相当于 m/z 703.82 的7离子[乂八00八0八尺十只+](这个离子不在图10.3的谱图中)。系列中的 下一 个离子 相当于 m/z 为 604. 69 的 [AGCAGAR + H+]。 再下 一个离 子相当 于/^/=为533.61的[〇0八〇八尺+只+],等等。在胰蛋白酶肽的1^8"1\48谱图 中, y 离子 系列 常常比 b 离子 系列强 (这个 经验方 法也常 有例外 )。 当然 ,也可 以检索 相当于 AGACGAV 的离子 系列, 它会与 AVAGCAGAR 肽的 b 离子 系列 匹配。 dm_200392_TpepC_std #587 RT.20.55 AV 1 NL 1 95E7 图 10. 3 AVAGCAGAR 的 [M+2H]2+ 离 子的加 注释的 M&MS 谱图 SALSA 根据 下列因 素对用 于离子 系列的 MS^MS 谱图评 分:① MS~MS 谱图 中与 离子系 列匹配 的离子 数目; ②匹配 离子的 强度。 具有与 系列中 大多数 或全部 离子匹 配的强 信号的 MS~MS 谱图得 分最高 。另 一方面 ,只 与系列 中很少 几个离 子 匹配的 MS^MS 谱图 ,或 匹配离 子强度 很低的 MS~MS 谱 图将得 到低分 。可以 • 73 • 指定 在用于 匹配的 MS^MS 谱 图中必 须要有 的最少 匹配离 子数来 控制匹 配的严 格性。 10. 4 SALSA 检测离 子系列 的应用 离 子系列 检测的 应用可 以用两 个例子 来说明 。在 第一个 例子中 ,我们 对检测 一 个蛋白 质的两 种形式 感兴趣 。一个 是野生 型序列 ,另 一个 序列有 单个氨 基酸发 生置换 。野 生型蛋 白质的 胰蛋白 酶消化 产生肽 AVAGCAGAR, 而 突变型 蛋白质 用 相同的 酶消化 产生肽 AVAGCAVAR。 假定 已对其 混合肽 进行了 LC- 串联 MS 分析 ,希望 找出与 这两个 蛋白质 相关的 M&MS 扫描 。序 列中相 对细微 的改变 (在第 7 位缬氨 酸置换 甘氨酸 ) 引起 Ty 离子 系列的 改变。 特别是 y 离子 系列中 y3 〜 y7 由于 甘氨 酸和缬 氨酸的 质量不 同而发 生位移 ,以 致这些 y 离子 出现在 AV- AGCAVAR 谱图 中较高 m/z 位置 (图 10.4A 相对图 10.4B)。 即使 检测的 y 离 子出现 在不同 的绝对 m/z 值, 由序列 AGCA 定 义的“ 尺”仍 可与图 10. 4A 和图 10. 4B 谱 图中的 y 离子系 列匹配 。在系 列中, y 离子 的相对 位置在 两张谱 图中相 同。 因此对 AGCA 进行 SALSA 检索 可以检 测这两 种肽。 离子 系列的 检索允 许微小 差异。 如果改 用系列 AGCAG 检索 AVAGCAGAR 和八¥八〇〇八乂八尺的1^8~]^3谱图,也能检测这两种肽(图10.4)。但是“八〇- CAG” 尺与 AVAGCAGAR 的 M&MS 谱图 的匹配 要比与 AVAGCAVAR 的 M&MS 谱 图匹配 的更好 ,因为 AGCAG “ 尺”可 以检测 AVAGCAGAR 的 y2〜 y7 离子, 但是只 能检测 AVAGCAVAR 的 y3〜y7 离子 ( 比较图 10.4A 和 10. 4B)。 尽管有 这种微 小差异 ,检 测到 的这两 种肽的 MS^MS 扫描 得分都 要高于 其他 不含有 “AGCAG” 序 列肽的 MS~MS 扫描。 用 SALSA 进 行离子 系列检 索应用 的第二 个例子 是检测 蛋白质 不完全 水解消 化产物 。蛋 白质组 学中常 会发生 蛋白水 解酶不 能进行 完全有 效切割 。如果 AV- AGCAGAR 肽是 一个更 长序列 ... FPGK YK A VAGCAGARTGKH …的一 部分, 不完全 消化可 以产生 YKAVAGCAGAR 和 AVAGCAGARTGK。 YKAVAG- CAGAR 的 y 离子 系列为 但其 离子系 列 (力〜%) 与 AVAG- CAGAR 的 y 离子系 列相同 ,用 VAGCAGA 的离子 系列检 索可找 出这两 种肽的 MS^MS 扫描。 SALSA 特别 有用的 是相同 检索也 能找出 AVAGCAGARTGK 肽 的 MS-MS 扫描 。因 为这个 肽含有 C 端延伸 ( 相对于 AVAGCAGAR), 它的 y 离 子位于 MS-MS 谱图 的不同 m/z 值 。然而 ,由检 索序列 VAGCAGA 定 义的离 子系列 间隔的 距离保 持不变 ,尽 管沿 m/z 轴 移动。 上述 例子再 一次表 明了用 SALSA 算 法进行 离子系 列检索 的能力 。在 MS~ MS 数据的 评估中 ,图型 识别算 法可以 有选择 性地检 测与任 何肽序 列或修 饰肽及 其不同 变化形 式相关 的 M^MS 扫描。 SALSA 检 测能更 准确的 鉴定肽 和源蛋 白质。 • 74 • A 423 40 38 36 34 32 30 28 26^ 24j 22! 2〇\ (、三 G A 1 j : 1 : : y3 ,U, ) , , 1. U- , , . , 1 1. y4 iillu y6 U y7 150 200 1 I I 250 350 400 nt/z 550 图 10. 4A 序列 AGCAG 的离 子系列 “虚拟 尺”与 AVAGCAGAR 的 MS~MS 谱图 的匹配 38^ 36. 34: 32 30 28 26 24i 22i 20 C 8 6 G A C G y4 y; -V-r- U- rll. \ 1 1 1 Ji y5 / 100 2(5〇- ■ ■ ■ • '3i〇l ' -3^0L ' 1 '40V ' ' 4V '' 1 1 1 r— r- 600 图 10. 4B 序列 AGCAG 的离 子系列 “虚拟 尺”与 AVAGCAVAR 的 MS~MS 谱图 的匹配 推 荐读物 Hansen, R T. , Jones, J. A- , Mason, D. E. , and Liebler, D. C (2001) SAL • 75 • SA: a pattern recognition algorithm to detect electrophile-adducted peptides by au- tomated evaluation of C1D spectra in IX-MS-MS analyses. Anal. Chem. 73 , 1676—1683. Liebler, D. C. , Hansen, B. T. , Davey, S. W. , Tiscareno, L. , and Mason, D. E. (2001 ) Peptide sequence motif analysis of tandem ms data with the SALSA algorithm. Anal. Chem. , in press. • 76 • I 合 廣组学 的启用 11 采集蛋 白质组 11.1 只 有一个 基因组 ,但有 许多蛋 白质组 采 集蛋白 质组的 目的是 鉴定尽 可能多 的蛋白 质组分 。在 前面的 讨论中 ,我们 把“蛋 白质组 ”看作 是生物 所有基 因的全 部对应 蛋白质 。然而 ,“ 总”蛋 白质组 是抽象 的东西 。在 任何 生物中 没有一 个细胞 同时含 有全部 基因编 码的全 部蛋白 质 。即 使在酵 母中, 在特定 时间大 约三分 之一的 基因不 表达。 在高等 生物中 ,不 同的 基因和 蛋白质 在不同 组织和 不同的 发育阶 段表达 。例 如, 眼睛的 视网膜 色素上 皮细胞 和主动 脉平滑 肌细胞 中一定 有许多 相同的 蛋白质 表达, 特别是 那些与 细胞基 本功能 相关的 蛋白质 。然而 ,表 达收缩 蛋白质 是肌肉 的特征 ,而 表达光 感受器 蛋白质 是视网 膜色素 上皮的 特征。 在受刺 激的肌 肉细胞 中或 在暴露 于光中 的视网 膜色素 上皮细 胞中可 发生更 细小的 变化, 包括蛋 白质表 达 或翻译 后修饰 的变化 。因 而不同 的细胞 表达不 同的蛋 白质组 ,相 同的细 胞在不 同状 态下表 达不同 的蛋白 质组。 除了生 物中不 同细胞 的许多 蛋白质 组外, 在生物 中也有 其他有 趣的惟 一蛋白 质组 。细胞 外液体 含有许 多分泌 蛋白。 血浆、 CSF、 唾液、 尿和汗 都含有 对生物 状态变 化起反 应的蛋 白质组 。令 人感兴 趣的是 这些蛋 白质组 分的改 变可能 与生物 的疾 病有关 ,可以 用作诊 断指标 。重要 的是任 何蛋白 质组都 是由产 生它的 生物、 组织或 细胞的 状态来 定义。 因为状 态总是 在变化 ,所 以蛋白 质组也 总是在 变化。 11. 2 选择 用于分 析的蛋 白质组 不同的 细胞和 组织含 有不同 的蛋白 质组, 因此首 先考虑 选择什 么样的 细胞和 组 织作为 蛋白质 组样品 。要 鉴定蛋 白质组 ,我 们希望 尽可能 得到均 一的和 能代表 细胞 或组织 类型的 样品。 在某些 情况下 ,培 养细胞 是相对 合适的 样品。 复杂组 织 ,如 哺乳动 物的肾 ,有 许多细 胞类型 紧密连 在一起 。使组 织中的 细胞解 离和分 部的 技术可 用于复 杂组织 。然而 ,在处 理样品 时靶细 胞的生 物化学 变化可 能严重 干扰 系统。 最近为 在组织 中选择 性地收 集某些 细胞样 品而引 人的一 项技术 是激光 捕获显 微解剖 ,将显 微镜与 组织采 集结合 ,从 组织的 冰冻部 分选择 性地抽 取某些 细胞 ,从而 使我们 能选择 细胞群 体进行 进一步 分析。 激光捕 获显微 解剖在 分析肿 瘤和 相邻正 常组织 中的应 用已为 最近癌 基因表 达变化 的研究 提供了 帮助。 捕获用 于分 析的少 量组织 或细胞 导致只 有很少 量的总 蛋白质 可供研 究用, 因此样 品中低 丰度 表达的 蛋白质 很难以 检测。 • 79 • 从组织 或细胞 中取样 的另一 个重要 问题是 分离步 骤往往 引起细 胞应激 反应, 蛋白质 可能由 于对这 些应激 起反应 而发生 变化。 在细胞 取样和 DNA 抽提 中形成 的活性 氧种类 (ROS) 的 增加是 我们熟 悉的人 为假象 ,这使 体内氧 化损伤 的分析 更 为复杂 。因为 ROS 也能氧 化蛋白 质并激 活适应 性响应 ,所 以蛋 白质组 潜在的 人工 改变也 是一个 很重要 的问题 ,特别 是在分 析与应 激有关 的蛋白 质时这 一点更 重要。 细胞匀 浆和分 部的第 二个主 要问题 是内源 蛋白酶 的活化 ,这 可能将 导致许 多 蛋白质 被酶解 成片段 。尽 管蛋白 质片段 的分析 仍可产 生有用 信息, 但如果 将获得 的数据 与根据 分子质 量得到 的蛋白 质组分 相联系 ,可 能会引 起混淆 。最后 。组 织样 品的制 备和储 存方式 也会极 大影响 蛋白质 组分析 的结果 。用固 定剂固 定的组 织样品 一般不 适合于 蛋白质 组分析 ,因 为用甲 醛或类 似固定 剂处理 组织会 引起蛋 白质交 联 ,妨碍 肽片段 的消化 和回收 。相反 ,冷 冻的组 织切片 很适合 蛋白质 分析。 尽管蛋 白质分 部提取 可能会 对蛋白 质组样 品有所 影响, 但对于 分析来 说蛋白 质分 部有突 出的优 点:使 分析变 得简单 。从一 个样品 检测多 种蛋白 质的能 力取决 于从样 品中分 离到的 肽的量 和获得 MS 数据的 能力。 选择分 析亚细 胞组分 (如线 粒体) 可以使 分析人 细胞样 品的约 25 000 个蛋白 质的任 务减少 到分析 1 000 〜 2 000 个蛋 白质。 用目前 的技术 ,当 低丰度 蛋白质 存在于 1 000 个 蛋白质 的混合 物时 ,比 存在于 15 000 个 蛋白质 的混合 物时更 容易得 以鉴定 。所 以目前 对细胞 或组 织样品 进行蛋 白质组 分析的 最好方 法是通 过亚细 胞组分 分离先 对样品 进行分 部 。较简 单样品 (如 CSF) 可能 不需要 这种预 分部。 11.3 第一 种蛋白 质组采 集方法 : 2D SDS-PAGE 和 MALDI-TOF MS 这种方 法将高 效的蛋 白质分 离方法 (2I>SDS~PAGE) 与 方便的 、高 通量的 MS 分 析方法 (MALDI-TOFMS) 相结合 。如图 11. 1 所示 ,蛋白 质先从 样品中 蛋白质 切割, 消化 ►肽 自动化 2D 凝胶 蛋白 质鉴定 t 肽 MS 数据 MALDI-TOF • 80 • 图 1 1 . 1 通过 2I>SDS"P AGE 和 MALDI-TOF 进行蛋 白质组 的采集 抽提, 然后用 2I>SDS^PAGE 进 行分离 。蛋白 质点通 过染色 显示。 蛋白质 点的手 工检查 容易引 起混淆 ,可以 使用成 像系统 扫描染 色凝胶 的图像 ,记 录样品 中蛋白 质 的分布 。用几 种软件 对这些 图像进 行分析 、比较 和存档 。蛋 白质 组采集 的目的 是鉴定 尽可能 多的系 统组分 ,因 此可 以选择 多个或 全部蛋 白质点 并从凝 胶中切 出 ,用凝 胶中消 化将蛋 白质切 割成肽 ,然 后用 MALDI-TOFMS 分析 (见第 6 章 和第 7 章 )。 在肽质 量指纹 谱算法 和软件 (见第 7 章) 的帮助 下分析 MS 数据, 进行蛋 白质的 鉴定。 如 前所述 ,这 个方法 的优点 是利用 2D 凝胶 的分 离能力 和使用 高通量 、灵敏 和 方便的 MALDI-TOF MS 进行 蛋白质 鉴定。 蛋白质 组分析 一般可 鉴定所 选择的 蛋白 质点的 50% 〜 75%, 这取 决于以 下几个 因素。 与高 等生物 相比具 有较小 蛋白质 组的低 等生物 (如 细菌和 酵母) 一般 能得到 较大量 蛋白质 的鉴定 。因 为这些 生物总 的基因 数较少 ,在不 同基因 家族中 近乎相 同 的成员 (平行 进化同 源物) 较少 (见第 2 章 )。 相反 ,高 等生物 如果蝇 和线虫 有较 大数目 的蛋白 质平行 进化同 源物, 它们除 了有不 同的肽 ,还可 能产生 若干相 同的肽 。这降 低了根 据一两 个独特 的肽鉴 定蛋白 质的可 信度。 用肽质 量指纹 谱方法 鉴定蛋 白质的 问题是 已发表 的基因 组序列 注释的 不确定 性。 经过测 序分析 的基因 组中的 许多基 因的编 码序列 ,最初 是由帮 助定义 每一个 基因编 码序列 的起始 和终止 的算法 确定的 。进 行这些 指定的 算法有 很大的 错误比 率 ,可 能接近 30% 或更多 。因 而大部 分编码 序列是 正确的 ,但是 某些误 差会导 致 N 端和 C 端肽 的质量 指纹谱 的错误 数据。 这个问 题会随 着基因 组序列 的更好 注 释而得 以解决 ,可以 在已完 成的蛋 白质序 列数据 库帮助 下使用 质量指 纹谱算 法。 一个相 关问题 是基因 组序列 不一定 能预测 RNA 剪 接变种 ,而 这些变 种可能 是某些 蛋白质 的重要 形式。 在一个 蛋白质 的两种 形式中 ,会有 某些相 同的肽 。在 用肽质 量指纹 谱算法 指定蛋 白质时 ,变种 肽会引 起不确 定性。 肽质 量指纹 谱鉴定 前用到 2D 凝胶 ,尽管 2D 凝胶 的分辨 率很高 ,但 仍不能 把所 有蛋白 质完全 分离成 单个点 。由于 样品的 性质和 蛋白质 点在凝 胶中的 位置不 同 ,许 多蛋白 质点中 常含有 2 〜 5 个 蛋白质 。这些 多蛋白 质点的 消化产 生来自 2 个或更 多蛋白 质的肽 混合物 ,这 给肽质 量指纹 谱软件 工具指 定相关 蛋白质 时引人 不确 定性。 尽管较 新的算 法可以 将多蛋 白质组 分指定 到肽混 合物的 MALDI-TOF 谱图, 但随着 混合物 复杂性 的增加 ,指 定错误 也大大 增加。 另外 ,即 使采用 最灵敏 的染色 方法, 2D 凝胶还 是有限 定的蛋 白质测 定动态 范围 。不同 蛋白质 的细胞 表达水 平可有 百万倍 的差异 ,而 2D 凝胶 蛋白质 染色的 动 态范围 最多是 百倍到 千倍。 2D 凝胶一 般仅能 检测较 高丰度 表达的 蛋白质 。用 这种 方法对 酵母蛋 白质组 进行精 细的分 析表明 4 000 个表达 的蛋白 质中只 能检测 到约 1 500 个, 这些蛋 白质是 高效表 达基因 的产物 。因而 ,对 蛋白 质采集 来说, 2I>SDS~PAGE 和 MALDI-TOF 方法会 遗漏大 量的蛋 白质, 包括许 多有重 要生物 • 81 • 学意 义的蛋 白质。 11.4 第二种 蛋白质 组采集 方法: 多维肽 层析和 LC- 串联 MS 分析 蛋白质 组采集 的第二 种方法 将多维 肽分离 与串联 MS 肽 序列鉴 定技术 融合在 一起 。如图 11. 2 所示 ,这种 方法中 首先将 混合物 中的蛋 白质消 化成肽 (见第 5 章 )。 通 过层析 分离肽 ( 至少部 分分离 ), 然 后用电 喷雾串 f MS 得 到肽的 MS- MS 谱图 (见第 8 章和第 9 章 )。 这些 谱图在 Sequest 或类似 检索工 具的帮 助下与 数据库 的蛋白 质序列 匹配。 蛋白质 LC-MS-MS MS-MS 谱图 Sequest 鉴 定蛋白 质组分 图 11. 2 通过 LC-M&MS 进行蛋 白质组 的采集 这个基 本方法 有几个 版本, 它的两 个明显 特征是 :①主 要是用 肽而不 是用蛋 白 质进行 分析; ② 是根据 MS^MS 裂解 谱图, 而不是 根据肽 质量指 纹谱鉴 定蛋白 质 。在这 一基本 方法中 ,并 不对 混合物 中的蛋 白质进 行分离 ,而是 在进行 MS 之 前 ,将蛋 白质混 合物消 化成肽 ,通过 不同的 LC 步 骤进行 分离。 这 个方法 的基本 思路是 得到尽 可能多 的混合 物肽的 MS~MS 谱图 。串联 MS 仪器一 般使用 数据依 赖控制 ,以便 选择用 于 M^MS 分析的 肽离子 并记录 数据。 为了最 多地分 析不同 的肽, 仪器尽 可能多 地“分 散”肽 混合物 。我 们先讨 论最简 单的 LC-MS 方法 ,然后 考虑几 种衍生 方法。 1.RPLC-MS。 在这一 方法中 ,用 RPLC-MS 分 析的肽 混合物 进行水 / 乙腈 梯 度洗脱 。通过 RPLC 梯 度使混 合物中 的肽得 以分离 。这是 最简单 的系统 。这 • 82 • 种系 统运转 良好, 在任何 特定时 间从柱 上可洗 脱多于 5 种的肽 。但 当混合 物较复 杂时 ,仪器 来不及 记录某 一时间 所有洗 脱下来 的肽片 段信号 ,在 这种 情况下 ,仪 器最可 能得到 在该时 间洗脱 的丰度 最高的 5 种肽 离子的 MS*MS 谱图。 2. 具 有流动 控制的 RPLC-MS。 这个 方法与 前面描 述的方 法相似 ,但 MS 仪器能 感知“ 成堆” 的肽从 柱上洗 脱下来 。为了 避免肽 丢失, 系统减 慢泵流 ,从 而减慢 了“成 堆”肽 离子的 洗脱, MS 有更 多的时 间记录 所有肽 离子的 M&MS 数据 。特 别是当 总离子 流超过 某个阈 值时, MS 在 LC 泵上 进行反 馈控制 减慢或 停 止流动 。即 使在某 一瞬间 有几十 种肽的 复杂混 合物进 行洗脱 ,仪 器仍有 足够的 时间 系统地 得到所 有肽的 MS^MS 谱图, 而不是 只得到 最上面 5 或 6 个肽的 MS~ MS 谱图 。这 种策略 常称为 “峰停 留”, 可以非 常有效 地增加 鉴定肽 组分的 数目。 为设 定反馈 控制系 统我们 需要掌 握某些 仪器程 序编写 技巧。 这个方 法的缺 点是停 止流动 步骤会 引起多 次停止 和起始 ,导致 层析时 间延长 ,产 生对计 算机辅 助数据 分 析来说 数量巨 大的数 据文件 。此外 ,长 时间 层析时 由于柱 上样品 的扩散 (条带 伸展 ), 引 起层析 分辨率 的逐渐 降低。 3. 串联 LC- 串联 MS (见第 4 章图 4. 7)。 在第 4 章 描述过 这种层 析方法 ,它 需要在 RP 柱的前 面紧接 着装一 根强阳 离子交 换柱。 全部样 品上样 到强阳 离子交 换柱 ,大多 数肽与 柱结合 。使用 盐梯度 洗脱结 合不紧 密的肽 ,再用 RP 梯 度分离 这些肽 。盐 梯度洗 脱后是 RP 分 离的循 环重复 10 〜 20 次。 使用两 相层析 系统的 结果 是肽混 合物的 极大“ 分散” ,同 时增加 了所鉴 定肽的 数目。 与前面 描述的 “峰 停留” 一样, 这种方 法进行 的时间 非常长 (6 〜 18 小时) 并且 得到的 数据文 件 非常大 。引 人这种 方法的 Yates 及其同 事开发 了一种 Sequest 的特 定版本 ,使 用群 组计算 机分析 数据。 Patterson 及 其同事 描述的 方法中 有一个 较简单 的变换 是使 用双离 子交换 方法, RP LC-MS 首先分 析的是 与离子 交换柱 不发生 结合的 肽, 然后用 单一盐 浓度洗 脱与柱 结合的 肽进行 第二次 RPLC-MS。 这种方 法极大 增加了 不同肽 的检测 ,且 不像 多步离 子交换 /RP 循环 ,只产 生较少 的数据 文件。 还有 一种版 本是使 用单独 的强阳 离子交 换柱, 用盐梯 度将肽 分成组 ,收集 到的不 同 盐梯度 组分再 依次由 前面第 1 部 分描述 的简单 RP LC-MS 系 统进行 分析。 4. 有几 个“技 巧”可 以提高 前述三 种方法 的操作 。首 先应了 解只有 长度约 为 5 〜 20 氨基酸 之间的 肽能够 产生可 供数据 库检索 使用的 MS~MS 信息。 因而在 LC-MS 之前 可使用 大小排 阻层析 将样品 限定为 仅含有 最可能 产生有 效鉴定 的肽。 另一个 有趣的 想法是 使用数 据依赖 仪器控 制系统 。可输 人一个 “排除 目录” ,这 是 仪器在 运行时 可忽略 ( 不进行 MS~MS 分析) 的离子 目录。 样品输 入一次 ,系 统将 获得其 中的多 种肽的 MS*MS 数据 ,然后 输入刚 刚已分 析过的 离子目 录作为 排 除目录 ,再 一次分 析样品 ,仪 器此时 只记录 在第一 次分析 中没有 分析过 的肽离 子数据 ,这样 会增加 在两次 分析中 MS^MS 谱图记 录的总 肽离子 数目。 前面描 述的蛋 白质组 采集的 LC- 串联 MS 方法都 开始于 消化成 肽的粗 蛋白质 • 83 • 混合物 ,然 后进行 分析。 这种方 法的特 征之一 是避免 了麻烦 的蛋白 质分离 技术, 如 2D 凝胶分 离技术 。然而 ,用 来自未 分部蛋 白质混 合物的 大量肽 作为起 始材料 使 肽层析 步骤承 担了在 MS 分析 之前“ 分散” 混合物 的重任 。可以 通过在 样品处 理前加 一个简 单蛋白 质分离 步骤以 减少下 游分离 的任务 。有 几种简 单的分 离步骤 可用于 此目的 。通过 混合物 蛋白质 的离子 交换层 析可将 蛋白质 分离成 5 〜 20 种组 分。 类似地 ,可 使用液 相制备 IEF。 商业上 已有的 IEF 装置 可产生 12 〜 20 种组 分 。还 可使用 1I>SDS~PAGE。 在每种 情况下 ,可容 许分离 毫克到 克的蛋 白质。 在 这些步 骤中高 容量是 重要的 ,因为 这样可 增加在 LC-MS 分析中 检测低 丰度表 达蛋白 质的可 能性。 , 11. 5 哪 种方法 最好? ’ 前 面讨论 的蛋白 质组采 集的两 种基本 方法有 其不同 的优点 。使用 2D 凝胶和 MALDI-TOF MS 可提供 高通量 并最大 限度地 利用强 有力的 蛋白质 分离方 法学。 使用肽 的多维 LC- 串联 MS 分析 产生最 可靠的 蛋白质 鉴定, 因为它 是根据 直接表 明肽 序列的 M&MS 谱图进 行鉴定 。这 两种方 法也存 在一些 问题。 2D 凝胶 很难 重复, 2D 凝胶和 MALDI-TOF MS 倾向 于检测 高丰度 蛋白质 。另 一方面 ,与串 联 MS — 起使用 的多维 LC 分离是 技术上 的挑战 ,仍 在迅速 发展。 方法的 选择取 决于已 有资源 ,用 任何一 种方法 都可在 蛋白质 组采集 课题中 取得巨 大进展 。最好 是用 这两种 方法提 供互补 信息, 2D 凝胶和 MALDI-TOF MS 非常 适合较 简单样 品, 其目的 是鉴定 主要系 统组分 。值 得注意 的是在 2I>SDS~PAGE 中蛋白 质点强 度的变 化提供 了一个 明显的 比较蛋 白质组 的方式 ,这将 在下一 章进一 步讨论 。对 于复 杂混合 物中高 丰度和 低丰度 蛋白质 的完整 采集, 很明显 与串联 MS 结 合的多 维 LC 是 最有效 的方法 。最 近在酵 母蛋白 质组采 集中, Aebersold 及其同 事仔细 比较 这两种 方法就 证明了 这一点 。由于 蛋白质 组采集 的方法 正在迅 速发展 ,技术 的精 确改进 和蛋白 质分离 方法的 新组合 将进一 步“分 散”复 杂肽混 合物, 极大增 加 LOMS 方法的 效率。 推 荐读物 Davis, M.T., Beierle, J., Bures, E.T., McGinley, M.D., Mort, J. , Robinson, J. H. , Spahr, C. S. , Yu, W. , Luethy, R. , and Patterson, S. D. (2001) Automated LC-LC-MS-MS platform using binary ion-exchange and gradient reversedphase chromatography for improved proteomic analyses. J . Chromatogr. B. Biomed. Sci. Appl. 752, 281 — 291. Gygi, S. P. , Corthals, G. L. , Zhang, Y. , Rochon, Y. , and Aebersold, R. (2000 ) Evaluation of two-dimensional gel electrophoresis-based proteome analysis technology. Proc. Natl. Acad. Sci. USA 97 , 9390 — 9395. • 84 • Simone , N. L. , Paweletz, C. P. , Charboneau, L. , Petricoin, E. F. , and Li- otta, L. A. (2000) Laser capture microdissection: beyond functional genom- ics to proteomics. Mol. Diagn. 5 , 301 — 307. Washburn, M. P. , Wolters, D. , and Yates, J. R. (2001) Large-scale analy- sis of the yeast proteome by multidimensional protein identification technology. Nat. BiotechnoL 19, 242 — 247. • 85 • 12 蛋白质 表达谱 12. 1 处 在变化 中的蛋 白质组 生物化 学和生 理学的 许多工 作告诉 我们生 物化学 途径总 是在不 断变化 之中; 使用 DNA 微阵证 实细胞 中基因 表达模 式也总 是在变 化的; 不同生 物技术 观测到 在生 物日常 生命周 期或在 细胞周 期中许 多酶状 态也处 于规律 性变化 之中。 所有这 些变化 提示蛋 白质组 也处在 不断变 化之中 。除了 生命本 身的这 些变化 ,环 境刺 激 、化 学试剂 、药物 以及生 长和疾 病过程 都诱导 机体产 生不同 的变化 。从 事复杂 病理学 (如 癌症) 或药物 治疗的 研究人 员对许 多诱导 变化感 兴趣。 也许蛋 白质组 学的 最终挑 战是测 定随时 间变化 的所有 细胞的 蛋白质 状态, 但是技 术还不 成熟, 因 此比较 一个细 胞或生 物在两 种状态 之间的 蛋白质 组的相 关问题 变得很 重要。 蛋白质 表达谱 研究中 最基本 的是测 定并比 较两个 样品中 一组蛋 白质的 表达。 这就 需要有 在两个 样品中 检测和 鉴定相 同蛋白 质的方 法提供 比较这 些蛋白 质水平 的基础 。以 下概述 的两种 方法可 用来比 较蛋白 质的表 达水平 ,但是 这些方 法仅表 明蛋白 质自身 的表达 水平, 不能确 定蛋白 质修饰 的改变 。鉴 定蛋白 质的修 饰还需 要结合 使用后 面几章 概括的 方法。 12. 2 使用 2D 凝胶 的比 较蛋白 质组学 比较蛋 白质组 学最常 用的方 法是用 两个样 品进行 2I>SDS~PAGE, 比 较蛋白 质点的 图型。 2I>SDS~PAGE 特 别适合 于比较 蛋白质 组分析 ,能有 效地分 离多种 蛋白质 。最近 2D 凝胶 技术 的发展 (见第 4 章 ), 提高了 2D 凝胶可 重复性 ,甚至 在引人 MS 蛋 白质鉴 定之前 ,已可 以用这 种方法 进行蛋 白质组 的比较 。蛋 白质的 鉴定在 过去是 繁锁和 困难的 ,现在 由于肽 质量指 纹谱和 LC-MS~MS 分析的 应用, 已可 以基本 上鉴定 任何通 过凝胶 染色检 测到的 蛋白质 。用 2D 凝胶 比较蛋 白质组 的重要 任务是 鉴定凝 胶之间 的不同 特征。 研究 人员已 进行了 大量工 作来开 发分析 2D 凝胶 蛋白质 点图型 的软件 工具。 此外, 也已开 发出保 存这种 信息的 大批数 据库。 2D 凝胶成 像分析 中最广 泛使用 的 程序是 Melanie™, 它 是由瑞 士生物 信息研 究所开 发的。 Melanie™ 对 2D 凝胶 染色的 图像进 行分析 。可 以使 用文件 扫描仪 (产生 .gif 或 .tif 文件 ), 但 最好使 用 CCD 相机获 得图像 。程 序首先 评估凝 胶的“ 特征” ,它是 指与凝 胶本底 相比显 现的重 要不同 。“ 特征 ”相当 于凝胶 上的蛋 白质点 (图 12.1)。 可 以通过 光密度 (OD)、 大小 和体积 (整 个蛋白 质点面 积上的 OD) 来鉴定 特征。 这些鉴 定参数 是一块 凝胶中 或多块 凝胶之 间特征 比较的 基础。 • 86 • 图 12. 1 用 Melanie™ 分析软 件进行 2D 凝胶 蛋白质 点图像 的注释 当然 ,对于 蛋白质 表达谱 ,我 们希望 比较两 个不同 样品在 2D 凝胶上 存在的 特征点 或特征 点强度 的不同 。但 是进 行多次 2D 凝胶 操作时 ,很难 得到精 确的重 复性 。特 定蛋白 质点的 位置通 常有微 小变化 。如 果蛋白 质点的 位置稍 有不同 ,就 很 难在两 块凝胶 上比较 。为解 决这一 问题软 件允许 使用者 鉴定“ 界标” ,它 们是 在 要比较 的两块 (或 所有) 凝 胶中都 存在的 蛋白质 。然后 通过软 件使这 些特征 “ 配对” 产生一 系列蛋 白质对 。通 过这些 蛋白质 对可以 对比或 “匹配 ”凝胶 。匹 配过程 包括两 块凝胶 的对比 ,以 便使 界标在 2D 空间彼 此有对 应关系 。换 句话 说, 凝胶成 像图按 像素进 行排列 以便使 所有的 界标特 征匹配 。这个 过程需 要图像 的某些 转换或 空间“ 扭曲” ,以便 补偿凝 胶的局 部几何 变形。 — 旦凝胶 匹配, 就可以 进行特 征比较 ,以 检测凝 胶之间 0D 体积 的不同 ,对 可观 察到的 差异给 出图形 输出并 用数字 标出这 些区别 (图 12.2)。 软件也 能进行 数据统 计分析 ,协助 解释一 些重要 的差异 。这 种操作 允许使 用者鉴 定两个 或更多 样品之 间的特 征或蛋 白质点 的不同 。凝 胶可直 观地“ 叠放” 以便比 较图像 。有些 软件能 从多块 凝胶中 收集到 图像并 合成虚 拟凝胶 ,提 供在生 物不同 状态中 混合蛋 白质 组的主 档案。 鉴定 感兴趣 的蛋白 质点时 包括点 的剪切 、在 凝胶中 消化和 MS 分析等 操作。 除了 检测多 块凝胶 上特征 点之间 的不同 ,软件 也允许 使用者 注释特 征点, 并将特 征点 与含有 MS 数据 、基因 序列和 功能基 因组学 数据的 数据库 文件相 连接。 • 87 • 图 12. 2 用 Melanie™ 分 析软件 对多个 2D 凝胶 上蛋白 质点的 强度进 行定量 和比较 用 2D 凝胶检 测蛋白 质表达 谱的关 键是能 有效地 比较两 块凝胶 和鉴定 不同表 达的蛋 白质点 ,这 种方 法经过 若干研 究小组 的发展 已建立 2I>SDS~PAGE 数据 库 。这些 数据库 保存大 量经过 分析的 2D 凝胶 的注释 图像。 这些数 据库越 来越成 为比较 不同实 验室所 产生数 据的重 要资源 。这 些数 据库和 类似于 Melanie 的软件 程序 有一个 重要特 征:能 够将大 量凝胶 与一块 凝胶或 凝胶组 进行比 较和进 行蛋白 质点变 化图型 的统计 总结。 Flicker 程 序是另 一个通 过互联 网比较 2D 凝胶图 像的独 特软件 工具, 它是由 国立 癌症研 究所的 Lemkin 及 其同事 开发的 (http: //www. lecb.ncifcrf.gov/ flicker/)。 Flicker 使用与 前面描 述过的 相同方 法进行 凝胶的 评估和 匹配。 Flicker 的一个 重要特 征是允 许用网 上浏览 器比较 不同来 源的凝 胶图像 。这 不仅可 以进行 来自 不同数 据库图 像的便 捷比较 ,而 且可将 自己的 2D 凝胶 图像与 不同数 据库的 图 像进行 比较。 • 88 • 2D 凝胶是 检测蛋 白质表 达谱的 一个重 要方法 ,它 提供 进行蛋 白质组 比较的 可视图 像基础 ,在 这方面 是独一 无二的 。然而 ,这 个方法 有一个 重要的 缺点: 2D 凝胶的 染色仅 能测定 样品中 丰度较 高的蛋 白质。 细胞中 蛋白质 表达范 围约为 百万倍 ,而凝 胶染色 局限在 约一百 倍的动 态范围 。可 以通过 增加待 分析蛋 白质的 上样量 来增加 低丰度 蛋白质 的检测 ,但 是高 丰度蛋 白质最 终控制 凝胶的 许多特 征 。许多 蛋白质 以多种 修饰形 式存在 ,它们 可能有 不同的 等电点 ,可被 2D 凝胶 分开 。而对 低丰度 蛋白质 来说, 不同修 饰的蛋 白质分 散成多 个点可 能降低 染色检 测能力 。最后 ,肽从 消化和 凝胶中 的回收 率较低 ,会 妨碍 MS 鉴定极 弱染色 (低 丰度) 的蛋 白质。 如在第 5 章提 到的, 肽从凝 胶中消 化的回 收通常 不是定 量的, 回 收率常 常少于 60%。 用 2D 凝胶 检测 蛋白质 表达谱 的主要 缺点都 来自于 2D 凝 胶染 色对蛋 白质检 测的动 态范围 有限。 尽管染 色和显 色方法 在不断 发展和 提高, 这 个问题 仍可能 最终将 2D 凝胶局 限于分 析相对 高丰度 蛋白质 。然 而, 2D 凝胶 分析在 许多情 况下是 适宜的 ,因 此基于 2D 凝胶 的蛋 白质组 谱图将 仍是一 项有价 值 和广泛 使用的 技术。 12. 3 使用 LC-MS 和同 位素标 记的比 较蛋白 质组学 对 蛋白质 组比较 来说, LC-MS 方法与 2D 凝胶 方法在 概念上 相反。 2D 凝胶 方 法分离 蛋白质 进行图 像比较 ,而 LC-MS 方法 分离肽 ,评 估样品 之间所 采集数 据的 不同。 下面是 LC-MS 方法 的概述 。用 试剂处 理两个 蛋白质 样品以 便“标 记” 。标 记物除 了一个 含有重 同位素 ,一个 含有轻 同位素 ,在 化学 上是相 同的。 消化样 品并用 LC-MS~MS 分 析肽。 MS~MS 数据 的分析 (如用 Sequest 分析) 允 许鉴定 存在的 蛋白质 。与 每一个 M&MS 扫描 相对应 的全扫 描谱图 可以测 定轻同 位 素和重 同位素 标记肽 的比率 。这个 比率相 当于两 个样品 中该蛋 白质的 比率。 LC-MS 方法 不能进 行蛋白 质的绝 对定量 ,而 是提供 两个样 品中一 个特定 蛋白质 的相 对定量 。这 个方法 最早由 Gygi 和 Aebersold 用来 分析蛋 白质组 的不同 。在 下面将 讨论这 一方法 及其某 些不同 版本。 我们 先讨论 用于同 位素标 记的标 记物。 稳定同 位素标 记技术 是“稳 定同位 素稀释 ”技术 的改变 。要 理解 为什么 使用这 项技术 ,可以 回想稳 定同位 素是原 子核 中中子 数目变 化的元 素形式 ,它们 不是放 射性的 。例如 ,氢没 有中子 ,而 它的 低丰度 同位素 氘有一 个中子 。氢 GH) 的 质量是 1, 氘 (2H) 的 质量是 2。 其他 常用的 稳定同 位素是 13C (比 12C 重 1 amu),15N (比 14N 重 1 amu) 和 180 ( 比 160 重 2amu)。 用氘 原子置 换某些 氢原子 ,这样 标记的 化合物 (称为 “ 含氘的 ”) 有较 大的分 子质量 ,因为 每一个 氘提供 额外的 1 质量 单位。 一个有 8 个氘 的化合 物的质 量比未 标记的 相同化 合物质 量要高 8 amu。 然而, 这两个 化 合物至 少在我 们考虑 的分析 技术范 围内有 基本相 同的化 学性质 。这意 味着未 标记 的和用 氘试剂 标记的 同一种 肽有相 同的层 析性质 ,在 MS 中 显示相 同的电 • 89 • 离 和裂解 。但是 MS 仪器 能将它 们作为 不同的 种类加 以区分 ,因 为它们 有不同 的 m/z 值 。这 些特征 使稳定 同位素 标记成 为示踪 、标记 和在两 个不同 样品中 对相同 肽定量 的理想 试剂。 下面的 例子将 稳定同 位素标 记应用 到两个 不同样 品的某 个特定 肽的分 析中。 假 定样品 A 有 100 pmol 某种肽 ,样品 B 有 50 pmol 相 同的肽 。用 某个试 剂处理 样品 A 使其 加上 一 '个化 学标记 d〇 (如在 N 端 ) , 而样品 B 带有 — t" 山 。(氣 标记) 的 标记物 (图 12. 3)。 然后混 合样品 ,用 LC-MS 进行 分析。 因为非 同位素 d〇 标 记的 加尾肽 (来 自样品 A) 和山 。标记 的肽 (来 自样品 B) 显 示相同 的化学 性质, 经 HPLC 柱一 起洗脱 ,在 相同时 间进人 ESI 离子源 。全扫 描谱图 (图 12.3) 表 明两种 标记肽 的信号 。仪 器记录 d〇 (非 标记) 和 cU 标记肽 的单电 荷和双 电荷离 子的 全扫描 谱图。 选择这 些肽离 子进行 MS^MS 分析。 MS~MS 谱 图基本 上相同 (除 了预期 的由于 山和山 。标记 质量 不同造 成的质 量不同 ), 这表明 在全扫 描谱图 中 两个前 体离子 代表相 同的肽 。而 且可用 Sequest 分析 MS-MS 谱 图找出 肽的蛋 白质 来源。 山和 山 。标记 的肽离 子强度 的比率 表明它 们在最 初样品 A 和样品 B 中 的比率 。换句 话说, d〇 标记肽 的双电 荷离子 强度是 d1() 标记 肽的双 电荷离 子强度 的 2 倍 ,这 反映了 与样品 B 比较 ,样品 A 有 2 倍量 的特 定肽。 d() 标记 1标记 „ 1«»0 »»-; I, 卜 (”於 /".|卜'.:?. . MS-MS \ 谱图 ( 肽 4 ( 狀 d,。 、 1 标记 ^ 标记 y) 、 ~ < \ 混合 LC-MS-MS 数据依 赖扫描 d 厂 [M+2H]2 [M+HV/^ d 丨。 m/z 数 据评估 Sequest d。%。 比率表 明 在样品 1 和样品 2 中 蛋白质 的比率 全扫 描谱图 图 12. 3 通 过稳定 同位素 标记的 N 端加 尾和 LC-M&MS 分析 对两个 样品中 某个蛋 白质相 对定量 我们已 建立了 同位素 标记如 何通过 LC-MSMS 帮助肽 的定量 ,再 来仔 细看一 下 Gygi 和 Aebersold 对这个 方法的 应用。 在实际 实验中 我们常 常要对 两个样 品中多 • 90 • 种 蛋白质 进行定 量比较 ,而 我们的 样品多 是复杂 蛋白质 混合物 产生的 更为复 杂的肽 片段 混合物 ,每个 蛋白质 经胰蛋 白酶消 化产生 多种肽 ,但 实际 上我们 只需要 从每一 种 蛋白质 中产生 一两种 代表肽 的标记 衍生物 以鉴定 蛋白质 ,用 以测定 蛋白质 的相对 含量。 Gygi 和 Aebersdd 的 方法使 用一种 新的多 功能标 记试剂 (图 12.4), 称为 “同位 素编码 的亲和 标记物 ” (ICAT)。 该试剂 由三部 分组成 ,第 一部 分是和 巯基发 生反应 的碘乙 酰胺功 能基团 ,可以 使标记 物共价 标记蛋 白质的 自由半 胱氨酰 巯基。 第二个 部分是 含有一 个接头 ,或者 含有氢 (非标 记的, d〇) 或者 含有氘 (标 记的, 山)。 第三个 部分是 生物素 ,提 供对 亲和素 的高亲 和力。 生物素 碘 乙酰胺 图 12.4 具巯基 活性的 ICAT 试剂 图 12. 5 总 结了分 析步骤 。蛋白 质样品 A 用轻 d〇-ICAT 试 剂处理 ,样品 B 用 重 山-ICAT 试剂 处理。 ICAT 试 剂标记 蛋白质 的一个 或多个 半胱氨 酰巯基 。样品 混合后 一起用 胰蛋白 酶消化 ,产 生含 有少许 ICAT 标记肽 的复杂 消化物 。全 部混 合物上 样到亲 和素玻 珠柱, ICAT 标记的 肽通过 生物素 与柱紧 密结合 。在 混和样 品中 大多数 肽被洗 脱掉, 保留在 亲和素 玻珠上 的是来 自样品 A 和 B 的 ICAT 标 记肽 。这样 , 最初非 常复杂 的胰蛋 白酶消 化物被 简化成 一组与 亲和素 结合的 ICAT 标记肽 。这组 肽代表 其来源 蛋白质 。然 后从柱 上洗脱 ICAT 标记肽 ,用数 据 依赖扫 描通过 LC-MS~MS 进行 分析。 这些数 据的分 析基本 上与图 12.3 中两种 简单 肽样品 的分析 相同。 MS^MS 数据的 Sequest 分析 (用 半胱氨 酸残基 质量校 正 存在的 ICAT 标记物 ) 可 以找到 与其对 应的肽 和蛋白 质序列 。因而 ICAT 标记 肽 产生可 以鉴定 这些肽 的源蛋 白质序 列信息 。与 每一个 M&MS 扫 描相对 应的全 扫描分 析揭示 了带有 d〇- 和 d8- ICAT 标记 物的前 体离子 。标 记肽在 整个分 析中都 成比例 ,这 种比 例与标 记肽的 源蛋白 质的比 例相符 。全 扫描中 d〇- 与 山- ICAT 标 记肽之 比表明 了样品 A 中相关 蛋白质 与样品 B 中相同 蛋白质 之比。 • 91 • F 4 个靶 _ _ 蛋白 质拷贝 用轻 (d。) ICAT 标记半 胱氨酸 蛋白 质拷贝 用重 (\) ICAT 标记半 胱氨酸 _ H m/z 全 扫描谱 图表明 MS-MS 谱图 L/H 比率 表明 肽序列 相 对定量 鉴定 图 12. 5 用 有巯基 活性的 ICAT 试剂和 LC-MS~MS 对两 个样品 中的 蛋白质 进行相 对定量 例如, 酵母抽 提物的 分析产 生两个 ICAT 标记肽 HHIPFYEVDLC* DR 和 DCTVTLK (C11 表示 ICAT 修饰的 半胱氨 酸残基 ), 这两 种肽都 定位于 蛋白质 GAL10。 比 较两个 样品间 d〇- 和 山- ICAT-HHIPFYEVDLC1* DR 的 水平表 明两个 样品中 蛋白质 GAL10 的相 对水平 ,例 如比较 未经处 理酵母 和乙醇 或半乳 糖处理 (引起 中间代 谢中多 种酶水 平的很 大变化 ) 酵 母的蛋 白质组 。分别 用半乳 糖和乙 • 92 • 醇 处理的 酵母也 可通过 ICAT LC-MS*MS 来比较 。乙醇 处理的 样品用 do-ICAT 标记 ,半乳 糖处理 的样品 用 d8-ICAT 标记。 山-与 山-ICAT 标记的 HHIP- FYEVDLC* DR 和 d〇- 与 dg- ICAT 标记的 DC* VTLK 的 比率是 1 : (>200) , 这 表明 与乙醇 处理酵 母中的 GAL10 相比, 半乳糖 处理酵 母中的 GAL10 有大于 200 倍的 增加。 ICAT 方 法一般 分析和 检测每 一个蛋 白质的 1 〜 3 个代 表肽。 检测一 个蛋白 质 的多个 肽增加 蛋白质 鉴定的 可靠性 。而 且多次 d〇/d8-ICAT 肽比率 的测定 ,可 增 加测定 两个样 品中该 蛋白质 相对含 量的精 确性。 ICAT 方法在 LC-M&MS 分析之 前使用 ,使 同位 素标记 与多维 肽分离 结合。 如上 一章讨 论的, 使用与 LC-M&MS 结 合的多 维蛋白 质和肽 的分离 ,通 过“分 散” 肽混合 物以增 加相对 低丰度 蛋白质 的检测 ,使得 MS 仪 器能得 到样品 中尽可 能多 的肽的 M^MS 谱图 。与同 位素标 记一起 使用多 维肽分 离可最 大程度 比较低 丰度 蛋白质 表达的 变化。 对 蛋白质 组比较 来说, ICAT 方法有 2D 凝胶 /MALDI-TOF 方 法不具 备的一 些优点 。第 一, LC-MS~MS 比 MALDI-TOF 能更准 确地从 复杂混 合物中 鉴定蛋 白质 。第二 ,与多 维肽分 离一起 使用的 LC-MS~MS 能检测 低丰度 蛋白质 ,而 2D 凝胶 分析受 蛋白质 染色的 低动态 范围的 限制。 ICAT 技术也 有某些 局限性 。第一 ,某些 蛋白质 或者不 含有半 胱氨酸 残基, 或 者半胱 氨酸残 基在使 用的标 记条件 下不与 ICAT 试 剂接触 。这些 蛋白质 则不能 用 ICAT 方法 检测。 第二, ICAT 方法 基本上 是比较 两个样 品中蛋 白质表 达水平 的工具 。因 为在这 些分析 中只能 检测含 有可与 ICAT 反应的 半胱氨 酸的肽 ,来自 蛋白 质的大 多数肽 在亲和 素玻珠 洗涤步 骤被“ 浪费” 。而这 些被浪 费的肽 有许多 是关 于蛋白 质修饰 (如磷 酸化) 变化的 信息。 这些修 饰与两 个样品 中蛋白 质功能 的变 化有关 。除 非修饰 正好发 生在含 有可与 ICAT 反应的 半胱氨 酸的肽 ,否 则不 能被 检测。 同位素 标记方 法将被 进一步 改进。 蛋白质 组定量 比较对 理解细 胞的生 物化学 越来 越重要 。一般 方法是 在两个 样品中 用带有 不同标 记物的 标记肽 ,然后 分析样 品, 比较每 个不同 标记肽 的水平 。尽管 ICAT 方法直 接标记 巯基, 它也可 能标记 肽的 其他功 能基团 ,如 N 端胺基 。这 将改变 简化复 杂肽混 合物的 策略. 是前述 的 ICAT 方 法的必 要修改 。同位 素标记 策略的 创造性 应用在 定量蛋 白质组 学中有 远大 前景。 推 荐读物 Binz, P. A. , Muller, M. , Walther, D. , Bienvenut, W. V. , Gras, R. , Hoogland, C. , et al. ( 1999) A molecular scanner to automate proteomic re- search and to display proteome images. Anal. Chem. 71, 4981 — 4988. • 93 • Gygi, S. P. , Rist, B. , Gerber, S. A. , Turecek, F. , Gelb, M. H. , and Aebersold, R. ( 1999) Quantitative analysis of complex protein mixtures using isotopecoded affinity tags. Nat. BiotechnoL 17, 994 一 999. Lemkin, P. F. (1997) Comparing two-dimensional electrophoretic gel images across the Internet. Electrophoresis 18, 461 — 470. Wilkins, M. R. , Gasteiger, E. , Bairoch, A. , Sanchez, J. C. , Williams, K. L , Appel, R. D. , and Hochstrasser, D. F: (1999) Protein identifica- t tion and analysis tools in the ExPASy server. Methods Mol. Biol. 112, 531 — 552. • 94 • 13 鉴定 蛋白质 -蛋白 质相互 作用和 蛋白质 复合物 13.1 “远 亲不如 近邻” propinquity 是 不常用 的名词 ,它 的意思 是接触 、接近 或类似 亲属的 密切关 系 。上 述引语 是证明 在取得 政治成 功中私 人接触 密切的 重要性 ,是 政治上 的自明 之理。 蛋白质 在这方 面很像 政治家 ,因 为在大 部分细 胞生物 化学中 像立法 政治一 样需要 团队工 作。. 蛋白质 通过彼 此结合 形成具 有特定 功能的 多组分 复合物 ,从而 使蛋白 质“一 起 工作” 。这些 功能单 位有的 如二聚 体转录 因子复 合物一 样简单 ,有 的如 形成核 糖体的 30 多 个组分 系统那 样复杂 。生 物化学 家已开 始研究 与一个 蛋白质 结合或 相 互作用 的全部 蛋白质 。发现 在高等 生物中 (如人 和小鼠 ) 蛋白质 有多种 功能结 构域 ,从而 提出许 多蛋白 质有多 种相互 作用。 理解蛋 白质复 合物怎 样行使 功能对 理解 细胞如 何作为 一个系 统行使 系统功 能是重 要的。 理解这 些系统 的第一 步是鉴 定组分 。研究 者寻找 许多新 发现基 因的功 能时的 一个重 要线索 是相关 蛋白质 与其他 已知功 能蛋白 质的相 互作用 。例如 ,许 多蛋白 激酶 信号传 导复合 物包括 激酶、 磷酸酶 、调节 蛋白和 结构蛋 白的相 互作用 。尽管 可以 通过鉴 定催化 结构域 确定激 酶和磷 酸酶的 基本生 物化学 功能, 但辅助 蛋白质 参与 有功能 的激酶 信号传 导复合 体的证 据主要 来自已 经证实 的这些 蛋白质 的相互 作用。 13.2 鉴 定蛋白 质-蛋 白质相 互作用 在细胞 系统中 蛋白质 相互结 合主要 来自两 类实验 。第一 类实验 是靶蛋 白质与 结合 蛋白质 一起进 行的免 疫沉淀 (图 13. 1)。 蛋白质 用 1I>SDS~PAGE 分 离并电 转移到 膜上。 用推测 的可与 靶蛋白 质结合 的蛋白 质抗体 进行免 疫检测 。当然 ,这 种 方法需 要有可 与蛋白 质结合 的抗体 ,而且 往往需 要进行 推测。 这些抗 体“沉 淀” 实验对 证实推 测的蛋 白质- 蛋白质 相互作 用是非 常有用 的工具 ,但这 种方法 无法测 定不可 预测的 多蛋白 质复合 物成员 。例如 ,图 13.1 中 没有对 标记为 “X” 的蛋白 质抗体 ,即使 存在相 互作用 也不能 被检测 。下 面将会 讨论这 种方法 的一些 不 同版本 。这种 方法的 主要局 限性是 实验中 仅能检 测可预 测的蛋 白质。 第二类 主要方 法是酵 母双杂 交系统 (图 13.2)。 在这种 方法中 ,两个 蛋白质 之间 相互作 用的检 测是间 接的。 为编码 两个感 兴趣蛋 白质的 (图 13. 2 中的 Prl 和 Pr2) 基因 分别与 一个转 录因子 的两个 不同结 构域的 编码基 因融合 ,这一 对融合 • 95 • 蛋白质 ^ 复合物 抗体 捕获 图 13. 1 用免疫 沉淀和 Western 印迹法 对多蛋 白质复 合物进 行解析 的基因 在酵母 中表达 。这 两个 不同融 合体编 码的转 录因子 组分彼 此结合 [图 13. 2 中的 DNA 结合 结构域 (DBD) 和活化 结构域 (AD)], 活化 酵母的 报告基 因。 这种彼 此结合 是因为 我们感 兴趣的 两个基 因产物 彼此相 互作用 形成复 合物时 才发生 。当 这两个 蛋白质 相互作 用形成 一个复 合物时 ,转录 因子的 两部分 也彼此 靠近 ,使 报告基 因活化 ,以便 进行信 号检测 。这是 一种重 要的测 定方法 。已 经做 了很多 这方面 工作帮 助建立 来自不 同物种 的蛋白 质-蛋 白质相 互作用 。因 为测定 方法是 间接的 ,也 存在一 些可能 混淆结 果解释 的因素 ,其中 包括: ①某些 融合基 Prl/Pr2 口 • 96 • 图 13. 2 检测蛋 白质- 蛋白质 相互作 用的酵 母双杂 交方法 因产 物不能 到达细 胞核; ②融合 基因产 物与其 他蛋白 质的相 互作用 阻碍转 录因子 组分的 活化; ③在酵 母中某 些基因 产物很 难作为 杂合体 表达。 13. 3 蛋白质 - 蛋白质 相互作 用和蛋 白质复 合物的 MS 分 析:基 本方法 基于 MS 的蛋 白质组 分析工 具的应 用提供 了鉴定 多蛋白 质复合 物组分 的新方 法 。基本 方法相 对简单 ,如图 13. 3 所示 。首 先我们 对某个 蛋白质 感兴趣 (蛋白 质 1), 与其相 互作用 的蛋白 质未知 。制 备细胞 裂解物 ,加人 蛋白质 1 抗体 ,蛋 白质 1 及其 结合蛋 白质与 抗体发 生免疫 沉淀。 沉淀出 的蛋白 复合物 可以用 以下两 种 方式之 一进行 分析。 OJf© lit 免 疫沉淀 切割 条带, 消化 鉴 定组分 数据采 集算法 MALD1-T0F MS 鉴 定组分 图 13. 3 用免疫 沉淀和 lI>SDS"PAGE/MALDI-TOF 对多 蛋白质 复合物 进 行解析 (上面 ) 或用 LC-M&MS 进行“ 鸟枪法 ”鉴定 (下面 ) 一种方 法是用 1I>SDS~PAGE 凝胶分 离蛋白 复合物 ,然 后染色 并挑选 蛋白质 条带进 行消化 ,再用 MALDI-TOF 进行 分析。 用肽质 量指纹 谱算法 (见第 7 章) 从 MS 数据中 鉴定蛋 白质。 这个方 法如图 13. 3 上半部 分所示 。也 可以在 消化凝 胶 中的蛋 白条带 后使用 LC-M&MS 得到 MS^MS 谱图 ,然 后用数 据库相 关算法 如 Sequest 进 行鉴定 。使用 SDS-PAGE 分离 的一个 潜在问 题是常 造成蛋 白质的 丢失 ,这 是由于 在凝胶 中蛋白 质的不 完全消 化和肽 从凝胶 中的不 完全回 收造成 的 ,这可 能会导 致混合 物中低 丰度蛋 白质难 以检测 。另 一方面 ,使 用蛋白 质分离 步 骤可以 增加用 MALDI-TOF MS 和肽质 量指纹 谱鉴定 蛋白质 的效率 ( 见下文 )。 • 97 • 另一个 鉴定存 在于免 疫沉淀 物中蛋 白质的 方法是 直接对 免疫沉 淀出的 混合物 进 行消化 ( 不先对 它们进 行分离 ), 然后用 MALDI-TOFMS 或 LC-MSMS 分析肽 消化 混合物 。这 称为“ 鸟枪法 ”分析 (DNA 测序策 略的类 似方法 ), 能得到 很好的 结果。 这个方 法如图 13.3 下半部 分所示 。由于 消化物 中含有 来自复 合物中 几个不 同蛋白 质的消 化肽段 ,包 括从 抗体产 生的肽 (如 下所述 ,抗 体可以 从分析 中排除 ), 这 些因素 使肽混 合物直 接进行 MALDI-TOF MS 分析变 得复杂 。如果 混合物 含有三 个或 更少的 蛋白质 ,用 MALDI-TOF 直接 分析鉴 定这些 蛋白质 是相对 容易的 。随 着 蛋白质 数目的 增加, MALDI-TOF 谱图的 复杂性 使鉴定 越来越 困难。 这种复 杂性使 MALDI-TOF 比 LC-M&MS 更少 地用于 肽混合 物的鸟 枪法分 析。 LC-MS~MS 更 适合于 分析较 为复杂 的肽混 合物。 LC-MS~MS 鉴定蛋 白质是 基于用 序列相 关算法 (如 Sequest) 分 析肽的 MS~MS 谱图 。多种 不同蛋 白质消 化 产生的 肽会产 生过于 复杂的 MALDI-TOF 谱图 ,而 LC-M&MS 获得单 独的肽 谱图 ,可单 独分析 每种肽 。对中 等复杂 蛋白质 混合物 (2 〜 5 个 蛋白质 ), 在 Se- quest 帮助下 用数据 缩减进 行简单 LC-M&MS 可以鉴 定结合 蛋白质 。几个 研究小 组 已使用 这种方 法鉴定 相对较 小的多 蛋白质 复合物 。然而 ,对于 更复杂 的混合 物 ,会降 低每种 蛋白质 中进行 M^MS 分 析的肽 的数目 。换 句话说 ,随着 许多肽 离开 LO 柱 ,仪器 在记录 一个肽 离子的 MS~MS 谱图时 ,往 往来不 及记录 另一个 肽离子 的谱图 ,导 致信号 的遗漏 ,减少 了序列 覆盖率 (即来 自每一 个被鉴 定蛋白 质的肽 的数目 ), 从而 降低了 鉴定的 准确性 。使 用多维 肽分离 (见第 11 章) 可以 增加 序列覆 盖率。 Link 及 其同事 使用串 联离子 交换和 RP LC 与 MS~MS —起分 析了有 78 个亚基 的酵母 核糖体 复合物 。与 M^MS —起使 用多维 肽分离 大大增 加了 蛋白质 鉴定的 数目并 增加了 每个蛋 白质的 序列覆 盖率。 上面 几节表 明对免 疫沉淀 样品的 MS 鉴 定可以 使用相 对简单 (MALDI- TOF) 或相 对复杂 (串联 LC-ESI-M&MS) 的方法 。方法 的选取 主要取 决于待 鉴定蛋 白质的 量和复 合物中 蛋白质 的数目 。一旦 建立了 MS 方法并 在实验 室中运 作起来 ,完 成分析 是相对 容易的 。在绘 制蛋白 质-蛋 白质相 互作用 谱中的 真正挑 战在 于获得 发生相 互作用 的蛋白 复合物 样品。 除免疫 沉淀外 还有其 他分离 复合物 的方法 。下 面几 节描述 分离复 合物的 方法。 13. 4 免 疫沉淀 分离 多蛋白 质复合 物最常 用的方 法是用 其中一 个组分 的抗体 免疫沉 淀复合 物。 前面简 介的例 子使用 免疫沉 淀分离 复合物 。我们 将讨论 成功应 用这个 方法的 某些必 要步骤 。首 先是得 到合适 的抗体 。抗体 应该对 我们感 兴趣的 靶蛋白 质有专 一 性结合 。此外 ,抗 体不但 能免疫 沉淀游 离的靶 蛋白质 ,而 且也能 对发生 相互结 合 的蛋白 复合物 中的靶 蛋白质 进行免 疫沉淀 。不是 所有的 抗体都 适合于 免疫沉 淀 ,应 该对抗 体免疫 沉淀其 靶蛋白 质的能 力进行 测试。 • 98 • 另一个 问题是 抗体能 成功免 疫沉淀 其靶蛋 白质, 但是当 其他相 互作用 蛋白质 存在时 ,则不 能免疫 沉淀耙 蛋白质 。这 可能是 由于缺 少足够 的抗体 专一性 (即抗 体与其 他蛋白 质反应 ), 或是由 于复合 物中其 他蛋白 质与靶 蛋白质 的抗体 识别位 点_发 生结合 从而“ 遮盖” 了抗体 识别。 抗体 对蛋白 复合物 的分离 是有用 的工具 。然而 ,当 分离到 蛋白复 合物后 ,抗 体可 能使蛋 白复合 物的分 析变得 更复杂 。与用 MALDI-TOF 或用 LC-MS~MS 分 析复 合物的 肽无关 ,样品 中含有 大量从 抗体衍 生的肽 ,这些 抗体衍 生肽使 分析变 得复杂 ,降 低了鉴 定靶蛋 白质复 合物中 成份的 灵敏度 。防止 这一问 题发生 的最有 效方 法是使 用与不 溶性玻 珠共价 连接的 抗体。 有一些 商业化 的试剂 盒可以 很容易 产生 固定化 抗体。 使用这 些与玻 珠连接 的抗体 ,在免 疫沉淀 之后用 变性剂 (如 lmol/L 乙酸) 简单 处理, 从与玻 珠相连 的抗体 上释放 结合的 蛋白质 复合体 。通 过 离心或 过滤捕 获玻珠 ,回收 抗体。 洗脱的 蛋白质 可进行 消化和 MS 分析 ,没有 抗体衍 生肽的 干扰。 一 旦鉴定 出与靶 蛋白质 结合的 蛋白质 ,需 要用另 外的方 法证实 免疫沉 淀实验 的发现 。我 们需要 得到某 些关于 观察到 的复合 作用不 是免疫 沉淀实 验假象 的补充 证据 。具有 已知和 相关功 能的蛋 白质的 鉴定, 如激酶 连同磷 酸酶和 支架蛋 白一起 被 鉴定肯 定是有 意义的 。然而 ,我 们也 可尝试 更好地 证明靶 蛋白质 与一种 推测的 结合蛋 白质的 结合。 通过在 另一个 免疫沉 淀实验 中使用 对一个 结合蛋 白质的 抗体 ,可以 知道是 否起始 的靶蛋 白质可 成为复 合物中 的结合 蛋白质 ( 比较图 13. 4 A 蛋白质 复合物 蛋白质 复合物 antl_ &抗 体捕获 抗 体捕获 消化, LC-MS-MS ,r 鉴 定组分 图 13.4 检 测蛋白 质复合 物成员 A •用 对一个 复合物 成员的 抗体进 行免疫 沉淀; B. 用对 另一个 推测的 复合物 成员的 抗体进 行免疫 沉淀。 • 99 • r 中实验 A 和实验 B 的结果 ) 。 可 以使用 一系列 这种类 型的免 疫沉淀 证实起 始实验 中鉴 定的蛋 白质的 结合。 13. 5 诱 饵和反 向诱饵 抗 体捕获 蛋白质 复合物 方法的 一种变 换方式 是使用 “诱饵 ”方法 。在 固相载 体上 固定靶 蛋白质 (图 13. 5A)。 有几 种将靶 蛋白质 固定在 玻珠或 类似载 体上的 方法 。蛋白 质与活 化载体 如环氧 烷琼脂 糖凝胶 ,一 起温 育可以 产生共 价连接 。环 氧 烷琼脂 糖凝胶 与蛋白 质亲核 的胺或 巯基共 价反应 。另 一种方 法是产 生含有 His 尾部或 FLAG 尾 部序列 的重组 蛋白质 。这些 重组蛋 白质与 固定的 镍树脂 或与固 定的抗 FLAG 抗体紧 密结合 。将 玻珠 上连接 的蛋白 质与可 能含有 结合蛋 白质的 细胞裂 解物或 类似抽 提物一 起温育 (图 13. 5)。 结合 蛋白质 与固定 在玻珠 上的靶 蛋白质 结合形 成多蛋 白质复 合物。 通过离 心或过 滤得到 固定化 复合物 ,然 后使结 合的蛋 白质从 复合物 中解离 ,再进 行消化 和分析 。选 择特定 MS 分 析方法 的考量 与前面 描述的 分析免 疫沉淀 蛋白质 的考量 相同。 固 定化的 靶 蛋白质 诱饵 形成 复合物 消化, LC-MS-MS 鉴 定组分 细胞 抽提物 蛋白质 图 13.5 鉴定多 蛋白质 复合物 成员的 “诱饵 ” (A) 和“反 向诱饵 ” (B) 方法 “ 诱饵” 方法相 比免疫 沉淀实 验有两 个优点 。第一 ,不 存在捕 获复合 物中使 分析变 得复杂 的抗体 。第二 ,不 需要考 虑是否 抗体识 别复合 物中靶 蛋白质 的适当 表位 。当然 ,诱饵 方法中 也可能 由于靶 蛋白质 与载体 的连接 而干扰 发生在 体内的 蛋 白质相 互作用 。例如 ,可能 由于靶 蛋白质 N 端的 固定化 破坏靶 蛋白质 N 端结 构域 与另一 个蛋白 质的相 互作用 。这个 问题可 通过下 面将要 叙述的 对照实 验适当 • 100 • 避免 。诱饵 方法相 对于免 疫沉淀 方法的 另一个 缺点是 必须产 生或得 到固定 化的靶 蛋白质 。取 决于靶 蛋白质 的不同 来源, 制做固 定化靶 蛋白比 仅仅产 生或购 买抗体 要 更昂贵 、更困 难或耗 费更多 时间。 使用 诱饵方 法鉴定 了靶蛋 白质的 结合蛋 白质后 ,可通 过“反 向诱饵 ”实验 (图 13. 5B) 证实 其相互 作用。 记录诱 饵实验 中鉴定 出的所 有与靶 蛋白结 合的蛋 白质 ,从所 有结合 蛋白中 选择一 个蛋白 质进行 固定化 ,然后 在相同 系统中 进行相 同类 型实验 ,然后 鉴定在 “反向 诱饵” 实验中 的结合 蛋白质 。鉴定 出的结 合蛋白 质中 有原来 的靶蛋 白质和 在“诱 饵”实 验中发 现的其 他结合 蛋白质 。这可 以证实 在该 实验条 件下这 些蛋白 质的相 互结合 。在 鉴定出 的蛋白 质中也 可能发 现“诱 饵”实 验中未 检测到 的结合 蛋白质 ,这 可以为 在一个 网络中 寻找其 他成员 提供新 方向 。反 向诱饵 方法的 延伸将 在这一 章后面 讨论。 13. 6 多 蛋白质 -核酸 复合物 一类重 要的蛋 白质- 蛋白质 相互作 用是蛋 白质与 特定核 酸序列 ,如与 基因的 启动 子相互 作用。 这些相 互作用 不仅包 括与转 录和修 复相关 的几个 蛋白质 之间的 相 互作用 ,还 包括蛋 白质与 特定核 苷酸序 列的相 互作用 。鉴 定这种 相互作 用常用 的 方法是 电泳迁 移率变 动分析 (EMSA), 如图 13. 6 所示。 含有感 兴趣序 列的寡 核苷酸 探针用 32P 标记 ,与含 有可能 与之发 生相互 作用的 蛋白质 裂解物 一起温 育 ,抽 提后在 非变性 条件下 进行琼 脂糖凝 胶电泳 。不 与蛋白 质作用 形成复 合物的 寡核 苷酸探 针在胶 中移动 较快, 而与蛋 白质形 成复合 物的标 记寡核 苷酸的 移动较 蛋白质 抽提物 非 变性琼 脂 糖凝胶 图 13.6 检测 与特定 DNA 序 列相互 作用蛋 白质的 “凝胶 变动” 和“超 变动” • 101 • r 慢 。移 动快慢 的差别 称为凝 胶“变 动”, 这表明 (希望 如此) 一个 或多个 蛋白质 与该 序列发 生特定 结合。 电泳之 前将推 测蛋白 质的抗 体与复 合物一 起温育 。如果 抗体识 别并结 合复合 物中的 蛋白质 ,形成 的复合 物在凝 胶中移 动较慢 。这 种额外 的变 动称为 “超变 动”, 可提供 至少一 个复合 物成员 的鉴定 。当然 ,这种 方法的 局限 性是抗 体发生 结合并 不一定 就能鉴 定复合 物中的 蛋白质 。更重 要的是 抗体的 作用需 要预先 推测, 这样不 利于发 现复合 物的新 蛋白质 组分。 分析蛋 白质组 学可以 通过两 种方式 解决这 个问题 。第一 ,切割 显示凝 胶变动 或 超变动 的条带 ,消化 蛋白质 ,然 后用 MS 进 行分析 。但是 ,这些 样品中 蛋白质 含 量一般 相当小 (由 于用放 射自显 影检测 32p 的 灵敏度 ), 如 果不放 大实验 ,或 结合 使用多 个同样 的样品 ,鉴 定会较 困难。 第二个 鉴定与 寡核苷 酸发生 相互作 用蛋白 质的方 法是对 前述的 诱饵实 验稍加 改动进 行实验 。“ 诱饵 ”是固 定在固 相载体 上的寡 核苷酸 (图 13.7)。 例 如生物 素化 的寡核 苷酸可 以用来 捕获与 核酸相 互作用 的蛋白 质及其 结合蛋 白质。 整个复 合物可 以用亲 和素包 被的玻 珠捕获 ,非 专一性 结合蛋 白质可 通过洗 涤除去 ,然后 洗脱 、消化 和分析 专一性 结合蛋 白质。 这个方 法的主 要问题 是很难 捕获与 被研究 的序列 有高度 结合专 一性的 蛋白质 。这 个方法 目前正 在几个 实验室 中开发 ,最终 将在鉴 定与核 酸相互 作用的 蛋白质 中取代 EMSA 技术。 n ▲擊 蛋白质 抽提物 生物 素化的 DNA 探针 探针 复合蛋 物邮 洗脱 蛋白质 A 消化, MS 分析 鉴 定组分 图 13. 7 用生 物素化 DNA 探针 检测与 DNA 相互 作用蛋 白质的 “诱饵 ”方法 13.7 蛋白质 网络谱 细胞中 几乎所 有的蛋 白质都 至少与 一个蛋 白质相 互作用 ,这些 蛋白质 形成连 结的 网络。 Fields 及其同 事在绘 制酵母 蛋白质 相互作 用网络 谱时, 系统应 用了酵 母双杂 交方法 。这 很好地 证实了 蛋白质 网络的 存在。 绘制蛋 白质相 互作用 网络谱 时对酵 母双杂 交测定 方法稍 加改变 ,改 变后的 方法是 前面描 述的诱 饵和反 向诱饵 • 102 • 1 实验 的扩展 应用, 这种用 于蛋白 质网络 谱的方 法如图 13. 8 所示 。首 先靶蛋 白质, 称为 蛋白质 1, 被固定 在玻珠 载体上 ,这个 “诱饵 ”与细 胞裂解 物温育 ,回 收的 蛋白 质复合 物进行 MS 分析 ,其 结果揭 示有几 个蛋白 质与诱 饵结合 ,它们 是蛋白 质 2、 蛋白质 3 和 蛋白质 4。 然 后用固 定化的 蛋白质 2 进行 反向诱 饵实验 ,该实 验表 明结合 的蛋白 质包括 蛋白质 1、 蛋白质 3、 蛋白质 4 和一 个新的 蛋白质 ,称 为 蛋白质 5。 下一步 制备固 定化的 蛋白质 5, 在 相同实 验系统 中用它 作诱饵 。与 蛋白质 5 结 合的蛋 白质的 MS 分析 揭示了 蛋白质 2、 蛋白质 3、 蛋白质 4 和另一 个新 蛋白质 ,称为 蛋白质 6 的存在 。这 种分析 循环可 以无限 延续。 对每一 个结合 蛋白质 的发现 ,可 以进行 反向诱 饵实验 证实。 A 固定化 蛋白质 固定化 蛋白质 细胞 抽提物 鉴定 复合物 成员 2, 3, 4 固定化 蛋白质 am 鉴定 复合物 成员 1, 3, 4 , 消化, 消化, 消化, MS 分析 MS 分析 MS 分析 鉴定 复合物 成员 2, 3, 4 , 6 图 13. 8 用一 系列连 续的“ 诱馆” 和“反 向诱馆 ”实验 寻找蛋 白质相 互作用 的网络 这些诱 饵和反 向诱饵 实验的 净结果 是绘制 出蛋白 质-蛋 白质结 合的网 络谱, 它有 可能在 一个蛋 白质系 统中表 明这些 蛋白质 的功能 。当然 ,在这 里概括 的方法 需要在 每一个 实验中 产生固 定化蛋 白质, 这可能 是相当 耗时的 。可 以使用 抗体进 行 免疫沉 淀实验 ,总 的策略 类似。 前面描 述的使 用抗体 的优缺 点在这 也适用 。不 论是 用诱饵 还是用 抗体进 行实验 ,都在 绘制网 络谱时 确切鉴 定每一 步相互 作用的 蛋白质 中有其 明显的 优势。 推 荐读物 Craig, T. A. , Benson, L. M. , Tomlinson, A. J. , Veenstra, T. D. , Naylor, S. , and Kumar, R. ( 1999) Analysis of transcription complexes and effects • 103 • • of ligands by microelectrospray ionization mass spectrometry. Nat. Biotechnol. 17, 1214-1218. Honey, S. , Schneider, B. L. , Schieltz, D. M. , Yates, J. R. , and Futcher, B. (2001) A novel multiple affinity purification tag and its use in identifica- tion of proteins associated with a cyclin-CDK complex. Nucleic Acids Res. 29, E24. Ng , D. H. , Watts, J. D. , Aebersold, R. , and Johnson, P. ( 1996 ) De- monstration of a direct interaction between p561ck and the cytoplasmic domain of CD45 in vitro. J . Biol. Chem. 271 , 1295 — 1300. Panigrahi, A. K. , Gygi, S.P. , Ernst, N.L. , Igo, R.P. , Palazzo, S.S. , Schnaufer, A. , et al. (2001) Association of two novel proteins, TbMP52 and TbMP48, with the Trypanosoma brucei RNA editing complex. Mo/. C^// Biol. 21, 380-389. Rigaut, G. , Shevchenko, A. , Rutz, B. , Wilm, M. , Mann, M. , and Seraphin, B. (1999) A generic protein purification method for protein com- plex characterization and proteome exploration. Nat. Biotechnol. 17 , 1030—1032. Rudiger, A. H. , Rudiger, M. , Carl, U. D. , Chakra borty, T. , Roepstorff, P. , and Wehland, J. ( 1999) Affinity mass spectrometry-based approaches for the analysis of protein-protein interaction and complex mixtures of peptide- ligands. Anal. Biochem. 275, 162 — 170. Schwikonski , B. , Vetz, P. and Fields, S. (2000) A network of protein-pro- tein interactions in yeast. Nat. Biotechnol. 18, 1257 —— 1261. Yates, J. R. (2000) Mass spectrometry: from genomics to proteomics. Trends Genet. 16, 5 — 8. • 104 • 14 蛋白质 修饰谱 14. 1 蛋白质 修饰无 处不在 蛋白质 组学显 示的一 个公理 是在生 命系统 中大多 数蛋白 质都以 多种修 饰形式 存在 。在第 2 章谈到 蛋白质 的“生 命周期 ”时, 讨论了 多肽在 核糖体 的形成 、翻 译后的 切割、 通过内 源和外 源试剂 的修饰 、氧 化损伤 的累积 和最终 的降解 ,所有 这些 过程都 包括蛋 白质结 构的不 同修饰 。某些 蛋白质 存在多 重位点 的修饰 ,这增 加了修 饰的复 杂性。 在过去 50 年 ,生 物化学 家使用 许多蛋 白质生 物化学 技术测 定 蛋白质 的修饰 。在 大多数 情况下 ,生 化测定 只能说 明蛋白 质发生 了修饰 ,但不 能 表明修 饰位点 。蛋白 质的修 饰位点 很重要 ,因 为不 同位点 的相同 修饰可 能有不 同的 结果。 在生物 化学和 细胞生 物学最 近的工 作中, 研究者 利用许 多技术 来绘制 蛋白质 修饰谱 。两 种常用 的技术 是抗体 和定点 突变。 我们以 蛋白质 磷酸化 位点的 定位为 例 来说明 。针 对磷酸 丝氨酸 、磷酸 苏氨酸 或磷酸 酪氨酸 的单克 隆抗体 (MAb) 可以 用来定 位这些 氨基酸 残基在 完整蛋 白质或 切割肽 段上的 位置。 定点突 变允许 “敲除 ”在研 究系统 中磷酸 化的丝 氨酸、 苏氨酸 或酪氨 酸残基 。用 抗体对 这些蛋 白质或 消化后 的肽片 段进行 Western 印迹法 分析, 证明特 定氨基 酸置换 后不再 发生磷 酸化, 从而可 以推断 哪些氨 基酸位 于修饰 位点。 这一方 法有两 个问题 。第一 ,不能 肯定在 定点突 变中使 用的置 换氨基 酸是否 . 改变 了系统 的其他 的功能 ,如与 激酶的 结合。 即使氨 基酸置 换引起 的微小 结构变 化也可 能影响 邻近磷 酸受体 位点的 磷酸化 。有 多个紧 密相邻 的磷酸 化靶点 的肽中 特 别容易 发生这 种现象 。第 二个问 题是操 作问题 。这 种研究 需要大 量的工 作产生 抗体 和突变 蛋白质 。每研 究一个 新系统 时都要 解决抗 体专一 性问题 ,这极 大阻碍 了研 究进展 速度。 尽管已 用这种 方法对 磷酸化 做了广 泛研究 ,但是 有许多 有意义 的蛋 白质修 饰不宜 采用这 种实验 方法。 MS 方法 的引入 为鉴定 蛋白质 的修饰 提供了 一种好 方法。 MS 数 据的特 点是既 可 以测定 肽质量 和序列 ,也 可以提 供关于 肽修饰 的信息 。在 前面几 章讨论 的某些 MS 数据采 集和软 件工具 可帮助 鉴定特 定修饰 。这一 章分析 怎样结 合使用 MS 分析 和数 据采集 ,在 氨基酸 水平上 准确地 绘制蛋 白质修 饰谱 。先以 蛋白质 磷酸化 位点的 定 位为例 ,然 后延伸 到寻找 其他内 源修饰 和由环 境因子 引起的 外源修 饰上。 14. 2 序 列覆盖 率是鉴 定蛋白 质修饰 的关键 直到 现在我 们对蛋 白质的 MS 分析主 要集中 在蛋白 质的鉴 定和相 对定量 。在 • 105 • 许多情 况下, 胰蛋白 酶消化 后进行 MS 分析可 以提供 蛋白质 多个肽 片段的 数据。 MS 数 据在多 大程度 上代表 整个蛋 白质序 列常称 为“覆 盖率” 。例如 ,如 果分析 一 个长为 1〇〇 个氨基 酸的蛋 白质胰 蛋白酶 消化物 ,得到 相关的 60 氨基酸 残基的 MS 数据 ,这被 说成是 60% 的序列 覆盖率 。目 的只为 鉴定蛋 白质, 这是绰 绰有余 的 。我 们在用 MALDI-TOF 数据进 行肽质 量指纹 谱时, 只要有 2 〜 3 个肽 与数据 库条 目匹配 就足以 鉴定蛋 白质。 实际上 ,这可 以转换 成少至 10% 〜 15% 的序列 覆盖率 。在 LC-M^MS 中 ,对一 个长为 100 个 氨基酸 的蛋白 质来说 ,如 果有两 个 较好的 6 肽 M&MS 谱图就 可以进 行蛋白 质的确 切鉴定 ,这仅 相当于 12% 的覆 盖率 。因而 较低的 覆盖率 不妨碍 蛋白质 的准确 鉴定。 对蛋白 质表达 的定量 也是一 样 ,用 2D 凝胶 的图像 比较或 用稳定 同位素 标记的 LC-MS^MS, 少至 5% 〜 10% 的序 列覆盖 率就可 以确切 地定量 蛋白质 的表达 特性。 用 MS 绘制蛋 白质修 饰谱时 情况完 全不同 。只有 获得修 饰肽的 MS 数 据才能 检测到 肽修饰 。要检 查一个 蛋白质 的所有 氨基酸 的修饰 ,就必 须有全 部肽的 MS 数据 ,即 必须有 100% 序列 覆盖率 。这一 点如图 14.1 所示 。如果 进行蛋 白质的 胰蛋白 酶消化 ,然 后得到 MS~MS 谱 图和肽 1、 肽 4 和肽 7 的序列 ,可以 确切地 鉴定 蛋白质 (图 14. 1A)。 然而磷 酸化发 生在肽 2 和肽 8, 仅用肽 1、 肽 4 和肽 7 的数 据不能 找到存 在于其 他肽的 磷酸化 位点。 如果得 到含有 磷酸丝 氨酸残 基的肽 2 和肽 8 的 MS~MS 谱图 (图 14. 1B), 不仅能 鉴定蛋 白质, 而且能 推测这 两个肽 的精 确磷酸 化位点 ( 见下文 )。 但我们 在实际 实验中 不可能 在研究 每个蛋 白质时 都正 好获得 含有修 饰的肽 谱图, 这个例 子表明 了在绘 制蛋白 质修饰 谱时覆 盖率的 重要性 。我们 必须依 赖于覆 盖率或 运气。 但不能 总是依 靠运气 ,所 以必须 提高覆 盖率 。在讨 论提高 覆盖率 的策略 之前, 先讨论 一下在 MS 数 据中什 么信息 可以帮 助 我们找 到特定 氨基酸 残基的 修饰。 9 0 1 2 3 4 5 6 7 8 9 B 0 1 2 图 14. 1 序 列覆盖 率对检 测翻译 后修饰 的影响 蛋 白质的 黑色部 分代表 已得到 MS 数据 的序列 。肽 2 和肽 8 表明 磷酸化 位点。 14. 3 从 MS 数据推 测修饰 使用 MALDI-TOF 得 到肽混 合物的 MS 谱图, 其数据 可提供 肽离子 的精确 质量 测定。 测定的 质量反 映了肽 的组成 氨基酸 和所有 修饰基 团的质 量之和 。从 • 106 • MALDI-TOFMS 分析我 们可以 明确哪 个肽可 能有修 饰形式 存在。 例如, MAL- DI-TOF 分 析磷酸 化的和 非磷酸 化的肽 产生两 个信号 。低 m/z 值的 信号是 非磷酸 化肽 ,而 m/z 值高出 80 单位 的信号 相当于 磷酸化 的肽。 MALDI-TOFMS 分 析和肽 质量指 纹谱算 法及软 件的结 合不仅 可以鉴 定蛋白 质 ,而 且可以 鉴定修 饰形式 。这 些软件 允许使 用者指 定如磷 酸化的 一般修 饰以及 使用 者定义 的特有 修饰。 与数据 库中非 修饰肽 不匹配 的信号 可能与 这些肽 的修饰 形式 匹配。 这对 确定特 定肽的 修饰是 有用的 。然而 ,这 种方 法不能 精确地 定位特 定氨基 酸 的修饰 。例如 ,肽 VPQLEIVPNpSAEER 仅在丝 氨酸残 基含有 一个可 能的磷 酸 化位点 。有些 肽可能 含有多 个可能 的磷酸 化位点 。人 P53 蛋 白的肽 GQSTSRHK 含有 两个丝 氨酸, 它们都 是激酶 磷酸化 的位点 。非 修饰肽 有一个 771/之为900.9760的〇4+}^]+离子,而单磷酸化形式有一个所/:2为980.9558 的 [M+H]+ 离子 。但是 通过这 个数值 差异我 们仍不 能确定 两个丝 氨酸中 哪一个 发生 磷酸化 。如果 知道蛋 白质磷 酸化激 酶优先 磷酸化 的序列 ,能指 定可能 的磷酸 化位点 。但这 样做也 只是进 行推断 ,而 不是确 切鉴定 。要确 切鉴定 必须获 得肽离 子的 MSMS 谱图。 从 LC-MS-MS 提 供的肽 MS~MS 谱图 ,我们 不仅能 得到序 列信息 ,而 且能 得到修 饰的序 列位点 。例如 ,牛酪 蛋白的 磷酸肽 VPQLEIVPNpSAEER 的 MS~ MS 谱 图如图 14. 2 所示 。双电 荷离子 的质量 (m/z 831. 2) 比预期 的非修 饰肽的 质量 (m/z 791. 4) 高 40 单位 。这证 实存在 磷酸化 。谱图 含有提 供序列 信息的 b 和 y 离子 系列 。谱图 显示从 y5 离 子开始 y 离子 系列的 变化。 y5 离子高 于预 期的相 应非磷 酸化肽 80m/z 单位 ( 磷酸化 的肽为 m/z671.2, 而非 磷酸化 的肽为 m/z 591. 6)。 而且 y7、 y8、 %和%1 离子 的信号 出现在 高于非 修饰肽 相应产 物离子 80 m/z 的位置 (y6、 y1Q、 y12 和 y13 离 子不在 谱图中 )。 仅有一 个含有 憐酸丝 氨酸残 基的 b 离子 (b13) 出现在 谱图中 ,但 它的 m/z 移动了 80amu, 这 反映了 磷酸化 的 存在。 b 和 y 离子 系列 的改变 证实修 饰残基 的序列 位置。 M&MS 谱图 (图 14.2) 的 另一个 有意义 的特征 是位于 m/z 782. 1 的强产 物离子 ,这 个离子 来自中 性 片段中 丝氨酸 的磷酸 (98 Da) 丢失 。[一 般磷酸 (98 Da) 从双 电荷离 子的中 性丢 失产生 一个比 双电荷 前体的 历夂低 49 单位 的信号 ,在图 14. 2 中, m/z 为 831. 2 的 双电荷 磷酸肽 中磷酸 的丢失 导致在 m/z 为 782. 1 处 产生一 个片段 。从单 电荷 前体丢 失相同 片段产 生一个 比单电 荷前体 m/z 低 98 单 位的信 号。] 这种容 易 发生的 丢失是 MS^MS 中磷 酸丝氨 酸和磷 酸苏氨 酸残基 的特征 。相反 ,磷 酸酪 氨酸 残基不 易丢失 磷酸. 因为它 们没有 《 氢帮 助磷酸 的消除 反应。 [M+2H]2+ 前体离 子质量 的改变 、双 电荷 离子的 49 单位 (磷酸 ) 的中 性丢失 和含有 磷酸丝 氨酸的 b 和 y 离子的 80 amu 移动 ,综 合这些 因素可 以确切 证实在 这个狀 中丝氨 酸 磷酸化 的存在 和序列 位置。 • 107 • 在这个 例子中 应用的 标准基 本上可 用来定 位蛋白 质中任 何化学 修饰。 LC- MS~MS 比 MALDI-TOF 和 肽质量 指纹谱 更适合 用于蛋 白质的 化学修 饰定位 ,因 为 MS~MS 谱图提 供肽序 列信息 (b 和 y 离子) 和 关于修 饰的特 定信息 ( 如中性 丢 失或产 物离子 ) 。 在这 一章的 后面将 讨论这 些特定 修饰谱 图的特 征在鉴 定其他 蛋 白质修 饰中的 应用。 14. 4 样 品富集 很明显 ,我们 得到修 饰肽的 高质量 MS 或 MS~MS 谱图后 ,就 可以鉴 定肽和 修 饰位点 ,因 此确定 蛋白质 修饰的 关键是 获得修 饰肽的 MS 或 M&MS 谱图 。细 胞中特 定蛋白 质的全 部拷贝 中只有 一小部 分可能 带有特 定修饰 。例如 ,许 多蛋白 激酶 底物迅 速磷酸 化和脱 磷酸化 ,所以 在一个 特定时 间一个 蛋白质 只存在 很少磷 酸 化拷贝 。当试 图分析 蛋白质 样品的 修饰时 ,样 品中 大多数 肽是非 修饰的 ,这在 MALDI-TOF 分析中 意味着 非修饰 肽比修 饰肽有 强得多 的信号 。对 LC-MS~MS 分析 ,这意 味着非 修饰肽 的肽离 子更强 ,选 择进行 MS^MS 裂解的 可能性 更大。 为 解决这 一问题 ,我 们很容 易想到 的方法 是使用 富集策 略增加 修饰蛋 白质或 肽 在样品 中所占 的比例 。但在 蛋白质 或肽水 平上, 这取决 于修饰 的性质 和丰度 。相 对 于整个 蛋白质 ,大 多数修 饰蛋白 质的量 很少, 但修饰 会改变 蛋白质 的某些 性质。 例如, 改变蛋 白质等 电点的 修饰可 影响蛋 白质在 2D 凝胶中 的迁移 ,不 同修 饰的蛋 白质 可出现 “点横 向排列 ” ( 见第 4 章 )。 而肽比 蛋白质 小得多 ,肽的 修饰可 极大地 • 108 • 影响它 们的行 为和化 学性质 。对于 修饰肽 ,富 集策略 必须根 据修饰 部分本 身的化 学 、物理 或免疫 学性质 。基 本步 骤如图 14. 3 所示 。含 有修饰 和非修 饰肽的 蛋白质 消化物 上样到 含有某 种固定 化配基 的柱上 ,非 修饰 肽对柱 的亲和 力较小 ,容 易通过 柱 ,而 修饰肽 与柱紧 密结合 。通过 洗涤将 非修饰 肽从柱 上洗脱 。用破 坏修饰 肽与固 定化配 基相互 作用的 溶液将 修饰肽 洗脱。 磷酸化 的肽对 固定化 金属显 示很强 的亲和 力 ,这 是因为 阴离子 磷酸基 团对多 价金属 阳离子 的强亲 和力。 从蛋白 质消化 物中分 离磷 酸肽的 固定化 金属亲 和层析 OMAC) 方法 就是利 用了这 一性质 。尽管 这种方 法 能很好 地富集 磷酸化 肽样品 ,但 各种磷 酸肽与 IMAC 配基的 亲和力 会有所 变化, 因 而使用 这些柱 需要很 多技巧 ,必 须仔细 改进实 验方案 。富集 样品的 另一种 方法是 使用直 接对修 饰部分 的固定 化抗体 。例如 ,可 使用 磷酸化 氨基酸 的抗体 ,通 过免疫 沉淀 或固定 化抗体 柱捕获 磷酸肽 。和 IMAC 方 法一样 ,这种 方法取 决于抗 体对修 饰肽 的相对 亲和力 。对 捕获生 物异源 物质修 饰的肽 ( 见下文 ), 这种方 法是可 行的, 因为这 种抗体 已被用 于核酸 加合物 的类似 的富集 ,供 其后的 MS 分析 。与抗 磷酸氨 基酸抗 体一样 ,抗体 与修饰 肽的亲 和力决 定了富 集样品 的程度 。综上 所述, 我们提 出的每 个富集 策略都 需要仔 细优化 和注意 细节。 肽 混合物 洗涤 洗脱 1 混合 物上柱 IMAC 柱 ■ 2. 洗 去非磷 酸 化的肽 3. 洗脱 磷酸肽 MS 分析 图 14. 3 用 固定化 金属亲 和层析 (IMAC) 从肽消 化物中 分离磷 酸化肽 14.5 采集用 于修饰 研究的 MS-MS 数据 如前面 提到的 ,了旦 得到修 饰肽的 MS~MS 谱图 ,我们 就有可 能推出 肽序列 和修饰 位置。 即使设 计了富 集修饰 肽样品 的策略 ,富集 也不是 完美的 ,仍 必须在 许多 MS~MS 谱图 中进行 挑选并 确定哪 一个相 当于修 饰肽。 这与所 有肽混 合物的 LC-MS~MS 分析 面临的 困境类 似:需 要处理 极大量 的数据 。幸运 的是可 以使用 熟悉 的数据 缩减算 法和软 件工具 筛选相 当于修 饰肽的 MS*MS 扫描 数据。 Sequest 程序 允许使 用者指 定若干 可能出 现于蛋 白质的 普通低 分子质 量修饰 。例如 ,使用 • 109 • 者可 以指定 ,正 在进行 MS~MS 谱 图分析 的肽中 ,丝 氨酸、 苏氨酸 和酪氨 酸残基 的磷 酸化。 Sequest 将 MS~MS 数据 与从数 据库序 列产生 的虚拟 MS~MS 扫 描进行 关联 。数据 库中既 包括氨 基酸修 饰肽也 包括氨 基酸非 修饰肽 。例如 ,一个 MS~ MS 扫描可 能对一 个有丝 氨酸残 基的数 据库序 列显示 很高的 Sequest 相关 得分, 如果对 磷酸丝 氨酸肽 序列的 相关性 很高, 而与非 磷酸化 的序列 的相关 性很低 ,这 个 MS~MS 谱图可 能是来 自磷酸 化的肽 。如 果对 谱图中 Sequest 指 定的离 子检查 核实 ,磷酸 化肽的 b 和 y 离子系 列有相 应于磷 酸化的 变化, 可以确 定肽片 段发生 了磷酸 化修饰 。可用 Sequest 寻找各 种简单 、低分 子质量 肽修饰 。这 个方 法很适 合 下列情 况:① 化学修 饰的化 学性质 (质量 ) 可以 预测; ②修 饰导致 MS~MS 谱 图产生 变化; ③修 饰的质 量是在 Sequest 和 类似程 序规定 的范围 之内。 检 测蛋白 质修饰 的第二 个方法 是用第 10 章 描述的 SALSA 算 法分析 MS~MS 数据。 许多肽 修饰产 生特定 特征的 MS~MS 谱图 。例 如磷酸 化的丝 氨酸和 苏氨酸 在 MS^MS (图 14. 2) 中消 除磷酸 (98 Da)。 可在谱 图中观 察到分 别低于 双电荷 和单 电荷前 体离子 49 和 98 单 位的产 物离子 。其他 修饰也 可能在 MS-MS 谱图中 产生 特定产 物离子 。例如 ,多环 芳香烃 修饰的 肽随着 烃的解 离而裂 解成为 强产物 离子 。总之 ,在 肽序列 中任何 氨基酸 的稳定 修饰都 会改变 MS~MS 谱 图中的 .b 和 y 离 子系列 ,因为 修饰影 响了被 修饰氨 基酸的 表观残 基质量 。再 来讨 论在第 8 章 中 AVAGCAGAR 肽 的例子 。图 14. 4 是非 修饰的 AVAGCAGAR (图 14. 4A) 和 S- 羧甲基 -AVAGCAGAR (图 14.4B) 的 MS-MS 谱图 。这两 个肽的 yi〜y4 离子 dm_200392_TpepC_std #587 RT:20.55 AV:1 NL:1.95E7 A T:+cd Full ms2 388.37@40.00[95.00-790.00] • 110 • jj_200266_CmSpike_01 #595-597 RT:20.85-2092 AV:3 NL:3.67E5 图 14. 4B S~ 羧甲基 - AVAGCAGAR 的 M&MS 谱图 有 相同的 w/z 值 (未检 测^ 离子 ), 但是 y5 离子 不同 。在非 修饰的 肽中, y5 离子 CAGAR+ 位于 m/z 477, 而 修饰肽 S ■羧 甲基 CAGAR+ 的 %离 子位于 m/z 535, 质量 差异为 58, 这相当 于竣甲 基修饰 。在修 饰肽中 , y5〜y8 离子比 非修 饰肽的 MS~MS 谱图中 y5 〜 78离 子都高 58 m/z 单位。 相同的 改变也 存在于 b 离子 系列。 在两 种肽中 卜〜134离 子相同 ,但修 饰肽的 b5〜b8 离子 比非修 饰肽的 b5〜b8 离子 高 58 m/z 单位。 在第 10 章我们 讨论了 SALSA 算法 可检测 被特定 m/z 值隔开 的离子 系列的 MS^MS 谱图。 这种离 子系列 图型代 表特定 氨基酸 基序。 SALSA 产生由 b 或 y 离 子系列 中离子 相对距 离定义 的“虚 拟尺” ,在 MS~MS 扫 描中“ 虚拟尺 ”可用 来检 测离子 系列与 之匹配 的谱图 。对 AVAGCAGAR 肽和 序列类 似的肽 ,使用 相 对应于 肽中间 部分的 “GACGA” 尺进 行匹配 。前 面的例 子中, AVAG- CAGAR 肽 的半胱 氨酸残 基上引 人修饰 ,使分 别开始 于 %和 b5 离子的 y 和 b 离 子系 列发生 移动。 其结果 是尺与 修饰肽 的部分 y 离子 而不是 与全部 y 离子 系列匹 配 (图 14. 5)。 当 匹配从 观察到 的最高 y 离子 (y7) 开始时 ,可 发现 y7、 %和% 离 子与“ 虚拟尺 ”匹配 ,而 y2、 y3 和 y4 离子不 匹配。 如果从 观察到 的最低 y 离 子(力,图14.5中未标出)开始匹配,可发现力〜%离子匹配,而%^^7离子 不匹配 。在 这两 种匹配 方式中 都有部 分离子 匹配。 SALSA 对这 ^ 部分 匹配的 MS-MS 谱 图给出 有意义 的得分 ,但 得分低 于非修 饰肽的 MS-MS 谱图的 • ill • 图 14. 5A 用 GACGA 序 列“虚 拟尺” 检测高 m/2 值 y 离子系 列中的 S" 羧甲基 AVAGC • AGAR 图 14. 5B 用 GAOGA 序列 “虚拟 尺”检 测低; 值 y 离子系 列中的 S •羧 甲基 AVAGC • AGAR • 112 • 得分 。然而 ,这些 部分离 子系列 的匹配 可以让 我们用 SALSA 鉴定修 饰肽的 M&MS 谱图 。这些 MS-MS 谱图 的分析 可以确 定肽序 列和修 饰的精 确位置 。这 样 ,我们 可以定 位修饰 肽在数 据库蛋 白质序 列中的 位置, 确定修 饰蛋白 质和修 饰 位点。 这一基 本方法 是鉴定 蛋白质 组的有 力工具 。在 蛋白 质组中 ,蛋 白质修 饰影响 蛋白质 功能、 蛋白质 -蛋白 质相互 作用和 蛋白质 转换。 SALSA 算法 能区分 具有序 列 或修饰 (或 二者) 特征 的谱图 。然而 SALSA 鉴定修 饰肽的 前提是 MS 分析需 记录下 我们感 兴趣肽 片段的 MS~MS 谱图 ,因 此这使 我们又 回到这 一章前 面提到 的关键 问题: 覆盖率 。最 大可能 地利用 Sequest 和 SALSA 方法鉴 定蛋白 质的修 饰 ,需要 得到尽 可能多 的混合 物中肽 的谱图 ,因 此蛋白 质消化 、肽 分离和 仪器灵 敏度 达到最 佳对绘 制蛋白 质修饰 谱是重 要的。 14. 6 Sequest 和 SALSA 结合鉴 定蛋白 质修饰 Sequest 和 SALSA 单独使 用时在 绘制蛋 白质修 饰谱中 都有很 大的局 限性。 例如 ,我们 从含有 许多不 同蛋白 质的样 品中得 到了大 量修饰 和非修 饰肽的 MS~ MS 谱图。 Sequest 可检测 在已知 氨基酸 (如 磷酸丝 氨酸) 上 可预测 的修饰 。然 而 ,当修 饰的性 质和被 修饰的 氨基酸 不能预 测时, Sequest —般不 能检测 修饰形 式 。在 这种状 况下, Sequest 试 图使修 饰肽的 谱图与 数据库 中未修 饰的序 列相匹 配 ,从 而使匹 配发生 错误。 同理 ,用 SALSA 分析 这组数 据会出 现不同 的问题 。我们 试图用 SALSA 寻 找 显示某 些可预 测特征 (如磷 酸丝氨 酸和磷 酸苏氨 酸的磷 酸中性 丢失) 的 MS~ MS 谱图 。然而 ,还 是无法 检测不 能预测 的修饰 ,或 不产生 明显丢 失或产 物离子 (如 磷酸酪 氨酸) 的修饰 。如 在前面 和在第 10 章 描述的 ,用 SALSA 检测 修饰肽 MSMS 谱图 的最有 效方式 是进行 序列基 序检索 。但 要这样 做必须 知道检 索什么 基序 。除非 知道样 品中存 在什么 蛋白质 ,否则 无法这 样做。 Sequest 和 SALSA 可以 联用, 使其更 好地发 挥作用 (图 14. 6)。 基本 方法如 下 :先用 Sequent 分 析数据 ,许多 MS-MS 谱图数 据与数 据库序 列成功 关联。 Se- quest 不能正 确鉴定 修饰肽 ,但可 以鉴定 肽的非 修饰化 形式。 Sequest 检 索产生 样 品中某 些标志 蛋白质 的目录 (如图 14. 6 中的 蛋白质 1、 2、 3 和 4)。 接 下来用 SALSA 检索 这些蛋 白质的 肽所代 表的序 列基序 。这 些序列 基序检 索不 仅仅鉴 定非修 饰肽的 MS^MS 谱图 (这可 能已由 Sequest 鉴定 ), 而且 也鉴定 这 样一些 MS~MS 谱图: 它们与 非修饰 肽谱图 有离子 系列同 源性, 也有肽 质量和 产物离 子绝对 m/z 值 的不同 。这 些谱图 相当于 修饰肽 。对 这些谱 图进行 研究可 以推 测每一 个修饰 的质量 和序列 位置。 结合的 Sequest/SALSA 策 略是使 蛋白质 修饰 得到鉴 定和定 位的最 完美的 方式。 • 113 • MWIFVNAL1ENPTFDSQTKENMTLQPKSFGSTCQLSEKFIKAA1GCG1VESILNWV KFKAQVQLNKKCSAVKHNR1KGIPKLDDANDAGGRNSTECTLILTEGDSAXTLAVS GLGVVGRDKYGVFPLRGKILNVREASHKQ1MENAE1N^11K.1VGLQYK.KNYEDED •产 生胰 蛋白酶 肽目录 •使 SALSA 公式化 ,检 索可能 有修饰 的基序 1. MW1FVNALIENPTFDSQTK 2. ENMTLQPK 3. AAIGCGIVESILNWVK ! SALSA n. NYEDED u 鉴 定高分 MS-MS 扫描 一 AAIGCGIVESILNWVK( 非修饰 ) — ~ ►AA1GC*G1VES 丨 LNWVK (修饰 #1) ''~~'^AAIGCGIVES*ILNWVK (修饰 #2) 蛋白质 修饰得 到鉴定 图 14. 6 LC-MS~MS、 Sequest 和 SALSA 联用 鉴定混 合物的 蛋白质 组分和 蛋白质 的修饰 推 荐读物 Gatlin, C. L. , Eng, J. K. , Cross, S. T. , Detter, J. C. , and Yates, J. R. , III (2000) Automated identification of amino acid sequence variations in pro- teins by HPLC/microspray tandem mass spectrometry. Anal. Chem. 72, 757 — • 763. Liebler, D. C. , Hansen, B. T. , Davey, S. W. , Tiscareno, L. , and Mason, D. E. (2001 ) Peptide sequence motif analysis of tandem ms data with the SALSA algorithm. Anal. Chem. , in press. Neubauer, G. and Mann, M. ( 1999) Mapping of ph〇vSphorylation sites of gel- isolated proteins by nanoelectrospray tandem mass spectrometry: potentials and limitations. Anal. Chem. 71 , 235 — 242. Zhou, H. , Watts, J. D. , and Aebersold, R. (2001) A systematic approach to the analysis of protein phosphorylation. Nat. Biotechnol. 19, 375 — 378. • 114 • 15 蛋白质 组学的 新方向 15.1 正 在发展 的技术 ,正 在出现 的工艺 当我们 问在分 析蛋白 质组学 工作中 最关键 的是什 么时, 有两件 事情涌 现在脑 海 中:灵 敏度和 高通量 。灵 敏度是 重要的 ,因 为蛋白 质组学 要求按 照蛋白 质的天 然丰 度分析 ,在许 多情况 下我们 需要分 析以极 低水平 存在的 蛋白质 。高通 量也是 重要的 ,因为 要真正 分析蛋 白质组 ( 与蛋白 质相反 ), 必须 要尽可 能快地 进行大 量 蛋白质 的分析 。显然 ,蛋 白质 组学工 艺正在 朝高灵 敏度和 高通量 的方向 发展。 高灵敏 度和高 通量需 要工艺 和技术 上的发 展。“ 工艺” 是指提 供基本 分析能 力的仪 器或仪 器方法 ,如 MS 仪器 、离 子源、 层析仪 器等等 。另 一方面 ,“ 技术” 是指 为了从 已有仪 器得到 最多实 验结果 所采取 的步骤 。区 分这两 个领域 是重要 的 ,因 为这二 者的提 高将带 动蛋白 质组学 未来的 进步。 这 本书前 面描述 的大多 数仪器 已至少 存在五 年了。 20 世纪 90 年 代早期 ESI- LC-M&MS 就已经 存在于 实验室 ,自 1996 年以 后已经 得到广 泛使用 。在 同一时 间 许多实 验室也 已使用 MALDI-TOF 仪器。 在过去 五年中 已经广 泛使用 新型高 分 辨率的 TOF 分析器 。近 几年 MS 仪器 性能已 有了极 大提高 。确实 ,典 型的 MALDI-TOF 或 LC-MS 系统 比五年 前出售 的相同 仪器的 灵敏度 高出一 个数量 级 。这 反映了 在质量 分析器 工艺、 ESI 和 MALDI 离子 源设计 、探 测器灵 敏度和 系统电 子学等 方面的 提高。 蛋 白质组 学中灵 敏度的 提高主 要是因 为用于 MALDI-TOF 和 ESI-LC-MS 的 样品制 备和导 人技术 的提高 。更 有效的 蛋白质 抽提和 消化技 术能从 复杂样 品得到 更 好的蛋 白质和 肽产量 。改进 的样品 纯化步 骤可消 除去污 剂和盐 污染对 电离和 MS 分析 的干扰 。新型 LC 系统 较低的 流量和 更低的 死体积 保证少 量样品 更有效 地 传递到 MS 仪器。 MS 仪 器在低 流量时 往往运 转最好 ( 见下文 )。 从事 蛋白质 组学 和分析 蛋白质 化学工 作的研 究人员 在继续 开发可 提供更 高灵敏 度和更 大通量 的新 技术。 上述改 进将使 蛋白质 组分析 更灵敏 ,并 将促 进蛋白 质组学 继续快 速发展 。其 他正 在出现 的工艺 会进一 步提高 我们分 析蛋白 质组的 能力。 在下面 几节着 重介绍 四方 面正在 出现的 工艺。 15.2 新型 MS 仪器 用于 肽和蛋 白质的 MS 分析仪 器发展 得很快 ,包括 技术和 工艺上 的发展 。尽 • 115 • 管质 量分析 器和检 测器的 灵敏度 已有很 大提高 ,但样 品制备 和导人 方法的 不断改 进有利 于检测 灵敏度 的进一 步提高 。在 这些“ 尖端” 创新中 最值得 注意的 是用于 ESI-LC-MS 仪器的 超低流 量样品 引人系 统的使 用。“ 纳喷” 是描述 这些技 术的常 用术语 ,样 品以 每分钟 50 〜 500 纳 升的速 度流人 ESI 离子源 (而一 般通常 使用的 狭 口柱的 流速是 每分钟 50 〜 500 微升 )。 样品 导人过 程中降 低流速 可使肽 离子从 溶液 到质量 分析器 更有效 的转移 ,从 而可在 阿摩尔 到飞摩 尔范围 内对样 品进行 MS-MS 分析 ,而 高流速 分析系 统所需 的样品 分析量 要高出 两个数 量级。 纳喷可 以 用融合 硅毛细 管进行 。硅, 细管用 HnX 分离介 质装填 ,具有 LC 柱和 电喷射 针的双 重功能 。另 一种分 析方法 是样品 上样到 空的纳 喷针, 在纳喷 针中的 肽不经 串联 分离直 接进人 MS。 在串联 LC-MS^MS 的多维 层析应 用中, Yates 及 其同事 使用的 融合硅 毛细管 用离子 交换和 RPLC 分 离介质 (见第 4 章) 装填。 在过去 2 〜 3 年中 ,纳 喷离子 源已在 许多蛋 白质组 学实验 室使用 。然而 ,现 有纳喷 离子源 较低的 精密度 、不 易与自 动工具 (如 自动进 样器) 的 联接以 及仪器 较低的 可靠性 都 限制了 这一方 法的广 泛使用 。由于 纳喷的 高灵敏 度优点 ,最 近已 引人更 可靠和 更容 易操作 的商业 纳喷离 子源和 附件。 纳喷技 术的广 泛使用 表明它 在蛋白 质组学 分析中 将成为 默认的 IX-MS-MS 模式。 在第 6 章最后 提到的 较新的 、功 能更 强大的 MS 仪器是 Q-TOF (四 极杆飞 行时间 ) 和 FT (傅里 叶变换 ) 质量分 析器。 FT 仪器 可达到 质量分 辨率的 极限, 已越来 越多地 在分析 复杂肽 混合物 中使用 。在 复杂混 合物中 精确和 高分辨 率的肽 质量 测定, 允许使 用与第 7 章讨论 过的肽 质量指 纹谱不 同的方 式鉴定 蛋白质 。在 FT 分析 中称为 “精确 质量标 记”的 已知肽 质量在 某些情 况下可 作为独 特的标 识 。原则 上精确 质量标 记对蛋 白质组 分析是 非常重 要的综 合方法 。限制 FT 仪器 广泛使 用的主 要因素 是昂贵 的价格 和相当 复杂的 操作。 Q-TOF 仪器 (大都 装备有 ESI 离子源 ) 在蛋白 质组学 工作中 正在被 广泛地 使用。 Q-TOF 与离 子阱和 三级四 极杆仪 器相比 其主要 优点是 TOF 质量分 析器有 高质量 分辨率 。由 于可 以提供 更高的 分辨率 和更高 的质量 精确性 ( 要有适 当的校 准 ), 因此 Q-TOF 根据肽 M^MS 数据进 行从头 序列解 释变得 更容易 。前 体离子 选择和 产物离 子分析 的高精 确性非 常有利 于用数 据库相 关算法 (见第 9 章) 从 MS~MS 谱图精 确鉴定 蛋白质 序列。 Q-TOF 具 有相当 于或更 高于离 子阱和 MAL- DI- TOF 仪 器的灵 敏度。 Q-TOF 技术最 近的扩 展应用 是该分 析器与 MALDI 联 用 。这种 结合使 MALDI 电离 的优点 与进行 MS-MS 分析的 能力相 互补充 。这与 不能进 行真正 MS~MS (见第 6 章) 的 MALDI-TOF 仪 器有很 大不同 。采 用新型 四极 杆设计 的新一 代三级 四极杆 仪器已 于最近 诞生, 它可在 分辨率 、质量 精确性 和 灵敏度 方面与 Q-TOF 质 量分析 器不相 上下。 除了这 些已有 MS 技术 的提高 或进一 步开发 ,新 的串联 质量分 析器也 不断出 现 。其 中最令 人感兴 趣的是 TOF-TOF 质量分 析器, 仪器使 用两个 不同飞 行时间 • 116 • 分析器 的串联 质量分 析器, 供高分 辨率的 前体选 择和产 物离子 的检测 。与 不能进 行真正 MS^MS 实验的 MALDI-TOF 仪器 不同, TOF-TOF 分 析器在 MS^MS 分 析中 对前体 和产物 离子有 极高的 分辨率 ,具 有基于 MALDI 的高通 量 M^MS 的 前景。 另外, 值得注 意的是 MS 在 分析细 胞和组 织蛋白 质分布 的“虚 拟成像 ”方法 中的 应用。 最近的 工作表 明可以 将组织 切片印 迹转移 到聚乙 烯膜上 ,用 MALDI 基 质包被 ,然后 对印迹 表面的 各个位 置进行 一系列 MALDI 分析。 一系列 有序的 MALDI 激光“ 发射” 的排列 和谱图 的记录 ,可 以在 整个印 迹表面 记录肽 和蛋白 质质 量的谱 图图型 。具有 特定质 量的特 征数据 表明相 关蛋白 质或肽 在组织 切片中 的空间 分布。 这种技 术的进 一步开 发和最 终与串 联质量 分析器 的联用 ,将 提供蛋 白质 组学与 生物样 品成像 研究相 结合的 有力新 工具。 15. 3 自 动化和 机器人 在本书 描述分 析蛋白 质组学 技术时 ,我们 集中在 基础技 术方面 。例如 ,在 2D 凝胶 分析中 ,可能 选择若 干蛋白 质点供 MS 分析 。这意 味着切 出每一 个蛋白 质点, 对每个 蛋白质 样品进 行凝胶 中消化 ,对所 产生的 肽进行 MS 分析, 然后用 适 当的软 件来分 析数据 。尽 管这种 方法是 可行的 ,但 它在高 通量分 析方面 是受限 制的。 而且由 于在手 工样品 加工中 不可避 免的差 异导致 每个样 品质量 的不同 。当 然, 解决这 个问题 的关键 是在分 析过程 中尽可 能的实 现自动 化操作 ,以增 加蛋白 质组分 析的速 度和可 靠性。 在 2D 凝胶的 研究中 ,有几 家公司 出售软 件可用 来帮助 凝胶中 蛋白质 点的自 动成像 。在图 型识别 和比较 算法的 帮助下 ,选 择用于 分析的 蛋白质 点可在 很大程 度 上实现 自动化 。然后 软件驱 动自动 “点切 割器” ,收 集凝 胶碎片 ,并将 碎片转 移到供 自动消 化和为 MS 做准备 的机器 人装置 。在 许多 情况下 ,这 些机器 人实际 上可以 将制备 的样品 转移到 MALDI 靶或供 LC-MS 分析的 自动进 样器。 整个过 程的 自动化 极大提 高了蛋 白质组 分析的 速度。 通过机 器人进 行的可 高度重 复的消 化 和其他 样品制 备步骤 ,减 少了手 工样品 制备时 不可避 免的操 作差异 。此外 ,控 制这 些自动 化系统 的软件 提供自 动样品 追踪和 有关方 面的质 量控制 ,这对 高通量 分 析是重 要的。 样品 分析后 的自动 化有助 于数据 分析。 例如, MS 数据 文件的 自动化 处理能 够从收 集到的 数据进 行完全 自动化 的或半 自动化 的蛋白 质鉴定 。当然 ,评 估和解 释 这些分 析结果 是我们 的任务 。自 动化工 具在样 品制备 、分 析以及 数据采 集和组 织等 方面对 蛋白质 组的大 规模分 析是必 需的。 15.4 微级和 纳级仪 器操作 实 际上在 所有技 术领域 中的一 个重要 课题是 微型化 。微 型技术 特别适 用于高 灵 敏度分 析工作 ,微型 技术中 分析工 具的大 小与分 析样品 (细胞 中的蛋 白质和 肽) 的大小 更接近 。本书 描述的 大多数 技术的 低效率 是因为 试图在 内部大 小为微 米或毫 米的柱 、凝 胶和 MS 离子 源分析 皮摩尔 或飞摩 尔的肽 。这如 同沿街 滚动几 个弹子 ,并 试图在 街道的 另一头 全部回 收这些 弹子。 由于肽 可能与 许多表 面和组 分相 互作用 ,丢失 是不可 避免的 。许多 样品转 移步骤 (移液 、层析 和从凝 胶中洗 脱) 都 可能丢 失肽。 进行微 级或纳 级分离 和仪器 操作的 总体思 路是尽 量降低 分析物 和装置 大小的 差别 ,降低 分析的 无效性 。最近 微流装 置的开 发越来 越受到 关注, 这种装 置可用 于抽提 、消 化和其 他制备 蛋白质 和肽的 步骤中 。这种 装置所 需的样 品体积 在皮升 到微升 的范围 。在 公开发 表的文 献中已 报告了 大量原 型装置 ,另有 一些在 进行专 利商 业开发 。这 种装置 的一个 共同特 征是具 有与用 于微电 路的硅 芯片类 似的结 构 ,这 有助于 电子控 制和检 测器与 装置的 结合。 新的微 型样品 制备或 分离装 置常使 用平行 设计, 可同时 进行若 干样品 的处理 和分析 。这强 调了蛋 白质组 分析的 另一个 规则: 高通量 。本 书大部 分内容 中描述 的 蛋白质 组学不 能满足 由微阵 建立的 高度平 行分析 的标准 。多 个样品 的消化 、分 离和 MS 分析 的高度 平行装 置可极 大增加 蛋白质 组分析 的速度 。最后 ,微型 MS 离子源 正在开 发中, 它可有 效地使 微型肽 分离装 置与质 量分析 器联用 。这 种离子 源原型 使用的 电离方 法包括 MALDI 和 ESI。 微型离 子源和 纳喷一 样都有 高灵敏 度 。这些 微型电 离离子 源可使 样品离 子非常 有效地 转移到 质量分 析器。 15. 5 蛋白 质微阵 最终与 DNA 微阵匹 配的蛋 白质组 学当然 是蛋白 质微阵 。然而 ,蛋白 质微阵 仍存在 问题。 寡核苷 酸微阵 技术的 基础是 互补序 列通过 Watson-Crick 碱 基配对 进行 杂交。 而蛋白 质不与 互补序 列杂交 。寡核 苷酸微 阵中的 靶标与 探针的 一一 对 应关系 ,在蛋 白质组 学研究 中是不 可行的 。但 仍有若 干实验 室正在 开发通 过蛋白 质 或肽与 微阵中 不同识 别元素 专一相 互作用 ,进行 蛋白质 分析。 蛋白质 有若干 不同的 可能识 别元素 ,包括 选择性 结合较 低的分 子到选 择性结 合高 度专一 的分子 。前 者包括 离子交 换介质 ( 通过在 特定溶 液条件 下的电 荷结合 蛋白质 或肽) 和 固定化 金属亲 和配基 (它 们识别 某些蛋 白质功 能基团 ,如 磷酸丝 氨酸 、磷酸 苏氨酸 和磷酸 酪氨酸 )。 后者 包括直 接识别 蛋白质 的抗体 。直 接识别 特 定蛋白 质序列 表位的 MAb 对 其靶蛋 白质有 高度的 选择性 。核酸 结合子 (aptamer) 是蛋白 质或肽 的另一 类高选 择性识 别分子 。结合 子是不 同的寡 核苷酸 序列, 可识别 三维空 间结构 排列独 特的氢 键供体 和受体 ,因 而不同 的寡核 苷酸序 列可 能专一 地与特 定结构 的蛋白 质或肽 结合。 在蛋白 质组分 析中许 多识别 元素已 用在从 复杂混 合物中 抽提特 定蛋白 质和肽 的操 作中。 Ciphergen Biosystem (www. ciphergen.com) 深 人开发 了这种 方法, • 118 • 该公司 提供多 种订制 的“芯 片”用 于捕获 蛋白质 ,进行 MALDI-TOF MS 分析。 使用专 一性较 低的捕 获表面 可以收 集多种 蛋白质 ,专 一性 较高的 表面化 学物质 (如 MAb) 可以捕 获单一 蛋白质 及其某 些变化 形式的 蛋白质 。尽管 完整蛋 白质的 MALDI-TOF 分 析不能 提供确 切鉴定 ,但 MALDI-TOF 提 供的图 谱变化 信息可 以提供 更深人 研究的 基础。 蛋 白质识 别元素 微阵也 可以相 当于蛋 白质组 学中的 MS 分析, 而不是 仅仅为 MS 捕获 蛋白质 。例如 ,含 有许 多不同 抗体的 微阵可 用来捕 获各种 与抗体 结合的 蛋白质 。用这 种微阵 (如用 荧光标 记二级 抗体) 可提 供对特 定蛋白 质的高 灵敏和 高通量 的筛选 。当然 ,这 种方法 的成功 使用取 决于抗 体对靶 蛋白质 的专一 性和亲 和力 、抗体 吸附化 学对抗 体效率 的影响 ,以 及抗体 与靶蛋 白质结 合条件 的严格 性 。相关 方法也 在发展 ,例如 随着结 合子产 生和鉴 定技术 的提高 ,可 以预 期使用 高专一 性结合 子微阵 。作用 于特定 蛋白质 、肽 或其修 饰形式 的结合 子的大 量开发 可 以构建 用于大 规模蛋 白质组 分析的 印刷寡 核苷酸 微阵。 对蛋 白质组 学来说 ,微 阵方法 不仅仅 是作为 采集蛋 白质组 的工具 。特 定蛋白 质微 阵可用 于研究 蛋白质 -蛋白 质相互 作用以 及药物 和其他 化学或 物理因 素对蛋 白质相 互作用 的影响 ,可 以使用 印在玻 片或多 孔板上 的蛋白 质微阵 在特定 的环境 中研究 蛋白质 -蛋白 质或蛋 白质- 药物相 互作用 。然后 可用本 书前面 描述的 MS 工 具对在 单个微 阵元素 上的复 合物成 员或蛋 白质修 饰进行 分析。 推 荐读物 Baldwin, M. A. , Medzihradsky, K. F. , Lock, C. M. , Fisher, B. , Settine- ri, T. A. , and Burlingame, A. L. (2001) Matrix-assisted laser desorption/ ionization coupled with quadrupole/orthogonal acceleration time-of-flight mass spectrometry for protein discovery, identification and structural analysis. Anal. Chem. 73 9 1707 一 1720. Chaurancl, P. , Stoeckli , M. , and Caprioli , R. M. ( 1999) Direct profiling of proteins in biological tissue sections by MALDI mass spectrometry. Anal. Chem.71, 5263 一 5270. Conrads, T. P. , Alving, K. , Veenstra, T. D. , Belov, M. E. , Anderson, G. A. , Anderson, D. J. , et al. (2001) Quantitative proteome analysis of bacterial and mammalian proteomes using a combination of cysteine affinity tags andl0N-metabolic labeling. Anal. Chem. 73, 2132 — 2139. Figeys, D. and Pinto, D. (2000) Lab-on-a-chip: a revolution in biological and medical sciences. Anal. Chem. 72, 330 A — 335 A. Lopez, M. F. (2000) Better approaches to finding the needle in a haystack: optimi- zing proteome analysis through automation. Electrophoresis 21 , 1082—1093. • 119 • MacBeth, G. and Schreiber, S. (2001) Printing proteins as microarrays for high-throughput function determination. Science 289, 1760—1763. Medzihradsky, K. F. , Campbell, J. M. , Baldwin, M. A. , Falick, A. M. , Juhasz, P. , Vestal, M. L. , and Burlingame, A. L. (2000) The characte- ristics of peptide collision-induced dissociation using a high performance MALDI-TOF/TOF tandem mass spectrometer. Anal. Chem. 72, 552 — 558. Zhu, H. , Biolgin, M. , Bangham, R. , Hall, D. , Casamayor, A. , Ber- tone, P. , Lan, N. , Jansen, R. , Bidlingmaier, S. , Houfek, T. , Mit- chell, T. , Miller, P. , Dean, R. A. , Gerstein, M. and Snyder, M. (2001) Global analysis of protein activities using proteome chips. Science 293, 2101 — 2105. • 120 • 索 氨 基酸残 基质量 58 抗体 固定化 99 免 疫沉淀 98 Western 印 迹分析 95, 105 自动化 MS-MS 谱图 的获得 48 〜 49 样 品制备 117 生物素 ICAT 试剂 的组分 91 〜 92 作为 “诱饵 ”的寡 核苷酸 衍生物 1〇2 毛细 管电泳 30 密码 子偏倚 14, 27 碰撞诱 导解离 45, 47 溴化氰 35 数据库 BLAST 检索 63 错 误和不 确定性 56, 81 基因 组序列 3, 6 Edman 降解 62 电泳迁 移率变 动测定 (EMSA), 见 寡核苷 酸-蛋 白 质结合 电喷 雾电离 (ESI) 多电荷 蛋白质 和肽离 子分析 44 ESI 离子 源描述 44 〜 45 Flicker 88 傅 里叶变 换离子 回旋加 速共振 MS (FT -ICR, FT -MS) 50, 116 基因组 人类 3, 12 〜 13 其 他生物 13 高效液 相层析 (HPLC) 离 子交换 28 〜 29, 83 反相 28, 82 〜 83 停止流 动控制 (峰 停留) 83 串联 LC (LC-LC) 83 〜 84 引 ICAT 试剂 分 析方法 91 〜 93 . 在 酵母蛋 白质组 变化中 的应用 92 化 学结构 91 局限性 93 成像 在 MALDI -TOF MS 的应用 117 2D 凝胶 成像 88 在凝胶 中消化 35, 81 离子 阱质量 分析器 46 〜 48 MS-MS 谱图 的特征 48 MSn 48 分辨率 48 等 电聚焦 (也见 2D-SDS-PAGE) 液相 27, 84 同位 素标记 89 〜 90 激光 捕获显 微解剖 79 MALDI-TOF MS (基质 辅助激 光解吸 电离飞 行时间 质谱) 优点和 局限性 41 〜 42 MALDI 离子源 的描述 38 干 扰物质 42 基 质试剂 38 离子源 后衰变 41 分辨率 40 TOF 质量 分析器 39 〜 41 MALDI -Q-TOF MS 116 质谱仪 基 本组分 37 Melanie1 M 86 〜 87 2D 凝胶 图像 的注释 86 多图 像比较 87 微阵 DNA 3 〜 4 蛋白质 118 〜 119 微 型化仪 器操作 117 〜 118 • 121 • MS-MS 谱图 肽 序列从 MS-MS 谱 图的从 头解释 59 〜 60 氨基 酸序列 对裂解 的影响 61 肽裂 解术语 58 〜 59 多 蛋白质 复合物 用串联 LC-MS-MS 进 行分析 97 〜 98 用抗 体捕获 98 〜 99 使用生 物素寡 核苷酸 作为“ 诱饵” 1〇2 使用固 定化蛋 白质作 为诱饵 100 〜 101 纳喷 116 寡 核苷酸 -蛋白 质结合 • 用 电泳迁 移率变 动测定 (EMSA) 进 行分析 101 用 MS 进 行分析 102 肽质量 指纹谱 优点和 局限性 54, 56 . 定义 51 质量精 确性的 重要性 53 专一 性蛋白 酶在肽 质量指 纹谱中 的应用 52 软件 55 〜 56 磷酸肽 用 MALDI-TOF MS 进 行分析 107 在 MS-MS 中的裂 解特征 107 〜 108 固定化 金属亲 和层析 109 蛋白酶 (见 蛋白质 消化) 蛋白质 结构域 11 生 命周期 9 〜 11 平 行进化 同源物 13 序 列基序 11, 71 〜 75 蛋白 质化学 5 蛋白 质消化 Glu-C 34 非 专一性 蛋白酶 34 概述 33 基 本原理 33 胰 蛋白酶 34 蛋白 质表达 与 mRNA 丰度 的关系 14 蛋白 质抽提 21 〜 22 蛋白质 修饰谱 MS-MS 数据 的优点 106 〜 107 序列覆 盖率的 重要性 105 〜 106 用 SALSA 进行 LC-MS-MS 数 据采集 110 〜 113 非 MS 方法 105 MALDI-TOF MS 的使用 106 〜 107 蛋白 质-蛋 白质相 互作用 (见多 蛋白质 复合物 ) 蛋 白质组 多样性 79 蛋白质 组采集 样 品选择 79 〜 80 使用 2D-SDS-PAGE 80 〜 81 使用 LC-MS-MS 82 〜 84 蛋白 质组学 定义 3 四极 杆-飞 行时间 (Q-TOF) 质量 分析器 49, SALSA 与 Sequest 的结 合使用 113 修饰和 变种肽 的检测 74, 109 〜 113 初级和 二级检 索特征 70 序列基 序检索 71 〜 74 谱图特 征检测 69 〜 70 1D-SDS-PAGE 22 〜 24, 31, 97 缺点和 局限性 24 2D-SDS-PAGE 24 〜 26, 31 缺点和 局限性 26 〜 27 在蛋 白质组 采集中 的应用 80 〜 81 序列 覆盖率 定义 106 在 定位蛋 白质修 饰中的 重要性 106 Sequest 算 法描述 63 〜 64 与 SALSA 的结 合使用 113 修饰肽 的检测 67, 109 〜 110 结 果评估 65 〜 66 局限性 65 〜 67 在蛋 白质组 采集中 的应用 82 蛋 白质鉴 定软件 (也见 Sequest) 用于 MALDI-TOF 数据 55 〜 56 用于 MS-MS 数据 67 串联 MS 谱图 (见 MS-MS 谱图) TOF-TOF 质量 检测器 116 〜 117 三 级四极 杆质量 分析器 描述 45 〜 46 MS-MS 谱图 的特征 46 分辨率 46 酵 母双杂 交测定 95 〜 97 122 中科院 噇物所 图书馆 圓111圓_»圓丨丨丨丨 S0003888 1 来 源慮 “丄 :丨七 {) 丨 ^e>. m, I 单据号 邮 f 丨马 ' ■ IH/O.UIUI . 现 代生物 技术前 沿丛书 书名 基 因免疫 的原理 和方法 RNAi: 基因沉 默指南 (影 印版) 从 基因到 基因组 — - DNA 技 术概念 和应用 (影 印版) 结 构生物 学与药 学研究 DNA 芯 片和基 因表达 (影 印版) 计算分 子生物 学导论 (翻 译版} 植物 生物技 术导论 (影 印版) 蛋白 质化学 与蛋白 质组学 进化生 物技术 —— 酶 定向分 子进化 组 织工程 (影 印版) 生物 信息学 基 因的自 身维护 与疾病 的发生 生物芯 片分析 (影 印版) 生物芯 片分析 (翻 译版) 蛋 白质组 学导论 —— 生 物学的 新工具 (翻 译版) 书号 ISBN 定价 7-03-012588-6 ’ 38 元 7-03-012685-8 65 元 7-03-012477-4 46 元 y 7-03-011688-7 48^ 7-03-012248-8 29 元 7-03-011493-0 36 元 7-03-012799-4 . 72 元 7-03—012401-4 75 元 丨 7-03-012639-4 38 元 7-03-013407-9 7-03-009895-1 7-03-013232-7 52 元 ! 7-03-012247-)$^ i 80 元 7— 03 - 01 3661 -6 7-03-014258-6 ^ 88 元 ISBN 7-03-014258-6 9 787030 1 42580 > 销售 分类建 议:生 物医学 / 生 物技术 / 分子 生物学 生 命科罕 联 系电话 : 010- http://www.lifescience.co e-mail : i nfa@l ifescienc ^ / - 编 n ISBN