生物 & HE 中 国 科 学 院 生 物 多 样 性 委员 会 Br wr whe. ED oS PEM MC = ) 中 国 科学 院 生物 多 样 性 委员 会 ae kB wu ML -一 。 中 国 科学 院 生物 多 样 性 委员 会 上 ARR TURAL IE Bi 16 号 i 4 100717 兵器 工业 出 版 社 印 刷 厂 印刷 京 发 行 所 发 行 ”各 地 新 华 书 店 经 售 人 人 OA ioo7 18 A FFA : 787 X 1092 1/16 1997 年 12 月 第 一 次 印刷 ”印张 :14. 25 印 数 :1 一 1000 字数 :410 FF ISBN 7-03-005669-8/Q。616 ”定价 :41. 00 = F 随 着 时 间 的 推移 ,生物 多 样 性 的 重要 性 越 来 越 为 社会 各 界 所 理解 和 重视 。 众 所 周 知 , 生 物 多 样 性 中 最 为 重要 的 有 物种 多 样 性 .生态 系统 多 样 性 和 遗传 多 样 性 三 个 层次 。 遗传 多 样 性 是 这 三 个 层次 中 研究 相对 较为 薄弱 的 ,在 我 国 尤其 如 此 。 遗传 多 样 性 研究 具有 十 分 重要 的 意义 。 其 研究 结果 可 为 物种 濒危 机 制 的 探讨 、 种 质 资源 的 保存 与 利用 、 生 物 分 类 与 演化 的 研究 .生态 适应 机 制 的 探讨 等 提供 重要 证 据 或 依 据 。 我 国 的 遗传 多 样 性 研究 取得 了 重要 进展 ,特别 关于 大 熊猫 濒 危机 制 的 研究 受到 国外 同行 的 关注 。 但 是 , 除 中 国 科 学 院 生物 多 样 性 委员 会 生物 多 样 性 研究 丛书 ”之 一 《中 国 。 动 植物 遗传 多 样 性 兴 胡 志 昌 和 张 亚 平 主 编 ) 以 外 ,国内 还 没有 遗传 多 样 性 方面 的 专著 出 版 。 有 鉴于 此 ,我 们 组 织 翻译 了“ 分子 进 化 基础 "中科院 昆明 动物 研究 所 细胞 与 分 子 进 化 开放 研究 实验 室 陈 建华 译 , 张 亚 平 、 吴 春花 和 李 海 鹏 校 , 其 中 序 和 前 言 由 赵 丽 惠 译 , 马 克 平 校 ) 和 分子 变异 与 生态 学 问题 (中 科 院 植物 研究 所 魏 伟 译 , 钱 迎 倩 校 ) 以 补充 国内 这 方面 资料 的 不 足 。 为 了 促进 生物 多 样 性 研究 的 重要 支撑 学 科 之 一 ,生物 系统 学 的 发 展 , 我 们 将 “生物 系统 学 议程 2000 年 "中科院 动物 研究 所 郭 寅 峰 译 , 中 科 院 植物 研究 所 钱 迎 倩 和 动物 所 周 红 章 校 ) 同 时 编 入 此 书 , 作 为 《生物 多 样 性 译 丛 》 之 三 正式 出 版 。 其 它 三 集 分 别 是 :生物 多 样 性 译 丛 一 兴 包 括 《 保 护 世 界 的 生物 多 样 性 》 和 《生物 多 样 性 一 有 关 的 科学 问题 与 合作 研究 建议 》 两 部 分 )《 全 球 生物 多 样 性 策略 》( 作 为 《 译 丛 》 之 二 ) 和 《生物 多 样 性 公约 指南 兴 作 为 《 译 丛 》 之 四 )。 我 们 将 继续 选择 国外 本 领域 好 的 资料 翻译 出 版 ,及 时 把 国外 新 的 理论 、 方 法 和 动态 介绍 到 国内 ,以 推动 中 国 的 生物 多 样 性 保护 和 朋党 工作 。 北京 教育 学 院 刘 玉 明 先生 和 中 科 院 植物 所 赵 丽 惠 同 志 认 真 校订 译 稿 ,北京 海岸 文 化 服务 中 心 刘 万 海 先生 大 力 支持 。 在 此 ,向 他 们 表示 衷心 的 感谢 。 马克 平 1997 7 A 25 8 = 《分 子 进化 基础 》 Savayecensnavovsueesesnansaucsusavieveces soscussesccesensesscessocesssvcsscscenscaseceassesnceess (5) | 基因 结 析 与 突变 - … (6) (16) - (16) 前 言 ………… 2 群体 中 基因 的 动力 学 … 2.1 等 位 基因 频率 方面 的 改变 ee 2-9 ones. PTTTTT ELINOR ETE TIP ee erie Ti errerrerr err err errr 2. A ATRL BEIK KI) pp Ze 2. Ze 5 基因 替换 - 6 遗传 多 态 性 - 7 新 达尔 文学 说 与 中 性 突变 假说 - 3 ” 核 背 酸 序列 中 的 进化 变化 … 3.2 两 DNA 序列 间 的 核 苷 酸 蔡 换 数 4 4 和 28 若 换 速率 变异 的 原因 eev eee eee cee ee 4. 4. 4 APF BP ceecee ccc ceeceeeeecee Sic 4.5 细胞 器 DNA 中 的 替换 速率 4. 4. 5 分 子 系统 发 育 … 和 5. 5. WME ode TOWEL ccs cob Mee ccelecalecececcccccvccecevaneuentne'se 办 BE a ees eee SO ee Sa 用 前 稿 宦 本 二 直属 5. © PPR TCHR YH cnc ccc ccc ccc cccccessenececen cesses cee ceccce scenes cee see see seuss asec ces ces cescesecs 9 a 5. 7 物种 分 岐 时 间 的 估计 …………………: BB 二 9 人 和 猿 的 系统 发 育 os 分 子 古 生物 学 … 录 (3) (6) (7) “@) ead) (16) (199 «C219 * (22) - (24) = (26) (28) 二 (3]) a ll FT IE FE ll FT SE EE: [| Sob ons sen cocieow cue dewccwens cos con cus cnn cocens sovece conser ees 和 0 .1 PERF PREPAY RE en ee rte cedhapeents akedec ese terectesteey (HGS 3 —AS TE VE FE Ps FL AE FAH FR BM one nee ne nee cee cen ccc cee cence cee cen ens cce cence sescee cee ces see - (48) (28) (34) (37) (42) (42) (47) 二 6 ABR E 因 市 的 芒 考 酸 若 和 换 寞 式 二 0 多 同 义 密码 子 的 非 随机 应 用 oo csecee cesses cesses see cen aes 本 。(60) (53) (55) (60) (64) - (68) (69) (70) - (70) 如 条 5. 10 线粒体 和 叶绿体 的 内 共 牛 起 源 .pe ee °° - X7es (76) 5. 12 深 色 海 滩涂 :物种 保护 生物 学 中 的 一 次 教训 PR 6 由 基因 重复 和 外 显 子 混 匀 造成 的 进化 …………- naginul neninsanen sos cacecbsusvos cos ves ete 6.1 DNA 重复 的 类 型 … G. 2 IRAIDR GB cnc evncceessccccnncce ene ccenccessccesesceenns cesses concer cesses ccs see ces cee ssacee ens seeaen acs 6. 3 域 重 复 和 基因 的 延长 .ee 6.4 基因 家 族 的 形成 与 新 功能 的 获得 pe 6. 5 重复 基因 的 无 功能 化 ee 6.7 珠 蛋 白 基 因 超 家 族 revere ee ee G. 产 下 新 商 能 的 恋 通 和 途 物 .oo G. 10 Bo Be SCTE BU IRIEL, .0 TURE ERE HEAL, woe -nn om ene nen coc ceneee coc eencen enn sesces ses cce coe ose ens ese een eos coe ess cen caskennay nama DD BE Bie Fie EI woe ane con san con ons coc ces coe eee nce ese sab sscnas cos cesnanascaunapetes sescees 2 可 转 座 因子 … 3 反 录 序列 … 4 转 座 对 宿主 基因 组 的 影响 .. 的 向 全 寺 人 7 Hi 全 ‘- 7.5 杂种 劣势 … 7.6 转 座 与 物种 形成 … is 人 7 可 转 座 因 子 拷贝 数 的 进化 动力 学 ……………: 8 水 平 基因 转移 … 8 基因 组 的 组 织 化 和 进化 .JIC 值 … sees .7 细菌 的 GC 含量 … go 90 90 90 90 90 go gp ames 词汇 表 … 主题 索引 Eeessssseseseeaseeoeooeeeeoooooeceeoooecoeooooooooceoaooacoaos 二 .2 细菌 的 基因 组 大 小 的 进化 … ou eue cos ose ade oan ou won sein sansa uly euiaet wine ene ee a EOIN FA C—A HED 000 ono nee ccscee one cseuesuse ene consontss oneies tan A FRG HE Wy FE BAY Be BEY oon eee ccc ccc ccc ccc recccecencccccsccccesccecce cov ces cesses cesses ces cee ce Se Ti BO IN HG BIL, Fel] =2~ 22-002 one cee cee ces ces concen ace cee con ead ses eseors dus ena ase sane enna I MT EEG ann vox oes uns cee coe essen oss ons vesisnn ces tue ccs eua¥enasnienne 5B ee PAE 2d ee dd _E BY Y, 20e one vee ee Wes He) FO FR BE] cee cee cee cee cee cee cee cence cen ceeeee ccs seeneeceeceneescseees 引言 hy Rh De 《分 子 变异 与 生态 学 1 材料 来 源 seessessessooesoooosoossssessssssssssssooosooo oo 。 2 DNA—DNA 杂交 soe ne cee cee cee cee cee eee eee eee eee ses wee canes 3 限制 性 片段 分 析 和 pp A DNA 指纹 分 析 cee cee reece cee cee cence ces eee ees cee cence cen ces 5 DNA 放大 ooesosoossssessssssssoeosoosososssssesssssssossssossoosoo oo 。 问题 》 i) 性 别 鉴定 Sesoasceseaeeeseeeseseeeseseseessesseeeesseseeesoesoesesees ww ww ww wr (2000 年 系统 学 议程 :制订 生物 圈 计 划 》 - (198) - (199) esos cecccganasenereces sce scccsccecccccssccscsseceess (2()]) 系统 学 知识 及 生物 多 样 性 的 价值 … ee 内 容 提要 … 导言 … seeeo ee ooooooooooooooooooooooooooooo。 2000 年 系统 学 议程 :制订 生物 圈 计 划 … 人 类 健康 … 物种 经 济 学 … 林业 .… cee cee cee cee ceee 加 强 科 学 研究 … 2000 $6 GEE RAYE ccc cee ce eee cesce ees 第 一 项 任务 : ERD BS PEE ZBL HE A Se + 第 二 项 任务 :分 析 这 个 全 球 发 现 计划 获得 的 信息 ,并 将 其 融合 于 一 个 能 反映 生命 史 的 预测 性 分 类 系统 … 第 三 项 任务 :把 这 个 全 球 计 划 获 得 的 信息 整理 成 为 一 种 有 效 的 .可 查询 的 形式 , 以 最 大 限度 地 满足 科学 和 社会 的 需求 … —* 基础 设施 Poser ¢ . vila of SSS oo eee 2000 年 系统 学 议程 完善 了 其 他 生物 多 样 性 计划 pp 对 2000 年 系统 学 议程 的 投资 . 人 ee 参考 文献 … 词汇 … 区 变性 梯度 凝 胶 电 泳 sosooooeooooooooovoovooooooooooooooooooooooooooooooooooovoooooooooooooooooooooosoooooo oo 生态 学 应 用 aeeeeeeseeessesoeeesseeoeeoeeseeeoeoeoseeoesoeososooesoosooososeososoossoessesssessssessososesseooossoseeoosseooosooe - (184) 5 渐 渗 现象 与 杂交 地 带 ssesasaesesaeessceoeseeeoesoseessesecssoesosseeseeeesesessseoeooseseoessesessesoeeesooasesesa5sseeas 6 物种 的 鉴定 于 (184) (184) (184) (185) (186) (187) (187) (188) (188) (188) (197) (201) 基因 7 HE AW. FEE AE YE hh --e ee es TB FAA BF HBR AE hr SFE Gh nnn one ene ere cnn ces cnn enecesace cee con ces cesses casas cesses sescescesceeces 本 - (208) > (208) > (208) (202) (203) (204) (205) (206) (207) - (209) * (212) - (216) © (217) (214) (216) (217) (218) - (2208 chs se | 7 ae 二 ‘ 二 > “ ve ¢ - oe te : 有 ¢ das beeamebadeetess =: ae * oS ye RE a vu. x ae see rn yee i y iw eae eeeree 四 ove 4 ie a a ieee; GOT e x — ewer pees, +s * ‘me . eh 0 Ee 分 子 进 化 基础 原作 : 李 文 雄 〈 美 国 得 克 萨 斯 大 学 ) D. 蕊 劳 尔 〈 以 色 列 特拉维夫 大 学 ) 翻译 : 陈建华 Fundamentals of Molecular Evolution Wen-Hsiung Li (The University of Texas, Houston) Dan Graur (Tel Aviv University ) Sinauer Associates, Inc. , Publishers Sunderland, Massachusetts, 1991 Ties 序 1869 年 ,Johann Friedrich Miescher 发 现 了 DNA。 他 曾经 “大 胆 ” 地 认为 ,DNA 可 能 和 遗传 有 关 。 但 过 了 一 段 时 间 ,, 他 还 是 放弃 了 这 种 “ 荒 订 ” 的 观点 ,并 花费 30 多 年 的 时 间 去 研究 鱼 精 蛋 白 一 精子 细胞 中 非常 基本 的 蛋白 质 组 分 。 按 照 Miescher 的 观点 , 这 种 蛋白 质 是 遗传 的 关键 所 在 。 后 来 发 Bh, DNA 分 子 不 仅仅 是 遗传 的 关键 ,正如 一 位 分 子 进 化 学 先驱 Emile Zuckerkandl 所 说 的 那样 , 它们 还 是 “进化 史 的 文献 资料 ”。 实 际 上 , 每 一 种 活 组 织 的 DNA 都 是 历史 过 程 的 积累 。 然 而 , 包 容 在 这 些 过 程 里 的 信息 处 在 一 种 杂乱 无 章 的 无 序 状 态 中 , 是 分 散 的 或 片段 的 。 有 一 些 信息 是 隐藏 的 或 是 “伪装 ”的 ,很 难 辩 认 出 来 ; 有 一 些 已 丢失 , 毫 无 踪迹 可 寻 。 分 子 进 化 的 目的 就 是 要 澄清 这 些 历 史 过 程 , 整 理 信息 使 之 有 序 , 读 出 并 解 译 信息 。 由 于 进化 过 程 难以 用 基因 材料 研究 清楚 , 用 分 子 资料 不 仅 可 以 重建 进化 年 代 , 而 且 也 可 以 弄 清 进化 过 程 的 驱动 力 。 分 子 生 物 学 的 重大 突破 , 如 基因 克隆 技术 、DNA 序列 分 析 、 限制 性 核酸 内 切 栈 片段 分 析 等 , 在 某 种 意义 上 , 已 使 科学 家 们 处 于 一 种 新 的 十 分 有 利 的 位 置 。 我 们 能 够 洞察 一 个 从 未 见 过 的 世界 ,在 这 里 , 基 因 是 通过 复制 、DNA 混 匀 、 核 苷 酸 蔡 代 、 转 移 及 基因 转化 进化 的 。 在 这 个 世界 里 , 基 因 组 或 静止 , 或 流动 , 有 时 在 过 了 很 长 时 间 后 会 有 微小 的 变化 , 有 时 又 会 在 媳 眼 间 发 生 戏剧 性 的 地 质 学 斥 度 的 变化 。 通过 研究 遗传 材料 , 我 们 也 能 试 着 将 生物 界 按 系 统 发 育 事实 来 划分 , 并 建立 分 类 系统 。 与 传统 的 研究 进化 方法 相反 , 例 如 比较 解剖 学 、 形 态 学 和 古生物 学 , 都 毫 无 必要 地 将 自己 限制 在 极端 相似 组 织 的 进化 关系 研究 中 。 我 们 现在 已 经 能 够 建立 巨大 的 家 系 树 , 它 连接 兰 椎 动物 、 昆 贝 、 植 物 、 真 菌 和 细菌 , 并 能 够 追溯 它们 的 共同 祖先 , 一 直到 无 法 追溯 的 时 代 。 本 书 的 宗旨 是 从 分 子 水 平 上 描述 进化 的 原动力 , 进 化 过 程 的 驱动 力 及 其 基因 组 , 基 因 和 它们 的 产物 长 期 进化 的 各 种 分 子 机 制 所 产生 的 结果 。 另 外 , 本 书 从 进化 观点 为 分 子 材 料 的 比较 和 系统 发 育 分 析 提 供 了 基本 的 方法 论 。 尽 管 个 体 受 自然 选择 和 其 它 过 程 所 影响 , 我们 依然 强调 : 是 群体 和 基因 随 着 进化 时 间 而 变 。 为 了 在 这 些 看 起 来 完全 不 同 的 水 平 间 构造 联系 , 我 们 借用 了 群体 遗传 学 的 基本 。 我 们 着 手 为 分 子 进 化 “初学 者 ” 写 了 这 本 书 。 同 时 , 也 努力 保持 了 方法 的 科学 和 规范 , 并 包含 了 一 些 定 量 方法 。 因 此 , 可 以 用 数学 和 直觉 解释 , 从 分 子 水 平 上 描述 进化 现象 和 机 制 。 这 两 种 解释 都 不 会 削弱 彼此 的 说 服 力 , 还 会 相互 补充 , 以 帮助 读者 更 好 地 领会 观点 。 我 们 没有 试图 达到 泛泛 的 完满 性 , 而 是 提供 了 大 量 实例 , 以 支持 和 澄清 许多 理论 观点 和 有 争议 的 问题 。 许多 年 来 , 生 物化 学 家 和 分 子 生物 学 家 们 把 进化 研究 看 作 是 大 胆 推 测 , 无 根据 的 假设 和 无 学 科 方法 论 的 统一 体 , 而 这 种 评价 从 未 正确 过 。 分 子 方法 的 引进 不 容 置疑 地 将 进化 论 变 成 一 种 “ 硬 ” 科 学 。 在 这 里 , 能 够 从 经 验 数据 测度 、 计 数 或 用 计算 机 处 理 相关 的 参数 , 也 能 用 事实 去 检验 理论 的 正 确 性 。 在 今天 的 进化 研究 中 , 推 测 学 也 服务 于 同 物理 学 同样 的 目的 。 它 们 是 定量 性 假说 , 以 刺激 实 验 性 工作 。 由 此 , 理 论 能 够 得 以 校正 、 精 炼 或 被 驱 斥 。 本 书 的 主要 目的 之 一 是 通过 加 强 本 领域 的 事 实 基础 ,表明 进化 研究 已 经 达到 了 William Herschel 先生 于 1831 年 所 说 的 所 有 自然 科学 的 共同 目的 , 即 可 以 这 样 陈 述 其 主张 :“ 不 是 模糊 和 泛泛 的 , 而 是 在 位 置 、 重 量 和 量度 上 尽 可 能 精确 ”。 我 们 感谢 许多 同事 、 学 生 和 朋友 , 是 他 们 帮助 我 们 编辑 了 本 书 。 他 们 的 评论 、 建 议 、 指 正和 讨 论 大 大 地 提高 了 本 书 的 质量 , 也 避免 了 许多 。 我 们 荣幸 地 感谢 Sara Barton, Adina Breiman, David Cutler, David Hewett-Emmett, Winston Hide, Austin Hughes, Li Jin, Margaret Kidwell, Amanda Ko, Giddy Landan, William S. Lewis, Volker Loeschcke, Ora Manheim, David Mindell, Tatsuya ota, Lori Sadler, Paul Sharp, Yuval Shuali, Jurgen Tomiuk, Danid Wool 和 Chung-1 Wu. #5!) +h jit ot . HR 们 感谢 C. William Birky Jr. 和 Bruce walsh, 他 们 两 位 从 头 到 尾 地 校 阅 了 文稿 并 提出 了 很 多 有 益 的 建 3 . lei 博士 表达 感激 之 情 , 他 对 我 们 的 调查 研究 工作 给 予 了 极 大 的 鼓 一 以 色 列 两 国 科学 基金 会 的 支持 也 是 本 项 合作 成 果 得 以 面世 的 rr ae yes Ae 9 eS : mC Ts ES Heal Laas tab oF hae hah wt H2 se 人 让 Ea He tua a wt Py vu : ask : ry 7 ‘ i We 各 - ' ; pony ene om ce we Wee 的 六 eae Re. Re et . 15 CW A pee ee 区 机 了 同人 克 册 六 所 3 时 和 上 iz 7h ha EY TT Bg. py ae +i Oe ee Poe) "DIA Joxegrel Jral a i gH Mate SOT oda IO . aioe - og it a tutto Ton W i Lg alain 让 Mae Wea X@ 前 言 什么 是 分 子 进 化 分 子 进化 包括 两 个 研究 领域 : (1) 大 分 子 进 化 ; (2) 基因 和 有 机 体 进 化 史 的 重建 。 关 于 “大 分 子 进化 ", 我 们 指 的 是 在 进化 年 代 中 , 出 现在 遗传 材料 〈 如 DNA 序列 ) 中 的 变化 速率 、 模 式 及 产物 CME AR) 以 及 与 此 变化 相关 的 机 制 , 也 被 称 做 分 子 种 系 发 生 史 。 时间 枚 总 覃 分 于 认 化 这 《正如 从 分 子 材料 所 推 知 的 那样 ) 。 这 两 个 研究 领域 似乎 由 不 相关 的 研究 项 目 组 成 , 因 为 第 一 个 研究 领域 的 目的 是 要 盏 明 分 子 进化 的 原因 和 结果 ; 而 第 二 个 研究 领域 是 仅仅 把 分 子 用 作 工 具 , 以 重建 有 机 体 及 其 遗传 组 分 的 演化 史 。 然 而 在 实践 中 , 这 两 个 方面 是 紧密 相关 的 , 一 个 领域 的 进步 也 会 促进 另 一 领域 的 发 展 , 例 如 : 种 系 发 ” 生 知 识 对 决定 分 子 特 征 的 变化 顺序 是 很 必要 的 ; 相反 , 给 定 分 子 的 变化 模式 和 速率 知识 对 试图 重建 类 和 群 的 进化 史 是 很 重要 的 。 ESL, 第 三 个 研究 领域 , 前 生物 (Prebiotic) 进化 或 称 “ 生 命 起 源 ” 也 包含 在 分 子 进化 框架 中 。 然而 , 它 涉及 到 很 多 猜想 , 也 极 少 用 到 定量 方法 , 并 且 , 在 前 生物 系统 〈 即 缺乏 可 复制 基因 的 系 统 ) 信息 传递 过 程 的 规律 , 目 前 还 不 清楚 。 因 此 , 本 书 并 不 侧重 生命 起 源 , 有 兴趣 的 读者 可 以 参阅 Oparin (1957), Cairns-Smith (1982), Dyson (1985) 和 Loomis (1988) 的 著作 。 分 子 进化 研究 起 源 于 两 个 不 同 的 学 科 : 和 群体 遗传 学 和 分 子 生 物 学 。 群 体 遗 传 学 为 研究 进化 过 程 提供 了 理论 基础 , 而 分 子 生物 学 则 为 其 提供 了 经 验 数据 。 因 此 , 掌 握 群 体 遗 传 学 和 分 子 生 物 学 的 基 本 知识 对 理解 分 子 进化 是 很 有 神 益 的 。 Ket 1 基因 结构 与 突 本 章 提供 为 研究 DNA 水 平 上 的 进化 过 程 所 必需 的 .关于 分 子 生物 学 方面 的 基础 知识 。 最 为 基本 的 部 分 是 一 种 典型 的 真 核 生物 基因 的 基因 组 结构 和 各 种 突变 类 型 。 更 进一步 的 背景 知识 将 在 以 后 的 有 关 章 节 中 讲述 出 。 某 些 术语 请 参看 词汇 表 。 1.1 DNA 序列 除 某 些 病毒 外 ,所 有 生物 的 遗传 信息 都 由 脱氧 核糖 核酸 DNA (deoxyribonucleic acid) 分 子 所 扒 带 。DNA 通常 是 由 两 条 相互 缠绕 的 互补 链 所 组 成 ,形成 一 种 右手 螺旋 状 。 每 条 链 都 是 一 条 由 四 种 核 背 RAMA ARE RK HR. A PE (purines) : PR ERM A (adenine) fl & RM G(guanine) , Pi FP he (pyrimidines) ; fg fit % GE T (thymine) Fil fd he CCcytosine) 。 两 条 链 靠 核 苷 酸 之 间 的 氢 键 联系 在 二 起 。 腺 味 叭 与 胸腺 喀 啶 通过 两 个 氢 键 ,又 称 弱 键 (weak bond) 配 对 ;而 鸟 味 叭 与 胞 旷 啶 通过 三 个 氢 键 ,又 称 强 键 Cstrong bond) 配 对 (图 1 一 1)。 * HR BR a Moe Hin IER AS (a) H \ N—Heeeeese O i \ YN Neesece me a Fe Se (P) (s) O 〇 eeeseee H—N J Af PH We SiR (b) 图 1 一 1 Sahm He Boe Cy Bl A i oR) Be AT, Ca) A Ae AR HR Fo ARR SZ ie (25 BE) , fo Cb) AE LER Fo B 之 间 ( 强 键 )。P :磷酸 根 ;S : 糖 。 DNA 序列 中 的 每 一 个 核 苷 酸 都 包含 一 个 成 糖 ( 脱 氧 核糖 )、 一 个 磷酸 基 团 和 一 个 味 叭 或 喀 喧 碱 基 。DNA 分 子 的 主干 由 糖 和 磷酸 等 部 分 构成 ,它们 通过 不 对 称 的 5 一 3' 磷 酸 二 酯 键 共 价 连结 在 一 起 。 所 以 ;DNA 分 子 是 一 种 有 极 性 的 分 子 , 它 的 一 端 ,在 末端 核 苷 酸 的 5' 碳 原子 上 有 一 个 磷酸 根 ( 一 P), 另 一 端 ,其 末端 核 苷 酸 的 3 碳 原 子 上 有 一 个 游离 羟基 (一 OH) .磷酸 二 酯 键 的 方向 决定 着 分 子 的 特性 ; 。6。 例如 ,序列 5 一 G 一 C 一 A 一 A 一 工 一 3 与 序列 3' 一 G 一 C 一 A 一 A 一 工 一 5 是 两 种 不 同 的 序列 。 为 了 方 便 起 见 ;DNA 序列 按 其 转录 的 顺序 , 即 从 5' 端 到 3' 端 书写 ,它们 又 分 别 被 称 为 上 游 (upstream) 和 下 游 (downstream) 方 向 。DNA 的 双 螺 旋 形 式 有 两 条 链 , 按 反 辕 平行 方向 排列 着 (图 1 一 2)。 5’ P+dk-—P—dk—P—dR-~P die OM 3 bs rif ew etme C T T G 3’ RA RS St ee ve 图 1 一 2 双 链 DNA 的 反 向 平行 结构 的 图 示 P, 磷 酸根;dR ,脱氧 核糖 ;CH, 凑 基 ;A, 腺 味 叭 ;G, 鸟 味 叭 ;C, 胞 喀 啶 ; 工 ,胸腺 喀 喧 ;一 , 共 价 键 ;.,,。, 弱 键 ;…, 强 键 。 核糖 核酸 RNA(ribonucleic acid) 既 有 双 链 分 子 又 有 单 链 分 子 。RNA 与 DNA 不 同 之 处 在 于 ,其 主 王 糖 的 部 分 是 核糖 而 不 是 脱氧 核糖 ,由 尿 喀 啶 核 苷 酸 代 替 了 胸腺 喀 啶 核 苷 酸 。 腺 味 叭 , 胞 喀 啶 , 鸟 嘲 叭 ,以 及 胸腺 喀 啶 / 尿 喀 啶 ,都 是 标准 核 苷 酸 。 某 些 功能 RNA 分 子 , 特 别 是 tRNA 分 子 , 常 含有 非 标 准 核 苷 酸 , 即 在 转录 之 后 导入 RNA 分 子 中 的 、 将 标准 核 苷 酸 加 以 化 学 修饰 的 核 苷 酸 。 1.2 基因 结构 过 去 ,基因 被 定义 成 为 一 个 多 肽 链 编码 或 确定 一 个 功能 RNA 分 子 的 一 个 DNA 片段 。 然 而 ,最 近 的 分 子 研 究 却 从 根本 上 改变 了 我 们 对 基因 的 认识 ,所 以 ,我 们 将 采用 一 个 更 有 点 生气 的 定义 , 即 基因 是 对 某 一 特殊 功能 至 关 重 要 的 基因 组 DNA 或 RNA 的 一 个 序列 。 执行 这 一 功能 可 能 并 不 需要 该 基因 被 翻译 出 来 ,甚至 无 需 被 转录 出 来 。 现在 ,已 有 三 类 基因 被 认识 :(1) 为 蛋白 质 编码 的 基因 (protein-coding genes) ,它们 在 被 转录 成 RNA 之 后 再 被 翻译 成 蛋白 质 ;(2)RNA 基因 (RNA-specifying genes) ,它们 仅 被 转录 ;(3) 调 节 基 因 (regulatory genes) 。 按 照 狭 义 的 定义 ,第 三 类 只 包括 那些 不 转录 的 序列 。 被 转录 的 调节 基因 本 质 上 属 于 前 两 类 之 一 。 和 蛋白 质 编码 基因 和 RNA 基因 又 被 看 成 是 结构 基因 (structural genes), 注意 , 某 些 作者 将 结构 基因 的 定义 ,限制 在 只 包括 蛋白 质 编码 基因 的 范围 。 在 细菌 中 ,结构 基因 的 转录 仅 由 一 种 依赖 DNA 的 RNA 多 聚 酶 执行 。 与 之 不 同 的 是 ,在 真 核 生 物 里 要 用 到 三 种 RNA 多 聚 酶 。 核 糖 体 RNACrRNA) 基 因由 RNA 多 聚 酶 工 转录 ,蛋白质 编码 基因 由 RNA 多 聚 酶 工 转录 ,小 分 子 细胞 质 RNA(CscRNA) 基 因 , 象 转 移 RNA(CtRNA) 的 基因 , 则 由 RNA 2B 酶 开 转 录 , 某 些小 分 子 细胞 核 RNA(snRNA) 基 因由 多 聚 酶 工 转 录 , 另 一 些 则 由 多 聚 酶 下 转录 。 一 种 snRNA 基因 Us ,可 能 既 被 多 聚 酶 工 又 被 多 聚 酶 下 转录 。 蛋 和 白质 编码 基因 真 核 生 物 的 一 个 标准 的 蛋白 质 编码 基因 由 转录 部 分 和 不 转录 部 分 构成 (图 1 一 3a)。 不 转录 部 分 根据 它们 相对 于 蛋白 质 编码 基因 的 位 置 ,被 命名 为 5 和 3' 侧 序列 (flanking sequences) , 5! fill FF A&A LES RFA) ,它们 决定 转录 过 程 的 起 始 、 缓 急 和 终止 。 因 为 这 些 调节 序列 起 始 转录 过 程 , 所 以 ,它们 也 被 称 为 启动 子 (promoters) ,而 它们 所 处 的 部 位 则 叫 启动 子 区 (promoter region)。 启 动 子 区 由 以 下 信号 构成 :TATA 块 (TATA box) ,位 于 转录 起 始点 上 游 19 一 27 碱 基 对 (bp) 处 ,更 上 游 一 些 的 CAAT (CAAT box) ,以 及 一 个 或 多 个 GC 块 (GC box) 拷 贝 , 后 者 由 序列 GGGCGG 或 其 变异 体 组 成 ,位 于 CAAT 块 的 周围 (图 3a) 。 可 能 在 定向 方面 起 作用 的 CAAT 块 和 GC 块 , 控 制 RNA 多 聚 酶 的 起 始 联结 ,而 TATA 块 则 控制 转录 起 始点 的 选取 。 不 过 ,我 们 注意 到 ,以 上 信号 对 启动 子 的 功能 而 言 都 不 是 必 不 可 少 的 。 某 些 基 因 不 具有 TATA 块 ,所 以 没有 一 种 独一无二 的 转录 起 始点 . 另 一 些 基 因 婚 没有 CAAT 块 也 没有 GC 块 ,它们 的 转录 起 始 是 受 5' 侧 区 域 中 的 其 他 因素 所 控制 的 .3' 侧 序列 含有 关 于 转录 过 程 终止 的 信号 和 多 聚 腺 苷 酸 尾部 的 信和 号。 目前 ,还 不 能 精确 地 标明 三 个 基因 开始 和 终止 的 位 en? 点 。 真 核 生物 中 为 蛋白 质 编码 的 基因 的 转录 起 始 于 转录 起 始 部 位 (transcription-initiation site) (RNA 转录 物 中 的 帽子 部 位 (cap site)) ,结束 于 终止 部 位 (termination site), 后 者 与 成 熟 信 使 RNACmRNA) 分 子 的 多 聚 腺 苷 化 作用 (polyadenylation) 或 多 聚 腺 苷 酸 尾 部 位 (poly(A)-addition site) 可 能 等 同 , 也 可 能 不 等 同 。 换 言 之 ,转录 的 终止 可 能 发 生 在 比 多 聚 腺 苷 酸 尾部 更 下 游 的 地 方 。 转 录 而 成 的 RNA, 又 称 前 信使 RNA(pre-messenger RNA)(pre-mRNA) 包 含 5 和 3' 不 翻译 区 ,Cuntranslated regions) ,外 显 子 (exons) 和 内 含 子 (introns) 。 内 含 子 ,或 插 和 人 序列 ,是 一 些 虽 被 转录 但 在 前 mRNA 分 子 的 加 工 中 被 剪 除 的 序列 。 所 有 保留 在 经 拼接 而 达成 熟 的 mRNA 中 的 基因 组 序列 称 外 显 子 。 oe 外 显 子 的 某 些 部 分 称 为 蛋白 质 编码 的 外 显 子 或 编码 区 (coding regions) 。 有 几 种 类 型 的 内 含 子 , 按 它们 从 前 mRNA 中 剪除 的 特异 机 制 来 界定 其 性 质 ( 见 Lewin,1990)。 这 里 我 们 只 关心 那些 受 RNA 多 聚 酶 工 转 录 的 细胞 核 基因 中 的 内 含 子 。 这 些 内 含 子 在 分 子 成 熟 期 间 ,在 酶 促 作 用 下 从 前 mRNA 中 剪除 。 这 些 内 含 子 的 拼接 位 点 (splicing sites or junctions) 可 能 由 每 三 内 含 子 的 5 和 3' 端 上 的 核 苷 酸 来 决定 ,分 别称 给 体 (donor) 和 受 体 (acceptor) 部 位 。 例 如 ,所 有 真 核 生 物 的 细胞 核 内 含 子 都 以 GT 开始 ,以 AG 结束 (GT 一 AG 规则 (GT-AG rule)) ,而 已 表明 这 些 序列 对 于 正 确 的 剪 切 和 拼接 是 至 关 重 要 的 (图 1 一 3a)。 和 邻近 内 含 子 的 外 显 子 序列 可 能 对 拼接 部 位 的 决定 也 有 贡 献 。 此 外 ,每 一 内 含 子 都 含有 一 段 特别 的 序列 ,TACTAAC 框 (TACTAAC box) ,位 于 内 含 子 3/ 端 上 游 侧 序列 区 外 显 子 2 外 显 子 3 。 侧 序列 区 Aa fs az Z SE | | | | | | 起 始 密码 子 终止 密码 子 | 起 始 密码 子 起 始 密码 子 终止 密码 子 | -35 转录 起 始 A 终止 密码 子 (b) 图 1 一 3 (《a) 典 型 真 核 生 物 的 蛋白 质 编码 基 因 的 图 示 结 构 。 注 意 , 按 照 习惯 5/ 端 放 在 左边 . (b) 受 诱导 的 原核 生物 的 操纵 子 的 图 示 结 构 。 基 因 A 和 也 是 为 蛋白 质 编码 的 基因 ,并 被 转录 形成 一 个 信使 RNA。 阻 遇 物 基因 为 二 个 阳台 县 白 编码 ,后 者 结合 在 操纵 基因 上 ,并 通过 过 制 RNA 多 聚 酶 的 移动 从 而 阻碍 结构 基因 的 转录 。 操 纵 基因 是 二 段 至 风 有 10 个 碱 基 长 的 DNA 区 域 , 它 可 能 与 操纵 子 中 基因 的 被 转录 区 域 重 重 。 经 与 一 种 诱导 物 (二 种 小 分 子 ) 结 大 后 ,天 坎 物 转化 成 一 种 不 能 与 操纵 基因 结合 的 形式 。 于 是 RNA 多 聚 酶 就 能 起 动 操纵 子 中 基因 A fo BMH RL Lewin 1990)。(a 和 (b) 两 图 中 的 各 区 都 不 是 按 其 尺度 来 画 的 . 约 30 个 碱 基 的 地 方 。 这 一 序列 在 酵母 细胞 核 基 因 中 是 相当 保守 的 ,而 它 在 更 高 等 的 真 核 生 物 的 基因 申 则 要 变化 得 多 样 一 些 。 拼接 过 程 包括 5 拼接 部 位 的 裂 开 ,以 及 内 含 子 5 端 的 G 和 TACTAAC 框 中 第 6 位 上 的 A 之 间 形 成 克 酸 二 酯 键 。 随 后 ,3' 拼 接 部 位 裂 开 , 而 两 个 外 显 子 则 被 连 在 二 起, 内 含 子 的 数目 因 基因 而 异 。 某 些 基因 具有 十 几 个 内 含 子 , 其 中 有 些 内 含 子 可 能 有 几 千 个 核 昔 酸 长 。 另 三 些 ( 例 如 ,大 多 数组 蛋白 基因 ) 则 完全 没有 内 含 子 。 外 显 子 在 整个 基因 中 并 不 是 均匀 分 布 的 。8 。 有 些 外 显 子 密 集 在 一 起 ,另外 一 些 则 位 于 与 邻近 外 显 子 相距 很 远 的 地 方 。 图 1 一 4 给 出 了 说 明 这 一 现 象 的 一 个 例子 。 注意 ,细胞 核 蛋 白质 编码 基因 的 绝 大 多 数 具 有 内 含 子 。 并 非 所 有 内 含 子 都 起 分 裂 编码 区 的 作用 。 有 些 内 含 子 出 现在 不 翻译 区 域 ,主要 在 转录 -起 始 位 点 和 起 始 密码 子 之 间 的 区 域 中 。 真 细菌 类 的 蛋白 质 编 码 基因 与 真 核 生 物 中 的 这 类 基因 有 几 方 面 不 同 , 最 重要 的 是 ,它们 不 含 内 含 F (图 1 一 3b)。 真 细菌 中 的 启动 子 含 有 一 个 一 10 序列 (一 10 sequence) 和 一 个 一 35 序列 (一 35 se- quence) ,分 别 位 于 转录 起 始 位 点 上 游 10bp 和 35bp 的 地 方 . 前 者 也 称 普 里 伯劳 块 (Pribnow box) RA 序列 TATAAT 或 其 变异 形式 ,而 后 者 则 具有 序列 TTGACA 或 其 变异 形式 。 原 核 生 物 的 启动 子 在 离 一 35 序列 更 上 游 的 地 方 , 可 能 还 含有 其 他 一 些 特别 的 序列 。 原核 生物 中 几 个 结构 基因 可 能 呈 连 续 排 列 以 形成 一 个 基因 表达 单位 , 它 被 转录 成 一 个 mRNA 分 子 ,接着 再 翻译 成 不 同 的 蛋白 质 。 这 种 单位 通常 都 含有 控制 属于 该 单位 的 基因 协调 地 表达 的 遗传 因 素 。 这 一 由 基因 排列 成 的 整体 称 为 一 个 操纵 子 (operon) (图 1 一 3b) 。 RNA 基因 原核 生物 和 真 核 生 物 中 的 RNA 基因 ,其 结构 通常 是 相似 的 。 这些 基因 一 般 不 含 内 含 子 。 然 而 ,在 有 些 生 物 中 , 象 纤 毛虫 、 粘 菌 和 细菌 中 ,确定 RNA 的 基因 就 可 能 含有 在 RNA 变 成 有 功能 分 子 前 必须 被 剪除 的 内 含 子 。 涉 及 某 些 RNA 基因 的 转录 调节 的 序列 因素 ,有 时 被 包括 在 决定 功能 终 产物 的 序列 的 范畴 内 。 特 别 地 ,所 有 确定 tRNA 的 基因 都 含有 一 个 受 RNA 多 聚 酶 下 识别 的 内 部 转录 起 始点 。 许多 RNA 分 子 在 转录 之 后 都 受到 修饰 。 这 类 修饰 包括 标准 和 非 标准 核 苷 酸 的 挫 人 ,标准 核 苷 酸 转变 成 非 标准 核 苷 酸 的 修饰 ,向 5 或 3 末端 的 核糖 核 苷 酸 的 终端 序列 的 酶 促 添 加 等 。 图 1 一 4 人 的 区 因子 基因 中 8 个 外 显 子 的 位 置 .图 中 坚 线 代 表 8 个 外 显 子 .本 图 只 标 出 了 被 转录 的 区 域 , 外 显 子 和 内 含 子 均 按 其 尺度 绘 出 。 注 意 ,5' 不 翻译 区 比 3' 不 翻译 区 短 。 资 料 取 自 Yoshitake 等 (1985) 。 调节 基因 我 们 对 调节 基因 的 认识 比 对 其 他 类 型 基因 的 认识 要 晚 一 些 。 暂 时 只 有 几 种 这 类 基因 或 基因 家 族 被 鉴别 出 来 。 它 们 是 ;(1) 复 制 子 基因 (replicator genes) ,作为 DNA 复制 的 起 始 和 终止 的 特异 位 点 而 起 作用 ,(2) 重 组 子 基因 (recombinator genes) ,提供 受 与 重组 有 关 的 酶 识别 的 特异 位 点 ,(3) 分 离子 基 因 (segregator genes) ,在 有 丝 分 裂 和 减 数 分 裂 期 间 ,提供 将 染色 体 附 着 到 分 离 机 构 上 的 特异 位 点 ,以 及 (4) 附 着 位 点 (attachment sites) ,为 蛋白 质 、 激 素 , 或 其 他 分 子 所 附着 。 可 能 还 存在 更 多 的 调节 基因 , 它们 中 有 些 可 能 在 功能 和 位 置 两 方面 都 是 独立 于 结构 基因 的 ,并 且 可 能 与 更 复杂 的 调节 功能 , 象 多 细 胞 生物 的 个 体 发 育 有 关 。 1.3 遗传 密码 蛋白 质 合 成 涉及 到 一 个 解码 过 程 , 厌 此 ,一 个 由 mRNA 分 子 携带 的 遗传 信息 通过 转移 RNA (tR- NA) 介 体 的 使 用 ,而 被 翻译 成 氨基 酸 。20 种 基本 氮 基 酸 及 其 缩写 形式 列 于 表 1 一 1。 翻 译 从 翻译 起 始 位 点 开始 ,进行 到 一 个 终止 信号 时 为 止 。 翻 译 过 程 涉 及 相互 邻近 的 不 重 登 核 苷 酸 三 联 体 , 称 为 密码 子 《codons) 的 连续 识别 。 一 个 将 被 翻译 的 序列 的 相位 由 起 始 密码 子 决定 , 称 为 阅读 框架 (reading frame) 。 在 处 于 核糖 体 和 mRNA 分 子 间 的 中 间 相 位 的 翻译 机 构 中 ,每 一 个 密码 子 被 翻译 成 一 个 特异 氨基 酸 , 它 被 连续 地 添加 到 正在 延长 的 多 肽 链 上 。 密 码 子 与 氨基 酸 之 间 的 对 应 由 一 组 称 为 遗传 密码 (genetic 2 Oe code) 的 规则 来 决定 。 除 了 几 个 例外 情况 ( 见 后 面 ) ,与 细胞 核 为 蛋白 质 编码 基因 有 关 的 遗传 密码 是 “ 通 FAAS” Cuniversal) , 即 几 乎 所 有 真 核 生 物 的 细胞 核 基因 和 原核 生物 的 基因 的 翻译 ,都 是 由 同一 组 规则 所 决定 的 。 通用 密码 子 由 表 1 一 2 给 出 。 由 于 1 个 密码 子 由 3 个 核 童 酸 组 成 , 且 存在 四 种 不 同类 型 的 核 苷 酸 , 所 以 ,应 有 4: 一 64 种 可 能 的 密码 子 。 其 中 61 个 为 特异 的 氨基 酸 编码 ,并 被 称 为 有 意义 密码 子 (sense codons) ,其 余 3 个 则 为 无 意义 密码 子 或 终止 密码 子 (nonsense or stop codons) ,其 作用 是 充当 使 翻译 过 程 终止 的 信号 。 因 为 有 意义 密码 子 有 61 个 ,而 蛋白 质 中 的 氨基 酸 却 上 只 有 20 种 ,所 以 ,大 多 数 氨基 酸 由 1 个 以 上 的 密码 子 编码 。 这 样 一 类 密码 被 称 为 是 简 并 密码 (degenerate code) 。 编 码 同 一 氨基 酸 的 不 同 密码 子 称 同 义 密码 子 (synonymous codons), 。 相 互 之 间 仅 在 第 3 位 上 不 同 的 同 义 密码 子 被 指定 为 一 个 密码 子 族 (codon family) 。 例 如 ,为 顷 氮 酸 编码 的 4 个 密码 子 组 成 一 个 四 密码 子 族 。 与 之 对 比 ,为 丝 氢 酸 编码 的 6 个 密码 子 被 分 成 一 个 四 密码 子 族 和 一 个 二 密码 子 族 。 表 1 一 1 基本 和 氨基酸 及 其 三 字母 和 一 字母 缩写 名 = i ‘ 三 字母 缩写 一 字母 缩写 Alanine Ala A ”Arginine Arg R Asparagine Asn N Aspartic acid Asp D Cysteine Cys C Glutamic Acid Glu E Glutamine Gln Q Glycine Gly G Histidine His H Isoleucine Tle I Leucine Leu Le Lysine Lys K Methionine Met M Phenylalanine Phe F Proline Pro P Serine Ser S - Threonine Thr ify Tryptophan Trp WwW Tyrosine Tyr Y Valine Val V 表 1 一 2 通用 密码 子 密码 子 氨基 酸 mT 氨基 酸 RAT 氨基 酸 密码 子 氨基 酸 UUU Phe UCU Ser UAU Tyr UGU Cys UUC Phe UCC Ser UAC Tyr UGC Cys UUA Leu UCA Ser UAA Stop UGA Stop UUG Leu UCG Ser UAG Stop UGG Trp CUU Leu CCU Pro CAU His CGU Arg CUC Leu CCC Pro CAC His CGC Arg CUA Leu CCA Pro CAA Gln CGA Arg CUG Leu CCG Pro CAG Gln CGG Arg AUU Tle ACU Thr AAU Asn AGU Ser AUC lle ACC Thr AAC Asn AGC Ser AUA Ile ACA Thr AAA Lys AGA Arg AUG Met ACG Thr AAG Lys AGG Arg GUU Val GCU Ala GAU Asp GGU Gly GUC Val GCC Ala GAC Asp GGC Gly GUA Val GCA Ala GAA Glu GGA Gly GUG Val GCG Ala GAG Glu GGG Gly -10° 大 多 数 真 核 生 物 的 蛋白 质 中 第 1 个 氨基 酸 是 甲 硫 氨 酸 ,由 起 始 密码 子 (initiation codon) AUG 编 码 。 这 一 氨基 酸 在 成 熟 蛋白 质 中 通常 被 移 除 了 。 大 多 数 原 核 生 物 的 基因 也 用 AUG 密码 子 作 为 起 始 , 起 始 翻译 过 程 的 氨基 酸 则 是 甲 硫 氨 酸 的 衍生 物 , 称 甲 酰 甲 硫 氮 酸 。 表 1 一 3 哺乳 动物 线粒体 的 密码 子 ” 密码 子 AER FAT 氨基 酸 密码 子 AER RBS 氨基 酸 UUU Phe UCU Ser UAU Tyr UGU Cys UUC Phe UCC Ser UAC Tyr UGC Cys UUA Leu UCA Ser UAA Stop UGA Trp UUG Leu UCG Ser UAG Stop UGG Trp CUU Leu coy Pro CAU His CGU Arg CUC Leu CCC Pro CAC His CGC Arg CUA Leu CCA Pro CAA Gln CGA Arg CUG Leu CCG Pro CAG Gln CGG Arg AUU . Tle ACU Thr AAU Asn AGU Ser AUC Tle ACC Thr AAC Asn AGC Ser AUA Met ACA Thr AAA Lys AGA Stop AUG Met, ACG Thr AAG Lys AGG Stop GUU Val GCU Ala GAU Asp GGU Gly GUC Val GCC Ala GAC Asp GGC Gly GUA Val GCA Ala GAA Glu GGA Gly GUG Val GCG Ala GAG Glu GGG Gly < 与 通用 密码 子 的 差别 用 黑体 字 表示 。 通用 密码 子 在 质 体 一 象 维 管 植物 的 叶绿体 一 基因 组 所 采用 的 独立 的 翻译 过 程 中 也 被 使 用 着 。 比 较 起 来 ,大 多 数 线粒体 基因 组 和 几 种 细胞 核 基因 组 (例如 , 枝 原 体 属 Mycozplasma 和 四 膜 虫 属 Terrahny- men&) 则 使 用 与 通用 密码 子 不 同 的 密码 子 。 不 过 ,一 般 说 来 这 些 密码 子 与 通用 密码 子 之 间 只 有 较 小 的 差别 。 作 为 一 例 ,哺乳 动物 线粒体 的 密码 子 列 于 表 1 一 3。 注 意 , 通 用 遗传 密码 中 编码 丝氨酸 的 密码 子 有 两 个 被 用 作 终 止 密码 子 ,而 色 氮 酸 和 甲 硫 氨 酸 都 是 被 两 个 密码 子 编码 ,而 不 是 一 个 。 DNA 序列 在 染色 体 复制 过 程 中 ,正常 情况 下 被 精确 地 拷贝 。 然 而 , 极 偶然 地 也 会 出 现 错误 ,从 而 产生 新 的 序列 。 这 些 错误 称 之 为 突变 (mutations) 。 突 变 既 可 发 生 在 体 细胞 内 又 可 发 生 在 种 系 细胞 内 。 由 于 体 细胞 突变 是 不 遗传 的 ,所 以 ,在 只 讨论 进化 问题 时 我 们 将 不 考虑 它们 。 本 书 通 篇 提 及 的 “突变 ” 这 个 词 ,将 只 指 在 种 系 细胞 中 的 突变 。 突变 可 以 根据 受 突变 事件 影响 的 DNA 序列 的 长 短 来 分 类 。 例 如 ,突变 可 能 影响 到 一 个 核 苷 酸 〈 点 突变 (point mnutations) ) 或 几 个 相互 邻近 的 核 苷 酸 。 我 们 也 可 按 突变 事件 造成 的 变化 类 型 ,将 突变 分 成 :(1) 替 换 (substitutions), 即 一 个 核 苷 酸 被 另 一 个 所 取代 ,(2) 缺 失 (deletions), 即 从 DNA 中 移 去 一 个 或 多 个 核 苷 酸 ,(3) 插 入 (insertions) ,向 序列 中 添加 一 个 或 多 个 核 苷 酸 ,(4) 倒 位 (inversions) , 即 含 有 2 个 或 多 个 碱 基 对 的 双 链 DNA 片段 转动 180"( 图 1 一 5)。 核 背 酸 蔡 换 核 苷 酸 替 换 分 成 转换 (transition il Mi # (transversions) Wi *. HRA A M GCM) = jaja T AIC CHE ME) Z NA) A ER. HR — SR SF — Ea A HH. 发 生 在 蛋白 质 编 码 区 的 核 苷 酸 蔡 换 也 可 通过 它们 对 翻译 产物 恒 白 质 的 影响 来 定性 。 如 果 替 换 不 引起 氨基 酸 改 变 ( 图 1 一 6a) , 则 被 称 为 是 同 义 的 (synonymous) 或 沉默 的 (silent) 。 非 同 义 的 或 引起 氢 基 酸 改变 的 突变 ,又 可 进一步 攻 划 分 成 总 又 的 (missensey 和 无 义 的 (nonsense) 突 变 。 谋 又 实 变 将 受到 国王 (a) ”bb) 图 1 一 5 突变 的 类 型 〈a) 原 序列 ;(b) 从 C 到 工 的 转换 ;(c) 从 G 到 C 的 颠 换 ;(d) 缺 失 序 列 ACCTA;(e) 插 人 序列 AAAGC; (5 -GCAAAC— 3! 倒 fi Re 5’ — CAAACG— 3’, 影响 的 密码 子 变 成 另 一 种 密码 子 , 后 者 确定 的 氨基 酸 与 前 者 编码 的 氨基 酸 互 不 相同 (图 1 — 6b). HM 突变 则 将 密码 子 变 成 一 个 终止 密码 子 ,这样 , 由 于 翻译 过 程 在 成 熟 前 就 结束 了 ,所 以 最 终结 果 是 产生 一 个 截 掉 尾巴 的 蛋白 质 ( 图 1 一 6C) 。 (b) He Cys AAGGCAAACCTACTGGTCTTATGT x AAGGCAAATCTACTGGTCTTATGT = AAGGCAAACCTACTGCTCTTATGT AAGGCAACTGGTCTTATGT ACCTA AAGGCAAACCTACTAAAGCGGTCTTATGT AAGGTTTGCCTACTGGTCTTATGT ATA ATA ATA ATA ATA ATA 图 1 一 6 发 生 在 编码 区 中 的 替换 类 型 (a) 同 义 的 ,(b) 误 义 的 ,和 (c) 无 义 的 。 每 一 个 有 意义 密码 子 通过 一 次 核 苷 酸 替 换 可 以 突变 成 9 种 其 他 密码 子 , 例 如 ,CCU(pro) 可 以 经 历 6 种 非 同 义 的 替换 , 变 成 UCU (Ser), ACU (Thr),GCU (Ala),CUU (Leu) , CAU (His) # CGC (Arg), WA 3 种 同 义 的 替换 , 变 成 CCC,CCA 或 CCG。 因 为 通用 遗传 密码 由 61 个 有 意义 密码 子 组 成 ,所 以 有 61X9=549 种 可 能 的 核 苷 酸 蔡 换 。 如 果 我 们 假定 核 苷 酸 替 换 随 机 地 进行 且 编 码 区 中 所 有 密码 子 具 相同 的 频率 ,那么 ,我 们 就 能 根据 遗传 密码 算出 不 同类 型 核 苷 酸 蔡 换 的 期 望 比 例 ., 这些 数 据 。12 。 Ala GCA AAC GIC CIG GCAAACGTCCTGTTAACA Asn Val GTC GTA Val Val GTC TGC Phe Val Leu Thr ACA ACA Thr Thr ACA ACA Thr Thr ACA 列 于 表 1 一 4。 由 于 遗传 密码 的 结构 , 同 义 替 换 主要 发 生 在 密码 子 的 第 3 位 上 。 事 实 上 ,第 3 位 上 所 有 可 能 发 生 的 改变 中 ,大 约 70%% 是 同 义 的 。 相 比 之 下 ,密码 子 第 2 位 上 的 所 有 蔡 换 都 是 非 同 义 的 ,而 第 1 位 上 发 生 的 核 苷 酸 变化 , 绝 大 多 数 也 是 如 此 (96%% )。 表 1 一 4 随机 蛋白 质 编 码 序 列 中 不 同类 型 突变 替换 的 相对 频率 替换 数目 百分比 全 部 密码 子 总 数 549 100 同 义 的 134 25 非 同 义 的 415 75 误 义 392 71 KEM 23 4 第 一 位 总 数 183 100 同 义 的 8 4 非 同 义 的 175 96 误 义 166 91 无 意义 9 5 第 二 位 总 数 183 100 同 义 的 0 0 非 同 义 的 183 100 误 义 176 96 LBM 7 4 第 三 位 总 数 183 100 同 义 的 126 69 非 同 义 的 57 31 误 义 50 27 无 意义 7 4 缺失 一 一 一 4 一 一 = a5 a — eS 添加 图 1 一 7 不 等 价 交 换 , 结 果 是 子 链 之 一 中 某 一 DNA 序列 缺失 ,而 另 一 子 链 中 则 出 现 同一 序列 的 重复 。 图 中 先 形 表 示 某 一 特定 长 度 的 DNA。 缺失 和 插入 缺失 和 揪 和 人 可 能 由 几 种 机 制造 成 。 机制 之 一 是 不 等 价 交 换 (unequal crossing over)。 图 1 一 7 绘 出 了 _ 1 殴 单 模型 ERR EET FRR CAR LIE — DNA 片段 缺失 ,而 在 另 一 条 上 则 出 现 相 应 的 添加 。 另 一 个 机 制 是 复制 滑脱 (replication slippage) 或 滑脱 链 误 配 (slipped- strand mispairing) 。 这 类 事件 发 生 在 含有 邻接 短 重复 序列 的 DNA 区 域 中 。 图 1 一 8a 表示 ,在 DNA 复 制 期 间 ,滑脱 可 因 邻 接 重复 间 的 误 配 而 引起 ,而 滑脱 又 可 造成 某 一 DNA HERA RES MR. 于 究竟 是 缺失 还 是 重复 , 则 要 看 滑脱 发 生 在 5"~3' 方 向 还 是 与 之 相反 的 方向 。 图 1 一 8b 表明 ,滑脱 误 配 也 可 能 发 生 在 非 复 制 DNA 中 。 造成 DNA 序列 插入 或 缺失 的 第 三 种 机 制 是 DNA 转 座 ,这 将 在 第 7 章 中 加 以 探讨 。 SRS AULA SEAS BEE (ges) 因为 当 一 个 带 有 缺失 或 插入 的 序列 与 原 序列 比较 时 ,两 序列 中 就 将 有 一 个 会 出 现 “ 裂 锋 ”( 第 3 章 )。 裂 颖 事件 中 涉及 的 核 苷 酸 数目 ,范围 从 一 个 或 几 个 到 包括 成 千 个 核 昔 1 138 (a) 在 DNA 复制 期 间 正常 配对 四 相互 作用 巢 色 体 DNA 的 正常 配对 5’—AATCCTAGTATATA 3’ nwt Ss siseeceace 5’—AATCCTAGTATATACACGAATT—3° 4'—TTAGGATCATATATGTGCTTAA—S’ - SP2SSTS See eeese caer <~TTAGGATCATATATCTGCEE AE 地 滑脱 链 误 配 , 滑 脱 链 误 本 滑脱 链 误 配 AG AG T A rs 5 一 AATC TATA Le 5’ AATCCTAGTATATA 4 [ tit eens icp tes 5 AATE 人 3’—TTAGGATCATAT TATGTGCTTAA—S’ 3'—TTAG ATATGTGCTTAA 一 一 5 32322333 G 中 5 一 TTAccATcATAT , TTAA 一 -一 5 A A Cc TE GT 复制 继续 插入 TA 重复 单位 不 配对 的 TA 重复 单位 被 切除 后 继续 复制 - 切除 /修复 | MA TA 重复 单位 AG Hy I AG GonA. « «=e 加 5 oe TATATACACGAATT—3" 5 一 AATCCTAGTATACACGAATT —3 Crit | a ee 生生 下 这 证 下 下 让 人- 和 你 于 和 明生 吕 生 放 计 5 一 AATC 让 IE 3 TTAC ATATGTGCTTAA 一 一 5 2 Boe 3‘—TTAGGATCATATATGTGCTTAA—S’ Tc 图 1 一 8 BREMOSR PA (FHUARAR) MOAR AEH ER FRA, DRAFT DNA 合成 的 方向 , 圆 点 表示 碱 基 配 对 。(a) 在 DNA 复制 期 间 TA 重复 中 发 生 的 两 碱 基 滑 脱 。3' 一 5' 方 向 中 的 滑脱 造成 一 个 TA 单位 播 入 的 结果 ( 左 半 图 )。 另 一 方向 中 的 滑脱 则 造成 一 个 重复 单位 缺失 的 结果 ( 右 半 图 )。 右 半 图 中 的 缺失 是 正在 生长 的 链 的 3' 端 上 ,未 配对 重复 单位 ( 标 有 星 号 ) 被 切除 而 造成 的 ,推测 系 赁 借 DNA 聚合 酶 的 3 一 5' 外 切 酶 活性 。(b) 在 非 复制 DNA PTA 重复 中 发 生 的 两 碱 基 滑 脱 。 误 配 区 形成 单 链 环 ,它们 可 能 是 切 离 和 误 配 修复 的 目标 。 结 果 ( 有 是 缺失 还 是 插入 ) 依 赖 于 倒 底 是 哪 条 链 被 切 离 和 被 修复 ,以 及 在 DNA 修复 过 程 中 究竟 是 哪 条 链 被 当 作 模 板 。 自 Levinson 和 Gutman (1987) 修 改 而 成 。 酸 的 连续 长 段 。 裂 颖 的 长 度 基 本 上 展示 出 双 峰 型 频率 分 布 , 短 裂 颖 (到 20 一 30 核 苷 酸 为 止 ) 常 常 是 由 DNA 复制 过 程 中 的 错误 所 造成 的 , 象 上 面 讨论 过 的 滑脱 链 误 配 , CaS Bt 36 th BK DNA 转 座 所 造成 。 FE Fit SK, UN RS SE AE TO KE RAR FE 23) FC WU KS ea) BE HE SP 下 游 的 编码 序列 将 会 按 错误 的 相位 阅读 。 这 种 突变 称 框架 移动 (frameshift) 突 变 。 结 果 , 一 个 裂缝 不 仅 会 导入 许多 氮 基 酸 的 改变 ,而 且 还 可 能 使 终止 密码 子 被 抹 掉 或 者 在 相位 中 导 和 新 的 终止 密码 子 ,后 果 是 产生 长 度 异 常 的 蛋白 质 ( 图 1 一 9) 突变 的 空间 分 布 突变 不 是 在 整个 基因 组 中 随机 出 现 的 .有 些 区 域 比 另 一 些 区 域 更 容易 突变 ,它们 被 称 为 突变 的 热 四 Bre Ui pee ea Pe i A A ak Sa a SA a em eR 5’ 一 TG 一 3' 。 志 核 苷 酸 5 一 TT 一 3' 在 原核 生物 中 是 一 个 突变 热点 ,但 在 真 核 生 物 中 通常 不 是 . 在 细菌 中 ,含有 短 加 〔 即 "两 条 互补 链 读 起 来 相同 的 序列 ,如 5 二 GCCG- GC—3's-5'= GGCGCC— 3’ #1 5’/ -GGGCCC— 3’) HY DNA 内 的 区 域 ,被 发 现 比 其 他 区 域 更 易于 突 变 。 在 真 核 生物 的 基因 组 中 , 串 接 重复 常常 是 缺失 和 插 人 的 热点 ,或 许 这 是 滑脱 链 误 配 所 造成 的 结果 。 = (palindromes el4e my pave Ala Lew Val ‘Lew Lew Thr le “ Cys “de> “Ter AAG GCA CTG GTC CTG TTA ACA ATA TGT ATA TAA TACCATCGCAATAGGG AAG GCA CTG TCC TGT TAA CAATATGTATATAATACCATCGCAATAGGG bye Ala’ “Leu. Phe Cys Ter iu oAla..Asn..Val. Leu. Leu. Thr... Ile... Cys. Ie Ter AAG GCA AAC GTC CTG TTA ACA ATA TGT ATA TAA TACCATCGCAATAGGG AAG-GCA AAC GGT CCT GTT AAC AAT ATG TAT ATA ATA.CCA TCG CAA TAG GG Bye pvAla Asn Gly «Pro ~ Vab(iiAsn’\ Asn >) MetoyTyr: De) «Tle Prov Ser Gin ‘Ter a 图 1 一 9 由 缺失 或 插入 造成 的 阅读 框架 发 生 框 架 移动 的 例子 。(a) 缺 失 一 个 G 造 成 成 熟 前 终止 。(b) 插 入 一 个 G, 结果 抹 掉 了 一 个 终止 密码 子 。 终 止 密码 子 下 划 有 横 线 。 习题 1. 从 某 种 哺乳 动物 中 找 出 两 个 完全 定 序 了 的 为 蛋白 质 编码 的 基因 (你 可 以 应 用 数据 库 或 一 本 杂 志 )。 确 定 它们 每 一 个 的 内 含 子 和 编码 外 显 子 间 的 长 度 比 。 用 取 自 果 蝇 的 两 个 为 蛋白 质 编码 的 基因 再 做 上 述 处理 。 哪 些 基因 的 内 含 子 与 外 显 子 长 度 比 更 大 ? 2. 从 某 种 哺乳 动物 中 找 出 一 个 完整 的 mRNA 序列 。 删 去 你 在 编码 区 中 最 先 碰 到 的 两 个 核 苷 酸 CI。 判 断 是 否 有 一 个 成 熟 前 终止 密码 子 进入 阅读 框架 ,或 者 是 否 翻译 会 超越 原 终止 密码 子 而 延长 。 3. 用 习题 2 中 的 序列 ,在 编码 区 中 第 6 个 C 后 插入 一 个 A。 插 和 人 将 会 怎样 影响 翻译 ? 4. 用 习题 2 中 的 序列 ,判断 有 多 少 密码 子 能 经 一 次 核 苷 酸 蔡 换 而 突变 成 终止 密码 子 。 5. 用 习题 2 中 的 序列 ,判断 密码 子 第 3 位 中 有 多 少 转换 是 同 义 的 ,而 又 有 多 少 颠 换 是 同 义 的 。 后 继 阅 读 文献 Darnell, J. E., H. F. Lodish and D. Baltimore. 1990. Molecular Cell Biology, 2nd Ed. Scientific American Books. New York. Lewin, B. 1990. Genes TV . Oxford Universtity Press, New York. Stryer, L. 1988. Biochemistry, 3rd Ed. Freeman, New York. Suzuki, D. T.. A. J. F. Griffiths. J. H. Miller and R. C. Lewontin. 1989. An Introducition to Ge- netic Analysis, 4th Ed. Freeman, New York. Watson, J. D, N. H. Hopkins, J. W. Roberts. J. A. Steitz and A. M. Weiner. 1987. Molecular Biolo- gy of the Gene, 4th Ed. Benjamin/Cummings, Menlo Park, CA. 2 群体 中 基因 的 动力 学 群体 遗传 学 探讨 发 生 在 群体 内 的 遗传 变化 。 本 章 将 介绍 某 些 对 理解 分 子 进化 来 说 至 关 重 要 的 、 群 体 遗 传 学 的 基本 原理 。 群 体 遗 传 学 的 一 个 基本 问题 ,是 确定 一 个 突变 基因 的 频率 在 各 种 进化 力量 的 影 响 下 ,将 如 何 随时 间 而 变化 .此 外 ,从 长 期 的 观点 看 ,重要 的 是 决定 一 个 新 的 突变 变异 型 完全 替代 群体 中 的 老 变异 型 的 概率 ,以 及 估计 替代 过 程 将 会 进行 得 多 快 。 与 形态 上 的 改变 不 同 , 许 多 分 子 变化 好 象 对 生物 的 表 型 只 有 很 小 的 影响 ,所 以 ,分 子 变 异型 的 频率 受 机 遇 的 影响 强烈 。 因 此 ,在 处 理 分 子 进化 时 ,机 遇 因素 应 该 被 考虑 进去 。 2.1 等 位 基因 频率 方面 的 改变 。 一 个 基因 在 染色 体 或 基因 组 上 的 位 置 称 基因 座位 (locus) , 某 一 给 定 基 因 座 位 上 所 选取 的 基因 形 式 称 等 位 基因 (alleles) .在 一 个 群体 中 , 某 一 基因 座位 上 可 能 有 一 个 以 上 的 等 位 基因 存在 ,它们 的 相对 比例 称 等 位 基因 频率 (allele frequencies) 或 基因 频率 (gene frequencies)。 例 如 ,我 们 假定 。 一 个 大 小 为 N 的 单 倍 体 群 体 中 , 某 一 基因 座位 上 有 各 具 ni An, 个 拷贝 的 两 个 等 位 基因 。 那 么 ,它们 的 等 位 基因 频率 就 分 别 等 于 和 和 天。 注意 ,其 中 心 二 nm 一 N ,而 对 十 冰 一 1。 进化 是 在 群体 的 遗传 组 成 方面 发 生变 化 的 过 程 . 因 此 ,进化 过 程 中 最 基本 的 部 分 是 等 位 基因 频率 随时 间 的 变化 .事实 上 ,从 进化 的 观点 看 ,一 个 新 突变 要 变 得 有 意义 就 必须 增加 它 自 己 的 频率 FRA 在 群体 中 被 固定 (fixed)( 即 在 随后 的 世代 中 所 有 个 体 将 共有 同一 种 突变 型 等 位 基因 )。 如 果 不 增加 自 己 的 频率 ,那么 这 个 突变 将 对 该 物种 的 进化 史 几 乎 没有 影响 .对 于 一 个 要 增加 频率 的 突变 型 等 位 基因 来 说 ,必须 是 某 些 因子 而 不 是 突变 来 挫 和 作用。 这 些 因子 包括 自然 选择 ,随机 遗传 漂 变 ,重组 和 迁徙 。 为 了 认识 进化 的 过 程 ,我 们 必须 研究 以 上 因子 是 如 何 影 响 等 位 基因 频率 的 变化 的 。 本 书 里 ,我 们 只 讨论 自然 选择 和 随机 遗传 漂 变 。 在 涉及 形态 学 性 状 的 经 典 进化 研究 中 ,自然 选择 被 看 成 是 进化 的 主 要 驱动 力量 。 与 此 成 鲜明 对 比 的 是 ,在 分 子 水 平 上 随机 遗传 漂 变 被 认为 在 进化 中 起 重要 作用 。 研究 群体 中 的 遗传 变化 有 两 种 数学 途径 :决定 性 的 和 随机 性 的 .决定 性 模型 (deterministic model) 较 简 单 。 它 假定 ,群体 中 等 位 基因 频率 从 这 一 代 到 下 一 代 的 改变 是 以 唯一 的 方式 发 生 的 ,并 且 能 根据 关于 初始 条 件 的 知识 毫 不 含糊 地 预测 出 来 .严格 说 来 ,此 途径 仅 当 两 个 条 件 满 足 时 才能 应 用 :(1) 群 体 在 大 小 上 是 无 限 的 ,和 (2) 环 境 或 者 不 随时 间 而 变 或 者 按 决定 性 规则 而 变 。 这 些 条 件 在 自然 界 显 然 绝 不 会 得 到 满足 ,因此 , 纯 决 定性 途径 对 于 描述 群体 中 等 位 基因 频率 随时 间 的 变化 可 能 是 不 够 的 。 随 机 的 或 不 可 预料 的 等 位 基因 频率 方面 的 波动 也 必须 被 考虑 进去 。 处 理 随 机 波动 需要 一 种 不 同 的 数学 途径 。 随 机 性 模型 (stochastic models) 假 定 等 位 基因 频率 的 变 化 按 或 然 性 方式 发 生 , 即 ,从 这 一 世代 中 关于 条 件 的 知识 我 们 不 能 含糊 地 预料 下 一 世代 里 的 等 位 基因 频率 ,而 只 能 决定 可 能 出 现 的 某 些 等 位 基因 频率 的 出 现 概率 .显然 ,随机 性 模型 比 决定 性 模型 更 可 取 , 因为 它们 建立 在 更 为 现实 的 假定 之 上 。 不 过 ,决定 性 模型 在 数学 处 理 上 要 容易 得 多 ,而 且 在 某 些 条 件 下 它们 也 能 得 出 足够 精确 的 近似 结果 。 以 下 ,我们 将 按 决 定性 方式 处 理 自然 选择 。 2.2 自然 选择 自然 选择 Cnatural selection ) 被 定义 成 :一 个 群体 内 遗传 上 不 同 的 个 体 或 基因 型 的 有 差别 的 增殖 。 . 16 . 有 差别 的 增殖 是 由 个 体 间 如 死亡 率 、 能 育 性 .生殖 力 、 交 配 成 功 和 后 代 生 活力 等 因子 方面 的 差异 所 造 成 的 。 自然 选择 是 个 体 间 在 与 增殖 有 关 的 性 状 方面 存在 遗传 变异 的 必然 结果 。 如 果 一 个 群体 由 在 这 类 性 状 方面 相互 无 差别 的 个 体 所 组 成 , 则 它 将 不 会 受到 自然 选择 。 选 择 导致 等 位 基因 频率 随时 间 而 变 。 然 而 ,仅仅 是 等 位 基因 频率 从 一 代 到 另 一 代 发 生变 化 ,并 不 一 定 表示 自然 选择 在 起 作用 。 别 的 过 程 , 例 如 随机 遗传 漂 变 ,也 能 导 至 等 位 基因 频率 随时 间 的 改变 ( 见 后 面 的 内 容 )。 eo eee eae 过 ,由 于 一 个 群体 的 大 小 通常 受 其 所 处 环境 的 容量 限制 ,所 以 , 某 三 个 体 的 进化 成 功 不 是 由 其 绝 对 适合 度 (absolute fitness) 而 是 由 其 与 群体 中 其 他 基因 型 相 比 的 相对 适合 度 (relative fitness) 所 决定 的 。 在 自然 界 ,不 能 预期 一 个 基因 型 的 适合 度 在 所 有 世代 和 所 有 环境 条 件 下 保持 不 变 。 然 而 ,对 每 种 基因 型 指定 一 个 恒定 的 适合 度 值 ,我 们 就 可 以 得 出 一 些 简单 的 理论 公式 ,它们 对 理解 由 自然 选择 导致 的 群体 遗传 结构 变化 的 动力 学 是 很 有 用 的 。 在 某 些 最 简单 的 模型 里 ,我们 假定 生物 的 适合 度 仅 由 其 遗 传 组 成 所 决定 。 我 们 还 假定 ,所 有 基因 座位 对 个 体 的 适合 度 的 贡献 相互 独立 ,所 以 每 一 基因 座位 都 能 被 隔离 开 来 处 理 。 群体 中 的 大 多 突变 型 都 会 降低 其 携带 i 。 这 类 突变 将 受到 淘汰 性 选择 并 且 最 终 将 会 被 从 群体 中 去 除 。 这 种 的 选择 称 负 选 择 或 纯洁 (GBA Cogaive oF poring section 偶 尔 ' 某 二 新 突变 可 能 与 群体 中 最 好 的 等 位 基因 一 样 合适 ,这 utral) , 且 其 命运 将 不 由 选择 所 决定 ?3 极 军 见地 , 可 能 会 产生 一 个 能 给 其 携带 者 以 选择 优势 的 突变 型 。 这 类 突变 将 人 RE AEF (nositiv or dares élection ) 。 NRA OLR A eee od I Des 下 面 我 们 将 考虑 一 个 有 两 个 等 位 基因 , eres | 的 基因 座位 的 例子。 每 等 位 基因 可 被 指定 __ + 内 在 适合 度 值 ; 它 可 能 是 优势 的 .劣势 的 ,或 中 性 的 。 然 而 ,这 种 指定 只 适用 于 单 倍 体 生 物 。 在 两 倍 体 生物 中 ,适合 度 最 后 由 该 基因 座位 上 的 两 个 等 位 基因 间 的 相互 作用 所 决定 。 两 个 等 位 基因 ,将 有 三 种 可 能 的 两 倍 体 基 因 型 :AIA ,AiA, 和 A:A: ,它们 的 适合 度 则 可 分 别 用 wi wie wok RA 给 定 某 一 群体 中 等 位 基因 A, 的 频率 为 p, 该 互补 等 位 基因 A, 的 频率 为 q 王 1 一 p, 我 们 可 以 证 明 , 在 随机 交配 下 AJA ,AiA, 和 ALA, 的 频率 将 分 别 为 p ,2pq 和 号 。 一 个 维持 着 这 种 基因 型 比 的 群体 , 被 认为 是 处 于 哈 迪 一 温 伯 格 平 衡 (Hardy-Weinberg equilibrium) 。 1M .p=p’ +> (2pq) UK a=> (2pq) 十 qz。 ee eee) 在 一 般 情 况 下 ,三 种 基因 型 被 指定 为 以 下 适合 度 值 和 初始 频率 基因 型 AA, A,A, A.A, 适合 度 Wi Wiz W22 频率 P2 2pq q° 现在 让 我 们 考虑 一 下 等 位 基因 频率 随 选 择 而 改变 的 动力 学 。 假 定 三 种 基因 型 的 频率 及 其 适合 度 如 上 ,, 则 三 种 基因 型 AlAi ,AiA, A ALA, 对 下 一 世代 的 相对 贡献 ,将 分 别 为 pwii,2pqwiz 和 qzwz。 因 此 ,等 位 基因 A, 的 频率 在 下 一 世代 将 变 成 y 2 ee ed pw, + 2pqwy, + 9 oz 每 世代 等 位 基因 A, 的 频率 改变 量 被 表示 成 Aq=q' 一 q。 我 们 可 以 证 明 Ar = pal pwr 一 Wy) + q (Way x ¥en) p’wy, + 2pquy. + q° 2row, 下 面 ,我 们 假定 A, 是 该 群体 中 的 原 等 位 基因 或 “ 老 , 本 然后 ,我 们 来 考虑 一 个 新 突变 型 等 位 基因 A, 出 现 后 ,等 位 基因 频率 变化 的 动力 学 。 为 了 数学 上 的 便利 ,我 们 给 予 A,A, 基因 型 的 适合 度 值 为 1。 新 产生 的 基因 型 AiA, MAA, 的 适合 度 将 有 赖 于 A 和 As 间 相 互 作用 的 模式 .。 例如 ,如 果 A, 对 A, 是 完全 显 性 的 ,那么 wavwb 和 wz 可 分 别 写成 1,1 十 s, 和 1 十 s, 如 果 A, 完全 隐 性 , 则 适合 分 别 为 1,1,1 十 s。 这 里 s BHAA, 的 基因 型 与 A,Ai 间 的 适合 度 差异 。s 的 值 为 正 表 示 与 AlA, 比较 e 飞 7 (2. 1) (2. 2) 适合 度 增 高 ,而 为 负 时 则 表示 适合 度 降 低 。 共 显 性 在 选择 的 共 显 性 模式 (codominant mode of selection) 或 基因 选择 (genic selection) 中 ,两 种 纯 合 子 有 着 不 同 的 适合 度 值 ,而 杂 合子 的 适合 度 则 为 两 种 纯 合 基因 型 的 适合 度 的 平均 值 。 三 种 基因 型 的 相对 适合 度 值 可 写成 : 基因 型 AA, AiA, A:A, 适合 度 1 1 十 s 1 十 2s 根据 等 式 2. 2, 在 共 显 性 下 我 们 得 等 位 基因 A. 的 每 世代 频率 改变 如 下 : 4 天 (2. 3) ~ 1+ 2spq + 2 图 2 一 1 BARA s=0.01 的 等 位 基因 A, WI In tO. BOT) AB, FE A te ES Ze ET El 等 位 基因 频率 的 前 提 下 增加 其 中 一 种 等 位 基因 的 频率 ,而 与 等 位 基因 在 群体 中 的 相对 频率 无 关 。 因 此 ,基因 选择 是 一 种 定向 选择 (directional selection)。 注 意 ,在 低频 率 下 对 一 个 共 显 性 等 位 基因 的 选择 * 1.0 0.8 0.6 it & 0.4 0.2 四 0 200 400 600 800 1,000 1,200 1,400 世代 图 2 一 1 具 S=0.01 的 共 显 性 优势 等 位 基因 ,在 其 于 第 0 代 作 为 突变 的 结果 而 出 现 后 的 频率 。 不 是 十 分 有 效 ( 即 ,等 位 基因 频率 的 变化 缓 慢 )。 原 因 在 于 , 当 A: 频率 低 时 ,等 位 基因 A, 处 于 杂 人 合子 中 的 比例 较 大 。 例 如 , 当 A; 的 频率 为 0.5 50MM A, 等 位 基因 由 杂 合 子 携带 ,而 若 A, 的 频率 为 0. 01, 则 99%% 的 这 种 等 位 基因 都 处 于 杂 合 子 中 。 因 为 杂 合 子 带 有 两 种 等 位 基因 ,受到 的 选择 压力 比 纯 合 子 A;A; 的 弱 ( 即 s 和 2s 的 关系 ), 所 以 在 低 q 值 下 等 位 基因 频率 的 总 改变 量 就 小 。 超 显 性 在 选择 的 超 显 性 模式 (overdominant mode of selection ) , 杂 合 子 有 最 高 的 适合 度 。 于 是 : SEA AA, AA, A2A2 适合 度 1 1 十 s” 1+t 这 里 s>O 目 s>t。 根据 ALA, 的 适合 度 是 高 于 、 等 于 或 低 于 AVA, 的 适合 度 ,t 可 相应 地 吉 正 值 、 零 、 或 负 值 。 等 位 基因 频率 的 变化 表示 成 On agen = (2. 4) 图 2 一 2 表示 一 个 受 超 显 性 选择 的 等 位 基因 的 频率 变化 .与 造成 一 个 等 位 基因 最 终 从 群体 申 消 失 的 著 显 性 选择 体制 不 同 , 在 超 显 性 选择 下 ,群体 迟早 将 达到 一 种 两 等 位 基因 共存 的 平衡 状态 。 平 衡 送 到 后 将 看 不 到 等 位 基因 频率 的 进一步 变化 ( 即 Aq=o)。 所 以 , 超 显 性 选择 属于 一 种 称 为 平衡 选择 或 稳 定 化 选择 (balancing or stabilizing selection) 的 选择 体制 。 4 18> 处 于 平衡 时 的 等 位 基因 AD 的 频率 可 通过 令 等 式 2.4 的 Aq 一 o 而 解 出 : (2.'5) s 了 一 2 从 当 t 王 0( 即 两 种 纯 合 子 有 相同 的 适合 度 值 ) 时 ,两 种 等 位 基因 的 平衡 频率 将 都 是 50% 。 1.0 0.8 0.6 0.4 0.2 世代 图 2 一 2 一 个 受 超 显 性 选择 的 等 位 基因 的 频率 变化 。 起 始 频率 从 上 到 下 各 为 ;0.99,0.75,0.25 Fo 0. 013s=0. 250 及 t=0.125。 因 为 s 和 t 的 值 都 特别 大 ,所 以 等 位 基因 频率 的 变化 迅速 。 注 意 , 在 q 一 0.667 处 有 一 个 稳定 平衡 。 自 Hartl 和 Clark(1989) 修 改 而 成 。 2.3 随机 遗传 漂 变 正如 上 面 提 到 的 ,自然 选择 不 是 引起 等 位 基因 改变 的 唯一 因子 。 等 位 基因 频率 变化 也 可 因 机 遇 而 产生 ,虽然 在 这 种 情况 下 变化 不 是 有 方向 性 的 而 是 随机 的 .产生 等 位 基因 频率 的 随机 波动 的 一 个 重要 因子 是 生殖 过 程 中 配子 的 随机 取样 (图 2 一 3)。 之 所 以 出 现 取样 问题 ,是 因为 在 自然 界 中 绝 大 多 样 情 况 下 , 任 一 个 世代 中 可 用 配子 的 数目 都 远大 于 下 一 世代 所 产生 的 成 年 个 体 数 。 换 句 话 说 ,只 有 一 小 部 分 配子 成 功 地 发 育 到 成 体 。 在 一 个 经 受 孟 德尔 式 分 离 的 两 倍 体 群体 中 ,即使 没有 配子 过 剩 , 即 每 一 个 _ 体 对 下 二 世代 正好 贡献 两 个 配子 ,取样 问题 也 会 发 生 。 原 因 是 , 杂 合 子 能 产生 两 种 配子 ,而 传 给 下 一 世 代 的 两 个 配子 由 于 机 遇 却 可 能 是 同一 类 型 的 。 为 了 看 取样 造成 的 后 果 , 让 我 们 考虑 一 个 群体 中 所 有 个 体 有 同样 的 适合 度 以 至 于 选择 不 起 作用 的 理想 情形 。 我 们 再 把 问题 进一步 简化 ,考虑 一 个 没有 重奏 世代 的 群体 ( 即 一 群 同时 繁殖 的 个 体 ) ,这 样 , 任 一 给 定 世代 都 能 与 前 一 世代 和 后 一 世代 毫 不 含糊 地 区 分 开 来 。 该 被 考虑 的 群体 为 两 倍 体 , 由 N 个 不 体 所 组 成 ,所 以 ,对 任 一 给 定 的 基因 座位 来 说 该 群体 含有 2N 个 基因 。 接 下 来 我 们 处 理 具 有 两 个 等 位 基因 A, 和 A,、 频 率 分 别 为 p 和 q=1 一 p 的 一 个 基因 座位 的 简单 例子 。 当 从 无 限 的 配子 库 中 抽取 ON 个 配子 时 ,样本 中 正好 含有 i 个 A, 型 基因 的 概率 p, 由 二 项 式 概率 函数 给 出 : PS SF a \ 1 ie i7TQQN — ai’? 对 于 两 种 等 位 基因 共存 ( 即 00 的 基因 选择 ,我们 得 , K = 4Nsu (2.18) RES» YE BP LE PK Is CN) PE HA Es) .以 及 突变 率 Cu), 2.6 遗传 多 态 性 如 果 一 个 基因 座位 在 群体 中 有 两 个 或 更 多 的 等 位 基因 存在 , 则 它 就 被 说 成 是 多 态 性 的 (polymor phic)。 然 而 ,如 果 其 中 一 个 等 位 基因 有 非常 高 的 频率 ,比如 说 99 斩 或 更 高 ,那么 ,其 他 等 位 基因 看 来 都 不 能 在 样本 中 被 观察 到 ,除非 样本 特别 大 。 所 以 ,从 实际 出 发 ,如 果 那 种 最 党 见 的 等 位 基因 的 频率 小 于 99% ,, 则 该 基因 座位 通常 被 定义 为 多 态 性 的 。 该 定义 显然 有 点 武断 ,而 且 在 文献 中 还 可 发 现 有 人 用 别 的 标准 。 中 24 ° 测度 某 一 群体 的 多 态 性 程度 的 最 简单 方法 之 一 ,是 通过 将 多 态 性 基因 座位 数 用 所 取样 本 的 基因 座位 总 数 来 除 ,以 算出 多 态 性 基因 座位 的 平均 比例 。 然 而 ,该 测度 与 被 研究 的 个 体 数 有 关 。 群体 内 遗 传 变异 性 的 更 为 合适 的 斥 度 是 平均 期 望 杂 合 度 (expected heterozygosity) 或 基因 多 样 度 Cgene diversity) 。 该 尺 舌 多 态 性 的 武断 描绘 ,可 以 从 有 关 基 因 频 率 的 知识 中 直接 算出 ,并 且 受 取样 作 用 的 影响 较 小 。 一 个 基因 座位 上 的 基因 多 样 度 定义 为 : h=1— 之 (2.19) 这 里 x 是 等 位 基因 的 频率 而 mm 为 该 玄 基 因 座 位 上 等 位 基因 的 总 数 。 对 任 一 给 定 的 基因 座位 而 言 ,h 是 随机 地 从 该 群体 中 选取 的 两 个 等 位 基因 互 不 相同 的 概率 .所 有 被 研究 过 的 基因 座位 的 h 值 的 平均 值 , 了 ,可 用 作 群 体内 遗传 变异 性 程度 的 一 种 估计 。 基因 多 样 度 太 度 h 和 五 , 曾 被 广泛 用 于 电泳 数据 和 限制 酶 数据 。 不 过 ,它们 可 能 不 适用 于 DNA 顺序 数据 ,因为 自然 界 中 DNA 水 平 上 的 遗传 变异 程度 是 相当 高 的 。 特别 地 , 当 所 考虑 的 序列 很 长 时 , 样本 中 的 每 一 序列 看 来 都 与 别 的 序列 有 一 个 或 多 个 核 苷 酸 的 差别 , 在 大 多 数 情 况 下 h 和 H 都 将 接近 于 1。 所 以 ,这 些 基 因 -多 样 度 太 度 将 无 法 区 别 不 同 的 基因 座位 或 群体 , 也 不 再 是 多 态 性 的 信息 义 度 。 对 于 DNA 顺序 数据 , 关于 群体 中 多 态 性 的 更 合适 的 义 度 ,是 任意 两 个 随机 选取 的 序列 间 每 位 点 的 平均 核 苷 酸 差异 数 。 该 尺度 称 核 苷 酸 多 样 度 Cnucleotide diversity) (Nei 和 Li,1979) ,用 天 表示 : 区 一 0 。 [2 20) 这 里 和 Ml x; 25) A DNA 序列 的 第 1 种 和 第 j 种 类 型 的 频率 ,而 DNA 序列 的 第 i 种 和 第 j 种 类 型 间 不 同 核 苷 酸 的 比值 。 目前 ,关于 DNA 序列 水 平 上 的 核 苷 酸 多 样 度 , 仅 有 为 数 不 多 的 一 些 研 究 。 这 类 研究 之 一 涉及 果 ii D. melanogaster 的 乙醇 脱氧 酶 (Adh)? 基 因 座 位 。 路 越 Adh 区 域 的 11 个 序列 已 由 克 赖 特 曼 (Kreit- man,1983) 定 序 。 这 些 线性 排列 的 序列 长 达 2379 SRR. 如 果 不 管 缺失 和 插 人 , 则 有 9 个 不 同 的 等 位 基因 ,其 中 一 个 由 3 个 序列 表示 ,而 其 余 的 则 各 由 一 个 序列 表示 (图 2 一 7)。 所 以 ,频率 xi 一 xs 各 为 1/11, 而 频率 x, 为 3/11。43 个 核 苷 酸 位 点 是 多 态 性 的 。 首先 我 们 计算 每 对 等 位 基因 的 不 同 核 苷 酸 所 点 的 比值 .例如 ,等 位 基因 1 一 S 和 2 一 S 在 2379 个 核 音 酸 中 相互 有 3 个 不 同 , 则 rs 一 0. 13%。 样 本 中 所 有 等 位 基因 对 的 if ee 2 一 1。 由 等 式 2. 20, 估 出 核 苷 酸 多 样 度 为 r* 一 0. 007。 被 研究 的 等 位 基 因 中 6 个 是 缓慢 移动 的 电泳 变异 型 (S),5 个 为 快速 移动 的 电泳 变异 型 (F)。S 和 开间 的 区 别 是 由 一 个 BAERS. 结果 赋 于 蛋白 质 以 不 同 的 电泳 运动 性 所 造成 的 。 对 这 些 电泳 类 型 的 每 一 种 ,也 曾 分 别 地 计算 了 它们 的 核 苷 酸 多 样 度 .我 们 得 到 :关于 S,x=0. 006; 关 于 F,r 王 0.003。 这 些 结果 指出 ,S 等 位 基 因 的 多 态 性 是 F 等 位 基因 的 两 倍 。 ? 侧 序列 外 显 子 1 ASF 幼稚 前 导 外 显 子 2 ASF , 外 显 子 3 内 含 子 加 ”外 显 子 4 FABRE 3 侧 序列 Hl CcG CAATATGGG C GC T ac C ccc GGAATCTCCACTA GG A 5C AGC C 7 1S an ‘ & da ? . T T A GACT AAG ie. >> . ~ 2s Ae ; aoa. * Je C2 T.A CA.TAAC.. ; 3S sun P lie - ~ A T A Be Se a . eet “©. OF WS, abe ie ae Vee A TA , 55 AG... -A. TC 5 A G GT a Sr C 6S etter koh ; G eh als SE. WM. . 24) Ba A ok 了 CGIA C T 7- Se ‘ G GTCTCC C ar TGC AG A.TC G G GTCTCC 于 ao TGC AG a: tC G G GTCTCC C25 F * 10-F TG CHAG.9. 2A .TC G od G GTCTCC c G nt TGC AGGGGA... ’ rT G A G eterce C 图 2 一 7 3D. melanogaster 的 乙醇 脱 氢 酶 基因 ,其 11 个 序列 中 的 多 态 性 核 苷 酸 位 点 。 只 有 那些 与 共同 顺序 有 差异 的 地 方 被 显示 出 来 了 。 圆 点 表示 与 共同 顺序 相同 。 外 显 子 4 中 的 星 号 指示 赖 氨 酸 -对 - 苏 氨 酸 替 代 的 位 点 ,该 蔡 代 是 两 电泳 型 等 位 基因 间 出 现 快 / 慢 运动 性 的 原因 。 自 Hartl 和 Clark(1989) 修改 而 成 。 bo wn amas 表 2 一 1 RMD. melanogaster? 的 醇 脱 氢 酶 基因 座位 的 11 个 等 位 基因 中 > 成 对 地 比较 的 百分比 核 背 酸 差异 等 位 基因 等 位 基因 1S 25 3S 4S 5S 6S 7F 8F 9F 10F 1-S ze 0.13 3-S 0.59 0.55 4-S 0.67 0.63 0.25 5-5 0.80 0.84 0.55 0.46 6-S 0.80 0.67 0.38 0.46 0.59 7-F 0.84 0.71 0.50 0.59 0.63 0.21 8-F 1.13 1.10 0-88 0.97 0.59 0.59 0.38 9-F 1-13 1.10 0.88 0.97 0.59 0.59 0.38 0:00 10-F 1.13 1-10 0.88 0.97 0.59 0.59 0.38 0.00 0.00 11-F 1.22 1.18 0.97 1.05 0.84 0.67 0.46 0.42 0.42 0.42 A Nei(1987). #48 Kreitman(1983). ‘ a. 加 以 比较 的 位 点 的 总 数 为 2379。S 和 下 分 别 表 示 缓 慢 和 快速 移动 的 电泳 型 等 位 基因 2.7 新 达尔 文学 说 与 中 性 突变 假说 达尔 文 提出 他 的 进化 学 说 根据 的 是 自然 选择 ,而 没有 关于 群体 中 变异 的 来 源 的 知识 。 备 德尔 定律 被 重新 发 现 以 及 遗传 变异 被 证 明 是 由 突变 产生 的 之 后 ,达尔 文 主义 和 备 德 尔 主 义 被 用 作 后 来 被 称 为 进化 的 综合 或 新 达尔 文 主义 Cneo 一 Darwinism ) 的 那 种 理论 的 框架 。 根 据 该 学 说 ,虽然 突变 被 看 成 是 遗传 变异 的 根本 源 ,但 目 然 永 择 短 在 决定 群体 的 租 人 七 移 志 , 并 在 基因 替换 的 过 程 中 、 着 FA. 一 时 ,新 达尔 文 主义 成 了 进化 生物 学 中 的 法 则 ,而 选择 终于 被 看 成 是 能 驱动 进化 过 程 的 唯一 力 量 。 其 他 因素 , 象 突变 和 随机 漂 变 , 被 认为 最 多 只 有 次 要 作用 。 新 达尔 文 主义 的 这 一 特殊 标记 称 为 选 _ 择 主 义 (selectionism ) 。 很 据 选择 论 者 或 进化 过 程 的 新 达尔 文学 派 的 观点 ,基因 替换 是 以 选择 对 有 利 突变 作用 的 结果 而 出 现 的 。 另 一 方面 多 态 性 则 是 由 平衡 选择 来 维持 的 。 于 是 ,新 达尔 文 论 者 把 蔡 换 和 多 态 性 看 成 是 由 不 同 的 进化 惫 量 驱 动 的 \ 丙 种 孤立 的 观 尔 ” 适 困 蕉 换 是 正 的 适应 性 过 程 的 最 后 结果 ,如 果 上 且 只 有 当 二 个 新 的 等 位 基因 能 改善 该 生物 的 适合 度 时 , 它 才 会 经 此 过 程 而 占据 群体 的 以 后 世代 ;而 多 态 性 则 是 在 某 . 一 基因 座位 上 两 个 或 更 多 个 等 位 基因 共存 对 该 生物 或 该 群体 有 利 时 , 才 被 维持 的 .新 达尔 文学 派 的 理 论 主张 自然 界 中 大 多 数 遗 传 多 态 性 是 稳定 的 。 十 九 世 纪 七 十 年 代 后 期 群体 遗传 学 中 出 现 了 一 次 革命 。 蛋 白质 顺序 数据 的 应 用 打破 了 群体 遗体 学 研究 中 的 物种 界线 ,并 且 首 次 为 检验 与 基因 替换 的 过 程 有 关 的 学 说 提供 了 足够 的 经 验 数 据 ,1968 年 ,木村 提出 ,进化 中 大 多 数 的 分 子 变化 是 由 于 中 人 性 或 近 中 性 突变 i wt 9 (Kimura, 19 dL; King 和 Juges, 。 这 一 假说 ,现在 上 性 学 说 Cneutral theory of molecular evolution ) 而 著称 ,极力 主张 :分 子 水 平 上 的 大 多 数 进化 变化 以 及 物种 内 的 大 多 数 变异 性 , 既 不 是 由 有 利 等 位 基因 的 正 选 择 也 不 是 由 平衡 选择 所 造成 的 ,而 是 由 选择 上 呈 中 性 或 近 中 性 的 突变 型 等 位 基因 意 币 只 是 说 ,这 他 等 位 基因 的 命运 很 大 程度 上 是 由 随机 遗传 漂 变 所 决定 的 。 换 句 话说 ,选择 可 能 会 起 E 用 ,但 它 的 强度 太 弱 以 至 于 不 能 抵消 机 遇 作用 的 影响 。 要 使 这 种 情况 成 为 事实 ,二 不 等 下 择优 势 度 或 劣势 度 的 绝对 值 必须 小 于 1/(2Ne) , e 为 有 效 群 体 大 小 。 照 中 性 学 说 的 说 法 ,等 位 基因 的 频率 纯粹 由 随机 规则 所 决定 ,而 且 我 们 在 任 一 给 定时 刻 得 到 的 画 面 都 只 是 一 种 瞬 态 , 它 代表 取 自 进行 着 的 动力 学 过 程 中 的 一 种 暂时 构造 。 因 此 ,多 态 性 基因 座位 是 由 或 者 在 走向 固定 的 途中 、 或 者 将 要 灭绝 的 那些 等 位 基因 所 组 成 。 从 这 一 场景 来 看 ,与 进化 过 程 有 关 的 所 有 分 子 的 表现 形式 ,都 应 被 看 成 是 突变 输入 和 与 之 相伴 的 等 位 基因 的 随机 灭绝 或 固定 的 某 一 连续 © IO20。 “过程 的 结果 。 故而 ,中 人 性 学 说 把 替换 和 多 态 性 看 成 是 同一 现象 的 两 个 侧面 。 替 换 是 一 个 长 期 而 渐进 的 过 程 , 藉 此 突变 通 等 位 基因 的 频率 随机 地 增加 或 减少 ,直到 这 些 等 位 基因 最 终 困 机 遇 而 固定 或 丢失 。 在 任何 给 定时 间 量 ; 某 亚 基因 座位 所 具有 的 等 位 基因 ,其 频率 将 既 不 是 0%% 也 不 是 100%%。 这 些 就 是 多 态 性 的 基因 原 位 。 审 往 学 说 认为 ,群体 让 的 大 多 数 遗 传 多 态 性 在 自然 界 中 都 是 朋 时 的 。 “下 入 论 者 和 选择 论 着 朵 季 证 酌 末 质 ,涉及 突变 型 等 位 基因 的 适合 度 值 的 分 布 问题 .两 种 学 说 都 认 为 ,大 多 数 新 突变 是 有 害 的 并 且 它们 很 快 被 从 群体 中 清除 ,所 以 ,它们 对 替换 速率 和 群体 内 的 多 态 性 的 量 都 没有 什么 贡献 。 不 同 的 是 ,关于 非 有 害 突变 中 中 性 突变 的 相对 比例 问题 。 选择 论 者 主张 很 少 的 Sopa * echnla onstabeisieti tes so 2 ICES: scingrnmmpornnembeens 点 得 到 普遍 承认 .第 二 ,分子 生物 学 和 玫 体 遗 传 学 间 综 合 ,通过 分 子 进 化 和 遗传 多 态 性 只 是 同一 现象 的 两 个 侧面 这 一 概念 的 导 和 人 ,而 大 大 加 强 (Kimurra 和 Ohta,1971)。 虽 然 争论 仍 在 继续 ,但 任何 令 人 满意 的 进化 学 说 必须 与 分 子 水 平 上 进化 过 程 的 这 两 个 方面 一 致 ,这 一 点 现在 已 得 到 承认 。 在 一 系列 研究 中 , 根 井 等 (Nei 等 ,1978) 曾 从 这 一 观点 检验 过 中 性 突变 假说 。 最 近 , 赫 德 森 等 (Hudson 等 ,1987) 曾 提出 过 一 种 方法 ,测试 由 种 间 DNA 顺序 比较 揭示 的 高 速 进化 着 的 DNA 区 域 , 是 否 象 中 性 突变 假说 所 预测 的 那样 ,在 物种 内 也 表现 出 高 水 平 的 多 态 性 。 习题 1. ASR 2.2 FHS 2.3. 2. 如 果 A, MWA 是 完全 显 性 , 那么 等 位 基因 A. 的 每 世代 频率 改变 将 是 多 少 ? 3. 从 等 式 2.4 导出 等 式 2.5 中 的 平衡 频率 。 4. 给 定 一 个 由 5 个 两 倍 体 个 体 组 成 的 群体 ,其 中 Ai 的 频率 为 0.5, 且 A AA, 有 同样 的 适合 度 , ABA ,在 下 一 世代 A, 的 频率 为 (a)0.0,(b)0.5, 或 (c)1.0 的 概率 各 为 多 少 ? 5. 在 一 个 肉体 以 2 : 1 超过 雄性 的 群体 中 ,有 效 群 体 大 小 与 调查 统计 的 群体 大 小 的 比 是 多 少 ? 6. 一 个 经 历 过 瓶颈 的 群体 ,比如 在 连续 6 个 世代 中 其 群体 大 小 为 :10、10、10'、10.10' 和 10'。 其 长 期 群体 大 小 是 多 少 ? 7. 在 一 个 有 效 群 体 大 小 为 100, 且 Ne=N 的 群体 中 ,一 个 具 0. 01 的 选择 劣势 度 的 新 突变 ,其 固 定 概率 是 多 少 ? 8. 应 用 图 2 一 7 中 的 序列 ,计算 等 位 基因 (a)1 一 S、 2 一 S 或 3 一 S 间 ,(b)1 一 S 和 7-F 间 ,编码 区 〈 黑 长 方块 ) 中 的 核 背 酸 多 样 度 。 该 编码 区 长 771 个 核 苷 酸 。 后 继 阅 读 文献 Christiansen, F. B. and M. W. Feldman. 1986. Population Genetics. Blackwell Scientific Publica- tions. Cambridge, MA Crow. J.F.and M. Kimura. 1970. An Introduction to Population Genetics Theory. Harper & Row. New York. artl, D. L. and A. G. Clark. 1989. Principles of Population Genetics. 2nd Ed. Sinauer Associates. Sunderland, MA. Hedrick, P. W. 1983. Genetics of Populations. Science Books International. Portola Valley. CA. Kimura. M. 1983. The Neutral Theory of Molecular Evolution. Cambridge University Press. Cam- bridge. Nei. M. and D. Graur. 1984. Extent of protein polymorphism and the neutral mutation theory. Evol. Biol. 17: 73—118. 3 核 音 酸 顺 序 中 的 进化 变化 DNA 序列 进化 中 的 基本 形式 是 核 苷 酸 随时 间 的 改变 。 这 一 过 程 值得 详细 考虑 ,因为 核 苷 酸 顺 序 中 的 变化 在 分 子 进 化 研究 中 , 既 用 来 估计 进化 的 速率 又 用 于 重建 生物 进化 的 历史 。 然 而 , 核 苷 酸 鞭 换 的 过 程 通常 是 极其 缓慢 的 ,以 至 它 不 可 能 在 研究 者 所 生存 的 时 间 里 被 观察 到 。 因 此 ,为 了 检 出 DNA 序列 中 的 进化 变化 ,我 们 依靠 比较 法 , 即 让 某 一 给 定 顺序 与 另 一 个 与 它 在 进化 上 过 去 有 共同 祖先 的 顺 序 比较 。 这 种 比较 要 用 到 统计 学 方法 ,其 中 几 种 将 在 本 章 中 讨论 。 3.1 DNA 序列 中 的 核 音 酸 蔡 换 前 一 章 中 ,我 们 把 进化 过 程 描绘 成 一 系列 的 基因 替换 ,在 这 一 过 程 中 新 等 位 基因 以 单个 突变 的 形 式 产 生 ,继而 增加 其 频率 ,最 终 则 在 群体 中 固定 。 现 在 我 们 从 不 同 的 观点 来 看 这 一 过 程 。 我 们 注意 到 , 要 被 固定 的 等 位 基因 其 顺序 不 同 于 它们 所 替代 的 等 位 基因 。 如 果 我 们 使 用 的 时 间 尺 度 中 一 个 时 间 单 位 比 固 定时 间 长 ,那么 ,任何 给 定 基 因 座 位 上 的 DNA 顺序 都 将 表现 出 连续 变化 。 为 此 ,研究 一 下 一 个 DNA 序列 中 的 核 苷 酸 如 何 随时 间 改 变 将 是 有 趣 的 。 象 以 后 我 们 要 解释 的 那样 ,这 一 研究 结果 可 被 用 来 建立 估计 两 序列 间 蔡 换 数 的 方法 。 为 了 研究 核 苷 酸 替 换 的 动力 学 ,我 们 必须 作出 几 项 关于 一 个 核 苷 酸 被 另 一 个 替换 的 概率 的 假定 。 文献 中 已 提出 了 许多 这 样 的 数学 方案 。 我 们 将 把 讨论 仅 限 制 在 那些 最 简单 且 最 常用 的 方法 上 : 朱 克 斯 Ail 4k 46 (Jukes 和 Cantor,1969) 的 一 参数 模型 (one-parameter model) 和 木村 (Kimura ,1980) 的 两 参数 异型 (two-parameter model) 。 关 于 更 一 般 的 模型 的 评论 ,读者 可 参考 李 等 (Li 等 ,1985a) 的 论述 。 朱 克 斯 和 坎 托 的 一 参数 模型 朱 克 斯 和 坎 托 模型 的 替换 方案 如 图 3 一 1 所 示 。 该 模型 假定 蔡 换 在 4 种 核 苷 酸 类 型 中 随机 地 发 生 。 换言之 ,在 变化 方向 上 没有 任何 倾斜。 例如 ,如 果 所 考虑 的 核 苷 酸 是 A, 则 它 将 以 相同 的 概率 改变 Purines A G T Pyrimidines i a A3—1 MMAR -KURM, AMA PHF 6H HAIR F ABA a, MTC BG. 在 此 模型 中 , 对 每 种 核 苷 酸 来 说 , 蔡 换 速率 为 每 单位 时 间 Se, FL 3 种 可 能 的 变化 方向 中 每 种 的 蔡 换 速率 都 是 w。 因 为 该 模型 只 涉及 一 个 参数 ,所 以 它 又 叫 一 参数 模型 © 28 e 我 们 假定 一 个 DNA 序列 中 某 一 位 点 上 座 落 的 核 苷 酸 在 时 刻 0 时 为 A。 首先 ,我 们 要 问 : 该 位 点 在 时 刻 t 时 被 A 占据 的 概率 是 多 少 ? ”该 概率 用 Paw RA. 因为 我 们 从 A 开始 ,所 以 该 位 点 在 0 时 刻 被 A SNR Pam=l. ENA 1, 该 位 点 上 仍 为 A 的 概率 由 Pa 一】 一 3c (3.1) 给 出 , 它 反映 出 核 苷 酸 保持 不 变 的 概率 , 即 1 一 3a。 在 时 刻 2 仍 有 A 的 概率 为 Pag) = (1 — 3@)Paay + @L1 — Paay] (3. 2) Fy TF te SK , HE ATT BP YE) J TE: CK PR RS ABE A 2) KF BO MTC 或 G 但 随后 又 回复 到 A( 图 3 一 2)。 在 时 刻 1 RBA A 的 概率 是 PAo ,而 在 时 刻 2 REA A 的 概率 是 1 一 3a。 这 两 个 独立 变量 的 乘积 给 出 了 第 一 种 局 面 的 概率 , 它 构成 等 式 3. 2 NH. EMA RRA A 的 概率 为 1 一 PAo ,而 在 时 刻 2 变 成 A 的 概率 为 w。 这 两 个 概率 的 乘积 给 出 了 第 艺 种 局 面 的 概率 , 它 即 等 式 3. 2 中 的 第 2 项 。 mE 局 面 工 Aw I t=0 A A 不 替换 替换 fel A 4E A 不 替换 替换 t=2 A A 图 3 一 2 假定 在 时 刻 0 某 一 位 点 上 为 A, 而 在 时 刻 2 该 位 点 上 仍 有 A 的 两 种 可 能 的 局 面 。 用 以 上 公式 ,我们 可 以 证 明 , 以 下 递 推 式 可 用 于 任何 的 ti: 0 Sea) HEAT AT Ae SAT A Paw WE et BE SH 3. 3 ,为 : Paci — Paw Bre Sel se A a Bice) (3. 4a) 或 AP 4g) =— 3aPio + @01 — Paw) =— 40P aq + 4 (3. 46) 至 此 我 们 考虑 的 是 一 个 离散 的 时 间 过 程 。 不 过 ,我 们 可 以 用 连续 时 间 模 型 来 近似 这 一 过 程 , 把 APaA 看 成 是 时 刻 t 时 的 变化 率 。 以 这 一 近似 ,等 式 3. 4b 被 重 写 成 dP aa) AO 一 一 4aPao +a (3.5) 这 是 一 个 一 阶 线性 微分 方程 ,其 解 由 Paw = < + aa He 7 (3. 6) 给 出 。 因 为 我 们 从 A 开始 , 所 以 Pao=1l. Ki Pay => + Ge" (3.7) 事实 上 ,等 式 3. 6 REHAB FMR. HM. BK ARE RAE A, Py... 0. iit 在 时 刻 t 该 位 置 上 有 和 的 概率 为 Pa oe a hie G | (3. 8) © 29 « 等 式 3.7 和 3. 8 对 描绘 替换 过 程 来 说 是 充分 的 。 从 等 式 3. 7, 我 们 可 以 看 到 ,如 果 起 始 核 背 酸 是 AIBA Paw Ht STH Rh A 1 降 到 1/4( 图 3 一 3)。 另 一 方面 ,从 等 式 3. 8 我 们 看 到 ,如 果 起 始 核 苷 酸 不 是 A, 那 么 Pa 将 从 0 单调 地 上 升 到 1/4。 所 以 ,不 管 起 始 条 件 如 何 ,PAw 最 终 都 将 达到 174( 图 3 一 3)。 这 对 工 C AG 而 言 也 是 正确 的 .因此 ,在 朱 克 斯 - 坎 托 模型 下 4 种 核 苷 酸 中 每 种 的 平衡 频率 都 是 1/4。 达到 平衡 后 ,在 概率 上 将 没有 进一步 的 变化 , 即 , 对 所 有 t 都 有 Paw =Pr =Pom =Pow=1/4. AM, 核 苷 酸 的 频率 仅 在 无 限 长 的 DNA 序列 中 保持 不 变 。 实 际 上 ,DNA 序列 的 长 度 是 有 限 的 ,所 以 核 苷 酸 频率 上 的 波动 看 来 是 会 发 生 的 。 1.0 0.8 0.2 0 40 80 120 160 200 时 间 ( 百 万 年 ) 图 3 一 3 一 个 位 置 上 有 某 一 核 苷 酸 的 概率 随时 间 的 变化 :由 同样 的 核 音 酸 开 始 ( 上 线 ) 或 由 不 同 核 苷 酸 开始 (下 线 )。 虚 线 表示 平衡 频率 (0. 25)。a 一 5X10“" 核 音 酸 /位 点 /年 。 上 面 ,我 们 的 注意 力 集中 在 一 个 特定 的 核 苷 酸 位 点 上 ,而 把 Psw 处 理 为 一 种 概率 。 然 而 ,PE\v, 所 可 被 解释 成 某 一 DNA 序列 中 A 的 频率 。 例 如 ,如 果 我 们 从 一 个 仅 由 腺 味 聆 构成 的 序列 开始 , 那 委 PAw =1, 而 PAw 则 是 在 时 刻 t 该 序列 中 A 的 期 望 频率 。 MKB A 且 时 刻 t HRPM A 这 一 事实 考虑 进去 ,我 们 可 以 把 等 式 3.7 以 更 明确 的 形式 重 写成 Paaw = > + (Se (3. 9) 如 果 起 始 核 苷 酸 是 G 而 不 是 A, 那 么 由 等 式 3. 8 我 们 得 caw = + a (ess (3. 16) 因为 在 朱 克 斯 - 坎 托 模型 下 所 有 核 苷 酸 都 是 等 价 的 ,所 以 Poa) =Poawy =Prawy. PLE RNTVEK 一 个 一 般 性 的 概率 ,Pioo, 这 是 某 一 核 苷 酸 在 给 定 起 始 核 苷 酸 为 i 的 条 件 下 在 时 刻 t 变 为 j 的 概率 。 应 用 这 个 一 般 化 了 的 概念 和 等 式 3. 9, 我 们 得 Pia = + = (Bye (S39) 且 由 等 式 3. 10; on 4 a Se (3. 12) ix iF}. 木村 的 两 参数 模型 象 朱 克 斯 和 坎 托 模型 那样 ,假定 所 有 核 苷 酸 蔡 换 随机 发 生 , 这 是 不 现实 的 。 例 如 ,转换 ( 即 A 和 G 之 间或 C 和 T 工 之 间 的 变化 ) 一 般 比 颠 换 ( 即 所 有 其 他 类 型 的 变化 ) 更 频繁 一 些 ( 第 4 章 )。 考 虑 到 这 一 事实 ,木村 (Kimura,1980) 曾 提出 一 个 两 参数 模型 ,如 图 3 一 4 所 示 。 在 此 方案 中 ,每 一 核 苷 酸 位 点 上 ° 30 « 转换 型 替换 的 速率 为 每 单位 时 间 ,而 每 种 颠 换 型 蔡 换 类 型 的 速率 则 为 每 单位 时 间 B。 a 味 叭 A G We ee C a. 图 3 一 4 核 音 酸 蔡 换 的 两 参数 模型 。 在 此 模型 中 ,转换 的 速率 (a) 可 能 不 等 于 颠 换 的 速率 (B) 。 该 模型 比 朱 克 斯 - 坎 托 模型 复杂 ,而 我 们 将 只 给 出 最 后 结果 。 从 等 式 3. 11 我 们 看 到 ,在 朱 克 斯 - 坎 托 模型 中 , 某 一 位 点 上 在 时 刻 t 时 的 核 苷 酸 与 时 刻 0 时 的 相同 的 概率 ,对 4 种 核 苷 酸 来 说 是 相同 的 。 即 ,PAAo 王 Pecuw 王 Po 三 Prro 。 由 于 替换 方案 的 对 称 , 这 种 等 同性 对 木村 的 两 参数 模型 也 是 成 立 的 。 我 们 将 用 Xo 表 示 该 概率 。 可 以 证 明 : X@) = 4+ (Dew + (Sener (3.13) 在 朱 克 斯 - 坎 托 模型 下 ,等 式 3. 12 不 管 从 核 苷 酸 1 到 核 苷 酸 j 的 变化 是 转换 还 是 颠 换 都 成 立 。 与 之 不 同 ,在 木村 的 两 参数 模型 下 ,我 们 必须 对 转换 和 颠 换 两 种 变化 加 以 区 别 。 我 们 用 Yu 表示 起 始 核 苷 酸 和 时 刻 t 时 的 核 苷 酸 经 转换 而 互 不 相同 的 概率 。 我 们 看 到 ,由 于 替换 方案 的 对 称 , 所 以 Yu 王 PAcou 二 PeAo 王 Prco 王 Per 可 以 证 明 Y() = + A (Fe Es (Ser (3. 14) HA hMRPRSRGRERAK-HREKRPHRRMAAA AY BR.Z.H FRA: Ape a “ (Pe (3. 15) 注意 ,每 种 核 苷 酸 只 有 一 种 转换 类 型 ,但 却 经 受 着 两 种 类 型 的 颠 换 。 例 如 , 若 起 始 核 苷 酸 是 A, 那 么 这 两 种 可 能 的 颠 换 变化 即 为 A~C 和 A-~TI。 因 此 ,起 始 核 背 酸 与 时 刻 t 时 的 核 苷 酸 经 两 种 颠 换 类 型 之 一 的 变化 而 互 不 相同 的 概率 ,将 是 由 等 式 3. 15 给 出 的 概率 的 两 倍 。 还 要 注意 ,Xo 十 Yeo 十 2Zo 三 ahs 3.2 两 DNA 序 列 间 的 核 苷 酸 蔡 换 数 一 个 群体 中 的 等 位 基因 替换 一 般 要 花 成 千 甚 至 上 百 万 年 来 完成 (第 二 章 ) 。 为 此 ,我 们 不 能 靠 直接 观察 来 处 理 核 苷 酸 蔡 换 的 过 程 , 核 苷 酸 替 换 常 常 是 从 那些 有 共同 起 源 的 DNA 分 子 的 成 对 比较 中 推 断 出 来 的 。 两 个 核 苷 酸 序 列 相互 分 岐 以 后 ,每 一 个 都 将 积累 核 苷 酸 替 换 。 所 以 , 自 两 序列 发 生 分 岐 以 来 所 出 。 现 的 核 苷 酸 蔡 换 数 , 就 是 分 子 进化 中 最 通常 用 到 的 变量 。 当 两 核 苷 酸 序列 间 的 分 岐 程度 较 小 时 ,在 任 一 位 点 上 发 生 一 次 以 上 替换 的 机 会 可 以 忽略 , 则 两 序 列 间 被 观察 到 的 差异 数 将 接近 实际 替换 数 。 另 一 方面 如 果 分 岐 程度 突出 ,那么 ,由 于 在 同一 位 点 上 的 多 重 替 换 (multiple substitution ) 或 多 次 “ 击 中 ”(Cmultiple“hits”) , 观察 差异 数 看 来 将 小 于 实际 替换 数 。 例如 ,如 果 某 一 位 点 上 的 核 苷 酸 ,在 一 个 序列 中 从 A 变 到 C 再 变 到 下 ,在 另 二 个 序列 中 则 从 A 变 到 T, 那 么 ,尽管 已 发 生 了 3 次 替换 ,但 两 序列 在 该 位 点 上 却 是 相同 的 (图 3 一 5) 。 文 献 中 已 有 几 种 修正 这 . 31 。 种 偏差 的 方法 被 提 了 出 来 。 x - & «x * K ef RR x i H al ge m XK i it ® HR Bi 1 关 * VU *4 < < < be be 4 人 Peet t =o) SIS NOP LOG MENS ok Oo RO “ACT(Thr)e>ACGCThr) & 1 : AAT(Asn)AAG(Lys)«*ACG (Thr) 途径 1 需要 一 次 同 义 变化 和 一 次 非 同 义 变化 ,而 途径 工 则 需要 二 次 非 同 义 变化 .已 知 同 义 蔡 换 远 比 非 同 义 替 换 发 生得 频繁 (第 四 章 ) ,所 以 我 们 可 以 假定 途径 I 比 途 径 1 ers 我 们 假定 途径 | 的 权重 为 0. 7 而 途径 工 的 权重 为 0. 3, 那 么 两 密码 子 间 呵 义 的 差异 数 估计 为 0.7X1 十 0.3X0 王 0.7, 而 非 同 义 的 差异 数 为 0.7X1 十 0.3X2=1.3。 这 里 所 用 的 权重 是 假设 的 。 对 所 有 可 能 的 密码 子 对 的 权重 作 经 验 性 的 估计 ,富田 和 安永 (Miyata 和 Yasunaga,1980) 曾 根据 蛋白 质 顺 序数 据 作出 , 李 等 (Li 等 ,1985b) 则 根据 DNA 顺序 数据 而 得 到 。 如 果 我 们 假定 两 种 途径 可 能 性 相同 ;那么 ,上 例 的 非 同 义 差异 数 为 (L 十 2)/2 一 1. 5, 而 同 义 差异 数 则 为 (1 十 0)/2=0.5。 可 见 , 加 权 法 和 非 加 权 法 可 能 会 给 出 有 点 不 同 的 结果 。 实 际 上 ,两 种 方法 的 估 值 间 的 差异 一 般 较 小 (Nei 和 Gojobori, 1986) ,但 对 于 那些 高 度 保守 的 蛋白 质 , 如 组 蛋白 和 肌 动 蛋白 ,对 编码 的 基因 而 言 它们 可 能 非常 重要 (Li 等 , 1985b) 。 用 任何 一 种 方法 ,我 们 都 能 估 出 两 编码 序列 间 的 同 义 差 异 数 (Ms) 和 非 同 义 差异 数 (MA)。 从 以 上 结果 我 们 可 以 用 ps=MSs/Ns 算出 每 同 义 位 点 的 同 义 差 异 数 ,并 用 pp =Ma/Na 算出 每 非 同 义 位 点 的 非 同 义 差异 数 。 这 些 公式 显然 没有 把 同一 位 点 上 多 次 击 中 的 效应 考虑 进去 。 我 们 可 用 朱 克 斯 和 坎 托 的 公式 : ees £. AMs K,=— {1 3Ns} (3.23) 和 3 AM, K,=— {ln i ox | (3. 24) 来 做 这 样 的 修正 。 一 种 可 采用 的 处 理 编码 区 的 方法 是 ,把 核 苷 酸 位 点 分 成 非 简 并 的 (nondegenerate), 两 重 简 并 的 (twofold degenerate) fll Pa & fai 3# 9 (fourfold degenerate) {ii A (Li 等 ,1985b) 。 如 果 一 个 位 点 上 所 有 可 能 的 变化 都 是 非 简 并 的 , 则 该 位 点 是 非 简 并 的 ;如 果 三 种 可 能 的 变化 中 一 种 是 同 义 的 , 则 该 位 点 是 两 重 简 并 的 ;如 果 所 有 可 能 的 变化 都 是 同 义 的 , 则 该 位 点 即 为 四 重 简 并 的 。 例 如 ,密码 子 TIT(Phe) 的 前 两 位 是 非 简 并 的 ,而 第 3 位 则 是 两 重 简 并 的 ( 见 第 一 章 中 的 表 1 一 1)。 相 比 之 下 ,密码 子 GTT(Val) 的 第 3 位 是 四 重 简 并 的 。3 个 异 亮 氨 酸 密 (lle) 码 子 中 的 第 3 位 被 简化 处 理 成 两 重 简 并 位 点 ,尽管 事实 上 该 位 置 上 的 简 并 是 三 重 的 。 在 哺乳 动物 的 线粒体 基因 中 , 异 亮 氨 酸 只 有 两 个 密码 子 , 所 以 其 第 3 位 事 实 上 就 是 两 重 简 并 位 点 ( 见 第 一 二 的 委 工 二 37 将 核 苷 酸 位 点 经 上 述 分 类 分 成 各 种 简 并 美 型 (degeneracy « classes) 之 后 ,我 们 即 可 对 这 3 类 位 点 分 别 计算 两 编码 序列 间 的 替换 数 。 注 意 ,根据 定义 所 有 非 简 并 位 点 上 的 替换 都 是 非 同 义 的 。 类 似 地 ,所 有 四 重 简 并 位 点 上 的 替换 都 是 同 义 的 。 在 两 重 简 并 位 点 上 ,转换 型 变化 (Ce>*T 和 Ac>*G) 是 同 义 的 ,而 所 有 其 他 变化 , 即 颠 换 型 变化 ,都 是 非 同 义 的 。 在 哺乳 动物 线粒体 的 遗传 密码 里 ,此 规则 一 无 例外 。 另 一 方面 ,在 通用 的 细胞 核 遗 传 密码 中 , 却 有 两 个 例外 : 精 氨 酸 密码 子 (CGA 和 AGA,CGG 和 AGG) 第 1 位 ,其 上 的 一 种 颠 换 型 变化 是 同 义 的 ,而 其 他 类 型 的 颠 换 和 所 有 转换 都 是 同 义 的 ;以 及 3 个 异 亮 氨 酸 密 子 (AUU AUC 和 AUA) 中 的 最 后 一 位 也 是 如 此 。 根据 两 种 方法 计算 替换 速率 的 计算 机 程序 可 由 作者 提供 , 若 需 要 ,请 寄 一 个 格式 化 了 的 TBM PCa 三 兼容 软磁盘 来 拷贝 。 3.3 , 核 背 酸 序列 和 氨基 酸 序列 的 线性 排比 两 不 同 源 序 列 的 比较 涉及 对 缺失 和 插入 位 置 的 鉴别 问题 ,因为 两 个 品系 从 其 共同 祖先 分 玻 演 化 时 . 34 * eis sn eet itt steer digmnclit mA DNA FF Ba Be A LE ARE RRA IE A he 7 RE — PET A We» BF 8 FE BR 虽然 我 们 是 用 DNA 序列 来 说 明 线 性 排比 的 过 程 ,但 同样 的 原则 和 程序 也 可 用 于 氨基 酸 序列 的 排比 。 事 实 上 ,用 氨基 酸 顺序 与 用 DNA 顺序 比 起 来 ,前 者 通常 能 得 到 更 可 靠 的 线性 排比 线性 排比 由 一 系列 成 对 的 碱 基 组 成 ,其 中 每 一 个 碱 基 各 来 自 一 个 序列 .有 3 种 线 列 的 对 ,(1) 匹 本 的 大 基 对 ,(2) 匹 配 错误 的 碱 基 对 ,和 (3) 由 来 自 一 个 序列 的 碱 基 与 另 一 序列 的 空缺 碱 基 Cnull base) 组 成 的 对 子 。 空 缺 碱 基 用 表示。 一个 匹配 的 对 子 表示 一 个 自 两 序列 分 坡 以 来 没有 发 生变 化 的 位 点 ,_ 个 匹配 错误 的 对 子 表示 一 次 替换 ,而 一 个 空缺 对 子 则 表示 ,在 这 两 个 序列 之 一 的 该 位 置 上 曾经 发 后 过 一 次 缺失 或 者 插入 。 考虑 两 DNA 序列 A 和 B, 其 长 度 分 别 为 m 和 nm 的 例子 。 如 果 我 们 用 x 表示 匹配 的 对 子 数 ,用 Y 表示 匹配 错误 的 对 子 数 ,而 用 z 表示 含有 一 个 空缺 碱 基 的 对 子 数 , 则 我 们 有 , 1 十 Mi 一 2(z 十 y) 十 > (au Z) 点 阵 法 当 只 有 少数 裂缝 上 且 两 序列 在 其 他 任何 方面 差异 都 不 太 大 时 ,一 种 合理 的 线性 排比 可 以 由 视觉 观 察 得 到 ,或 者 也 可 用 被 称 为 点 阵 法 (dot matrix method) 的 方法 得 到 。 在 此 法 中 ,被 线 排 的 两 个 序列 作 为 一 个 和 矩阵 的 首 列 和 首 行 而 写 出 (图 3 一 6)。 在 两 序列 中 核 苷 酸 相同 的 矩阵 位 置 处 记 上 圆 点 。 如 果 两 序列 等 同 ,那么 该 矩阵 对 角 线 上 的 所 有 元 素 都 将 是 圆 点 (图 3 一 6a) 。 如 果 两 序列 有 差异 但 可 被 无 裂 颖 地 线 排 , 则 对 角 线 元 素 的 大 多 数 是 圆 点 (图 3 一 6b) 。 如 果 两 序列 之 一 中 出 现 一 个 裂 矣 , 则 线性 排比 的 对 角 线 将 垂直 或 水 平地 移动 (图 3 一 6c)。 如 果 两 序列 间 的 差异 既 有 裂缝 又 有 替换 (图 3 一 6d) , 则 找 出 裂 锋 的 位 置 并 从 犯 种 可 能 的 线性 排比 中 挑 出 一 种 可 能 是 很 困难 的 。 在 这 样 的 情况 下 ,视觉 观察 和 点 阵 法 就 不 可 靠 了 ,而 为 了 得 到 客观 的 线性 排比 已 有 几 种 计算 方法 被 提出 来 了 Met GCI ht s.tz aT, SC 6 Taco: Ph _ SSR SRR Bee i li ~4 7 A OO a> € (d) A 3—6 ThE OA Sem APE AYO 1) % sO A 212 7 HIM HEF AHA RARRLARMA. AMP ELH OSHARGRAPASH HIALEAH 组 成 。 途 径 2 含 有 8 个 对 角 线 步骤 ,其 中 2 个 是 空格 ,和 1 个 水 平 步 骤 。 途 径 1 MRAZ MHARED MY TAR 定 , 即 根据 哪 种 进化 序列 更 有 可 能 :一 次 两 核 昔 酸 缺 失 ( 途 径 1) 或 一 次 一 核 苷 酸 缺 失 和 两 次 替换 (途径 2) 来 决定 。 。35 。 顺序 一 距离 法 两 序列 间 最 为 可 能 的 线性 排比 是 ,根据 某 种 标准 使 线 列 中 匹配 错误 和 有 裂缝 的 数目 最 小 的 那 种 。 不 幸 地 是 ,降低 匹配 错误 数 结 果 常 会 导致 裂缝 数 增加 ,反之 亦 然 。 例如 ,考虑 以 下 两 个 序列 : A:TCAGACGATTG (m=11) B:TCGGAGCTG (n= 9) 我 们 可 按 如 下 排比 将 匹配 错误 数 降 到 和 零 ; 全 一 ACUTE ORG 人 人 一 全 (人 在 这 种 情况 下 裂缝 数 为 6。 反之 , 裂 矣 数 可 降低 到 由 |m 一 n| 个 核 苷 酸 组 成 的 一 个 裂 颖 ,结果 匹配 错误 数 却 增加 了 : (1) TCAGACGATTG TCGGAGCTG— — crn 在 这 种 情况 下 ,我 们 只 有 一 个 位 于 末端 ,因而 也 是 不 可 避免 的 裂缝 ,但 匹配 错误 (用 星 号 标 出 ) 的 数目 却 为 5。 或 者 ,我 们 可 以 选 一 个 裂 颖 数 和 替换 数 都 不 是 最 小 的 线性 排比 。 例 如 , (1) TCAG—ACGATTG TC—GGA—G CG 在 这 种 情况 下 匹配 错误 数 是 2, 裂 颖 数 为 4。 那么 ,这 3 种 线性 排比 中 哪 一 种 最 可 取 ? 显 然 , 将 蔡 换 与 裂缝 比较 就 好 象 将 芋 果 和 桔子 比较 一 样 。 所 以 ,我 们 必须 找到 一 个 共同 标准 , 藉 此 来 比较 裂 颖 和 替换 。 [ri] ty HE BK PK Ay Fe SE Ab Fi] (gap penalty) 。 有 几 种 指定 裂 矣 处 罚 的 系统 .所 有 系统 都 是 在 相对 于 点 状 的 替换 .缺失 和 插 人 出 现 的 频繁 程度 如 何 , 这 类 问题 的 预先 理解 的 基础 上 建立 的 。 在 第 1 个 系统 中 , 裂 颖 的 总 长 度 (z) 用 恒定 的 裂 笑 处罚 Cw) 来 乘 。 该 系统 背后 的 假定 是 ,有 某 一 裂 妖 的 概率 反比 于 裂缝 的 大 小 。 举 例 说 来 ,有 一 个 由 两 核 苷 酸 组 成 的 裂 颖 的 概率 ,与 有 两 个 各 由 一 核 苷 酸 构成 的 裂 颖 的 概率 相同 .这 样 , 对 任何 线性 排比 ,我 们 都 能 用 D= y+ wz (3. 26) 来 计算 两 序列 间 的 距离 尺度 (D)。 在 第 2 种 处 罚 系统 中 ,我们 假定 长 的 缺失 和 插入 在 进化 中 与 短 的 比较 ,出 现 的 可 能 性 是 不 同 的 。 在 这 种 情况 下 ,对 不 同 长 度 裂 颖 的 处 罚 可 能 正比 于 裂 颖 长 度 也 可 能 并 非 如 此 。 根 据 这 一 系统 ,与 某 一 特定 线性 排比 有 关 的 距离 尺度 是 D=y+ Dj wer (3. 27) 其 中 ,zk ZEKE K Bt wk WE RA OK 的 裂 颖 的 处 罚 。 现在 让 我 们 用 有 w=2 的 第 1 个 系统 来 比较 线性 排比 1,I 和 HE。 得 到 的 距离 (D) ,对 线性 排比 1,0 AM AHA 0+ (2K 6)=12,54+ (2X2) =9,M 2 十 (2X4) 王 10。 我 们 将 选取 线 排 工 。 如 果 我 们 用 有 wi=2 Aw.-6 的 第 2 个 系统 , 则 了 的 值 结 果 对 工 工 和 开 分 别 为 12,11 和 10。 在 这 种 情况 下 , HK THE LAG HE MM 任何 线性 排比 算法 的 目的 ,都 是 从 所 有 可 能 的 线性 排比 中 ,选取 具有 最 小 D 值 的 那 种 线性 排比 。 在 最 和 常 应 用 的 方法 中 ,有 尼 德 尔 曼 与 文 施 (Neeldleman 和 Wunsch,1970) 法 ,和 塞 勒 斯 (Seller,1974) 法 . 在 前 一 种 方法 中 ,两 序列 间 的 类 似 性 (similarity) 用 类 似 指 数 (Csimilarity index) 来 测度 ,而 具 最 大 类 似 性 的 那 种 线性 排比 将 被 从 所 有 候选 者 中 选取 出 来 。 在 塞 勒 斯 法 中 ,两 序列 间 的 不 相似 性 (dissimi- larity) 用 距离 指数 (distance index) 来 测度 , 具 最 小 距离 的 那 种 线性 排比 将 被 选 出 。 这 两 种 方法 曾 被 证 明 在 某 些 条 件 下 是 等 价 的 (Smith 等 ,1981) 。 在 必须 从 许多 线性 排比 中 选 出 一 种 时 ,寻找 最 佳 排比 的 任务 若 无 计 算 机 的 帮助 常常 难以 完成 。 在 。36。 尼 德 尔 曼 与 文 施 (Needleman 和 Wunsch,1970) 算 法 或 其 修订 法 的 基础 上 ,已 有 许多 关于 线 排 顺 序 的 常用 计算 机 程序 建立 起 来 。 要 记 住 的 最 重要 的 一 点 是 ,作为 最 后 结果 的 线性 排比 常 有 赖 于 裂 矣 处 罚 的 选取 ,而 后 者 又 有 赖 于 ,相对 于 点 替换 的 频率 裂缝 事件 在 DNA 和 有 蛋白质 进 化 中 的 频率 究竟 是 多 少 的 这 样 一 些 关键 的 假 ye wa 3.4 核 苷 酸 替 换 数 的 间接 佑 计 在 估计 两 序列 间 核 苷 酸 蔡 换 数 方面 ,最 完全 的 解决 可 通过 比较 它们 的 核 苷 酸 顺 序 而 得 到 。 不 过 , 蔡 换 数 也 可 从 其 他 类 型 的 分 子 数 据 ,象限 制 酶 图 谱 或 者 DNA 一 DNA 杂交 得 到 的 数据 间接 地 推断 出 来 。 限制 性 核酸 内 切 酶 片段 模式 和 位 点 图 谱 限制 性 核酸 内 切 酶 (restriction endonucleases) 或 限制 酶 (restriction enzymes) 能 识别 被 称 为 识别 顺 FF (recognition sequences) 的 特殊 双 链 ':DNA 序列 ,并 在 识别 顺序 上 或 其 近 旁 切 开 该 DNA。 识别 顺序 通 常 长 为 4 或 6 碱 基 对 ,它们 中 许多 都 是 回 文 ( 即 它们 是 旋转 对 称 的 )。 识 别 顺序 可 能 是 唯一 的 (例如 EcoRI) ,也 可 能 不 是 唯一 的 (例如 Hind I 工 )( 见 表 3 一 1) 。 切 点 称 为 拼接 位 点 (splicing site) 或 限制 位 点 (restriction site) 。 许 多 限制 性 内 切 核酸 酶 以 一 种 错开 的 方式 切 开 双 链 DNA, 所 以 将 产生 “粘性 末端 ” (sticky ends) ,以 后 它们 可 在 连接 酶 (ligase) 的 作用 下 相互 连接 (ligated)。 这 就 是 为 什么 限制 酶 能 在 遗 传 工 程 中 成 为 一 种 极 有 用 的 工具 的 原因 。 表 3 一 1 列 出 了 几 种 限制 酶 的 识别 顺序 和 拼接 位 点 。 表 3 一 1 几 种 限制 性 核酸 内 切 酶 的 识别 顺序 和 切 点 酶 ‘ 识别 顺序 (RS) 切割 识别 位 点 A SS. ee CAE BD 2K WR) 大 小 不 确定 性 回 文 “邻接 在 RS 中 错开 式 EcoR | 1_¢ 2A Aree 5) —G-LA—A- eer 03 P ~~ . . / ae (Escherichia coli) 3 —C —T eee Hind I 5 —G—T —Py Y py—A—c—3' 6 Se 4p oH oe = (Haemophilus influenzae) 3'—C—A—Pu ah 1 7G8 Hae I 5'—G—=G 4+ c—c-3 4 = 半 + 起 = (Haemophilus aegy ptus) eee Oe 4S Sx BY Bbv I 5 —G—CH AG eens! $ = “= ete = 5 (Bacillus brevis) GT 人 Nei I 5 CG + c/G—G—G—3! 5 25 + 中 下 (Neisseria cinerea) 3 —G—G_—G/e we wept Not I 5 —G=C + ¢-—G—c—c—G—c-3' 8 = 十 + +t 7 (Nocardia otitidis-caviarum) 3’—_C—G—C—C—G—G mee Hinf | 5! —G Aa ae 4 = =: = i ar (Haemophilus influenzae) 3’—-C—T—N—-A-=G—5' A a\ 识 别 顺序 用 黑体 字母 表示 .。 切 点 用 箭头 指出 .不 确定 的 地 方 , 象 Pu: 味 叭 ;Py: 喀 喧 ;C/G:C 或 G;N: 任 何 核 苷 酸 。 Nn 表示 由 mn 个 任意 的 核 苷 酸 组 成 的 序列 。 当 一 个 双 链 的 DNA 片段 受到 水 解 时 , 即 有 各 种 不 同 长 度 的 片段 产生 出 来 。 它 们 可 因 其 各 自 的 长 度 而 在 电泳 凝 胶 上 分 开 , 因 为 在 凝 胶 上 较 短 的 片段 比较 长 的 要 跑 得 更 快 也 移动 得 更 远 。 通 过 用 已 知 长 度 的 DNA 片段 作 基准 ,限制 性 片段 的 长 度 即 可 被 估计 出 来 。 不 同 的 DNA 序列 根据 其 识别 位 点 的 数 目 和 位 置 的 差异 而 受到 限制 酶 的 不 同 切 割 。 a -个 DNA 序列 水 解 产 生 的 片段 的 数目 和 大 小 被 称 为 限制 片段 模式 (restriction-fragment pattern) 。 连 续 而 交互 地 应 用 几 种 能 将 DNA 水 解 成 重 友 片 段 的 限 制 酶 ,常常 可 推断 出 DNA 上 限制 位 点 的 大 概 位 置 ( 图 3 一 7)。 表 示 某 一 DNA 序列 上 限制 位 点 的 位 置 - 37° 的 方案 图 称 限 制图 谱 (restriction map ) 。 应 用 限制 酶 来 推断 两 序列 间 的 替换 数 ,其 背后 的 理由 是 ,两 DNA 序列 的 类 似 性 越 大 则 其 限制 片 段 模式 就 越 相 似 。 通 过 对 DNA 序列 内 限制 位 点 的 分 布 作出 某 些 假 定 , 例 如 , 象 4 种 核 苷 酸 有 相同 的 频率 以 及 它们 在 序列 中 的 空间 分 布 是 随机 的 ,这 样 的 假定 , 则 从 限制 位 点 数据 就 可 以 对 DNA 序列 间 限制 模式 方面 的 进化 变化 进行 研究 ,从 而 估计 出 每 位 点 的 核 苷 酸 替 换 数 (K)。 首先 ,我们 考虑 从 限制 片段 模式 来 估计 开 。 从 共有 片段 数 来 估计 K ,要 求 我 们 对 由 限制 性 核酸 内 切 酶 水 解 的 DNA 的 电泳 模式 进行 直接 比较 .这 里 提供 的 方法 是 由 根 井 和 李 (Nei 和 Li,1979) 创 导 的 。 文献 中 曾 报导 过 另外 两 种 方法 (Upholt,1977;Engels,1981la) ,而 卡 普 兰 (Kaplan,1983) 曾 证 明了 这 3 种 方法 给 出 类 似 的 结果 。 DNA 的 两 序列 间 共 有 DNA 片段 的 期 望 比例 IF) ,可 由 A 2mxy f= tn (3. 28) 来 估计 ,其 中 mx 和 my APE AES X ALY 7K RG Pe AE AY Bl BE BC. Oxy J Je BB SEAR BY 片段 数 。 根 井 和 李 (CNei 和 Liy,1979) 曾 证 明 , 共 有 片段 的 期 望 比例 (FE) 可 用 在 t 时 间 内 某 一 限制 位 点 保持 不 变 的 概率 (G) 来 表示 ,两 者 之 间 的 近似 关系 为 Fr soz Ge ™G yr BA Ae ETE A EAE YP td Bt fe}, 3c 26 FF fe) EA ABO K=2at. WT GRIM KHER 3. 29,8 G = (F(3 一 2G)]1 (3. 30) Wr AT at — 7 ER A. ABE (Nei, 1987) 建议 用 G=F2 作 为 最 初 尝试 值 . 一 般 只 需要 很 少 几 次 反复 循环 。G 的 估 值 可 使 我 们 得 到 KK 的 估 值 ,关系 如 下 : aes = in(G) (3. 31) (3. 29) 让 我 们 来 考虑 下 面 这 样 一 个 例子 : 取 自 两 种 野生 小 麦 (4egiiozs sharonensis 和 Ae. bicornis) 1) FAM 线粒体 DNA 片段 ,用 3 种 限制 酶 ,Ba 1, Hind I fl EcoRI 来 水 解 ,它们 的 识别 顺序 都 为 6 碱 基 对 长 (数据 自 Graur 等 ,1989a) 。4e. sharonensis 水 解 产 生 4 个 片段 ,而 Ae. bicornis 水 解 则 产生 5 个 片段 。 两 个 片段 为 两 种 小 麦 所 共有 。 用 等 式 3. 28 ,我 们 估 出 下 为 2/9 王 0. 222。 现 在 我 们 可 以 开始 由 等 式 3. 30 给 出 的 反复 尝试 过 程 。 我 们 采用 的 G HAW 0. 222'*=0. 687. 第 一 次 循环 后 我 们 得 G=0.775, 而 下 一 次 循环 G=0.753。 随 着 尝试 的 进行 摆 幅 将 越 来 越 小 ,而 在 弟 5 次 和 第 6 次 循环 后 我 们 都 得 到 G=0.758。 因 此 ,我们 终止 反复 尝试 过 程 。 为 了 得 到 两 序列 间 替 换 数 的 估 值 ,我 们 用 等 式 3. 31。 最 后 结果 是 ,两 线粒体 序列 的 相互 差异 用 每 核 苷 酸 位 点 替换 数 K=0. 092 来 估计 。 现在 我 们 考虑 由 限制 位 点 图 谱 估计 两 序列 间 的 核 苷 酸 替 换 数 .在 前 面 的 例子 中 ,限制 位 点 的 位 置 是 未 知 的 。 如 果 限 制 位 点 已 在 DNA 序列 上 定位 ,那么 ,我 们 可 以 直接 从 图 谱 上 找 出 共有 和 非 共有 的 位 点 ,并 估 出 替换 数 。 设 mx 和 my 分 别 为 DNA 序列 X 和 了 中 限制 位 点 的 数目 ,而 mxv 为 两 序列 间 共 有 的 限制 识别 位 点 数 。X 和 在 某 一 给 定位 点 上 共有 同样 的 识别 顺序 的 概率 用 S 表示 ,此 值 可 用 2772Xy 二 mx + my (3432) 估 出 (Nei Al Li,1979), RARER KH H.p. al AA p=1—S (3. 33) 估计 Er Se Sal UL HA EP PR BC. Pe 3 ia) A TF C8. 19 MEY p 估 出 。 限制 位 点 图 谱 法 比 限制 片段 模式 法 要 乏味 一 些 ,但 却 可 靠 得 多 。 前 者 在 区 值 高 达 0 25 时 仍 可 应 用 , 而 后 者 对 于 K>0. 05 的 情况 就 可 能 是 不 精确 的 。 38 « ES 酶 工 的 位 点 ae! Fe ee A ; 1 a Oe, en : Waly At cone fe 1 A i (b) 2p i a cr a a6 I Ki Nm 心 ul (e) WHE 片段 中 看 到 ] {A,D 2 1A,E 3 B,E 4 B,E 5 CF Vv ( i ee (g) iIuid 图 3 一 7 DNA 序列 上 限制 位 点 的 定位 图 。(a) 一 个 假想 的 DNA, 具 有 由 两 种 不 同 的 限制 酶 识别 的 识别 位 点 .该 序 列 的 识别 图 谱 未 知 。(b)3' 端 用 放射 性 标记 . (C)DNA 由 酶 工 水 解 产生 片段 A,B 和 C, 而 由 酶 开水 解 则 产生 片段 D、 正和 FE。(d7 用 一 种 限制 酶 得 到 的 每 一 片段 再 用 另 一 种 限制 酶 水 解 , 产 生出 亚 片 段 1 一 5。(e) 这 些 亚 片 段 被 用 于 鉴别 重 登 片段 。(f) 这 些 亚 片段 按 它们 间 的 重 枉 模 式 指 示 的 秩序 排列 。 (g) 推 理 出 的 DNA 序列 的 限制 图 谱 。 片 段 和 亚 片 段 可 根据 它们 的 长 度 一 个 个 地 鉴别 出 来 ,而 长 度 则 是 从 它们 在 电泳 凝 胶 上 的 位 置 推出 的 。 未 端 片段 和 亚 片 段 则 由 其 放射 性 标记 来 鉴别 。 自 Suzuki 等 (1989) 修 改 而 成 。 DNA—DNA 杂交 DNA—DNA 杂交 (DNA 一 DNA hybridization ) 技 术 是 以 这 样 的 事实 为 根据 的 : 双 链 DNA 分 子 的 热 稳定 性 有 赖 于 两 条 链 间 核 苷 酸 匹配 的 比例 。 随 着 匹配 比例 的 降低 , 双 链 的 热 稳定 性 也 降低 。 在 两 条 链 来 自 同 一 序列 的 双 链 DNA( 即 同 源 双 链 (homoduplex) 分 子 ) 中 ,匹配 的 比例 根据 定义 应 为 100 和 % 。 另 一 方面 ,在 两 条 链 来 源 不 同 的 双 链 DNA( 即 异 源 双 链 (heteroduplex) 分 子 ) 中 ,匹配 的 比例 则 小 于 1。 其 大 小 有 赖 于 这 两 个 序列 自 它 们 从 某 一 共同 祖先 分 化 以 来 究竟 累积 了 多 少 核 苷 酸 关 异 。 所 以 , 异 源 双 链 DNA 将 会 在 比 同 源 双 链 DNA 低 的 温度 下 变性 或 熔 解 成 单 链 。 DNA 杂交 试验 的 基本 实验 程序 如 图 3 一 8 所 示 。 大 致 上 ,在 重复 序列 被 除去 以 后 ,该 程序 包括 将 来 自 两 不 同 物种 的 变性 DNA 的 混合 物 缓慢 冷却 ,以 制造 出 人 工 杂 种 DNA 分 子 。 然 后 ,将 该 混合 物 逐 DNA- DNA 通过 单 链 重新 退火 athe IE 形成 的 DNA- DNA 双 链 50 区 0 A 物 种 同 源 双 链 和 R ja Ra 3 异 源 双 链 a # NIVWV : B 物种 同 源 双 链 图 3 一 8 从 DNA 一 DNA 杂交 研究 推论 出 的 顺序 类 似 性 。 双 链 分 子 被 熔 解 成 单 链 的 DNA。 同 源 双 链 和 异 源 双 链 通 过 单 链 的 重新 退火 而 形成 。50% 的 DNA 熔 解 成 单 链 的 温度 用 Tm 表示 ,测定 两 种 同 源 双 链 和 异 源 双 链 的 Tm。 两 . 种 同 源 双 链 间 的 Tm 值 可 能 是 不 同 的 ,同样 两 互 不 相同 的 异 源 双 链 类 型 间 的 Tm 值 也 可 能 是 不 同 的 。 自 Avers 〈《1989) 修 改 而 成 。 渐 加 热 ,并 在 每 一 温度 下 测定 溶液 中 单 链 DNA 的 百分比 。 关 于 此 法 (TEACL 法 ) 的 详细 介绍 ,可见 例 如 享 特等 (Hunt 等 ,1981) 的 论述 。 杂种 DNA 的 热 稳 定性 ,用 50%% 的 杂种 DNA 解 离 成 单 链 时 的 温度 来 度量 。 然 后 将 此 半 熔 解 温度 与 50 为 的 同 源 双 链 DNA 变 成 单 链 时 的 温度 比较 。 注 意 , 在 每 一 次 种 间 比 较 中 ,我 们 有 两 种 同 源 双 链 , 每 物种 各 有 一 种 ,所 以 ,习惯 上 我 们 用 它们 的 半 熔 解 温度 的 平均 值 。 同 源 双 链 和 蜡 源 双 链 的 半 熔 解 温 度 间 差 异 ,ATm, 由 经 验证 明 , 与 碱 基 对 误 配 的 比例 近似 地 线性 相关 (Britten 等 ,1974)。 我 们 将 这 种 关 系 表示 成 户 一 CATm (3. 34) 这 里 p 是 误 配 的 比例 ,C 是 一 个 常数 。C 的 值 通过 对 碱 基 对 误 配 度 已 知 的 异 源 双 链 进行 DNA 一 DNA 杂交 试验 ,而 从 经 验 上 得 到 。C 值 被 发 现 随 实验 条 件 的 不 同 而 在 C=0. 01 和 C=0. 015 之 间 变 化 。 已 知 ATm 的 实验 误差 是 非常 大 的 ,因此 ,对 同样 的 物种 对 应 该 做 许多 次 重复 观察 。 现在 让 我 们 来 考虑 下 面 的 一 个 数字 例 ( 数 据 来 自 Caccone 和 Powell,1989)。 KA AK ARBRE (Pan paxzzscxs) 雄 性 的 同 源 双 链 DNA 的 平均 Tm 值 , 分 别 为 59.50C 和 59.12C 。 于 是 , 同 源 双 链 分 子 的 LE 平均 值 为 59. 31C 。 两 交互 的 异 源 双 链 DNA 的 Tm 平 均值 则 为 57. 59C 。 因 此 ,ATm 为 1. 72C. 由 等 式 3. 34, 我 们 得 到 一 个 每 核 苷 酸 位 点 大 约 0. 017 一 0. 026 次 替换 的 差异 。 . 40° 习题 1. 证 明 等 式 3. 3 Xt t=O 成 立 , 即 , 若 t=0 则 它 将 简化 成 等 式 3. 1 。 2. 导出 等 式 3. 10, 并 证 明 在 朱 克 斯 - 坎 托 模型 下 Poa =Pcaw =Praw 3. 当 a=B 时 ,木村 的 两 参数 模型 将 变 得 与 朱 克 斯 和 坎 托 的 一 参数 模型 等 同 。 为 了 证 实 这 一 点 。 证 明 : 当 此 条 件 满 足 时 ,等 式 3. 13 将 变 得 与 等 式 3. 11 相同 , 且 等 式 3.14 和 3.15 都 变 得 与 等 式 3. 12 相同 。 4. 用 等 式 3. 13,3.14 和 3.15 证 明 ,在 木村 的 两 参数 模型 下 -一 个 序列 中 4 种 核 昔 酸 的 平衡 频率 都 是 相同 的 ( 即 1/4) ,这 与 一 参数 模型 的 结果 一 样 。 5. ASK 3.16 SS 3.17, 6. 对 以 下 两 个 序列 Ser Thr Glu Met Cys Leu Met Gly Gly TCA ee uns AMG TCT TTA . ATG | GGG GGA ee eon | GGG. CATA TAT) :CTAC ATG GGTin ATA Ser Thr Gly Ile Tyr Leu Met Gly Tle 计算 (\a) 每 同 义 位 点 的 同 义 替 换 数 和 (b) 每 非 同 义 位 点 的 非 同 义 替 换 数 。 7. 根据 木村 的 两 参数 模型 ,两 序列 间 的 差异 数 为 P 二 Q ,证 明 当 转换 和 颠 换 合 起 来 考虑 时 等 式 3. 21 将 被 简化 成 等 式 3. 19。 8. 用 点 阵 法 线性 排比 以 下 两 个 顺序 : AATGCTTGCATGGGGCTAGTT ATTGCTGCATGAGGCGCGCTAGT 选 出 两 种 可 能 的 线性 排比 ,并 决定 用 每 核 苷 酸 为 2 BY He BE Ah Sa — Sp a AY 裂缝 处 罚 ,比如 说 10 ,该 选择 会 受到 影响 吗 ? 5 3 2 4 Vv AEE ae, SS ee ee), ere | 1 + 3 6 人 图 3 一 9 两 限制 性 内 切 核酸 酶 图 谱 的 假想 例 。 序 列 上 的 数字 代表 这 些 片 段 的 长 度 (以 kb 为 单位 )。 9. 从 图 3 一 9 中 的 两 序列 的 限制 位 点 图 谱 , 估 计 两 序列 间 核 苷 酸 的 替换 数 , 用 (a) 共 有 片段 的 比 例 , 和 (b) 共 有 限制 位 点 的 比例 。 限 制 性 内 切 核酸 酶 的 识别 顺序 为 4 RR. PA 6 RE 点 的 限制 性 内 切 核 酸 酶 ,将 会 有 什么 样 的 结果 ? 该 差异 的 原因 是 什么 ? 后 继 阅 读 文献 Doolittle. R. F. 1990. Molecular Evolution: Computer Analysis of Protein and Nucleic Acid Se- quences, Academic Press, San Diego, CA Li, W.-H..C. -C. Luo and C. -I. Wu. 1985. Evolution of DNA sequences . pp. 1—94, In R. - MacIntyre (ed. ), Molecular Evolutionary Genetics, Plenum, New York. Nei, M. 1987 Molecular Evolutionary Genetics, Columbia University Press. New York. 4 核 昔 酸 蔡 换 的 速率 和 模式 前 一 章 中 导出 的 数学 理论 可 用 于 核 苷 酸 替 换 速 率 的 研究 之 中 ,而 该 速率 则 是 分 子 进化 研究 里 的 一 个 基本 量 。 事 实 上 ,为 了 阐明 某 一 DNA 序列 进化 的 特性 ,我 们 需要 知道 , 它 进 化 得 究竟 有 多 快 ,以 及 其 组 成 部 分 的 核 苷 酸 替 换 速 率 是 多 少 。 比 较 一 下 基因 和 不 同 DNA 区 域 间 的 替换 速率 也 是 很 有 趣 的 ,因为 这 可 以 帮助 我 们 理解 进化 中 核 苷 酸 蔡 换 的 机 制 。 知道 了 核 音 酸 蔡 换 的 速率 ,还 使 我 们 能 对 物 种 间 的 分 岐 演化 这 样 的 进化 事件 ,给 出 一 个 时 间 年 代 来 .不 过 ,要 想 做 到 这 一 点 ,我 们 必须 知道 从 一 组 物种 佑 出 的 速率 是 否 能 适用 于 另 一 组 生物 种 群 。 这 就 提出 了 这 样 一 个 问题 , 即 ,速率 在 不 同 的 进化 谱 系 间 是 怎样 变化 的 。 4.1 TRARY RR % TE WR PF 4 HY BE (rate of nucleotide substitution ) 被 定义 成 每 年 每 位 点 的 替换 数 ,并 可 用 两 同 源 序列 间 的 替换 数 开 , 除 以 2 工 来 算出 ,这 里 工 是 两 序列 间 发 生 分 岐 的 时 间 ( 图 4 一 1)。 即 , 人 入 (4.1) 祖先 序列 序列 1 序列 2 图 4 一 1 两 同 源 序列 在 工 年 前 从 某 一 共同 祖先 序列 分 岐 而 来 。 两 序列 发 生 分 岐 的 时 间 工 ,假定 与 两 物种 发 生 分 化 的 时 间 相 同 , 且 通常 都 用 古生物 学 数据 资料 来 推 算 。 本 节 我 们 将 处 理 不 同 基因 间 , 和 某 一 基因 的 不 同 区 域 间 的 速率 变异 问题 。 为 此 目的 ,建议 对 所 有 被 考虑 的 基因 使 用 同样 的 物种 对 。 这 有 两 重 原因 。 首先 ,关于 分 岐 时 间 的 古生物 学 估计 通常 都 有 很 天 的 不 确定 性 。 用 同一 对 物种 ,我 们 就 可 以 无 须知 道 分 岐 时 间 而 去 比较 各 基因 间 的 进化 速率 。 其 次 , 替 换 速 率 在 各 谱系 间 可 能 变化 很 大 ( 见 第 48 页 ) ,在 这 种 情况 下 ,两 基因 间 速 率 上 的 差异 可 能 是 由 谱系 间 的 差异 所 造成 ,而 不 是 由 两 基因 本 身 的 差异 所 造成 的 。 目前 研究 核 苷 酸 蔡 换 速率 的 最 合适 的 数据 来 自 哺 乳 动物 ,这 是 因为 ,有 关 哺 乳 动物 的 DNA 序列 的 数据 最 为 丰富 ,有 关 哺 乳 类 的 化 石 记 录 相 对 而 言 特征 比较 明确 .全面 ,再 加 上 可 以 得 到 哺乳 类 之 间 相当 可 靠 的 分 岐 时 间 的 缘故 。 编码 区 我 们 在 表 4 一 1 中 列 出 了 36 种 为 蛋白 质 编码 的 基因 的 同 义 蔡 换 速 率 和 非 同 义 替 换 速 率 。 这 些 速 率 是 从 人 类 与 中 齿 类 同 源 基因 间 的 比较 中 算出 的 。 根 据 与 真 兽 亚 纲 哺乳 类 的 辐射 演化 有 关 的 古生物 学 证 据 , 人 类 := 吵 齿 类 的 分 岐 时 间 已 被 设 定 为 8000 万 年 前 。 © 42° 表 4 一 1 ”哺乳 类 各 为 蛋白 质 编码 的 基因 的 同 义 蔡 换 速 率 和 非 同 义 蔡 换 速率 ” 基因 非 同 义 替 换 速 率 (X103) 同 义 替 换 速 率 (X10?) 组 蛋白 组 蛋白 3 135 0. 00 士 0. 00 6. 38+1.19 组 蛋白 1 101 0. 00 士 0. 00 GE 已 - 上 3 多 收编 系统 蛋白 肌 动 蛋白 a 376 0.01 士 0.01 3. 68 士 0. 43 肌 动 蛋白 349 0. 03 士 0. 02 3.1340. 39 WR . HS Ak A ft TR HE AK 生长 激素 释放 抑制 因子 一 28 28 0. 00 士 0. 00 3. 97 士 2. 66 胰岛 素 51 Oss Os 4.0242. 29 促 甲状 腺 素 118 0. 33 士 0. 08 BT 胰岛 素 样 生 长 因子 工 179 0. 52 士 0. 09 2. 32+0. 40 促 红细胞 生成 素 191 0.72+0.11 4. 34+0. 65 胰岛 素 C MK 35 0. 91+0. 30 6. 7743. 49 甲状 旁 腺 素 90 0. 94 士 0. 18 4.18 士 0. 98 促 黄体 生成 激素 141 1. 02+0. 16 3. 29+0. 60 生长 激素 189 1.23 0. 15 4. 95+0. 77 尿 激酶 一 血 纤 蛋白 溶 酶 原 435 1. 28+0. 10 3. 92+0. 44 活化 因子 白细胞 中 介 素 I 265 1.42+0. 14 "4. 6040. 65 松 驰 肽 54 2.5140. 37 7.49+6. 10 血红 和 蛋白 和 肌 红 蛋白 o- 珠 蛋 自 141 M5550. 11 5. 14+0. 90 肌 红 蛋白 153 0. 56+0. 10 4.44+0. 82 B- 珠 蛋白 144 0. 80 士 0. 13 3. 05 士 0. 56 载 脂 蛋白 E 283 0. 98 士 0. 10 4.0440. 53 A 三 时 243 1. 57 士 0. 16 4. 47 士 0. 66 A 一 RN 371 1.58+0. 12 4. 15+0. 47 免疫 球 蛋 白 IgVu 100 1.0740. 19 5. 661. 36 IgY, 321 1.46+0. 13 5. 1140. 64 Igk 106 1. 8740. 26 5. 90+1. 27 FRR al 166 1.4140. 13 3.5340. 61 Bl 159 2. 2140. 24 5. 88+1. 08 Y 136 2. 79+0. 31 8. 59+2. 56 其 他 蛋白 质 醛 缩 酶 A 363 0. 07 士 0. 03 3.59+0. 52 Fe Bi ORS BR AR HK BH IE 217 0.1340. 04 2.1340. 35 He 肌 酸 激酶 M 380 0. 15+0. 03 3. 08+0. 37 甘油 醛 -3- 磷 酸 脱 氢 酶 331 0. 20 士 0. 05 2. 8440. 37 FLA A 331 0. 2040. 04 5. 03+0. 61 乙酰 胆 碱 受 体 y 亚 基 , 540 . 0. 29+0. 04 3. 2340. 3] it AF AG RY 411 ADS a 5. 82+0. 67 AA 590 0. 9140. 07 6. 63+0. 61 平均 * 0. 85(0. 73) 4.61(1. 44) a. 所 有 速率 都 以 人 和 嗜 齿 类 基因 间 的 比较 为 根据 , 且 分 岐 时 间 设 定 为 8000 万 年 以 前 。 速 率 以 每 10° 年 每 位 点 替换 数 为 单位 。 b.L= 受 比较 的 密码 子 数 。 : c. 平均 指 算术 平均 值 ,括号 内 的 值 为 标准 偏差 ,都 是 用 所 有 基因 的 值 算出 的 。 我 们 注意 到 , 非 同 义 替 换 的 速率 在 基因 间 变 化 极 大 。 变 化 幅度 从 组 蛋白 3 和 组 蛋白 4 的 有 效 数 字 为 零 ,到 干扰 素 Y 的 每 年 每 非 同 义 位 点 2.79 又 10-?" 替 换 。 某 些 激素 (例如 生长 激素 释放 抑制 因子 一 28 和 胰岛 素 ) 是 极其 保守 的 ,而 另 一些 激 素 则 或 者 以 中 间 速 率 ( 例 如 促 红细胞 生成 素 ) 进 化 ,或 者 以 高 速 率 ( 例 如 白细胞 中 介 素 I 和 松 驰 肽 ) 进 化 .血红蛋白 和 肌 红 和 蛋白 以 中 速 进化 ,而 载 脂 蛋 白 和 免疫 球 重 昌 则 进化 得 非常 迅速 。 。 43-¢ ev wm we —_ — . — 同 义 蔡 换 的 速率 变化 也 相当 大 ,不 过 比 起 非 同 义 替 换 来 速率 变化 要 小 得 多 。 可 以 证 明 , 基 因 间 同 义 蔡 换 速 率 方面 的 变异 明显 地 大 于 仅 由 统计 学 波动 造成 的 期 望 变异 。 对 表 4 一 1 中 绝 大 多 数 基因 来 说 , 同 义 替 换 的 速率 大 大 超过 非 同 义 蔡 换 的 速率 。 如 在 一 个 最 极端 的 例子 ,组 蛋白 3 中 ,虽然 从 其 氨基 酸 顺 序 看 它 是 进化 上 最 为 保守 的 蛋白 质 中 的 一 种 ,但 其 同 义 蔡 换 的 速率 却 非 常 高 。 对 表 4 一 1 中 的 基因 来 说 , 非 同 义 蔡 换 的 平均 速率 为 每 年 每 非 同 义 位 点 0585 久 10 * 替换 。 同 义 替 换 的 平均 速率 为 每 年 每 同 义 位 点 4.6X10 "替换 , 即 为 非 同 义 替 换 平均 速率 的 5 倍 。 非 编码 区 来 自 非 编 码 区 的 数据 远 不 如 来 自 编码 区 的 数据 丰富 ,所 以 目前 只 做 过 有 限 的 比较 分 析 工作 。( 注 意 ,要 估 出 某 一 序列 中 的 替换 速率 ,我 们 必须 至 少 有 来 自 两 个 物种 的 数据 。) 因 为 大 多 数 已 发 表 的 序列 为 mRNA ,它们 不 含 内 含 子 和 侧 区 域 , 所 以 ,其 5 和 3' 不 翻译 区 是 唯一 能 进行 仔细 研究 的 非 编码 区 . 表 4 一 2 列 出 了 根据 人 与 咕 齿 类 比较 得 到 的 16 种 基因 中 这 两 个 区 域 的 替换 速率 。 在 这 两 个 区 域 中 不 同 基因 间 的 速率 变化 都 非常 大 ,但 这 种 变异 可 能 很 大 程度 上 代表 了 抽样 所 造成 的 影响 ,因为 这 两 区 域 通常 都 非常 短 。 在 几乎 所 有 基因 中 ,5' 和 .3' 不 翻译 区 中 的 速率 都 低 于 四 重 简 并 位 点 上 的 替换 速率 ( 即 , 其 上 所 有 可 能 的 核 苷 酸 蔡 换 都 是 同 义 蔡 换 的 位 点 )。5 和 3' 不 翻译 区 的 平均 速率 分 别 为 每 年 1. 96 X 10 "和 2.10X10 替换, 它们 都 约 为 四 重 简 并 位 点 上 的 平均 速率 ,每 年 3. 55X10 替换 的 60% 。 表 4 一 2 根据 人 与 小 鼠 或 大 鼠 的 基因 间 比 较 ,得 到 的 为 蛋白 质 编码 的 基因 的 Rs 不 翻译 区 和 四 重 简 并 位 点 上 的 核 背 酸 蔡 换 速 率 * 5' 不 翻译 区 3' 不 翻译 区 四 重 简 并 位 点 > ye ce 速率 二 速率 L 速率 ACTH 9099 7 二 0ORT 07 «| 25 上 01 275 Beyer 醛 缩 酶 A 124 1. 08:0.26 154 1:7340.32 195 3.160.408 载 脂 蛋白 A— 83 3.0640. .63053473 二 全 35 160 3. 38 士 0. 50 aK AE 23 1. 27+0. 69 84 1.70+0.42 . 153 ‘4.0040. 60 Na, K-ATP fig 8 118 2.45+0.45 1117 0.5740.06 118 2.87+0.54 肌 酸 激酶 M 70 1.714:0.46 968 1.79-0.30 178 2. 812:028m o- 胎 蛋 自 47 3.6441.13 144 2.79+0.49 225 4.144+0.54 o- 珠 蛋白 34 1.5640.65 90° 2.2140.50 81 4.47+0.98 © B- 珠 蛋白 50 1.3040.46 126 2.85+0.49 78 2. 42+0. 56 甘油 醛 -3- 磷 酸 脱 氢 酶 70 -153440.38 121 1.74 土 0.36 .170 2. 430. 39 生长 激素 21. -1.79+0.85 91. 1.8340.41 83 3.8240.78 胰岛 素 56 2.92+0.80 ‘53° 3.09+0.81 62 4.19+1.00 白细胞 中 介 素 :1 59 1.09 寺 0.38 1046 2.02+0.14 105 2.97+0.60 乳酸 脱氧 酶 A 95 2.7940.85 , 470 2.4840.23 152 346440560 pi aac aes 61 1.88+0.52 111 2.5740.48 23 2.37+1.00 酸 三 甲 基 内 盐 1 甲状 旁 腺 素 84. «1.794043 228 2.2140.30 38 3.85+1.21 平均 * 1. 96(0. 78) 2. 10(0. 61) 3. 33(0. 69) a. 速率 以 每 10? 年 每 位 点 替换 数 为 单位 。 b. L= fi BM. c\ 平 均 指 算术 平均 ,括号 内 的 值 为 标准 偏差 ,都 是 用 所 有 基因 的 值 算出 的 。 假 基 因 (pseudogenes) 是 一 些 由 功能 基因 派生 ,但 由 于 发 生 了 阻止 其 正常 表达 的 突变 而 退化 成 无 功能 的 DNA 序列 (第 六 章 和 第 七 章 )。 由 于 它们 不 受 功 能 限制 ,所 以 ,它们 可 以 期 望 以 较 高 的 速率 进 化 。 表 4 一 3 列 出 了 乳牛 和 山羊 的 4y 队 和 凡 ' 假 基因 中 苦 换 速率 间 的 比较 ,以 及 B 一 和 7 一 珠 蛋 自 基因 中 非 编 码 区 和 四 重 简 并 位 点 上 的 速率 间 的 比较 。 这 些 假 基因 中 的 速率 事实 上 略 高 于 其 他 区 域 中 的 速 。44。 率 。 看 来 这 一 点 对 假 基 因 来 说 是 普遍 成 立 的 ,尽管 目前 有 关 假 基因 的 资料 尚 属 有 限 。 表 4 一 3 乳牛 和 山羊 的 B 一 和 7 一 珠 蛋 和 白 基 因 间 的 分 岐 ,以 及 B 一 珠 蛋 和 白 假 基因 间 的 分 上 EEN BR 和 小 珠 蛋白 基因 。 统计 量 SFL BUT mmm? WAP SUT gL BH HAHA 5.3 Tad . 1 BiG 8.1 8.8 6 | Shah 标准 误差 u2 2.0 2.5 O07 2.2 1.5 0.9 an FL = {0 Jak ; UT = 76 aa OK ah 5 DA Pe IE — WO A PE A 4 一 2 中 .我 们 对 基因 的 不 同 区 域 中 .以 及 假 基 因 中 的 替换 速率 进行 了 比较 .关于 5' 和 3' 不 翻译 1 po as kx KI ‘ = : 忌 +i 各 ae a a ry i en Rar 3 Kl bd Ma > x aes # mR ot & Fs ats x hk § tal KK ling di ZK is : nee id hs He = : ei 2 3 Fe Ag Fee - Fe FS ASe ix 2 eS M iw pies i a Oar = ie be te ne 5 a 基因 假 基因 图 4 一 2 大 区 域 , 非 简 并 位 点 ,两 重 简 并 位 点 和 四 重 简 并 位 点 的 速率 ,都 是 将 表 4- 2 中 所 列 基因 加 以 平均 后 的 平 均 速 率 。5' 侧 区 域 的 速率 ,通过 假定 该 速率 与 四 重 简 并 位 点 上 的 速率 之 比 为 5. 3/8. 6( 即 由 表 4 一 3 得 出 的 值 ), 和 四 重 简 并 位 点 上 的 平均 速率 为 每 年 3. 33X10-? 替 换 ( 表 4 一 2) 而 算出 。 内 含 子 的 速率 ,3/ 侧 区 域 的 速率 以 及 假 基 因 的 速率 也 按 同 样 方式 算出 。 由 于 以 有 限 的 资料 为 基础 而 作出 的 估计 已 经 够 多 了 ,又 由 于 一 个 区 域 中 的 速率 会 因 基 因 的 不 同 而 有 差异 ,所 以 ,图 4 一 2 中 展示 的 速率 可 能 对 任何 一 个 具体 的 基因 都 是 不 适用 的 ,但 它 却 提供 了 不 同 DNA 区 域 中 的 替换 速率 间 一 个 大 致 的 .一 般 性 的 比 较 . 有 了 这 种 思想 准备 ,我 们 将 看 到 ,一 个 基因 中 的 替换 速率 以 四 重 简 并 位 点 上 的 为 最 高 ,内 含 子 中 和 3' 侧 区 域 中 要 略 低 一 些 ,3' 不 翻译 区 域 ,5' 侧 区 域 ,5' 不 翻译 区 域 和 两 重 简 并 位 点 有 中 等 大 小 ,而 非 简 并 位 点 上 的 为 最 低 。 平 均 下 来 假 基因 有 最 高 的 替换 速率 ,虽然 它 只 比 一 个 功能 基因 的 四 重 简 并 位 点 上 的 速率 稍 高 一 些 。 4.2 和 蔡 换 速率 变异 的 原因 为 了 推理 出 DNA 区 域 间 替 换 速率 出 现 变 异 的 原因 ,我们 应 注意 到 ,替换 速率 是 由 两 个 因子 所 决 ” 定 的 :(1) 突 变 率 和 (2) 一 个 突变 的 固定 概率 (第 二 章 )。 后 者 又 与 该 突变 是 有 利 的 .中 性 的 还 是 有 害 的 有 关 。 由 于 突变 率 看 来 在 一 个 基因 内 变化 不 大 而 在 不 同 基因 间 则 可 能 变化 较 大 ,所 以 ,我 们 将 对 一 个 “基因 的 不 同 区 域 间 的 速率 变异 和 不 同 基因 间 的 速率 变异 分 别 讨论 。 不 同 基因 区 域 间 的 变异 我 们 首先 考虑 一 个 基因 中 同 义 位 点 和 非 同 义 位 点 间 的 大 差异 。 由 于 一 个 基因 内 同 义 位 点 与 非 同 义 位 点 上 的 突变 率 应 该 相同 ,或 者 至 少 是 非常 相似 ,所 以 ,替换 速率 上 的 差异 就 可 归 因 于 两 种 不 同类 。 495。 型 位 点 间 纯 洁 化 选择 的 强度 上 的 差异 。 这 可 用 分 子 进 化 的 中 性 学 说 来 理解 (第 二 章 )。 结 果 会 导 - 氮 基 酸 替换 的 突变 比 同 义 的 改变 对 该 蛋白 质 的 功能 造成 有 害 影响 的 机 会 要 高 。 所 以 , 绝 大 多 数 非 同 义 突 变 都 将 受 纯洁 化 选择 而 从 群体 中 清除 。 其 结果 将 使 非 同 义 位 点 上 的 替换 速率 降低 。 相 比 之 下 , 同 义 的 改变 有 较 高 的 机 会 是 中 性 的 ,而 它们 中 在 群体 中 固定 的 也 要 多 些 。 当然 , 非 同 义 替 换 可 能 有 幸 使 蛋白 质 的 功能 得 到 改善 。 然 而 ,如 果 有 利 选 择 在 该 蛋白 质 的 进化 中 起 主要 作用 的 话 , 则 非 同 义 蔡 换 的 速率 应 该 超过 同 义 替 换 的 速率 .事实 上 ,在 某 些 免疫 球 蛋 白 基 因 里 , 决定 互补 性 的 区 域 (CDRs,, 又 以 高 可 变 区 著称 ) 中 非 同 义 的 速率 高 于 同 义 的 速率 。 这 种 较 高 的 速率 已 经 归 因 于 对 抗体 多 样 性 的 超 显 性 选择 (CTanaka 和 Nei,1989)。 不 过 , 当 考 虑 的 是 整个 免疫 球 蛋 自 基 因 时 , 非 同 义 的 速率 仍然 大 大 低 于 同 义 的 速率 ( 表 4 一 1) 。 这 个 结果 指出 ,即使 在 免疫 球 蛋白 中 ,大 多 数 非 同 义 突变 也 是 不 利 的 ,并 且 将 从 群体 中 清除 。 休 斯 和 根 井 (Hughes 和 Nei,1989) 曾 报导 在 主 组 织 相 容 性 复合 体 基 因 的 某 些 区 域 中 有 类 似 情形 , 即 非 同 义 替 换 的 速率 超过 同 义 替 换 的 速率 。 他 们 把 非 同 义 替换 有 更 高 的 速率 归 因 于 超 显 性 选择 。 一 个 基因 中 同 义 的 和 非 同 义 的 速率 间 的 对 比 证 明了 分 子 进化 中 一 个 众所周知 的 原则 , 即 ,对 某 一 大 分 子 的 功能 限制 越 强 , 则 其 进化 的 速率 就 越 缓 慢 。 杰 村 Kimura,19837 曾 用 一 个 简单 模型 将 此 原则 表达 成 一 个 公式 。 假 定 某 一 分 子 中 所 有 突变 的 某 一 部 分 上 ,是 选择 中 性 或 近 下 竹 的 ;而 其 余 的 则 是 有 Sica ae ee a ne ea ed 它们 对 整个 分 子 进 化 的 速率 没有 多 大 贡献 )。 如 果 我 们 用 vr 表示 每 单位 时 间 每 位 点 的 总 突变 率 , 那 么 ,中 性 突变 的 突变 率 即 为 zw 王 zrf。 根 据 分 子 进化 的 中 性 学 说 ,替换 速率 为 民 王 wm (第 二 章 )。 因 此 , /大 C4.2) 在 任 一 给 定 基因 内 ,该 zr 值 可 假定 对 同 义 位 点 和 非 同 义 位 点 都 是 相同 的 。 然 而 ,fs 值 则 是 同 义 位 点 的 比 非 同 义 位 点 的 高 ,所 以 前 者 要 比 后 者 进化 得 快 。 虽 然 该 模型 是 过 于 简单 了 ,但 它 对 解释 不 同 DNA 区 域 间 速率 上 的 差异 却 很 有 帮助 。 依 上 述 模型 看 ,最 高 的 速率 预期 应 出 现在 一 个 没有 任何 功能 的 序列 中 ,由 于 没有 功能 ,所 以 它 里 面 的 所 有 突变 都 是 中 性 的 ( 即 ff=1)。 事 实 上 , 假 基 因 看 起 来 的 确 有 最 高 的 核 苷 酸 蔡 换 速率 ( 表 4 一 3 和 图 4 一 2)。5 和 3!' 不 翻译 区 有 比 编码 区 中 的 同 义 替 换 更 低 的 替换 速率 ,这 一 观察 事实 进一步 支持 解 释 问 题 的 中 性 路 线 , 因 为 这 些 区 域 含 有 关于 转录 起 始 和 终止 的 信和 号 在 一 个 蛋白 质 内 ,有 不 同 结构 和 功能 的 区 域 看 来 受 着 有 差别 的 功能 限制 ,并 以 不 同 速率 进化 着 。 胰岛 素 原 为 此 提供 了 一 个 极 好 的 例子 。 它 由 A,B 和 C 三 个 片段 组 成 (图 4 一 3) ,片段 C 位 于 分 子 的 中 间 ,并 在 活性 激素 (胰岛 纪 上 ) 形 成 期 间 被 除去 即 胰岛 素 是 由 余下 的 A 和 B 两 个 片段 所 构成 的 。 片 段 C 人 B 链 C ik A 4 (一 胰岛 素 被 切除 的 肽 进化 速率 0.13x 102/ 位 点 /年 ”进化 速率 0.97 x 10/ 位 点 /年 图 4 一 3 AAA AEA IR Sy ACN Fo Ls 44) 0 C 肽 编码 的 UNA 区 域 中 核 将 酸 赫 换 速 率 间 的 比较 。 成 熟 的 胰岛 素 分 子 由 一 条 人 A 链 和 一 条 也 链 ,通过 二 硫 键 (S) 联 结 而 成 。 自 Kimura(1983) 修 改 而 成 。 , 对 胰 马 素 的 激素 活性 不 起 任何 作 用 ,而 被 认为 只 对 产生 该 激素 的 正确 三 级 结构 有 促进 效果 。 结 果 ,为 C 户 段 编 码 的 区 域 的 非 同 义 替 换 速 率 , 为 A 链 和 也 链 编码 的 区 域 的 平均 非 同 义 替 换 速 率 的 7 倍 多 (图 4 一 3)。 然 而 ,C 片段 上 一 定 仍 受 着 相当 程度 的 限制 ,因为 该 区 域 中 的 非 同 义 替 换 速 率 还 是 比较 低 的 , 它 与 一 珠 蛋 日 中 的 相应 速率 大 致 相当 ( 表 4 一 1)。 s。 0,。 基因 间 的 变异 为 了 对 基因 间 非 同 义 替 换 速率 方面 的 大 变异 作出 解释 ,我 们 必须 再 次 考虑 这 样 两 个 可 能 的 牧 事 者 :突变 率 和 选择 强度 .不 同 的 基因 有 相同 的 突变 率 , 这 样 的 假定 在 这 种 情况 下 可 能 不 能 成 立 , 因 为 基 因 组 的 不 同 区 域 可 能 有 着 不 同 的 突变 倾向 。 沃 尔 夫 等 (Wolfe 等 ,1989a) 曾 提出 ,哺乳 动物 细胞 核 基 因 组 的 不 同 区 域 , 在 突变 率 方 面 的 差异 相互 间 以 一 个 数值 为 2 的 因子 来 区 别 。 然 而 ,不 同 基因 组 区 域 间 突变 率 上 出 现 2 倍 的 差异 ,甚至 不 能 算 作 造 成 非 同 义 替 换 速 率 方面 将 近 1000 倍 的 出 人 的 部 分 原因 。 所 以 ,决定 非 同 义 替 换 速 率 的 最 重要 因素 看 来 还 是 选择 强度 , 它 又 转 而 由 功能 限制 所 决定 。 为 了 说 明 功 能 限制 的 效应 ,让 我 们 考虑 一 下 载 脂 蛋 白 和 组 蛋白 3, 它 们 有 着 差异 显著 的 非 同 义 蔡 换 速 率 。 载 脂 蛋 白 是 兰 椎 动物 血液 中 各 种 脂 类 的 主要 载体 ,而 它们 的 脂 类 结合 区 大 部 分 由 下 水 性 残 基 所 组 成 。 对 来 自 哺 乳 纲 各 目的 载 脂 蛋白 的 顺序 比较 分 析 表 明 ,该 区 域内 由 一 个 下 水 性 氨基 酸 ( 比 如 纺 氨 酸 、 亮 氨 酸 ) 去 替换 另 一 个 踊 水 性 氨基 酸 , 这 在 许多 位 点 上 都 是 可 以 接受 的 (Luo 等 ,1989)。 这 种 不 太 严 格 的 结构 要 求 可 用 来 解释 为 什么 这 些 基因 中 的 非 同 义 的 速率 会 相当 高 ( 表 4 一 1)。 处 于 另 一 个 极端 的 是 组 蛋白 3。 因 为 组 蛋白 3 中 的 大 多 数 氨 基 酸 在 核 小 体 ( 图 4 一 4) 形 成 时 ,将 直 接 与 DNA 或 其 他 核心 组 蛋白 相 所 作用 .所 以 .可 以 合理 地 假定 .只 有 很 少 几 种 可 能 的 替换 能 在 不 妨 联结 者 DNA 组 蛋白 2A,2B,3,4 组 蛋白 1 图 4 一 4 一 个 核 小 体 的 示意 图 。DNA 双 螺 旋 ( 黑 色 带 ) 转 着 核心 组 蛋白 iA 2A.2K.3 Fe 4 SH) BK, BE 白 1( 淡 灰色 ) 与 该 核心 粒子 的 外 部 和 联结 者 DNA( 白 色 带 ) 相 结合 。 自 Stryer (1988) 修 改 而 成 碍 该 蛋白 质 功 能 的 条 件 下 发 生 。 此 外 ,组 蛋白 3 还 必须 维持 其 严格 的 致密 性 和 高 度 碱 性 ,这 对 与 酸性 的 DNA 分 子 相互 作 用 是 必要 的 。 结 果 , 组 蛋白 3 对 大 多 数 分 子 变 化 都 绝 不 容忍 。 事 实 上 ,这 种 和 蛋白质 是 已 知 的 进化 最 为 缓慢 的 和 蛋白质 之 一 , 比 载 脂 和 蛋白 要 慢 1000 多 倍 。 同 义 替 换 的 速率 为 什么 也 会 因 基 因而 异 还 不 太 清楚 。 出 现 这 种 变异 可 能 有 两 个 原因 。 首先 ,基因 组 的 不 同 区 域 间 突 变 率 可 能 是 不 同 的 ,因而 同 义 替 换 速 率 上 的 变异 可 能 简单 地 反映 出 基因 所 处 的 染 色 体 位 置 (Wolfe 等 ,1989a)。 这 种 可 能 性 因 这 样 的 事实 而 得 到 进一步 的 支持 , 即 , 真 核 生 物 的 基因 组 是 由 被 称 为 同 质 段 的 明显 地 以 GC 为 内 容 的 片段 所 构成 的 ,这 些 片段 可 能 是 独立 复制 的 因而 可 能 表 现 出 不 同 的 突变 率 ( 第 八 章 )。 第 二 个 原因 可 能 是 ,在 某 些 基因 中 ,并 不 是 所 有 密码 子 都 是 在 适合 度 上 等 价 的 。 结 果 , 有 些 同 义 替 换 可 能 会 受到 选择 的 排斥 。 这 种 纯洁 化 选择 就 会 在 基因 间 产 生 同 义 替 换 速 率 方 面 的 变异 。 然 而 ,虽然 纯洁 化 选择 已 被 证 明 能 影响 同 义 替 换 的 速率 ,能 影响 细菌 .酵母 和 果 蝇 的 基 因 组 中 同 义 密 码 子 的 使 用 模式 ,但 现在 还 不 清楚 这 类 选择 是 否 在 哺乳 类 中 发 生 作 用 ( 见 第 55 页 ) 。 还 有 一 种 现象 也 曾 受到 注意 , 即 一 个 基因 中 的 同 义 蔡 换 速 率 和 非 同 义 替 换 速 率 间 存在 一 种 正 相 关 (Graur,1985; Li 等 ,1985b)。 若 假定 突变 率 随 基因 而 变 (因此 有 些 基因 的 同 义 和 非 同 义 的 替换 速率 将 都 很 总 ) ,或 者 假定 同 义 位 置 上 的 选择 大 小 受 邻 近 的 非 同 义 位 置 上 核 苷 酸 组 成 的 影响 , 则 该 现象 即 可 得 到 解释 CTicher 和 Graur, 1989). 4.3 一 个 正 选 择 例子 :乳牛 和 叶 猴 的 浴 菌 酶 如 前 面 的 章节 所 讨论 的 那样 ,基因 组 的 绝 大 多 数 基因 和 非 基因 区 域 中 核 苷 酸 替 换 的 速率 和 模式 , e 47 e 都 可 以 通过 四 突变 输入 ,@ 中 性 或 近 中 性 等 位 基因 的 随机 遗传 漂 变 ,和 人 排斥 有 害 等 位 基因 的 纯洁 化 选择 ,这 三 方面 的 结合 来 加 以 解释 .然而 ,在 浴 菌 酶 的 例子 中 ,对 有 利 突 变 的 正 选择 曾 被 证 明 在 某 些 哺 乳 类 谱系 中 起 作用 。 前 肠 发 酵 消 化 曾 在 有 胎盘 哺乳 类 的 进化 中 独立 地 两 次 出 现 , 一 次 在 反刍 动物 (例如 乳牛 ) 中 , 另 一 次 在 疣 猴 类 (例如 叶 猴 ) 中 。 在 这 两 种 情况 中 ,对 别 的 哺乳 动物 来 说 通常 不 在 胃 中 分 弯 产 生 的 溶菌 酶 , 它 能 补充 进来 ,以 消化 在 前 肠 执行 发 酵 任 务 的 细菌 的 细胞 壁 。 斯 图 尔 特 和 威尔逊 (Stewart 和 Wilson, 1987) 曾 对 来 自 乳 牛 . 叶 猴 、 独 卯 .人 \ 大 鼠 . 马 和 鸡 的 溶菌 酶 进行 过 氨基 酸 顺 序 比 较 ( 表 4 一 4) 。 他 们 注 意 到 ,乳牛 和 叶 猴 间 有 4 个 独特 地 共有 的 氨基 酸 。 对 这 一 观察 结果 有 两 种 可 能 的 解释 。 第 一 种 :有 可 能 乳牛 在 进化 上 与 叶 猴 的 亲缘 关系 比 与 马 的 更 近 , 于 是 这 些 独特 地 共有 的 氨基 酸 , 只 代表 出 现在 它们 的 共同 祖先 中 未 发 生 改 变 的 氨基 酸 顺 序 。 乳 牛 和 叶 猴 间 系 统 发 生 关系 更 近 的 假定 已 知 是 错误 的 。 另 一 种 ,这 些 在 该 两 物种 中 独特 地 共有 的 氨基 酸 ,可 能 是 独立 地 发 生 在 两 个 谱系 中 的 一 系列 平行 蔡 换 的 结果 。 事 实 上 ,将 氨基 酸 蔡 换 的 顺序 重建 后 ,斯图尔特 和 威尔逊 CStewart and Wilson,1987) 发 现在 乳 牛 和 叶 猴 谱系 中 有 7 个 平行 或 趋同 替换 (图 4 一 5)。 表 4 一 4 不 同 物种 的 溶菌 酶 间 顺 序 的 成 对 比较 ” 物 种 物种 MH AR Bb Bi 人 大 鼠 乳牛 5% 叶 猴 14 inte +38 32 65 Hh Hb 0 14 33 39 65 人 0 1 K fa 0 1 i A+ 4 0 马 0 0 自 Stewart 和 Wilson(1987) 。 a. 对 角 线 上 的 数 为 物种 间 氨 基 酸 的 差异 数 , 而 对 角 线 下 的 数 为 物种 间 独 特地 共有 的 残 基数 。 而 且 , 已 经 确定 ,这 些 替换 中 有 些 对 溶菌 酶 在 低 pH 值 下 更 好 地 行使 功能 有 贡献 , 象 在 反刍 动物 人 K14 K21 V23 E41 E50 N67 D75 N87 K119 K126 32| 叶 猴 See | L17_ $101 12 D37 H62 N82 T90 i Bh M29 R41 A47 R50 L79 R115 R122 图 4 一 5 乳牛 和 叶 钦 溶菌 酶 中 的 平行 或 趋同 氨基 酸 替 代 。 谱 系 的 长 度 与 沿 该 谱系 发 生 的 氨基 酸 替 代数 成 正比 。 每 次 替代 用 替代 后 氨基 酸 的 一 字母 缩写 ( 表 1 一 1) 表 示 , 其 后 续 数字 表示 替代 发 生 的 位 置 。 箭 头 指出 了 叶 猴 中 发 生 的 7 次 替代 ,它们 以 与 乳牛 谱系 平行 或 趋同 的 形式 发 生 。 与 乳牛 胃 溶 菌 酶 (没有 画 出 ) 的 氨基 酸 差 异 数 写 在 方块 之 中 。 自 Stewart 和 Wilson, (1987). 消化 系统 中 发 现 的 那些 酶 。 相 反 , 叶 猴 和 乳牛 溶菌 酶 在 高 pH AF AO AO. BR 可 以 不 出 什么 差错 地 推论 ,我 们 这 里 处 理 的 是 一 个 有 利 蔡 换 在 不 同 进 化 路 线 中 平行 地 发 生 , 表 现 出 对 类 似 的 选择 因子 平行 地 适应 的 例子 。 4.4 分子 钟 在 对 来 自 不 同 物种 的 血红 蛋白 和 细胞 色素 e 的 蛋白 质 顺序 比较 研究 中 , 朱 克 坎 德尔 和 波 林 。48 。 《Zuckerkandl 和 Pauling,1962,1965) 以 及 马 苞 利 阿 什 4Margoliash ,1963) 首 次 注意 到 ,这 些 蛋 白质 中 的 氨基 酸 替 换 速 率 在 不 同 的 哺乳 类 谱系 中 近似 相同 。 因 此 朱 克 坎 德尔 和 波 林 (Zuckerkandl 和 Paul- ao 之 ,就 是 存在 着 一 种 分 子 钟 (molecular clock)。 这 一 提议 马上 激 起 了 人 们 对 将 大 分 子 用 于 进化 研究 的 极 大 兴趣 。 事 实 上 ,如果 蛋 白质 是 以 恒定 的 速率 进化 着 的 ,那么 ,它们 将 可 用 于 决定 物种 分 岐 的 年 代 , 并 用 来 重建 生物 间 的 系统 发 育 关 系 。 这 将 与 通过 测定 放射 性 元 素 的 衰变 来 决定 地 质 年 代 类 似 。 分 子 钟 假说 也 激 起 了 大 量 的 争论 。 例 如 ,经 典 进化 论 学 者 们 就 反对 这 种 说 法 ,因为 进化 速率 恒定 的 说 法 与 在 表 型 和 生理 学 水 平 上 进化 速率 的 变化 无 常 对 不 上 号 。 当 速率 恒定 假说 用 于 估计 人 与 非洲 猿 间 的 分 岐 时 间 ,得 到 一 个 500 万 年 的 估 值 CSarich 和 Wilson ,1967) 时 ,该 假说 受到 了 特别 强烈 的 反 对 。 因 为 ,在 古生物 学 家 中 占 统治 地 位 的 观点 是 ,人 和 猿 的 分 岐 至 少 应 在 1500 万 年 前 ,两 者 差 得 太 远 。 许多 分 子 进化 科学 家 们 也 对 分 子 钟 假说 的 正确 性 提出 了 异议。 特别 是 古 德 曼 (Goodman ,1981) 以 及 他 的 同事 们 (Czelusniak 等 ,1982)。 他 们 认为 ,进化 速率 常常 在 基因 重复 之 后 出 现 加 速 , 而 蛋白 质 顺 序 在 适应 性 辐射 的 年 代 里 进化 要 快 得 多 。 例 如 ,他 们 主张 ,在 基因 重复 使 vc 和 有 8 血红 蛋白 分 开 之 后 出 现 了 极 高 的 氨基 酸 蔡 换 速 率 , 而 这 种 高 替换 速率 则 是 由 于 改善 血红 蛋白 功能 的 有 利 突变 所 造成 的 。 虽然 速率 恒定 假说 一 直 是 有 争议 的 ,但 它 已 广泛 用 于 分 岐 时 间 的 估计 和 系统 发 育 树 的 重建 中 (Nei,1975; Wilson 等 ,1977) 。 所 以 ,分 子 钟 假说 的 正确 性 在 分 子 进 化 中 是 一 个 生死 依 关 的 问题 。 近 几 年 中 DNA 顺序 数据 的 迅速 积累 为 检验 该 假说 提供 了 一 个 全 新 的 机 会 。 用 这 类 数据 与 用 蛋白 质 顺 序 数据 相 比 可 使 我 们 更 近 地 检 验 该 假说 ,而 与 DNA 一 DNA 杂交 数据 和 免疫 距离 数据 相 比 , 则 可 得 到 更 直接 的 解释 。 相对 速率 测验 关于 分 子 钟 假说 的 争论 常常 引起 有 关 物 种 分 岐 年 代 的 异议 .为 了 避免 这 一 问题 , 萨 里 奇 和 威尔逊 (Sarich 和 Wilson ,1973) 提 出 了 一 种 不 需要 知道 分 岐 年 代 的 检验 法 。 该 检验 法 称 相 对 速率 测验 (rela- tive-rate test), 如 图 4 一 6 所 示 。 假定 我 们 要 比较 谱系 A 和 B 中 的 速率 。 于 是 ,我 们 用 第 3 个 物种 C 作 为 参照 物 。 我们 应 该 确定 ,该 参照 物种 的 分 岐 过 程 发 生得 比 物 种 A 和 也 间 的 分 岐 更 早 。 例 如 ,为 了 比 较 人 和 马 来 猩 猩 谱 系 中 的 速率 ,我 们 用 一 种 猴 作 为 参照 物 。 A B C 图 4 一 6 用 于 相对 速率 测验 的 系统 树 。O 表示 物种 A 和 也 的 共同 祖先 。 从 图 4 一 6 很 容易 看 出 ,物种 A 和 C 间 的 替换 数 KAc 等 于 从 点 O 到 点 A RA AY RR (Kon) FIM 点 O 到 点 CC 发生 的 替换 数 (Koc) 之 和 。 即 , Kac = Koa + Koc (4, 3a) 类 似 地 ,有 : Kec 一 天 os + Koc (4. 36) 和 Kas = Koa + Kos (4. 3c) FAN KacsKac fl Kan fe MF OR IE EB Fie Ha CG = BE), A. BR ATT DAR Sh tS 个 方程 , 找 到 | Koa > Kop Fi Koc Wk : +496 Kac += Kaz “sx Kec Koa a 2 (4, 4a) Ss See Kos = pears 34 学 ae (4. 46) Koc = Kac + Koc — Kas (A. 4c) 2 现在 我 们 可 以 通过 Koa Al Kos 的 值 ,来 决定 替换 速率 在 谱系 A MIBABPEAHMS. AWHA AB 最 后 地 共有 一 个 共同 祖先 以 来 所 经 过 的 时 间 ,定义 为 对 两 个 谱系 是 相等 的 。 所 以 , 按 分 子 钟 假说 ,KoA 和 Kos 应 该 相等 BY ,Ko 一 Kos 王 0。 从 等 式 4.3a 和 4.3b FT WA AH » Koa —Kos=Kac—Kes. 故而 ,我 们 可 以 从 天 Ac 和 Kesc 来 直接 比较 A 和 B 中 的 替换 速率 。 小 鼠 和 大 鼠 中 接近 相等 的 速率 表 4 一 5 展示 了 用 相对 速率 测验 法 进行 的 小 鼠 和 大 鼠 中 同 义 替 换 速 率 的 比较 。 表 中 的 物种 A 此 HE) BL. i FP BWM ARK. A.A 天 Ac 一 Kesc 的 值 为 一 正 号 , 则 表示 小 鼠 中 的 速率 高 于 大 鼠 中 的 ,而 若 为 负 号 则 指示 实际 情况 正好 相反 。 表 4 一 5 小 鼠 (物种 A) 和 大 鼠 ( 物 种 B) 间 每 100 位 点 的 同 义 替 换 数 差异 (KAc-Kac) 基因 LY 下 AAAENKEE Kac— Kec 载 脂 蛋白 E 201 7.4 6108 59.5 1.845.3 肌 动 蛋白 a 249 17.9 58.2 59.1 —0.9+4.8 — 肌 动 蛋白 233) 19.70 SO 4654 5.0+4. 6 Thy-1 抗原 116. 19.3 5L8 5703 —5.5+68 乳酸 脱 氢 酶 A 219 30.9 80.4 80.3 0.148. 2 糖 蛋 白 激素 ,ax WE 58) “730.8 297.7 Gaus 13.4+18.5 胰 马 素 样 生长 因子 1 130 4.8 37.0 40.9 =3° 92-28 心房 钠 尿 因子 107 20.4 69.7 57.4 12. 348.3 生长 激素 2 i a ee iy FAR AR ER AL B G0 "ba? eee ee 7 ceo Lig fc oh FS Fy FRR SS BH Dik 154 Dh GIRS Bee y 8.8+6.5 醛 缩 酶 A 184. 15 a 57.5 63.3 Sa ec eS 肌 酸 激酶 M 251 /1722) 28.6. Bee 3.64.3 ie J Bit FE AA A FAL 35 19 Oy Aeon aee7 8.8410. 2 rath 1 Sit 2187 19.0 59.8 59.4 0.421. 5 A Li 等 (1987a) a 工 一 受 比较 位 点 数 。Ki 一 物种 1 和 j 间 每 100 位 点 的 替换 数 。 人 为 参照 物种 (c), 但 肌 酸 激酶 M 为 一 例外 ,该 行 数据 是 用 免 的 顺 序 作 为 参照 物 得 出 的 。 由 于 受 资 料 限 制 , 我 们 用 作 参 照 物 的 是 人 或 兔 的 顺序 ,而 不 是 从 与 小 鼠 和 大 鼠 的 亲缘 关系 更 近 的 物 种 , 象 仓 鼠 或 豚鼠 中 得 到 的 顺序 。 结 果 ,Kcs 一 Kec 的 估 值 表现 出 较 大 的 统计 误差 ( 表 4 一 5)。 不 过 ,小 鼠 和 大 鼠 中 的 蔡 换 速率 接近 相等 ,这 一 点 是 相当 明显 的 。 换 句 话说 , 当 将 所 有 顺序 一 起 考虑 时 ,该 速率 差 接近 于 0。 关 于 这 两 个 物种 中 非 同 义 蔡 换 的 速率 ,可 得 出 同样 的 结论 (Li 等 ,1987a) 。 人 中 的 速率 低 于 猴 的 速率 根据 免疫 距离 和 蛋白质 顺序 数据 , 古 德 曼 (Goodman,1961) 及 其 同事 们 (Goodman 等 ,1971 ) 提 出 ,大 科 动 物 ( 人 和 和 猿 ) 自 它们 从 远古 时 代 与 猴 分 离 后 ,出 现 了 速率 减缓 。 然 而 ,威尔逊 等 (Wilsom 等 , 1977) SQ BR DE ,减缓 是 一 种 人 为 现象 ,是 用 了 对 人 一 狼 分 岐 时 间 的 错误 估 值 的 结果 。 他 们 用 免疫 上 距离 数 s。 DO0O。 据 和 蛋白质 顺 序数 据 做 了 两 次 相对 速率 测验 ,结论 是 ,没有 任何 表明 人 科 动 物 速率 减缓 的 证 据 。 DNA 顺序 数据 可 对 上 述 争 论 给 出 一 个 更 好 的 解决 。 在 表 4 一 6 中 ,相对 速率 测验 法 被 用 于 比较 人 谱系 和 古 世 界 猴 谱系 的 核 苷 酸 替 换 速率 。 在 所 有 检验 中 ,谱系 也 是 人 的 谱系 ,而 谱系 A 为 猴 的 谱系 。 谱系 C 是 参照 物种 ( 见 表 下 的 注释 )。 因 此 ,速率 差 (KAc 一 Kac) 为 正 号 意味 着 人 谱系 曾 较 慢 地 进化 着 , 而 为 负 号 则 意思 相反 。 表 4 一 6 古 世 界 猴 谱系 (A) 和 人 谱系 (B) 间 每 100 MANA RE FM (Kac— Kac)" 顺序 位 点 数 KAB KAc 一 KBc 人 站 珠 蛋 白 假 基因 2000 7.4 2 Bball 同 义 位 点 BRA 71 8.9 2: 85.6 载 脂 蛋 白 A-i 158 7.9 =—§..da 408 促 红细胞 生成 素 145 ‘A? S125. 9 ma- 抗 胰 和 蛋白 酶 140 10.9 6.7 士 6.8 胰岛 素 84 18. 6 a OsTen Aa F 0- 珠 蛋白 601 4.7 3.4+1.4 不 翻译 区 和 侧 区 域 BEA 179 4.6 21. 7 3- 珠 蛋白 172 8.8 6.1 士 3. 2 总 计 3550 60:7 Zaz 0.16" ™ a. 所 用 参照 物种 为 泉 猴 (一 珠 蛋 白 假 基因 ), 狐 猴 (B 一 和 8 珠 蛋 白 ), 小 鼠 或 大 鼠 ( 促 红 细胞 生成 素 , 载 脂 蛋 白 A 一 I, 和 xl 一 抗 胰 蛋白 酶 ) 和 狗 ( 胰 岛 素 ) 。 ** 在 1% 水 平 与 0 差异 显著 。 我 们 注意 到 ,9 个 所 用 的 顺序 中 只 有 2 个 为 负 号 。 速 率 上 的 差异 即使 在 只 用 刀 假 基因 时 也 是 很 显著 的 。 若 将 所 有 顺序 一 起 考虑 , 则 Kac—Kec=2. 3%, i Kas=6.7%. Ask. Hitt RRIBRA PH K (A (Koa) W(6. 7%+2.3%)/2=4.5%, AKA PAW K (A Kon) RA 6.7% —4.5% =2. 2%, HA RIBA 以 4.5/2. 22 倍 于 人 谱系 的 速率 更 快 地 进化 着 。 了 岩 齿 类 中 的 速率 高 于 灵 长 类 中 的 速率 FAA Wu 和 Li,1985) 曾 用 相对 速率 测验 法 来 比较 员 齿 类 谱系 和 人 类 谱系 中 的 替换 速率 , 参 照 物 则 用 偶蹄 类 或 食肉 类 谱系 。 他 们 的 结论 是 , 吗 齿 类 谱系 同 义 替 换 的 速率 约 为 人 类 谱系 的 2 倍 。 不 过 要 注意 ,速率 上 的 估计 差异 指 长 期 内 ( 即 从 员 齿 类 一 灵 长 类 分 岐 到 现在 的 时 期 ) 的 平均 值 .由 于 在 发 生 分 岐 的 那 一 时 期 和 其 后 的 短 时 期 里 两 谱系 中 的 替换 速率 应 是 相似 的 ,所 以 ,速率 差异 一 定 是 随时 间 而 增加 的 。 因 此 ,以 上 估计 的 速率 差异 值 可 能 是 一 个 低估 值 。 要 想 知 道 更 近 时 期 的 速率 差异 ,我 们 需 要 分 别 估 出 员 齿 动物 内 和 灵 长 动物 内 的 替换 速率 。 表 4 一 7 展示 了 灵 长 类 和 吵 齿 类 中 的 替换 速率 的 比较 。 如 果 我 们 假定 人 一 黑猩猩 的 分 岐 发 生 在 七 百 万 年 前 ,而 人 一 古 世 界 猴 的 分 岐 发 生 在 二 千 五 百 万 年 前 , 则 人 和 黑猩猩 的 顺序 间 平 均 速率 为 每 年 每 位 点 1.3X10“ 替 换 , 而 人 与 古 世 界 猴 的 顺序 间 则 为 每 年 每 位 点 2.2X10“ 蔡 换 。 这 一 结果 与 古 世界 猴 谱系 以 2 倍 于 人 谱系 的 速率 进化 的 结论 是 一 致 的 。 如 果 我 们 假定 小 鼠 一 大 鼠 的 分 岐 发 生 在 一 千 五 百 万 年 前 , 则 小 鼠 和 大 鼠 的 顺序 间 平 均 速率 为 每 年 每 位 点 7.9X10 “ 蔡 换 。 因 此 , 趾 齿 类 中 的 速率 可 能 是 较 高 等 的 灵 长 类 中 的 速率 的 4 到 6 倍 。 虽 然 关 于 所 用 的 分 岐 时 间 还 不 是 很 可 靠 , 但 吵 齿 类 顺序 的 进化 比 灵 长 类 顺序 要 快 得 多 ,这 一 点 是 很 明显 的 。 表 4 一 7” 灵 长 类 和 财 齿 类 中 每 年 每 位 点 同 义 蔡 换 的 平均 速率 物种 对 位 点 数 百分比 分 岐 蔡 换 速率 (X10-9) 人 对 黑猩猩 921 1.9 1. 3(0. 9 一 1. 9)b 人 对 古 世 界 猴 998 11.0 2.2(1. 8 一 2. 8) 小 鼠 对 大 鼠 3886 2357 7. 9(3. 9 一 11.8) 自 Li 等 (1987a) a. 所 用 分 岐 时 间 , 人 一 黑猩猩 为 7(5 一 10) 百 万 年 前 ,人 一 古 世 界 猴 为 25(20 一 30) 百 万 年 前 ,小 鼠 一 大 鼠 为 15(10 一 30) 百 万 年 前 。 b. 括号 内 的 值 为 从 分 岐 时 间 的 上 限 估 值 和 下 限 估 值 得 到 的 速率 估 值 构成 的 范围 。 不 同 进化 谱系 间 蔡 换 速率 上 出 现 变异 的 原因 猴 的 替换 速率 高 于 人 的 以 及 吵 齿 类 的 替换 速率 高 于 灵 长 类 的 ,这 也 许 能 用 所 谓 世 代 时 间 效 应 (generation-time effect) 来 加 以 解释 ( 儿 ohne,1970) 。 路 齿 类 的 世代 时 间 比 人 的 要 短 得 多 ,所 以 ,如 果 在 这 些 生 物 间 每 世代 的 种 系 复制 没有 很 大 差别 的 话 , 则 每 年 的 种 系 DNA 复制 的 次 数 在 路 齿 类 中 就 可 能 比 在 人 类 中 要 高 许多 倍 。 因 为 突变 大 多 在 DNA 复制 的 过 程 期 间 积累 ,所 以 ,复制 的 周期 数 越 多 , 则 : 突变 错误 也 将 发 生得 越 多 。 这 一 因素 也 许 能 在 很 大 程度 上 解释 路 齿 类 的 替换 速率 高 于 人 类 的 替换 速 率 的 现象 。 类 似 地 , 儿 有 比 人 短 的 世代 时 间 , 所 以 ,应 该 预期 它 将 有 较 高 的 替换 速率 。 替换 速率 上 的 差异 也 可 部 分 地 归 因 于 DNA 修复 系统 的 效率 方面 的 差异 (Britten ,1986)。 已 有 的 有 限 资料 表明 Ma RA Eh ARIK DNA 修复 系统 ,因而 ,在 每 一 复制 周期 中 将 积累 更 多 突变 。 以 上 结果 不 应 拿 来 作为 不 存在 分 子 钟 的 证 据 。 我 们 注意 到 ,替换 速率 上 的 差异 是 在 具有 很 不 相同 的 世代 时 间 的 生物 间 被 观察 到 的 。 当 具有 相近 的 世代 时 间 的 生物 , 象 小 鼠 和 大 鼠 进行 比较 时 ,速率 恒 定 规律 表现 得 相当 明显 。 所 以 ,虽说 没有 一 个 关于 所 有 哺乳 类 的 全 球 性 时 钟 ,但 关于 许多 亲缘 关系 较 近 的 物种 类 群 的 地 方 性 时 钟 也 许 是 存在 的 。 4.5 细胞 器 DNA 中 的 替换 速率 与 细胞 核 基 因 组 相 比 ,细胞 器 基因 组 要 小 得 多 ,也 更 容易 进行 实验 研究 .而且 ,在 哺乳 动物 线粒体 基因 组 中 蔡 换 速率 特别 高 (Brown 等 ,1979)。 这 一 发 现 激 起 了 人 们 对 细胞 器 DNA 的 进化 问题 的 更 大 兴趣 。 哺乳 动物 线粒体 基因 组 由 一 个 环 状 、 双 链 DNA 组 成 。 长 为 15,000 一 17,000 碱 基 对 (bp) ,近似 地 相当 于 最 小 的 动物 细胞 核 基 因 组 的 1/10,000。 它 只 含有 单一 的 ( 即 非 重复 的 ) 序 列 :13 个 为 蛋白 质 纺 码 的 基因 ,2 个 rRNA 基因 ,22 个 tRNA 基因 和 一 个 调控 区 ,后 者 含有 复制 和 转录 的 起 始 位 点 。 该 基 因 组 在 结构 上 是 非常 稳定 的 ,这 一 点 ,从 不 同 种 的 哺乳 动物 间 其 基因 组 大 小 变异 不 大 即 可 看 册 。 与 其 成 鲜明 对 照 的 是 ,植物 的 线粒体 基因 组 却 展现 出 较 大 的 结构 变异 性 。 它 们 经 历 了 频繁 的 重 HE. 重复 和 缺失 (Palmer,1985)。 为 此 ,基因 组 大 小 在 40,000bp 到 2,500,000bp 的 范围 内 变化 .植物 中 的 线粒体 基因 组 可 能 是 线 状 的 ,也 可 能 是 环 状 的 ,而 在 许多 情况 中 ,遗传 信息 被 分 割 成 相互 独立 的 DNA 分 子 , 后 者 被 称 为 亚 基因 组 环 。 植 物 线粒体 的 编码 内 容 还 没有 全 部 确定 ;不 过 ,我 们 确 已 知道 ,有 3 个 确定 TRNA 的 基因 、 数 目 还 不 清楚 的 tRNA 基因 和 大 约 15 个 一 30 个 为 蛋 和 白质 编 码 的 基因 ,其 中 有 些 已 被 鉴别 出 来 了 。 (在 植物 线粒体 基因 组 中 结构 基因 可 能 以 多 重 拷贝 出 现 .) 目 前 ,尽管 植物 线 粒 体 基 因 组 在 大 小 上 有 很 大 变异 性 ,但 在 编码 内 容 上 却 没 有 表现 出 性 质变 异 的 迹象 , 维 管 植物 的 叶绿体 基因 组 是 环 状 的 ,大 小 在 120,000 到 220,000bp 的 范围 内 变化 ,平均 大 示 为 1505000bp(Palmer,1985)。 尽 管 在 大 小 上 有 如 此 大 的 变异 ,但 该 基因 组 已 知 在 结构 上 是 稳定 的 。 烟草 (Nicotiana iabpacxzz) 的 叶绿体 基因 组 已 经 被 完全 定 序 了 (Shinozaki 等 ,1986)。 它 是 一 个 环 状 分 子 ,长 155,844bp 含有 37 个 tRNA 基因 (其 中 8 个 含有 单 内 含 子 ) ,8 个 rRNA 基因 ,和 45 个 为 蛋白 质 编码 的 基因 [其 中 5 个 含有 单 内 含 子 ,其 中 2 人 站 含有 两 内 含 子 ) 。 两 条 链 都 用 于 编码 。Nizcoriazna tabacum 的 . 52 . 叶绿体 基因 组 还 含有 59 个 功能 不 知 的 外 加 开 读 框架 ,其 中 2 个 则 捅 进 了 内 含 子 。 哺乳 动物 线粒体 基因 中 同 义 替 换 的 速率 已 估 出 ,为 每 年 每 同 义 位 点 5.7X10 8 HR (Brown 等 , 1982)。 这 大 约 是 细胞 核 中 为 蛋白 质 编 码 的 基因 的 同 义 替 换 值 的 10 倍 。 非 同 义 替 换 的 速率 在 13 个 为 蛋白 质 编码 的 基因 中 变化 很 大 ,但 通常 都 比 细胞 核 基 因 的 平均 非 同 义 替 换 速 率 大 得 多 .哺乳 动物 线 粒 体 中 这 些 高 替换 速率 的 原因 ,看 来 是 相对 于 细胞 核 而 言 它 有 较 高 的 突变 率 。 高 突变 率 则 是 由 于 (a) 线 粒 体 中 的 DNA 复制 过 程 保 真 度 低 ,(b) 缺 乏 修复 机 制 或 修复 机 制 效率 极 差 ,和 (c) 诱 变 剂 浓度 高 ( 例 如 超 氧化 物 基 团 O, ) ,后 者 是 线粒体 执行 代谢 功能 的 结果 。 另 一 方面 ,作用 在 非 同 义 突变 上 的 纯洁 化 选择 的 强度 ,看 来 与 作用 在 细胞 核 基 因 上 的 属 同一 数量 级 。 根据 几 个 基因 顺序 或 限制 酶 图 谱 资料 进行 的 早期 研究 指出 ,叶绿体 基因 有 上 比 哺乳 动物 细胞 核 基 FA AFG AY 4% FF PR FR EK (Curtis 和 Clegg,1984;Palmer,1985) ,用 核 苷 酸 蔡 换 表 示 则 植物 线粒体 DNA 进化 缓慢 ,虽然 它 频 繁 地 经 历 着 顺序 重 排 (Palmer 和 Hebron ,1987)。 这 些 结果 近 来 被 更 广泛 的 DNA 顺序 分 析 所 证 实 (Wolfe 等 ,1987,1989) 。 表 4 一 8 展示 了 高 等 植物 的 这 3 种 基因 组 中 替换 速率 的 比较 。 每 非 同 义 位 点 的 平均 替换 数 (KA) 在 叶绿体 和 线粒体 基因 组 中 是 相似 的 ,但 每 同 义 位 点 的 平均 替换 数 (K.) 却 很 不 相同 ,在 单子 叶 植物 与 双子 叶 植 物 间 比 较 , 叶 绿 体 基 因 组 中 的 开 . 几乎 是 线粒体 基因 组 中 的 3 倍 ; 而 在 玉米 与 小 麦 或 大 麦 间 比较 则 前 者 是 后 者 的 6 倍 。 以 下 ,我 们 将 采用 前 一 个 比值 ,因为 它 是 根据 更 大 的 数据 组 而 得 到 的 。 植 物 细 胞 核 基 因 中 的 平均 同 义 替 换 速 率 约 为 叶绿体 基因 的 4 倍 。 于 是 植物 线粒体 .叶绿体 和 细胞 核 基因 中 的 同 义 蔡 换 速 率 , 近 似 地 呈 1 :3:12 这 样 的 比例 。 表 4 一 8 植物 叶绿体 、 线 粒 体 和 细胞 核 基 因 中 核 背 酸 蔡 换 速率 的 比较 ” 基因 组 Ks Ls Ka i 单子 叶 与 双子 叶 植物 间 的 比较 叶绿体 基因 0.58+0.02 4177 0.05+0.00 14421 线粒体 基因 0.2140.01 1219 0.04+0.00 4380 玉米 与 小 麦 或 大 麦 间 的 比较 细胞 核 基 因 0.7140.04 1475 0.06+0.00 5098 叶绿体 基因 0.17+0.01 2068 0.01+0.00 7001 线粒体 基因 0 OF 2413 0.01+0.00 1526 B Wolfe , (1987,1989b) a. 开 ,: 每 同 义 位 点 的 蔡 换 数 ;KA: 每 非 同 义 位 点 的 蔡 换 数 ;L.: 同 义 位 点 数 ;LA: 非 同 义 位 点 数 。 如 果 我 们 把 玉米 与 小 麦 间 的 分 岐 时 间 取 为 50 一 70 百 万 年 (Stebbins ,1981;Chao 等 ,1984) , 那 么 , 表 4 一 8 中 关于 细胞 核 的 数据 则 表现 出 一 个 每 年 每 位 点 5.1 一 7.1X10“ 替 换 的 平均 同 义 速率 。 这 与 在 哺乳 类 细胞 核 基 因 中 看 到 的 同 义 蔡 换 速 率 ( 表 4 一 1) 相 似 。 有 趣 的 是 ,细胞 器 的 基因 组 中 核 苷 酸 替 换 的 速率 与 结构 变化 的 速率 无 关 。 在 哺乳 类 中 ,以 核 苷 酸 替换 表示 的 线粒体 DNA 的 进化 非常 迅速 ,但 其 基因 的 空间 排列 和 基因 组 的 大 小 却 在 各 物种 间 保 持 稳定 。 相 反 , 植 物 的 线粒体 基因 组 经 历 了 频繁 的 结构 变化 ,但 其 核 苷 酸 替 换 速 率 却 极 低 。 在 叶绿体 DNA 中 , 核 苷 酸 蔡 换 速 率 和 结构 进化 都 很 缓慢 .替换 速率 和 结构 进化 速率 间 无 相关 性 ,这 表示 两 个 过 程 是 独立 地 进行 的 。 4.6 假 基 因 中 的 核 苷 酸 蔡 换 模式 因为 点 突变 是 DNA 序列 进化 中 最 重要 的 因素 之 一 ,所 以 分 子 进化 学 家 们 长 期 以 来 一 直 对 决定 自发 突变 的 模式 (pattern of spontaneous mutation) 怀 有 兴趣 (例如 ,Beale 和 Lehmann,1965; Zuck- erkandl 等 ,1971)。 该 模式 可 以 被 当 作 一 个 标准 ,用 于 推论 : 任 一 给 定 DNA 序列 中 核 背 酸 间 相互 变换 的 观察 频率 与 在 无 选择 下 , 即 在 选择 中 性 (selective neutrality) 下 ,预期 的 值 究竟 偏离 多 远 。 研究 点 突变 模式 的 途径 之 一 ,是 检验 不 受 选 择 限 制 的 DNA 区 域 中 的 替换 模式 。 假 基因 在 这 里 特 别 有 用 。 由 于 它们 无 功能 ,所 以 ,所 有 发 生 在 假 基 因 中 的 突变 都 是 选择 中 性 的 , 且 以 相同 的 概率 在 群体 中 固定 。 于 是 , 假 基因 中 的 核 苷 酸 蔡 换 模式 预期 将 反映 出 自发 点 突变 的 模式 。 图 4 一 7 表示 推论 假 基因 序列 中 的 核 苷 酸 桩 换 的 一 种 简单 方法 (Gojobori 等 ,1982;Li 等 ,1984)。 f / / / 序列 1 序列 2 序列 3 ( 假 基 因 ) (有 功能 的 ) 〈 有 功能 的 ) 图 4 二 7 推论 假 基 因 序 列 中 核 音 酸 堆 换 模 式 的 系统 笠 ” 虚 线 的 含义 是 无 功能 。 序列 1 是 一 个 假 基因 ,序列 2 是 其 有 功能 的 对 应 物 ,来 自 同 一 物种 ,而 序列 3 则 是 假 基因 出 现 前 即 发 生 分 岐 的 功能 序列 。 假定 在 某 一 核 苷 酸 位 点 上 ,序列 1 和 2 分别 各 为 A 和 G. 那 么 ,我 们 可 以 假定 , 若 序列 3 中 该 位 点 上 为 G 则 假 基 因 序 列 中 该 核 苷 酸 从 GEA AMARA 3 中 该 位 点 上 为 A 则 序列 2 PARRA A 变 成 G。 不 过 ,如 果 序 列 3 中 的 是 工 或 C, 则 我 们 不 能 决定 变化 的 方向 ,而 车 出 现 这 种 情况 则 该 位 点 将 从 比较 中 排除 。 由 于 假 基 因 中 的 替换 速率 通常 大 大 高 于 其 同 源 的 功能 基因 中 的 速 率 , 所 以 ,一 个 基因 与 一 个 假 基 因 间 核 苷 酸 顺 序 上 的 差异 ,在 绝 大 多 数 情 况 下 都 被 认为 是 假 基因 中 的 改变 所 造成 的 。 表 4 一 9 中 的 和 矩阵 代表 从 13 种 哺乳 类 假 基 因 序列 推 论 出 的 替换 的 联合 模式 。 抢 阵 中 的 每 一 个 项 和 ,都 代表 一 个 随机 序列 ( 即 四 种 碱 基 以 相同 的 频率 出 现 其 中 的 序列 ) 中 每 100 次 替换 里 碱 基 从 i 变 成 j 的 期 望 次 数 。 例 如 ,far 一 4.7, 表 示 所 有 替换 的 4.7%% 为 从 A BMT. 表 4 一 9 假 基 因 中 的 替换 模式 到 从 A Ae ( G 行 总 计 4.7 士 1.3 5.0+0.7 9.4+1.3 19.1 (5.341.4) \Gi6+0.8) (10.821.4)-° °(21.2) 本 Ae Ae 8. 2+1.3 3. 3 士 1. 2 15. 9 (4.8+1.1) (9241.3) (3.641.383) . (17:6) A 6.5+1.1 21.0+2.1 4.2+0.5 3h 7 (7141: 3) (C18. 2352989 (4. 2+0. 6) (29.5) a 20.742.2 7.24+1.1 5.3+1.0 33. 2 (18.64£1.9) (7.741.3) (5.541. 3) (31. 8) 31.6 32.9 18.5 16.9 列 总 计 (30.5) (31. 2) (20. 3) (18. 1) A Gojobori “ , (1982) Al Li , (1984) ae 表 中 项 为 以 13 种 哺乳 类 假 基 因 序 列 为 根据 推论 出 的 , 碱 基 从 i 变 为 j 的 百分数 (fi)。 括 号 中 的 值 是 把 所 有 CG BE RIA 中 排除 后 得 到 的 。 我 们 注意 到 ,突变 的 方向 是 非 随机 的 。 例 如 ,A 变 成 G 比 变 成 工 或 C 更 常 发 生 。 从 右上 角 到 左下 角 的 对 角 线 上 的 4 个 元 是 转换 的 加 值 , 其 余 的 8 个 元 代表 颠 换 。 所 有 转换 ,特别 是 C~>T 和 G->A,, 都 比 颠 换 更 常 发 生 。 转 换 的 相对 频率 之 和 为 59.2% ( 若 CG 二 核 苷 酸 被 排除 则 为 54.4% , 见 下 )。 我 们 注意 到 在 随机 突变 下 转换 的 期 望 比 例 仅 33%% ,因为 只 有 4 种 转换 却 有 8 种 颠 换 。 该 观察 比例 几乎 是 在 随机 突变 下 预期 值 的 两 倍 。 我 们 也 注意 到 ,有 些 核 苷 酸 比 另 一 些 要 更 容易 突变 。 在 表 4 一 9 的 最 后 一 列 ,我们 列 出 了 从 ATA 。54。 C 和 6G 突变 成 别 的 核 苷 酸 的 相对 频率 。 如 果 4 种 核 苷 酸 都 有 相同 的 突变 性 , 则 我 们 应 期 望 该 列 中 的 每 一 个 元 都 有 一 个 25%% 的 值 .实际 上 ,我们 看 到 ,G 以 33. 2 儿 的 相对 频率 突变 ( 即 ;G 是 一 种 高 可 突变 的 核 背 酸 ) ,而 工 则 以 15.9%% 的 相对 频率 突变 ( 即 它 达 不 到 那 种 可 变 程度 )。 HEHE A—-9 的 最 后 一 行 ,我 们 列 出 了 所 有 经 突变 而 变 成 AT.C AG 的 相对 频率 。 我 们 注意 到 ,所 有 突变 的 64.5%% 是 变 成 A 或 1 的 ,而 随机 过 程 期 望 的 值 应 为 50% 。 由 于 C 和 G 有 一 种 频繁 地 变 成 A 或 工 的 倾向 ,又 由 于 A AT AH 如 C 和 G 那 样 可 突变 ,所 以 , 假 基因 预期 应 变 得 富 含 A 和 T 工 .这 对 其 他 一 些 不 受 功 能 限制 的 非 编 码 区 应 该 也 是 成 立 的 。 事 实 上 , 非 编 码 区 普遍 发 现 是 富 AT 的 。 表 4 一 9 中 的 结果 是 根据 有 意义 的 链 , 即 未 被 转录 的 链 而 得 出 的 。 所 以 ,从 G 到 和 A 的 变化 实际 上 意味 着 一 个 G:C 对 被 一 个 A:T 对 所 取代 。 这 种 情况 的 出 现 , 可 以 是 有 意义 的 链 中 G 突变 成 A 的 结 果 , 也 可 能 是 与 前 者 互补 的 链 中 C 突变 成 工 的 结果 。 类 似 地 ,从 C 到 工 的 变化 ,也 可 能 是 在 一 条 链 中 C 突变 成 工 或 在 另 一 条 链 中 G 突变 成 A 的 结果 。 如 果 两 条 链 间 突变 的 模式 没有 差别 ,那么 我 们 应 有 fcA 王 fcr。 类 似 地 ,我们 应 能 得 到 fac 一 frcsfAr 一 frA,fAc 一 freyfcA 一 fcr 和 fcc 王 fcc。 这 些 等 式 仅 近 似 地 成 立 , 且 事实 上 这 两 条 链 间 的 突变 模式 可 能 存在 较 小 的 不 对 称 性 。 这 种 不 对 称 性 可 能 是 由 于 DNA 复制 期 间 ,先导 链 和 滞后 链 间 在 复制 机 制 方面 有 差异 所 造成 (Wu 和 Maeda, 1987). 已 知 从 C 到 工 的 转换 ,除了 碱 基 误 配 以 外 ,还 可 能 是 从 甲 基 化 了 的 C 残 基 经 脱 氨 而 变 成 工 残 基 , 这 样 一 种 转变 过 程 而 实现 的 (Coulonder 等 ,1978;Razin 和 Riggs,1980) 。 该 作用 将 提高 C:G->T 工 :A Al G:C>A:T. Bil fer All fox 3. HF AE RE DH DNA 中 约 90% WY EAL AY C RAE RHE TE 5’— CG) 一 3 二 核 苷 酸 中 (CRazin 和 Riggs,1980), 所 以 ,该 效应 将 主要 以 CG — KH B® MK TG 或 CA 的 形式 表现 出 来 。 一 个 基因 变 成 假 基因 后 ,这 类 变化 将 不 再 受 任何 功能 限制 ,因而 ,如 果 在 基因 的 沉默 化 (si lencing)( 即 失去 功能 ) 发 生前 CG 的 频率 相对 而 言 较 高 , 则 它 能 为 CT 工 和 G->~A 转换 作出 显著 贡献 。 对 看 来 曾 在 这 假 基 因 的 祖先 序列 中 出 现 过 CG 二 核 苷 酸 的 那些 位 点 予以 排除 ,由 此 而 得 到 的 替换 模 式 在 表 4 一 9 的 括号 中 给 出 。 此 模式 也 许 更 适合 于 :预测 一 个 长 期 不 受 功 能 限制 的 序列 (例如 一 个 内 含 子 的 某 些 部 分 ) 中 的 突变 模式 ,因为 在 这 样 的 序列 中 将 只 有 少量 CG SRK RATE. HERR CG 二 核 苷 酸 后 得 到 的 模式 有 点 不 同 于 不 经 排除 而 得 到 的 模式 。 特 别 地 ,4 种 转换 间 的 相对 频率 差异 显著 性 略 有 降低 ,而 各 颠 换 的 相对 频率 , 除 G->C 和 C>G 外 , 则 略 有 升 高 。 4.7 同 义 密 码 子 的 非 随 机 应 用 由 于 遗传 密码 的 简 并 ,20 种 氨基 酸 中 大 多 数 都 是 由 一 个 以 上 的 密码 子 编码 的 (第 一 章 )。 因 为 同 义 突变 不 造成 氨基 酸 顺 序 中 的 任何 变化 , 且 因为 自然 选择 被 认为 主要 在 蛋白 质 水 平 上 起 作用 ,所 以 , 同 义 突变 曾 被 当 作 选择 上 呈 中 性 的 突变 的 候选 者 (Kimura,1968;King 和 Jukes,1969)。 然 而 , 若 所 有 , 同 义 突变 事实 上 都 是 选择 中 性 的 ,那么 ,为 同一 个 氨基 酸 编码 的 同 义 密码 子 就 应 该 以 多 少 有 点 相同 的 频率 应 用 。 不 幸 的 是 , 随 着 DNA 顺序 资料 的 积累 ,逐渐 表明 同 义 密码 子 的 应 用 ,在 原核 生物 和 真 核 生 物 的 基因 中 都 显然 是 非 随机 的 (Grantham 等 ,1980)。 事 实 上 ,在 许多 酵母 的 基因 和 大 肠 杆菌 的 基因 中 ,应 用 上 的 偏 斜 是 极 显 著 的 。 例 如 ,在 大 肠 杆菌 CEschnerzchiza coli) > REA I Comp A) 中 的 23 个 亮 酸 残 基 里 , 有 21 个 由 密码 子 CUG 编码 ,尽管 为 亮 氨 酸 编码 的 还 有 5 种 密码 子 。 这 种 偏 斜 不 能 用 非 随 机 突变 来 解释 。 如 何 解 释 这 种 广泛 存在 的 密码 子 非 随机 应 用 现象 ,成 了 一 个 有 争议 的 问题 ,好 在 对 此 间 题 看 来 已 出 现 了 一 些 明确 的 答案 。 有 助 于 理解 非 随机 应 用 现象 的 一 个 观察 事实 是 ,一 个 生物 中 或 有 亲缘 关系 的 物种 中 的 基因 ,一般 表现 出 对 同 义 密 码 子 的 选取 有 同样 的 模式 (Grantham 等 ,1980) 。 于 是 ,哺乳 动物 \ 大肠 杆菌 和 酵母 的 基因 被 归 为 不 同 的 密码 子 应 用 类 型 。 格 兰 瑟 姆 等 (Grantham 等 ,1980) 因此 而 提出 了 基因 组 假说 (genome hypothesis)。 按 其 假说 ,任何 给 定 基因 组 中 的 基因 在 同 义 密码 子 的 选取 方面 都 采用 同样 的 纺 码 策略 , 即 在 密码 子 应 用 上 的 偏 斜 是 物种 特异 的 。 基 因 组 假说 被 证 明 一 般 说 来 是 正确 的 ,虽然 在 一 个 基因 组 的 不 同 基因 间 密 码 子 应 用 有 着 相当 大 的 异 质 性 ( 见 下 面 )。 大 肠 杆菌 和 酵母 中 密码 子 应 用 的 研究 , 极 大 地 增加 了 我 们 对 影响 同 义 密码 子 选取 的 因素 的 认识 。 © DD。 波斯 特等 (Post 等 ,1979) 发现, 大 肠 杆 菌 核糖 体 蛋白 基因 ,优先 应 用 于 被 含量 最 多 的 tRNA 种 类 识别 的 同 义 密 码 子 。 他 们 认为 ,这 种 偏向 是 自然 选择 的 结果 ,因为 应 用 由 含量 最 多 的 tRNA 种 类 翻译 的 密 码 子 ,将 会 增加 翻译 的 效率 和 精确 性 。 他 们 的 发 现 曾 激励 池村 (kemura,1981,1982) 去 收集 有 关 大 肠 杆菌 和 酵母 Saccharomyces cerevisiae ( Hie 74 BE AE) A tRNA 种 类 的 相对 丰 度 的 资料 。 他 证 明 , 在 这 两 个 物种 中 ,一 个 基因 中 同 义 密码 子 的 相对 频率 与 识别 它们 的 tRNA 种 类 的 相对 丰 度 间 存 在 着 正 相 关 。 对 于 高 度 地 表达 的 基因 而 言 , 这 种 相关 非常 强 。 例 如 ,在 大 肠 杆菌 中 4 种 亮 氨 酸 tRNA 里 含量 最 多 的 是 tRNA , 它 识 别 CUG 密码 子 , 而 ompA 基因 也 主要 用 这 种 密码 子 为 亮 氢 酸 编码 ( 见 上 面 )。 图 4 一 8 表示 6 个 亮 氨 酸 密码 子 的 频率 和 识别 它们 的 tRNA 的 相对 丰 度 间 的 对 应 关系 。 在 大 肠 杆 0.4 dq tRNA. tRNAS* =) tRNAGUR a ome) Ga ie) ae i i oo BB CUG CUA anil CUA CUC UUG UUA + 6 CUU UUA CuUG="CUU 1.0 高 水 平 表 达 基 因 1.0 高 水 平 表 达 基 因 Bt 0.8 0.8 i Ray “ 0.4 0.4 Mh z ss 0 0 CUG GUA. (GUG -LUG CUA. CUC UUUG “UUA + + ft CUU UUA CUG =CUU 1.0 1.0 ht 0.8 0.8 紧 低 水 平 表 达 基 因 低 水 平 表 达 基 因 # EE 1] 0.4 : 0.4 小 gf fc ° CCUG TGUA* =“CUC *UUG y CUA CUE § 'UUG UUA BW: ae CUUATUVA CUG CUU 图 4 一 8 ”关于 亮 氨 酸 的 密码 子 应 用 的 相对 频率 ( 白 柱 体 ) 和 相应 的 识别 tRNA 种 类 的 相对 丰 度 ( 黑 柱 体 ) 间 关系 的 图 解说 明 ,(a) 在 大 肠 杆 菌 中 和 (b) 在 Sacharomyces cerevisiae P Ao F (4) 40 E. coli 中 密码 CUC 和 CUU 间 的 符号 ) 表 示 这 类 密码 子 对 中 的 密码 子 都 是 由 同一 种 tRNA 来 识别 的 (例如 , 瑟 . co 中 CUC 和 CUU 都 由 tRNA: 呈 来 识别 ) 。 菌 中 ,tRNA "” 是 含量 最 多 的 tRNA 种 类 ,而 事实 上 ,在 高 水 平 表 达 的 基因 中 ,CUG( 由 这 种 tRNA if 别 的 密码 子 ) 的 应 用 比 另外 5 种 密码 子 要 频繁 得 多 。 另 一 方面 ,在 酵母 中 ,含量 最 丰富 的 亮 氨 酸 tRNA 种 类 是 tRNA, ,而 被 这 种 tRNA 识别 的 密码 子 (UUG) 也 是 数量 上 占 优 势 的 密码 子 。 对 比 之 下 ,在 以 较 低 水 平 表 达 的 基因 中 ,tRNA 丰 度 和 各 密码 子 间 的 对 应 在 这 两 个 物种 里 都 要 弱 得 多 (图 4 一 8)。 在 决定 高 水 平 表 达 的 基因 中 密码 子 的 应 用 模式 方面 ,翻译 效率 的 重要 性 已 得 到 以 下 观察 的 进 一 步 支 持 (Ikemura,1981) 。 已 知 密码 子 - 反 密码 子 配对 在 第 3 位 上 出 现 摇 摆 (wobbling) 。 例 如 , 反 密 码 子 的 第 工 位 上 的 U 既 可 与 A 也 可 与 G 配 对 。 类 似 地 ,G 既 可 与 C 也 可 与 U 配对 。 但 是 , 反 密 码 子 第 1 位 «56° 上 的 C 则 只 能 与 密码 子 第 3 位 上 的 G 配 对 ,以 及 A 只 能 与 可 配对 。 播 摆 还 可 能 通过 这 样 的 事件 来 实 现 :有 些 tRNA 在 第 1 反 密 码 位 置 上 含有 经 修饰 过 的 碱 基 , 而 这 类 tRNA 能 识别 一 种 以 上 的 密码 子 。 例如 ,次 黄 味 叭 (一 种 经 过 修饰 的 腺 味 叭 ) 可 与 U`C\A 三 种 碱 基 中 的 任何 一 种 配对 。 有 趣 的 是 ,大 多 数 能 识别 一 种 以 上 密码 子 的 tRNA ,都 表现 出 对 其 中 的 某 一 种 有 不 同 的 偏爱 。 例如 , 反 密 码 子 的 摇摆 位 置 上 的 4 一 硫 尿 喀 啶 (SU) ,可 以 识别 密码 子 播 摆 位 置 上 的 A 和 Gy; 然而 ,与 以 G 结尾 的 密码 子 相 比 , 它 对 以 A 结尾 的 密码 子 表现 出 明显 的 偏爱 。 这 种 偏爱 在 高 度 地 表达 的 基因 中 应 会 反映 出 来 . 大肠 杆菌 中 两 个 为 赖 氨 酸 编码 的 密码 子 是 由 一 种 tRNA 识别 的 ,该 tRNA 分 子 在 反 密 码 子 的 摇摆 位 置 上 有 S4U ,而 事实 上 ,在 大 肠 杆菌 的 omzp A 基因 中 ,19 个 赖 氨 酸 密码 子 里 15 个 是 AAA, 只 有 《4 个 是 AAG 。 表 4 一 10 列 出 了 由 夏普 等 (Sharp 等 , 1988) 广 泛 收集 的 密码 子 应 用 资料 中 的 一 部 分 。 对 每 一 组 同 义 密码 子 来 说 ,如 果 应 用 机 会 均等 , 则 每 种 密码 子 的 相对 频率 应 该 是 1。 然 而 ,大 多 数 情况 下 显然 并 非 如 此 。 而且; 在 大 肠 杆 菌 和 酵母 这 两 个 物种 中 ,密码 子 应 用 偏 斜 都 是 在 高 水 平 表 达 的 基因 中 比 在 低 水 平 表达 的 基因 中 更 严重 .对 此 差异 的 一 个 简单 解释 是 ,在 高 水 平 表达 的 基因 中 对 翻译 效率 和 精度 的 选 择 要 强 一 些 , 所 以 密码 子 应 用 偏 斜 也 就 显著 一 些 。 另 一 方面 ,在 低 水 平 表 达 的 基因 中 选择 相对 而 言 较 弱 , 所 以 ,该 应 用 模式 主要 受 选择 压力 和 随机 遗传 漂 变 的 影响 ,因而 偏 斜 程度 也 低 一 些 (Sharp 和 Li, 1986). 表 4 一 10 .4 个 物种 中 的 密码 子 应 用 ” 氨基 酸 - 密码 子 Escherichia Coli Saccharomyces Cerevisiae Drosophila Melanogaster 人 高 低 高 低 sy 低 G+C A+T Leu UUA 0.06 1. 24 0. 49 1.49 0. 03 0. 62 0. 05 0. 99 UUG 0,07 0. 87 5. 34 1.48 0. 69 1.05 0.31 oy Hyon cou “0 13 0.72 0.02 . 073 0. 25 0. 80 0. 20 1.26 Bue 017-0. 65 0. 00 0.51 0.72 0. 90 1. 42 0. 80 CUA. 0.04 0.31 0.15 0. 95 0. 06 0. 60 0.15 , £0.57 CUG 5.54 2. 20 0.02 °° 0.84 4.25 2. 04 3. 88 1. 38 Wa \aGOU 241 1.09 2.07 1.13 0. 56 0.74 0. 09 1. 32 GUC 0.08 0.99 1.91 0:76 , ‘1.59 0. 93 1. 03 0. 69 GUA 1.12 0. 63 0. 00 1,18: © :0..06 0.53; 0.11 0. 80 GUG ~ *0. 40 1.29 0. 02 0.93 1.79 1. 80 2.78 1.19 Ile AUU 0.48 1. 38 1.26 1.29 0.74 Doe 0.45 1. 60 AUC 2.51 1.12 1.74 0. 66 2. 26 0. 95 2.43 0.76 AUA _ 0.01 0.50 . 00 1.05 0. 00 0. 78 0.12 0. 64 Phe ©UUU 0.34 133. «(0.19 1. 38 0.12 0. 86 0.27 1.20 UUC 1.66 0. 67 1.81 0. 62 1. 88 1.14 1.73 0. 80 Met AUG 1.00 1.00 1.00 1.00 1.00 1. 00 1.00 » 1.00 A Sharp # , (1988) a. 对 每 一 同 义 密码 子 组 来 说 ,相对 频率 之 和 等 于 该 组 中 的 密码 子 数 。 例 如 , 亮 氨 酸 有 6 个 密码 子 , 所 以 关于 这 6 个 密码 子 的 相对 频率 之 和 即 应 为 6。 在 均等 地 应 用 下 ,一 组 中 每 一 密码 子 的 相对 频率 应 为 1, 所 以 各 值 与 1 的 偏差 指示 应 用 上 偏 斜 的 程度 。 高 和”* 低 "表示 以 高 水 平 表 达 和 以 低 水 平 表 达 的 基因 。 对 人 来 说 ,“G 十 C?" 意 味 着 高 GC 区 ,而 “A 十 IT 意味 着 高 AT 区 。 总 之 ,在 大 肠 杆菌 和 酵母 中 , 同 义 密码 子 的 选取 受 着 RNA 可 用 性 和 其 他 与 翻译 效率 有 关 的 因素 的 限制 。 这 些 限制 结果 将 以 纯洁 化 选择 表现 出 来 ,从 而 减缓 了 同 义 替 换 的 速率 (Ikemura,1981;Kimu- ra,1983)。 事 实 上 ,已 经 得 到 证 明 的 是 , 肠 道 细菌 的 基因 中 同 义 替 换 的 速率 与 密码 子 应 用 的 偏 斜 程度 #2 ff #3 (Sharp #l Li, 1986). ELS Saami ee trea BLL a 学 说 的 证 据 , 因 为 它 可 用 选择 限制 越 强 结果 进化 速率 就 越 低 这 一 原理 来 加 以 解释 ( 见 第 TH Kimura; 1983) 。 表 4 一 10 5B FR AB HY, FRR HP BY Hi BY EF AK de aS 029 AE GE AIR OF de aS 2 TA He 重 得 多 ,这 指出 对 翻译 效率 的 选择 在 决定 这 种 生物 里 同 义 密 码 子 的 选取 方面 也 起 重要 作用 。 在 许多 人 的 基因 中 , 密码 子 倾向 于 以 G 或 C 结尾 ( 即 在 第 3 位 置 上 有 较 高 的 GC 含量 ), 而 在 另 一 些 基因 中 却 有 较 低 的 第 3 位 置 GC 含量 。 不 过 ,有 几 种 原因 可 用 来 说 明 为 什么 该 偏 斜 可 能 与 基因 表达 的 水 平 无 关 。 首 先 ,ae 一 和 B 一 珠 蛋 白 基 因 在 密码 子 的 第 3 位 上 有 不 同 的 GC 含量 (分 别 为 高 含量 和 低 含量 ) ,但 它们 在 同样 的 组 织 ( 红 细胞 ) 中 以 近似 相等 的 量 表达 ,因而 它们 应 该 有 相同 的 表达 水 平 。 其 次 ,在 鸡 的 基因 中 ,密码 子 应 用 的 频率 与 tRNA 的 可 用 性 无 关 (Ouenzar 等 ,1988), 虽然 该 观察 也 许 不 能 直接 地 用 诗人 的 基因 。 最 后 ,第 3 密码 子 位 置 上 的 GC 含量 与 侧 区域 中 和 肉 含 子 中 的 GC 水 平 有 很 强 的 相关 性 (第 八 章 ,Bernardi 和 Bernardi, 1985;Aota 和 Ikeimura,1986 ) 。 例如 ,oa 一 珠 蛋 白 基 因 GC 含 量 高 且 它 位 于 高 GC 区 域 ,B 一 珠 蛋 白 基 因 GCC 含量 低 而 它 位 于 低 GC 区 域 ( 第 八 章 ,Bernardi 等 ; 1985) 。 计 是 ,看 来 人 基因 中 的 密码 子 应 用 偏 斜 , 极 大 地 因 含 有 该 基因 的 区 域 中 GC 的 含量 而 决定 。 正 如 将 要 在 第 八 章 讨论 的 那样 ,一 个 区 域 中 的 GC 含量 是 由 自然 选择 还 是 由 突变 偏 斜 所 决定 ,这 仍 是 一 个 有 争议 的 问题 。 不 过 ,由 于 一 个 基因 中 第 3 密码 子 位置 上 的 GC 含量 倾向 于 高 于 其 周围 区 域 中 的 含 量 ( 第 作 章 ;Aota 和 全 emura,1986), 所 以 ,有 可 能 人 的 基因 中 密码 子 应 用 模式 受到 某 种 程度 的 自然 先 择 的 影响 。 要 得 到 对 影响 人 中 密码 子 应 用 的 因素 的 更 多 知识 ,还 需要 做 进一步 的 研究 。 习题 1. 等 式 4.1 的 分 母 为 什么 是 2T AAT? 2. 图 4 一 9 表示 来 自 橄榄 狮 卯 CPazzo anubis) Mi 5 KBE (Pongo pygmaeus) 61 一 珠 蛋白 基因 的 第 1 和 第 2 外 显 子 的 DNA 顺序 。 用 一 参数 模型 分 别 算出 3 个 密码 子 位 置 中 每 一 个 的 每 位 点 替换 数 。 哪 一 个 位 置 进化 得 最 快 ? Ata? b: ATG GCG CTG TCC GCG GAG GAC CGG GCGGCT GTG CGC GCC CTG o: ATG CGC CTG TCC GCG GAG GAC CGG GCGCTG GTG CGT GCC CTG b: TGG AAG AAA CTG GGA AGC AAT GTT GGCGTC TAT GCT ACT GAG o: TGG AAG AAG CTG GGC AGC AAC GTC GGCGTC TAC ACG. ACA GAG b: GCC CTG GAG AGG ACC TTC CTG GCT TTCCCC GCC ACG AAG ACC o; GCC CTG GAG AGG ACC TTC CTG GCC TTCCCC GCA ACG AAG ACC b: TAC TTC TCC CAC CTA GAC CTG AGC CCCGGC TCC GCC CAG GTT o: TAC TTC TCC CAC CTG GAC CTG AGC CCCGGC TCC TCA CAG GTC b; AGA GCA CAC GGC CAG AAG GTG GCG GACGCG CTG AGC CTC GCC o: AGA GCC CAC GGC CAG AAG GTG GCG GACGCG CTG AGC CTC GCC b; GTG GAG CGC CTA GAC GAC CTA CCC CGCGCG CTG TCC GCT CTG o: GTG GAG CGC CTG GAC GAC CTA CCC CACGCG CTG TCC GCG CTG b; AGC CAT CTG CAC GCT TGC CAG CTG CGAGTG GAC CCA GCT AAC o: AGC CAC CTG CAC GCG TGC CAG CTG CGAGTG GAC CCG GCC AGC b: TTC CCG o; TTC CAG 图 4 一 9 A&E MHL (Cb) fo DRE B(C0)H O1L—-KREGKA PHRF 1 f 2% DNA MA, FARA Shaw 等 , (1987) 4 Marks ¥ , (1986). 3. 图 4 一 10 RAK A MHA REY 91 一 珠 蛋 白 基 因 中 第 1 SAB FH DNA 顺序 。 用 Ca) 一 参数 模型 ,和 (b) 两 参数 模型 ,算出 替换 数 。 这 两 个 估计 有 差别 吗 ? 将 此 结果 与 你 在 习题 2 中 得 到 的 结果 相 比 较 ,那么 ,该 内 含 子 的 进化 比 外 显 子 中 3 个 密码 子 位 置 上 的 进化 是 快 还 是 慢 ? 。58 。 b: TGCGGCGAGGCTGGGCGCCCCCGCCCTCCGGGGCCCTGCCTCCCCAAGCC o: TGCGGCGAGGCTGGGCGCCCCCGCCCCC-AGGGCCCTCCCTCCCCAAGCC b: CCCCGGACGCGCCTCACCGCCGTTCCTCTCGCAG o: CCCCGGACTCGCCTCACCCACGTTCCTCTCGCAG 图 4 一 10 RA MRMHH (Df BREE (0)H 61 一 珠 蛋 白 基 因 中 第 1 个 内 含 子 的 DNA 顺序 。 一 个 裂 镍 用 - 标 出 。 资 料 取 自 Shaw 等 ,(1987) 和 Marks 等 ,(1986) 4. 图 4 一 11 表示 来 自 人 仓鼠, 大 鼠 和 小 鼠 的 核 仁 素 基 因 中 的 第 1 个 内 含 子 的 部 分 DNA MF. 以 仓 鼠 的 顺序 作为 参照 物 , 用 相对 速率 检验 法 来 决定 ,大 鼠 谱系 和 小 鼠 谱 系 间 替换 速率 上 是 否 存在 差异 。 m: GTAAGAGGCCTGGCGCGCCGACGCGGACGACTAGGCCTGCTTTCGGAGGG r: GTAATAGGCCTGACGCGCGAACACGGACGACTAGGCCTGCTTTCTGAGAG h: GTGAGAGGCCTCGCGCGCGCCGACGGACGGACGGGCCTGCTTTCTGAGGG m: GCGCGCGCGCCGTCGCGGAGGGGAGGAGGGCTTGCGCGCAATCCCGGGCG r: GCGCGCGCGCCGTCGCGGAGGGGAGGAGGGCCTGCGCACAGTCCCGGGCG h; GCGCGCGCGCGGTCGCTCAGGGGAGGAGGGCCTGCGCGCAA TCCCGGGCG m: CGTTCGAGGGCGCCAGCTGGGGAACTCTCGCGCGACT AGCGGGAGGTCTC r: CGTTCGAGGGCGCA TGCTGGGGAAGTCTCGCGCGACT AGCGGAGGGTCTC h: CGTTCGAGGGCGCA TGCTGGGGAAGTCTCGCGCGACTAGCGGAGGGTCTC 图 4 一 11 ABDA(Mm). KAD PEACH HRERRA PRL 个 内 含 子 的 部 分 DNA 顺序 。 裂 名 (缺失 和 插入 ) 已 被 略 去 。 资 料 取 自 Bourbon 等 ,(1988) 5. 艾滋 (AIDS) 病 毒 的 两 个 品系 用 WMJ1 和 WMJ2 表示 ,在 1984 年 10 月 3 日 和 1985 年 1 月 15 日 从 一 个 两 岁 的 孩子 身上 分 离 出 来 (Hahn 等 ,1986)。 这 个 孩子 假定 只 受过 一 次 感染 (由 她 的 母亲 在 围 产 期 传 给 )。 这 两 个 分 离 物 间 外 壳 蛋 白 (exv) 基 因 中 每 同 义 位 点 的 同 义 替 换 数 为 0.0164(Li 等 , 1988) 。(a) 假 定 WMJ2 直接 从 WMJ1 进化 而 来 并 假定 这 两 个 顺序 在 1984 年 10 月 3 日 分 开 , 求 同 义 替换 速率 的 最 大 估 值 。(b) 假 定 这 两 个 品系 在 被 感染 时 即 开始 分 岐 ,并 假定 它们 已 独立 地 进化 了 两 年 , 求 该 基因 同 义 替 换 速 率 的 最 小 估 值 .这 些 蔡 换 速 率 比 对 哺乳 动物 的 基因 加 以 平均 的 同 义 替 换 速率 ( 表 4 一 1) 要 快 多 少 ? 6. 从 大 肠 杆 菌 .酵母 和 人 中 各 找 出 一 个 完整 的 cDNA 或 基因 顺序 。 对 每 一 种 基因 编 一 个 密码 子 应 用 表 ( 即 列 出 每 种 密码 子 在 基因 中 被 使 用 的 次 数 ) 。 那 么 ,该 密码 子 应 用 是 否 偏 斜 ? 在 哪 方 面 偏 斜 ? 密码 子 应 用 模式 在 这 3 种 基因 中 是 否 相 似 ? MRAZ WER AX 检验 法 去 判断 ,在 每 一 种 基 因 中 绩 氨 酸 密码 子 的 应 用 与 该 族 密码 子 机 会 均等 地 应 用 的 偏差 是 否 具 有 统计 学 意义 。 后 继 阅读 文献 Ikemura, T. 1985. Codon usage and tRNA content in unicellular and multicellusar organisms. Mol. Biol. Evol. 2: 13—34 Kimura, M. 1983. The Neutral Theory of Molecular Evolution. Cambridge University Press, Cam- bridge. MacIntyre, R. J. (ed. ). 1985. Molecular Evolutionary Genetics. Plenum, New York. Nei, M. 1987. Molecular Evolutionary Genetics. Columbia University Press, New York. Sharp, P. M. and W. -H. Li. 1986 An evolutionary perspective on synonymous codon usage in uni- cellular organisms. J. Mol. Evol. 24: 28—38 Steinhauer, D. A. and J. J. Holland. 1987. Rapiel evolution of RNA viruses. Annu. Rev. Microbiol. 41: 409— 433. 5 分子 系统 发 育 分 子 系统 发 育 是 用 分 子 生 物 学 技术 对 生物 间 的 进化 关系 进行 的 研究 。 它 是 分 子 进化 中 的 一 个 领 域 , 近 十 年 来 已 引起 了 广泛 关注 ,这 主要 是 因为 在 许多 情况 下 系统 发 育 关 系 用 任何 别 的 方法 都 难以 佑 价 的 缘故 .本 章 的 目的 是 ,解释 如 何 用 分 子 数据 来 构建 系统 树 , 以 及 给 出 一 些 例子 , ae 些 存在 已 久 的 系统 发 育 问题 ,分 子 方法 能 够 提供 比 传统 方法 要 清晰 得 多 的 解答 。 5.1 “分子 数 据 对 系统 发 育 研究 的 影响 rT TET eae Lie 甚至 早 于 备 德 尔 定 律 被 重新 发 现 的 1900 年 。 免 疫 化 学 研究 表明 , 血清 学 交叉 反应 在 亲缘 关系 较 近 的 生物 间 比 在 关系 较 远 的 生物 间 强 。 这 些 发 现 的 进化 含义 被 纳 托 尔 (Nutall,1904) 用 来 推论 各 不 同 动物 类 群 间 的 系统 发 育 关 系 。 例 如 , 他 断定 人 类 最 近 乡 的 亲属 是 猿 , 其 后 ,亲缘 关系 由 近 及 远 依 次 为 : 古 世 界 猴 ,新 世界 猴 和 原 猴 。 自 十 九 世 纪 六 十 年 代 后 期 以 来 ,分 子 生物 学 中 的 各 种 技术 都 得 到 发 展 , 从 而 开始 了 将 分 子 数据 广 应 用 于 系统 发 育 的 研究 .特别 是 在 十 九 世纪 七 十 年 代 和 十 九 世 纪 八 十 年 代 , 用 蛋白 质 顺序 资料 研究 分 子 系统 发 育 进 展 极 快 。 花 费 不 大 但 便利 得 多 的 方法 , 象 蛋白 质 电 泳 ,DNA 一 DNA 杂交 和 免疫 学 方 法 ,虽然 不 如 蛋白 质 顺 序 测定 来 得 精确 , 却 也 被 广泛 用 于 群体 间或 亲缘 关系 较 近 的 物种 间 的 系统 发 育 关系 的 研究 中 。 这 些 方法 的 应 用 也 刺激 了 遗传 距离 的 测定 和 系统 树 构建 法 的 发 展 ( 见 ,Fitch 和 Margo- liash , 1967; Nei, 19755 Felsenstein , 1988) 。 A+ Sth 40 /\ + 4 0 Je RY DNA 顺序 资料 的 积累 , 已 经 对 分 子 系统 发 译 产 生 了 巨大 的 影 Me]. DNA 顺序 资料 不 仅 更 为 丰富 ,而且 比 蛋 白质 顺序 资料 更 容易 分 析 。 因 此 ,它们 一 方面 已 被 用 于 推 断 象 人 与 猿 那样 亲缘 关系 很 近 的 物种 间 的 系统 发 育 关 系 ( 见 第 72 页 ), 另 一 方面 又 被 用 来 研究 一 些 非 常 古老 的 进化 事件 , 象 线粒体 和 叶绿体 的 起 源 ( 见 第 76 页 ), 门 和 界 的 分 化 (Woese,1987) 等 。 将 来 , DNA 定 序 看 来 将 用 于 解决 系统 发 育 研究 中 许多 长 期 得 不 到 解决 的 问题 , 象 细菌 和 单 细胞 真 核 生 物 间 的 进化 关系 (Sogin 等 ,1986,1989) ,这 用 任何 传统 的 进化 研究 方法 都 不 可 能 得 到 解决 。 事 实 上 ,分 子 oh paeennale Cae eS ee be ee RS Ra eae 的 系统 发 育 树 。 当然 ,我 们 也 不 放弃 进化 研究 的 传统 手段 ,象形 态 学 .解剖 学 .生理 学 和 古生物 学 等 。 因 为 , 不 同方 法 可 提供 互相 补充 的 数据 。 我 们 注意 到 ,分 类 学 主要 以 形态 学 和 解剖 学 资料 为 依据 5 而 古生物 学 信息 则 是 能 提供 用 于 进化 研究 的 时 间 框 架 的 唯一 资料 。 5.2 系统 树 地 球 上 的 一 切 生命 形式 ,不 管 是 现存 的 还 是 已 经 灭绝 了 的 ,都 有 一 个 共同 的 起 源 , 它 们 的 祖先 可 以 追溯 到 大 约 在 40 亿 年 以 前 生存 的 一 种 或 几 种 生物 。 因 此 ,所 有 动物 植物、 细菌 通过 祖 藉 而 相互 关 联 。 亲 缘 关 系 近 的 生物 是 由 一 个 较 近 代 的 共同 祖先 传 下 来 的 ,亲缘 关系 远 的 生物 则 由 较 远 古 的 共同 祖 先 传 下 来。 系统 发 育 研究 的 目的 是 :(1) 建 立 各 生物 间 正 确 的 系谱 学 联系 ,和 (2) 估 计 各 生物 自 它们 从 最 后 一 个 共同 祖先 那里 分 岐 以 来 的 分 岐 的 时 间 。 在 系统 发 育 研究 中 ,一 组 生物 类 群 间 的 进化 关系 常用 系统 树 (phylogenetic tree) 来 图 示 说 明 。 系 统 树 是 一 种 由 节点 和 分 枝 组 成 的 图 象 , 其 中 任何 两 个 邻近 的 节点 都 只 由 一 个 分 枝 来 联结 (图 5 一 1)。 节 s。 00。 点 (nodes) 代 表 分 类 学 单位 ,而 分 枝 (branches) 则 用 祖 类 和 祖先 来 定义 这 些 单位 间 的 关系 。 一 个 树 的 分 枝 模式 被 称 为 拓扑 图 (topology) 。 枝 长 (branch length) 通常 代表 在 该 分 枝 中 曾 发 生 过 的 变化 数 。 由 节 点 表示 的 分 类 学 单位 可 以 是 物种 、 群 体 . 个 体 或 基因 。 在 处 理 系统 树 时 ,我们 要 分 清 外 节点 (external nodes) 和 内 节点 (internal nodes)。 例 如 ,图 5 一 1a 中 ,节点 ABC、D 和 匡 是 外 节点 ,其 余 的 都 是 内 节点 。 外 节点 代表 处 于 比较 中 的 现存 分 类 学 单位 ,并 被 命名 为 操作 中 的 分 类 学 单位 (operational taxonomic units) 即 OTU 。 内 节点 则 代表 祖先 单位 。 图 5 一 1 为 处 理 一 个 系统 树 的 两 种 普通 方法 的 示意 图 。 在 图 5 一 la 中 ,其 分 枝 是 无 尺度 的 (un- 时 间 1 单位 图 5 一 1 一 个 关于 5 个 OTU 的 系统 树 的 两 种 可 供 采用 的 表示 法 。(a) 无 尺度 的 分 枝 :现存 的 OTU 排 成 一 条 线 , 节 点 位 于 与 分 岐 时 间 成 比例 的 地 方 。(b) 有 尺度 的 分 枝 :分 枝 的 长 度 与 分 子 变 化 数 成 比例 。 scaled) ,它们 的 长 度 与 已 注 明 在 分 枝 上 的 变化 数 不 成 比例 。 这 种 表示 法 使 我 们 能 将 现存 的 OTU 排 成 一 条 直线 ,而且 在 分 岐 时 间 已 知 或 已 估 出 时 ,还 可 把 代表 分 岐 事件 的 节点 按时 间 尺 度 来 排列 。 在 图 5 一 lb 中 ,分 岐 是 有 尺度 的 (scaled), 且 其 长 度 正 比 于 变化 数 。 如 果 任 何 两 个 OTU 间 的 距离 等 于 将 它们 联 起 来 的 所 有 分 枝 的 长 度 之 和 , 则 这 样 的 树 即 被 称 为 是 加 性 的 (additive) 。 例 如 , 若 可 加 性 成 立 , 则 图 5 一 la 中 OTUA AIC 间 的 距离 应 等 于 2 十 1 十 3 十 2 王 8。 两 个 OTU 间 的 距离 可 直接 从 分 子 数 据 ( 例 如 DNA 顺序 ) 算 出 ,而 枝 长 则 可 按 某 些 规 则 从 OTU 间 距离 估 出 ( 见 第 77 页 )。 如 果 在 任 一 核 苷 酸 位 点 上 曾 发 生 过 多 重 替 换 , 则 可 加 性 一 般 不 成 立 ( 图 3 一 cy 若 一 个 节点 只 有 两 个 直接 的 后 代 谱系 , 则 它 是 两 分 又 的 (bifurcating), 若 它 有 两 个 以 上 的 直接 后 代 谱 系 则 是 多 分 又 的 (multifurcating)。 为 简便 起 见 ,我 们 将 只 考虑 象 图 5 一 1 中 那样 的 两 分 又 树 。 有 根 树 和 无 根 树 系统 树 可 以 是 有 根 的 (rooted) 也 可 以 是 无 根 的 (unrooted) (图 5 一 2)。 在 有 根 树 中 ,存在 一 个 被 称 为 根 ( 图 5 一 2a 中 的 R) 的 特殊 节点 ,由 此 导向 任何 别 的 节点 都 具有 唯一 途径 .每 一 途径 中 的 方向 与 进 化 时 间 相 对 应 ,而 根 则 是 所 有 正 被 研究 的 OTU 5 OTU 间 的 关系 具 体 化 而 未 定义 进化 途径 的 树 ( 图 5 一 2b) 。 对 3 个 物种 来 说 ,存在 着 3 种 可 能 的 有 根 树 , 但 只 有 一 种 无 根 树 (图 5 一 3). 对 n 个 OTU 而 言 , 两 分 叉 有 根 树 的 数目 (Ng) 由 : CM EEN Nr = on-2 (yn 赴 9)! ere 给 出 ,其 中 nS2. Mt n>3, MANA RAND) A: ee OY Ph) be i-%s, =9)) 5 注意 ,n 个 OTU 的 可 能 无 根 树 数 等 于 Cn 一 1 个 OTU 的 可 能 有 根 树 数 .OTU 从 2 到 10 的 可 能 有 根 树 “0l,。 (a) A (>) C B D A RET Pd. Cc big B E 时 间 图 5 一 2 (a) 有 根系 统 树 和 无 根系 统 树 ”箭头 指示 从 根 (R) 到 OTUD) 的 唯一 途径 (a) (b) ley eee’ i a OK ; | 一 < C 图 5 一 3 从 3 种 OTU 可 能 会 构建 出 3 种 不 同 的 有 根 树 (a), 但 却 只 有 一 种 无 根 树 (b) 。 和 无 根 树 的 数目 列 于 表 5 一 1。 我 们 看 到 , 随 着 n 的 增加 Nu ANe 都 极 快 地 增 大 ,而 到 10OUT 时 已 经 有 200 多 万 两 分 叉 无 根 树 和 将 近 3500 万 有 根 树 了 。 由 于 这 些 树 中 只 有 一 种 能 正确 地 表示 这 些 OIU 间 真 实 的 进化 关系 ,所 以 , 当 n 较 大 时 ,推论 出 真实 的 系统 树 通常 是 非常 困难 的 。 表 5 一 1 对 1 一 10 OTU 可 能 的 有 根 树 和 无 根 树 的 数目 OTU 数 有 根 树 数 无 根 树 数 2 1 1 3 3 1 4 15 3 5 105 15 6 954 105 7 10395 954 8 135135 10395 9 2027025 135135 10 34459425 2027025 自 Felsenstein(1987) 真实 树 和 推测 树 导致 任何 类 群 的 OTU 形成 的 物种 形成 事件 的 秩序 ,在 历史 上 是 唯一 的 。 所 以 ,在 用 某 一 给 定数 的 OTU 建立 的 所 有 可 能 的 树 中 ,只 有 一 种 能 代表 真实 的 进化 历史 。 这 样 一 种 系统 树 称 为 真实 树 (true tree)。 用 某 一 组 数据 和 某 种 构 树 法 得 到 的 树 称 推 测 树 (inferred tree), 推测 树 可 能 与 真实 树 等 同 ,也 可 能 与 真实 树 不 同 。 基因 树 和 物种 树 表示 一 和 群 物种 的 进化 途径 的 系统 树 称 物种 树 (species tree)。 若 系统 树 是 根据 来 自 各 物种 的 一 个 。62 。 基因 构成 的 , 则 该 推测 树 即 为 基因 树 (gene tree)(Nei,1987) 。 它 与 物种 树 有 两 个 方面 不 同 。 第 一 ,从 两 不 同 物 种 取样 的 两 基因 的 分 岐 可 能 在 时 间 上 早 于 两 物种 的 分 岐 (图 5 一 4) , 这 将 造成 高 估 了 枝 长 的 结 果 , 但 如 果 我 们 处 理 的 是 长 期 进化 ,在 这 个 过 程 中 由 物种 内 遗传 多 态 性 造成 的 分 岐 成 分 可 以 忽略 的 话 , 则 还 不 至 于 出 现 严重 问题 . | G | | | | G | | | | P ) \ 7 ~ om \ 现在 a, bc ‘ de f 图 5 一 4 本 图 表示 : 若 群 体 在 时 刻 卫 是 着 传 上 多 态 的 , 则 基因 分 化 (4 ) 通 常 比 群 体 分 化 (D) 出 现 得 早 。 结 果 形 成 用 a 一 上 表示 的 6 个 等 位 基因 的 基因 进化 史 用 实 线 表示 ,群体 分 岐 则 以 虚线 表示 。 自 Nei(1987) 。 基因 树 的 第 2 个 问题 是 ,基因 树 的 分 枝 模式 ( 即 它 的 拓扑 图 ) 可 能 与 物种 树 的 不 同 。 图 5 一 5 展示 了 这 两 种 树 间 的 3 种 不 同 的 可 能 关系 。 基因 树 (a) 与 (b) 的 拓扑 图 和 与 其 对 应 的 物种 树 的 图 等 同 ( 例 时 间 4p ty A A A T ble ty B B B Xx Z hy 5X Y Z X Y Z 1 — e=T2N : : } po TANe : 7 TN (a) 本 0) (0) im S-5 ty Abt 46 WY ) fo JK tC) TL 3 种 可 能 关系 。 在 (a) 和 (b) 中 ,物种 树 的 拓扑 图 与 基因 树 的 等 同 。 注 意 ,(a) 中 基因 的 分 岐 时 间 大 致 等 于 群体 的 分 岐 时 间 。 而 (b) 中 却 不 然 ,基因 X 和 立 的 分 岐 时 间 大 大 早 于 各 自 所 属 的 群体 的 分 岐 时 间 。 在 (c) 中 ,基因 树 的 拓扑 图 与 物种 树 的 不 同 。 对 于 中 性 等 位 基因 ,每 种 树 出 现 的 概率 已 在 该 树 的 下 面 列 出 .ti 是 第 一 次 物种 形成 事件 发 生 的 时 间 ,t; 是 第 三 次 物种 形成 事件 发 生 的 时 间 。 图 中 工 =ti 一 tb,Ne WEAK 群体 大 小 。 自 Nei(1987) 。 如 ,X 和 YY 形成 一 簇 )。 然 而 基因 树 (c) 却 与 真实 的 物种 树 不 同 , 因 为 此 时 立 和 2Z 是 姐妹 类 群 . 当 第 一 次 物种 分 化 和 第 二 次 物种 分 化 间 的 时 间 间 隔 (ti 一 tz) 较 短 时 ,得 到 错误 的 树 (c) 的 概率 将 是 相当 高 的 , 这 种 情况 在 确定 人 、 黑 猩猩 和 大 猩猩 间 的 系统 发 育 关 系 时 可 能 确实 存在 。 为 了 避免 得 到 这 种 错误 类 型 ,在 构建 系统 树 时 就 必须 用 许多 基因 。 为 了 避免 随机 误差 也 需要 大 量 数据 。 因 为 核 苷 酸 蔡 换 是 随机 地 发 生 的 ,所 以 有 可 能 会 产生 随机 误差 。 例 如 图 5 一 5a 中 ,谱系 Z 累积 的 替换 可 能 会 因 机 遇 而 比 谱系 X 和 Y 的 少 ,尽管 它 发 生 分 枝 的 时 间 要 更 早 一 些 。 5.3 系统 树 的 构建 方法 文献 中 已 有 许多 构 树 方法 被 提出 来 。 有 关 的 详细 处 理 读 者 可 参考 史 尼 斯 和 索 卡 尔 (Sneath 和 Sokal,1970) 、 根 井 (Nei,1987) 以 及 费 尔 森 施 泰 因 (Felsenstein ,1988) 等 的 论述 。 这 里 我 们 讲 4 种 在 系 统 发 育 研究 中 常 被 用 到 的 方法 。 为 简单 起 见 , 我 们 考虑 核 苷 酸 顺序 数据 ,但 所 讲 到 的 方法 同样 也 可 用 于 其 他 类 型 的 分 子 数 据 , 象 氨基 酸 顺 序数 据 。 以 下 所 讲 的 方法 可 分 成 两 种 类 型 :距离 矩阵 法 (distance matrix methods) 和 最 节省 法 ( maxmum parsimony methods) 。 在 距离 矩阵 法 中 , 进化 距离 (通常 为 分 开 两 分 类 学 单位 的 核 苷 酸 或 氨基 酸 蔡 换 数 ) 按 所 有 可 能 的 分 类 单位 对 算出 , 并 用 根据 距离 值 间 的 某 些 函 数 关 系 建立 的 算法 来 构建 系统 树 。 在 最 节省 法 中 ,应 用 了 特性 状态 (例如 , 某 一 个 位 点 上 的 核 苷 酸 或 氮 基 酸 ), 而 导致 这 些 特性 状态 的 最 短 途径 即 被 选取 为 系统 树 。 不 加 权 算 术 平 均 组 对 法 (UPCMA) 不 加 权 算 术 平 均 组 对 法 (unweighted pair group method with arithmetic mean)(UPGMA) 是 一 种 简单 的 构 树 法 。 它 最 初 本 用 来 构建 分 类 学 表 型 关系 图 , 即 能 反映 出 各 OTU 间 的 表 型 相似 性 的 树 (Sokal 和 Michener,1958; 并 见 第 68 页 ) ,但 如 果 进 化 速率 在 不 同 谱系 间 近 似 地 恒定 ,以 至 进化 距离 与 分 岐 时 间 之 间 存 在 近似 的 线性 关系 , 则 它 也 可 用 来 构建 系统 树 (Nei,1975 ) 。 MRS 核 苷 酸 ( 或 氨基 酸 ) 替 换 数 这 样 的 线性 距离 太 度 就 应 该 被 用 到 了 。 UPGMA 法 采用 连续 聚 类 算法 ,在 此 法 中 局 部 拓扑 关系 按 相 似 性 的 级 别 来 鉴别 , rr ae 是 分 步 实 现 的 。 也 就 是 说 ,我 们 首先 从 所 有 OTU 中 找 出 两 个 最 相似 的 OTU ,并 把 它们 看 成 一 个 新 OTU。 这 样 的 OTU 我 们 称 之 为 复合 OTU (composite OTU)。 接 着 ,从 这 种 新 的 OTU 群 中 我 们 再 找 出 有 最 大 相似 性 的 对 子 , 如 此 继续 下 去 ,直到 我 们 最 后 仅 留 下 2 个 OTU 时 为 止 。 为 了 对 此 法 作出 具体 说 明 ,让 我 们 来 考虑 一 个 包含 4 个 OTU 的 例子 。 成 对 的 进化 距离 , A A Fe i AIK FE (Jukes 和 Cantor,1969) 所 估计 的 那样 (第 三 章 ) ,由 以 下 矩阵 所 给 出 : OTU OTU A B C B dap a C dac dac D dap dpp dep He EHP yA Be OTUi 和 j 间 的 距离 。 最 先 被 聚 类 的 两 个 OTU 是 距离 最 短 的 那 两 个 。 我 们 假定 dAs 有 最 小 值 , 则 OTUA 和 是 最 先 被 聚 类 的 ,而 分 枝 点 则 放 在 距离 为 dan /2 替换 的 地 方 ( 图 5 一 6a) 。 (a) A B (c) A 3 B diapyc 2 C D d(ABC)D B5—6 444 0TU 校 UPGMA 法 分 步 构 建 系统 树 的 示意 图 ( 详 见 正文 ) 第 一 次 聚 类 后 ,A 和 了 B 被 看 成 一 个 复合 OTU , 据 此 而 算出 一 个 新 距离 矩阵 , * 64.6 OTU OTU (AB) 人 全 deAB)c D d(apyp dep FE WH 58 BEB pd capyc= (dac tdac)/2sdcasyp= (dAp 十 dap)/2。 换 言 之 ,一 个 单 OTU 和 一 个 复合 OTU 间 的 ee. KM OTU 与 该 复合 OTU 的 各 组 成 单 OTU 间距 离 的 平均 值 。 如 果 dcAsyxc 是 新 矩阵 中 的 最 小 距离 ,那么 ,OTU C 将 加 入 到 复合 OTU(CAB) 中 , 且 在 diapye/2 处 有 一 个 分 枝 节点 (图 5 一 6b) 。 最 后 一 步 是 将 最 后 剩 下 的 OTUD 与 复合 OTU(CABC) 聚 类 。 整 个 树 的 根 位 于 dluAscp/2 王 [CdAb 十 dsp 十 dco)/3]/2 处 。 用 UPGMA 法 推测 出 的 最 后 树 如 图 5 一 6c 所 示 。 在 UPGMA 法 中 ,两 个 复合 OTU 间 的 距离 用 每 一 复合 OTU 中 的 所 有 组 成 OTU 间距 离 的 算术 平均 算出 。 例 如 ,复合 OTU Gj) 和 复合 OTU(Cmn) 间 的 距离 为 : (dint + din + dim + din) dijon) = 4 Roxana) #2 & OTU Gjk) Al (mn) HIF PBA: doy t Gakic Gn di, + a. d . d Giit)Gmn) = fet ie he he te Ee) (5. 4) 变形 距离 法 。 如果 假定 速率 恒定 在 各 谱系 间 不 成 立 , 则 UPGMA 法 可 能 会 给 出 错误 的 拓扑 图 。 例 如 ,假定 图 5 .= 一半 中 的 系统 树 是 真实 树 ,而 各 OTU 对 的 进化 距离 则 由 以 下 矩阵 给 出 : OTU OTU A B C B 8 Cc 7 9 D 12 14 11 用 UPGMA 法 ,我 们 得 到 的 推测 树 在 分 枝 模式 上 与 真实 树 不 同 ( 图 5 一 7b)。 如 ,推测 树 中 OTUA AIC 被 组 合 在 一 起 了 ,而 在 真实 树 中 ,A 和 B 才 是 姐妹 OTU 。( 注 意 , 此 例 中 可 加 性 不 存在 。 如 ,A 和 了 B 间 的 真实 距离 为 8. 而 估 出 的 联结 A 和 B 的 分 枝 . 其 枝 长 之 和 为 3.50 十 0.75 十 4.25 一 8. 50) 。 (a) 5-7 (a) RK A RES Cb) IR AR. HER A ARR AL EY — AR REO AREA UPGMA 方法 构造 。(c) 此 树 由 变形 距离 法 推断 得 到 。 根 必须 在 OTUD 和 OTUA、B 与 C 的 共同 祖先 节点 之 间 ,, 但 准确 的 位 点 不 能 确定 。 不 过 ,该 配 扑 图 错误 也 许 能 用 被 称 为 变形 距离 法 (transformed distance method ) 的 校正 方法 来 订 IE (Farris, 1977 ;Klotz 等 ,1979) 。 简单 地 说 ,此 法 是 用 一 个 组 外 单位 (outgroup) 作 参 照 物 ,来 对 被 研究 谱系 间 进 化 速率 不 等 的 情况 作 一 些 校正 ,然后 对 新 得 到 的 距离 矩阵 应 用 UPGMA 法 ,从 而 推测 出 该 树 的 拓扑 图 .组 外 单位 是 一 个 我 们 对 其 有 外 在 认识 的 OTU .这 些 外 在 认识 ,如 分 类 学 的 或 古生物 学 的 知识 ,能 清楚 地 表明 ,该 OTU 已 先 于 所 有 其 他 被 研究 的 OTU 而 从 其 共同 祖先 分 岐 出 来 。 在 现在 的 例子 中 ,我 们 假定 分 类 单位 D 对 所 有 别 的 分 类 单位 来 说 是 一 个 组 外 单位 。 那 么 D 即 可 当 作 参照 物 ,并 用 下 式 来 变换 距离 < sani! IT (5.5) ‘J Cd! f AB IE PE BS i= AB B& Cydp=(dantdantden)/3. dr S| AZEW T RIED Ad’ BY 1 AB 2 正 的 。 做 此 手续 是 因为 ,实际 上 上 距离 不 可 能 是 负 的 。 对 于 有 n 个 OTU( 不 包括 组 外 单位 ) 的 一 般 情 形 , 2 在 我 们 的 例子 里 , 瑟 一 交 而 新 距离 抢 阵 中 关于 分 类 单位 A.B 和 C 的 值 为 OTU OTU A B B 10/3 C 13/3 13/3 Hd As 有 最 小 值 ,所 以 A AB 最 先 被 聚 类 在 一 起 ,然后 ,C 再 加 和 到 该 树 中 。 根据 定义 ,组 外 单位 O- TUD 决定 该 树 的 根 , 因 而 最 后 加 入 该 树 。 这 样 就 给 出 了 正确 的 拓扑 图 (图 5 一 7c)。 在 上 例 中 ,我 们 仅 考虑 了 3 个 分 类 单位 和 1 个 组 外 单位 ,但 此 法 可 很 容易 地 推广 到 更 多 分 类 单位 和 /或 更 多 组 外 单位 的 场合 。 在 许多 具体 情况 下 ,不 可 能 预先 决定 被 研究 的 分 类 单位 中 哪 一 个 是 组 外 单位 。 为 了 克服 这 一 困 难 , 两 步 进行 法 已 被 提 了 出 来 (Li,1981)。 第 一 步 ,用 UPGMA 法 先 推出 该 树 的 根 。 然 后 ,处 于 根 一 侧 的 分 类 单位 被 当 作 参 照 物 (组 外 单位 ), 对 处 于 根 的 另 一 侧 的 谱系 间 不 相等 的 进化 速率 做 校正 ,以 后 再 做 相反 方向 的 校正 。 在 我 们 的 例子 中 ,此 法 也 能 找 出 正确 的 树 。 近邻 关系 法 在 一 个 无 根 两 分 又 树 中 ,如 果 两 个 OTU 通过 一 个 内 部 节点 联结 , 则 它们 就 被 说 成 是 近邻 Cneigh- bors)。 例 如 ,图 5 一 8a 中 ,A 和 也 是 近邻 ,C 和 D 也 是 如 此 。 与 之 相 比 , 图 5 一 8b 中 ,A 和 C 不 是 近邻 , BAC 也 不 是 。 然 而 ,如 果 我 们 把 OTUA 和 也 结合 成 一 个 复合 OTU , 则 复合 OTU(CAB) 和 单 OTUC 就 变 成 了 一 对 新 近邻 。 现在 我 们 假定 ,图 5 一 8a 中 展示 的 树 是 真实 树 。 那 么 , 若 可 加 性 存在 则 我 们 应 有 dac + dgp = dan + de =a+b+e+d + 24 = dag + dcp + 2x - AB G2 这 里 x 是 内 部 分 枝 的 长 度 。 因 此 ,以 下 两 个 条 件 成 立 : daz + dcp < dac + agp (5, 7a) 和 dap + dcp < dan + dac (5. 75) 这 两 个 条 件 总 称 为 四 点 条 件 (four-point condition) 。 即 使 可 加 性 只 不 过 近似 地 存在 ,这 些 条 件 可 能 也 是 成 立 的 。 反之 ,对 系统 发 育 关 系 不 知 的 4 个 OTU 而 言 ,以 上 两 个 条 件 可 用 来 找 出 近邻 (A 和 B;C MD). 一 旦 这 两 对 近邻 被 确定 ,系统 树 的 拓扑 图 也 就 被 确定 了 。 萨 塔 斯 和 特 韦 尔 斯 基 (Sattath 和 Tversky,1977) 提出 以 下 方法 来 处 理 多 于 4 个 OTU 的 情况 。 首 先 , 象 在 UPEGMA 中 的 情况 一 样 算出 距离 矩阵 。 对 每 种 可 能 的 四 单位 组 ,比如 OTUi,j,m Ain, WH di 十 dadn 十 dn 和 do 二 dm。 假定 第 一 个 和 的 值 最 小 ,那么 ,我 们 把 1 和 j 对 以 及 m 和 mn 对 都 记 1 分 ,而 i 和 本 对 和 mn 对 .和 m 对 ,j 和 mn 对 则 都 记 0 分 否则, 如果 dm 十 ds 有 最 小 值 , 则 我 们 就 给 1 和 曾 对 以 及 j 和 mm 对 记 1 分 ,而 给 其 他 4 种 可 能 的 对 子 记 0 分 。 在 对 所 有 可 能 的 四 单位 组 都 评 过 分 以 后 ,得 总 分 最 高 的 对 子 即 被 选 为 第 一 个 近邻 对 ,并 把 它 当成 一 个 OTU 来 处 理 , 下 一 步 ,如 在 UPGMA 中 的 情况 一 样 算出 新 距离 矩阵 ,然后 重复 以 上 过 程 选 出 第 二 个 近邻 对 。 此 过 程 继 续 到 所 有 OTU 被 聚 类 时 止 。 在 我 们 考虑 猿 和 人 的 系统 发 育 时 将 给 出 此 法 的 详细 说 朋 ( 见 第 72 页 )。 * . 66 °* Cc 图 5 一 8 (a) 有 4 个 OTU 和 (Cb) 有 5 个 OTU 的 两 分 又 无 根 树 。 以 近邻 关系 概念 为 根据 的 另 一 种 方法 曾 由 菲 奇 (Fitch,1981) 提 出 。 塞 图 和 根 井 (Saitou 和 Nei, 1987) 曾 提 出 一 个 称 为 近邻 结合 法 Cneighbor-joining method ) 的 方法 。 这 是 连续 地 找 出 使 树 的 总 长 度 最 小 的 近邻 对 的 方法 。 最 节省 法 最 节省 或 最 少 进化 的 原则 涉及 : 找 出 一 个 要 求 最 小 进化 变化 数 的 树 ,以 解释 被 研究 OTU 间 观 察 到 的 差异 ,这 样 一 种 树 称 为 最 节省 树 (maximum parsimony tree) 。 常 常 可 以 发 现 不 止 一 种 树 有 同样 的 最 小 变化 数 , 所 以 ,推测 出 的 树 可 能 不 是 唯一 的 。 下 面 讨论 的 方法 最 初 是 为 了 处 理 氨 基 酸 顺序 数据 而 提出 的 GEck 和 Dayhoft,1966), 后 来 经 修改 fa RAT AH BI FF Bitch ,1977) 。 . 我 们 先 对 信息 位 点 (informative sites) 进 行 定 义 。 一 个 核 苷 酸 位 点 是 具有 系统 发 育 方 面 的 信息 的 , 仅 当 它 在 众多 的 树 中 偏向 其 中 一 些 树 时 ,为 了 说 明 信 息 入 所 和 非 信息 位 点 问 的 区 别 ,让 我 们 考虑 以 下 位 点 顺序 2 1 A Giese GS Oe: A 2 Apna awe Ty G CG 3 | es ee SR ae) Es ae Oa Om 4 in the ae Diatiie woe Pere a, G 对 4 个 OTU 有 3 种 可 能 的 无 根 树 ( 图 5 一 9)。 位 点 1 不 是 有 信息 的 ,因为 所 有 顺序 在 该 位 点 上 都 有 A, 以 至 在 3 种 可 能 的 树 中 都 不 需要 任何 变化 。 在 位 点 2 上 ,顺序 1 有 A, 而 所 有 其 他 顺序 都 有 G, 所 以 只 需 作 一 简单 假定 , 即 谱系 中 核 苷 酸 从 G 变 成 A 导 至 了 顺序 1。 于 是 ,这 一 位 点 也 不 是 有 信息 的 ,因为 对 这 3 种 可 能 的 树 来 说 每 种 都 只 需要 1 次 变化 。 如 图 5 一 9a 所 示 , 对 位 点 3 来 说 ,这 3 种 可 能 的 树 中 的 每 一 种 都 需要 2 次 变化 ,所 以 也 不 是 有 信息 的 。 注 意 , 如 果 假 定 图 5 一 9a 的 树 I 中 联结 OTU 1 和 :2 的 节点 上 的 核 苷 酸 是 C( 或 A) 而 不 是 G, 则 该 树 所 需要 的 变化 数 仍 为 2。 图 5 一 9b 表明 对 于 位 点 4 这 3 种 树 的 每 一 种 都 要 求 3 次 变化 ,所 以 位 点 4 也 是 非 信 息 的 。 对 于 位 点 5, 树 工 只 要 求 1 次 变 化 ,而 树 工 和 开 则 各 要 求 2 次 变化 (图 5 一 9c) ,所 以 该 位 点 是 有 信息 的 。 从 这 些 例子 中 我 们 看 到 ,就 我 们 所 谈 到 的 分 子 数 据 而 言 , 仅 当 一 个 位 点 上 至 少 有 两 种 不 同类 型 的 核 苷 酸 、 每 种 类 型 至 少 在 两 个 被 研究 顺序 中 出 现时 ,该 位 点 才 是 有 信息 的 .在 上 例 中 ,信息 位 点 用 星 号 C* ) 指 出 。 为 了 推出 一 个 最 节省 树 ,我 们 首先 要 找 出 所 有 信息 位 点 。 接 着 ,对 每 种 可 能 的 树 我 们 算出 每 一 信 息 位 点 上 的 最 小 替换 数 。 在 上 例 中 ,对 于 位 点 5.7 和 9, 树 I 分 别 需要 1.、1 和 2 次 变化 , 树 工 分别 需要 2.2 和 1 次 变化 , 树 开 分 别 需要 2.2 和 2 次 变化 。 最 后 一 个 步 聚 是 ,对 每 种 树 将 所 有 信息 位 点 上 的 变 化 数 加 和 ,并 选 出 总 替换 数 最 小 的 那 种 树 。 在 我 们 的 例子 中 ,因为 树 I 在 信息 位 点 上 需要 的 变化 数 最 af * O/ . gt I i I 树 亚 G Gz (a) 1G A 3 Bone A G2 1 : ‘ a ° A A iG 位 点 3 Gc A A = Uh A4 3A A 4 4A A3 (b) 1A T3 1A F C2 1A Ps 和 位 点 4 C 一 一 -一 T 人 ATTTEOI } . e 9 nincit es 3T G4 re T3 “od 1G A3 1 fe? ae 2 de e A A 位 点 5 G A Pr A 2G A4 3A A4 4A A3 图 5 一 9 关于 4 个 DNA 顺序 (1.2,3 和 4) 的 3 种 可 能 的 无 根 树 (I,IL 和 下 ) 这 4 个 顺序 曾 被 用 来 选取 最 节省 树 册 (REX) 。 终端 节点 处 指出 了 现存 物种 中 该 同 源 位 置 上 的 核 音 酸 种 类 。 分 枝 上 的 每 一 个 国 点 表示 一 次 替换 , 它 被 放 在 发 生 替 换 欧 分 村 上 。 注 意 , 每 种 树 的 两 个 内 部 节点 上 的 核 苦 酸 只 表示 了 几 种 可 供 选 择 的 构建 中 的 一 种 。 例 如 , 树 - IE (c) 的 两 个 内 部 节点 上 可 能 都 是 G 而 不 是 A( 右 下 角 )。 在 这 种 情况 下 ,两 次 着 换 将 位 于 章 致 物种 3 和 4 的 分 枝 上 。 而 所 要 求 的 替换 最 小 数 却 保持 相同 。 小 (4), 所 以 选中 树 I 在 有 4 个 OTU 的 情况 下 ,一 个 信息 位 点 只 偏向 3 种 可 供 选取 的 树 中 的 一 种 .例如 ,位 点 5 偏向 树 I 甚 过 树 工 和 树 开 ,因而 被 说 成 是 支持 树 工 的 。 容 易 看 出 ,受信 息 位 点 支持 数 最 大 的 那 种 树 就 是 最 节 省 树 。 例 如 ,上 例 中 , 树 工 受 2 个 位 点 支持 , 树 工 受 1 个 位 点 支持 ,而 树 正 无 位 点 支持 ,结论 不 言 自 明 。 5.4 表 型 学 与 进化 枝 学 分 类 学 中 长 期 存在 的 争论 就 是 那些 一 直 在 “进化 枝 学 家 ”和 ”“ 表 型 学 家 ” 间 发 生 的 言辞 刻薄 的 争 论 。 进 化 枝 学 (cladistics) 这 个 词 可 以 定义 为 研究 进化 途径 的 科学 。 换 句 话说 ,进化 枝 学 家 对 这 样 一 些 问题 感 兴趣 :在 一 群生 物 中 存在 多 少 分 枝 ? 哪些 分 枝 与 别 的 哪些 分 枝 相 联 ? 分 枝 次 序 如 何 (Sneath 和 Sokal,1973)? 一 种 表示 这 种 祖先 一 后 代 关 系 的 树 状 网 络 称 进化 分 枝 图 (cladogram) 。 换 柯 话 说 , spss 枝 图 即 指 一 种 有 根系 统 树 的 拓扑 图 。 另 一 方面 , 表 型 学 (phenetics) 是 根据 一 群生 物 间 的 相似 程度 来 研究 它们 间 的 关系 的 科学 , 引 以 为 据 的 类 似 性 可 以 是 分 子 上 的 、 表 型 上 的 或 解剖 学 上 的 。 表 示 表 型 学 关系 的 树 状 网 络 称 表 型 关系 图 (Phenogram)。 虽 然 表 型 关系 图 可 以 当 作 进化 枝 学 关系 的 指示 物 来 用 ,但 它 可 不 必 与 进化 分 枝 图 等 同 。 如 果 在 分 岐 时 间 和 遗传 学 上 的 (或 形态 学 上 的 ) 分 岐 程度 间 存 在 线性 关系 , 则 这 两 种 树 可 能 会 变 得 相互 等 同 。 在 上 面 所 讨论 的 方法 中 ,最 节省 法 是 进化 枝 学 方法 的 一 个 典型 代表 ,而 UPGMA 法 则 是 二 种 典 型 的 表 型 学 方法 。 然而 ,其 他 方法 却 不 能 按 以 上 标准 简单 地 进行 分 类 。 例 如 ,变形 距离 法 和 近邻 关系 法 常常 被 说 成 是 表 型 学 方法 ,但 这 是 一 种 不 确切 的 说 法 。 虽 然 这 些 方法 用 了 类 似 性 (或 不 似 性 引 臣 离 ) 太 度 , 但 它们 并 没有 假定 类 似 性 和 进化 关系 间 直接 关联 ,也 并 不 打算 推测 表 型 学 关系 , 在 分 子 系统 发 育 中 , 用 更 合理 一 些 的 分 类 方法 应 把 它们 分 成 距离 法 和 特性 状态 法 (distance and character-state approaches) . 属于 前 者 的 方法 根据 距离 尺度 , 象 核 苷 酸 或 氨基 酸 的 替换 数 等 ,而 后 者 则 ; 依靠 该 特性 的 状态 ,如 某 一 特定 位 点 上 的 核 昔 酸 或 氨基 酸 ,或 某 - DNA 位 置 上 缺失 或 插入 的 出 现 或 . 68 . 不 出 现 等 。 根 据 这 种 分 类 , 则 UPGMA 法 ,变形 距离 法 和 近邻 关系 法 都 是 距离 法 ,而 最 节省 法 则 是 一 一 直 有 这 样 一 种 说 法 , 即 ,特性 状态 法 比 距 离 法 更 有 效用 ,因为 该 原始 资料 是 一 串 特性 状态 (例如 核 苷 酸 顺 序 ), 而 将 特性 状态 数据 转变 成 距离 矩阵 以 后 ,有 些 信息 就 丢失 了 。 然 而 我 们 注意 到 ,虽然 最 节省 法 事实 上 应 用 的 是 原始 资料 ,但 通常 它 仅 用 了 可 用 资料 的 一 小 部 分 。 例 如 ,第 75 页 上 的 例子 中 , 只 有 3 个 位 点 被 用 于 分 析 中 , 倒 有 6 个 位 点 被 排除 在 外 了 。 为 此 ,此 法 常 比 有 些 距 离 矩阵 法 的 效率 低 (fal Gn KL Saitou 和 Nei,1986)。 当 然 , 如 果 信 息 位 点 数 多 , 则 最 节省 法 一 般 是 非常 有 效 的 。 最 后 ,应 该 注意 到 ,不 管用 何 种 方法 ,一 个 推测 树 常 难免 有 拓扑 图 错误 。 为 了 得 到 正确 的 树 ,通常 需要 大 量 数据 资料 。 5.5 枝 长 的 估计 除了 在 UPGMA 法 中 外 ,我 们 都 不 曾 讨论 过 怎样 去 估计 梳 长 的 问题 。 现 在 ,我们 在 该 树 的 拓扑 图 已 被 推测 出 来 的 假定 下 ,来 处 理 这 一 问题 。 我 们 只 考虑 用 距离 矩阵 法 推测 出 来 的 树 对 于 最 节省 法 来 说 ,这 个 问题 要 复杂 得 多 ( 见 Fitch,1971)。 下 面 讨 论 的 方法 是 菲 奇 和 马 戈 利 阿 什 (Fitch 和 Margoliash, 1967) 的 方法 。 首先 ,我 们 考虑 一 种 最 简单 的 情形 , 即 一 个 有 3 个 OTU(CA,B 和 C) 和 1 个 节点 的 无 根 树 ( 图 5 一 10a)。 设 xy 和 2z 分 别 是 导向 A.B 和 CC 的 分 枝 的 长 度 。 很 容易 看 出 以 下 等 式 成 立 : za 一 工 十 y (5. 8a) dy = 2+2 (5. 8b) due = 9 +z (5. 8c) (b) at : 图 5 一 10 AIA DRA MH (Fitch 和 Margoliash ,1967) 法 计算 枝 长 时 采用 的 无 根系 统 树 。(a) 有 3 个 OTU 的 树 ,(b) 有 5 个 OTU 的 树 。 从 这 些 等 式 ,我 们 得 到 以 下 解 : phe: fant duc — doe (5. 9a) ae dap + dpc — dac eet tt a0) z= dac + dpc — dap 2 我 们 现在 来 处 理 有 3 个 以 上 OTU 的 情形 .为 简单 计 ,我 们 假定 有 5 个 OTU(1,2,3,4 M5). mK 拓扑 图 和 各 枝 长 如 图 5 一 10b 所 示 。 假 定 OTU 1 和 2 是 构 树 过 程 中 最 先 被 聚 类 的 OTU , 则 我 们 分 别 用 A 和 Bi 来 表示 OTU1 和 2 而 把 所 有 别 的 OTU(3、4 和 5) 放 在 一 个 复合 OTU 中 ,并 表示 成 C。 通 过 。69 。 (5. 96) (5. 9c) 这 种 安排 ,我 们 可 以 用 等 式 5. 9a 一 5.9c 来 估计 导向 A.B 和 C 的 分 枝 的 长 度 . 不 过 ,现在 dac 一 de 一 (dys tdyytdis)/3»drc=dorsis) = (des tdou+dos)/3 于 是 ,我 们 有 a=x Mb=y. 接着 OTUI M2 Ram _ 个 复合 OTU。 下面 再 假定 ,复合 OTU(12) 与 单 OTU3 是 下 一 个 要 结合 在 一 起 的 对 子 。 于 是 ,我 们 分 别 把 复合 OTU(12) 和 单 OTU3 用 A 和 B 表 示 , 把 其 余 的 OTU( 即 4 和 5) 放 在 新 的 复合 OTUC 中 。 以 上 述 同 样 的 方式 ,我 们 将 得 到 x,y 和 z。 注 意 ,这 时 d=y,c 十 (a 十 b)/2=x。 从 前 一 次 我 们 得 到 的 关于 a 和 b 的 值 ,可 以 算出 c。 继 续 进 行 这 样 的 过 程 , 直 到 所 有 枝 长 都 得 到 时 为 止 。 注意 ,有 时 某 一 被 估 出 的 枝 长 可 能 会 是 负 的 。 由 于 实际 枝 长 绝 不 可 能 是 负 的 ,所 以 ,最 好 用 0 来 代 替 这 样 的 估 值 。 作为 应 用 上 述 方 法 的 一 个 例子 ,让 我 们 来 算 一 下 图 5 一 7c 中 那个 树 的 各 枝 长 。 为 便于 说 明 ,我 们 把 在 推测 该 树 的 拓扑 图 时 用 过 的 距离 矩阵 再 次 列 出 。 为 了 避免 与 等 式 5.9 中 的 符号 混淆 ,我 们 把 O- TUA,B,C 和 D 分 别 地 重新 命名 为 OTU1,2,3 和 4。 OTU OTU 1 2 3 2 8 3 7 因为 OTU1 和 2 最 先 被 聚 类 ,所 以 ,我 们 把 OTU3 和 4 放 在 一 个 复合 OTUC 中 ,从 而 先 算 出 导向 OTU1 和 2 的 两 个 分 枝 的 长 度 (a 和 b)。 而 我 们 有 das=diz=8,dac= (di3tdy)/2=(74+12)/2=9. 5 和 dac 一 (d: 十 dx)/2 王 11.5。 由 等 式 5. 9a 一 5. 9c ,我们 有 :a=—x= (84+ 9. 5—11. 5)/2=3,b=y=(8+ 11. 5 一 9)/2=5。 下 一步 我 们 把 OTU1 和 2 处 理 成 OTU(12) 并 用 A Hm. FH, RNA :das=—day;:= (dis+do3)/2=(7+9)/2=8,dac=daz= (dis tda)/2= 124+14)/2=13,dsce=du=1l. AK RES sh 5. 9a 一 5. 9c, RITA :x= (8+13—11)/2=5,d=y=(8+11—13)/2=3,e=z= (134+11—8)/2=8. 由 图 5 一 7c 可 以 看 出 (a 十 b)/2 十 cx, 所 以 ,c 王 1。 至 此 计算 完毕 。 然 而 请 注意 ,由 于 我 们 不 知道 根 的 准确 位 置 , 所 以 我 们 不 能 估 出 联系 根 和 OTUD 的 分 枝 的 长 度 , 而 只 能 估 出 从 OTUA,B AC 的 共同 祖 先 节点 通过 根 到 OTUD WK EE. Bl e=8. 5.6 寻找 无 根 树 的 根 大 多 数 构 树 法 得 到 的 都 是 无 根 树 。 为 了 找到 无 根 树 的 根 ,我们 通常 都 需要 一 个 组 外 单位 ( 即 一 个 OTU ,其 外 在 信息 ,如 古生物 学 证 据 , 清 楚 地 表明 它 比 那些 被 研究 的 分 类 单位 更 早 地 发 生 分 枝 )。 而 根 则 被 放 在 该 组 外 单位 和 将 它 和 别 的 OTU 联结 起 来 的 节点 之 间 。 虽然 我 们 必须 能 肯定 该 组 外 单位 的 确 比 所 有 别 的 分 类 单位 更 旱地 发 生 分 岐 ,但 奉劝 各 位 ,不 要 选 一 个 与 被 研究 的 各 分 类 单位 亲缘 关系 过 于 遥远 的 组 外 单位 ,因为 ,在 这 样 的 情况 下 很 难得 到 该 组 外 单 位 与 其 他 分 类 单位 间 的 可 靠 估 值 。 例 如 ,在 构建 一 组 有 胎盘 哺乳 类 间 的 系统 发 育 关 系 时 ,我 们 可 以 用 一 种 有 袋 类 作为 组 外 单位 。 仅 当 所 用 的 DNA 序列 在 进化 中 是 高 度 保守 的 时 , 鸟 类 才 可 能 被 当成 可 靠 的 组 外 单位 。 在 此 例 中 植物 与 真菌 显然 也 够 资格 作为 组 外 单位 ,不 过 ,仅仅 因为 它们 与 哺乳 类 的 关系 太 过 遥远 用 它们 作 组 外 单位 ,结果 就 可 能 会 出 现 严重 的 拓扑 图 错误 。 用 一 个 以 上 的 组 外 单位 (假若 它 们 与 别 的 分 类 单位 都 不 是 关系 遥远 ) , 则 一 般 能 改善 该 树 拓扑 图 的 估计 结果 。 该 组 外 单位 还 必须 在 系 统 发 育 上 与 别 的 OTU 不 至 于 太 接 近 , 因 为 ,在 这 种 情况 下 我 们 不 能 肯定 它 是 一 个 真正 的 组 外 单位 , 即 不 能 肯定 它 与 其 他 OTU 的 分 歧 早 于 这 些 OTU 相互 间 的 分 岐 。 在 缺少 组 外 单位 的 情况 下 ,我 们 可 以 通过 假定 进化 速率 在 所 有 分 枝 上 近似 一 致 来 放置 根 。 在 这 种 假定 下 ,我 们 把 根 放 在 两 个 OTU 间 的 最 长 路 组 的 中 点 处 ‘on Sill Se — 5.7 物种 分 岐 时 间 的 估计 因为 计生 物 学 记录 远 不 够 完全 ,所 以 我 们 常常 不 去 管 物种 分 岐 的 年 代 。DNA 顺序 数据 在 这 方面 s。70 。 可 能 会 给 出 很 大 帮助 。 从 以 前 的 研究 中 获知 我 们 假定 某 一 DNA 序列 的 进化 速率 ,为 每 年 每 位 点 r 替 换 。 为 了 得 到 物种 A 和 也 间 的 分 岐 时 间 (T) ,我 们 对 来 自 这 两 个 物种 的 该 顺序 进行 比较 ,并 算出 每 位 点 替换 数 (K)。 如 第 四 章 所 示 , 我 们 有 以 下 等 式 : K = oF (5.. 40) Att .T 估计 为 K T=> (5.11) 如 在 第 四 章 所 说 明 过 的 那样 ,从 一 组 生物 得 到 的 核 苷 酸 替 换 速率 也 许 不 能 用 于 另 一 组 生物 .为 了 避免 出 现 这 样 的 问题 ,我 们 可 通过 加 进 第 3 个 物种 C( 它 与 物种 对 A 和 B 的 分 岐 时 间 已 知 ) ,来 估计 替换 速率 (图 5 一 11)。 设 Kij 是 物种 1 和 j 间 每 位 点 核 苷 酸 替 换 数 ,那么 , 核 苷 酸 替 换 速 率 可 由 fly Kac + Koc 一 一 《5. 12) 图 5 一 11 eit poked ia A ay A LEX) 估 出 。 物 种 A FB ial Ay AI 4D ek et Me (TA: fie Kas _ 2K asl) (5. 13) 2r — Kac + Kee fit, RZET. CMT, 未 知 的 情况 下 ,Ti 由 下 式 给 出 ; (Kac + Kyc)T, thas 以 上 公式 均 假 定 速率 恒定 。 但 如 前 一 章 中 所 讨论 的 那样 ,此 假定 常常 是 不 成 立 的 ,所 以 估 出 的 分 岐 时 间 应 该 小 心 处理 。 李 和 谷村 (Li 和 Tanimura,1987) 曾 提出 一 种 方法 ,此 法 能 降低 替换 速率 不 等 对 分 岐 时 间 估 计 的 影响 。 早先 我 们 已 经 注意 到 ,两 顺序 间 的 分 岐 时 间 可 能 比 携带 这 两 个 顺序 的 两 物种 间 的 分 岐 时 间 早 。 不 过 ,如 果 我 们 关心 的 是 长 期 分 岐 事件 ,比如 说 几 百 万 年 或 更 长 的 时 间 等 级 , 则 这 种 误差 通 常 并 不 很 严 重 。 还 应 该 注意 ,分 岐 时 间 的 估 值 通常 承受 着 较 大 的 随机 误差 。 为 了 减少 这 类 误差 ,在 估计 中 应 该 用 许多 顺序 。 T; (5. 14) 5.8 进化 校 系统 发 育 研究 的 目的 是 建立 不 同 物种 间 的 进化 关系 。 特 别 地 ,我 们 对 找 出 自然 进化 枝 (clades) 感 兴趣 。 一 个 进化 枝 被 定 尽 成 一 组 有 共同 祖先 的 物种 ,而 该 祖先 却 不 为 这 一 进化 枝 外 的 其 他 物种 所 共 有 。 图 5 一 12 BMH AWN 3 个 网 ;总 纲 , 卜 行 网 和 哺乳 纲 间 的 进化 关系 。 我 们 看 到 ,经 典 分 类 学 把 疏 行 类 指定 为 一 个 独立 的 网, 这 与 进化 枝 的 定义 不 符 , 因 为 这 3 类 疏 行 动物 与 另 一 个 类 群 一 一 鸟 类 有 共同 祖先 ,而 后 者 则 并 不 被 包括 在 疏 行 岗 的 定义 范围 内 。 另 一 方面 , 鸟 类 与 甸 类 倒 的 的 确 确 地 构成 了 一 个 自然 进化 枝 , 初 龙 亚 纲 , 因 为 它们 所 共有 的 一 个 共同 祖先 不 为 除 鸟 类 和 乌 类 以 外 的 任何 现存 生物 所 共有 。 类 似 地 ,所 有 鸟 类 和 所 有 有 怜 行 类 合 在 一 起 构成 一 个 自然 进化 枝 。 四 71 . LF i ~¥5 < a ARS Ah I 6808 C T ak; CG I 6971 G G a 到 I 来 自 Maeda 等 (1988) 的 数据 人 3 HEH RH OE KH H AATATA AATATA I 1472 G G A A I 2131 A A I 2224 A G A G I 2341 G a &: G C 下 2635 G G A A I A Williams 和 Goodman(1989) 2X ft AK . a、\ 位 点 序数 对 应 于 原始 来 源 中 给 出 的 序数 。 所 用 序列 的 总 长 度 为 10. 2 kb, 约 为 表 5 一 2 中 所 用 序列 的 2 倍 。 b、 假 定 : I ,人 和 黑猩猩 在 一 个 进化 枝 中 ; 工 , 黑 猩猩 和 大 猩猩 在 一 个 进化 枝 中 ;下 人 和 大 猩猩 在 一 个 进化 枝 中 。 c、\ 一 个 星 号 表示 在 该 位 点 上 缺失 一 个 核 苷 酸 。 另外 还 有 些 类 型 的 分 子 数 据 也 支持 人 和 黑猩猩 聚 类 的 结论 。 例 如 ,DNA 一 DNA 杂交 数据 (Sibley 和 Ahlguist,1984;Caccone 和 Powell,1989) 明 确 地 表示 ,在 图 5 一 14 里 3 种 供 选取 的 系统 发 育 关系 中 ,人 和 黑猩猩 聚 被 类 成 一 个 进化 枝 。 于 是 ,与 人 关系 最 近 的 现存 亲属 是 两 种 黑猩猩 ,其 后 为 大 猩猩 、 马 来 猩 猩 和 9 PARR 5.10 线粒体 和 叶绿体 的 内 共生 起 源 基本 上 有 两 种 理论 解释 真 核 生 物 中 与 细胞 核 分 开 的 线粒体 和 叶绿体 基因 组 的 存在 。 第 二 种 理论 例如,,Cavalier-Smith,1975) 认 为 ,细胞 器 的 基因 是 自体 起 源 的 ,是 通过 直接 的 父子 关系 从 细胞 核 基 因 传 下 来 的 。 细 胞 核 基因 组 的 某 些 部 分 被 并 人 到 一 个 由 膜 包 被 的 细胞 器 中 ,接着 假定 它 的 准 独 立 存 在 ,从 而 完成 了 这 一 起 源 过 程 。 与 其 不 同 的 是 ,内 共生 学 说 (例如 Margulis,1981) 认 为 核 外 DNA. 的 起 源 是 外 源 性 的 。 按 照 这 种 看 法 真 核 生 物 的 祖先 吞噬 了 原核 生物 ,接着 ,由 于 互利 或 有 共生 关系 的 缘故 , 后 者 被 保留 了 下 来 。 随 着 时 间 的 流逝 ,这 种 内 共生 通过 某 些 基因 的 丢失 而 变 得 更 为 密切 , alan 了 强制 性 共生 者 ( 即 ,不 能 在 其 宿主 体外 独立 地 存在 的 生物 )。 “= 现在 ,分 子 证 据 绝对 地 支持 内 共生 学 说 。 使 叶绿体 和 原核 生物 的 基因 组 与 真 核 生物 的 基因 组 区 分 开 来 的 生化 特性 , 列 于 表 5 一 5 中 。 然 而 ,最 根本 的 文 持 来 自 IRNA 顺序 数据 。 由 于 rRNA 顺序 有 较 低 的 替换 速率 ,所 以 ,它们 已 被 证 明 对 处 理 涉 及 非常 古老 的 进化 分 岐 事件 的 问题 是 很 有 用 的 。 ite BL ve Fl Bt FE AR (Schwarz il Kossel, 1980) wE HA. K A AK (Zea mays) 叶 绿 体 中 的 16SrRNA ;其 $F A FF GK A KATA CE. coli) fY 16SrRNA 的 极为 相似 。 在 细胞 核 的 和 叶绿体 的 zRNA 顺序 la] , 这 种 类 似 程 度 就 要 低 得 多 。 来 自 光 合 蓝 细 菌 的 16SrRNA 顺序 的 详细 分 析 (Giovannovi 等 ,1988) 支持 这 样 的 看 法 : 即 ,绿色 的 叶绿体 来 自 一 群 称 为 蓝 细菌 的 光合 细菌 (Bonen 等 ,1979)( 见 图 5 一 16a) 。 s。 76° as -ec 表 5 一 5 将 叶绿体 和 原核 生物 的 基因 组 与 真 核 生物 的 核 基因 组 区 别 开 来 的 分 子 特征 1. 无 组 蛋白 DNA 2. 大 小 为 120,000 一 150*000 碱 基 对 3. 环 状 基因 组 4. 转录 的 利 福 平 敏感 性 5. BRE IRA HE EK . MEH .spectromycin 和 巴 龙 霉 素 抑制 6. 翻译 对 放 线 菌 酮 的 不 敏感 性 7. 翻译 以 甲 酰 甲 硫 氨 酸 为 起 始 8. mRNA 的 多 聚 腺 苷 缺失 或 很 短 9. 原核 促进 子 结构 rRNA 顺序 的 系统 发 育 分 析 表 明 , 线 粒 体 来 自 紫色 细菌 的 a 分 枝 ( 图 5 一 16a;Cedergren 等 , 1988) 。 然 而 ,所 用 的 细胞 核 rRNA 顺序 指出 :高 等 植物 在 大 约 与 动物 和 真菌 相同 的 时 刻 发 生 分 枝 (图 5 一 16b), 这 与 传统 观点 一 致 ;而 线粒体 rRNA 顺序 却 指 出 ,高 等 植物 在 非常 接近 紫色 细菌 的 根 处 聚 类 ,与 真菌 .绿色 藻类 和 动物 则 是 分 离 的 (图 5 一 16a)。 这 是 与 传统 观点 , 即 把 高 等 植物 和 绿色 藻类 组 合 在 一 个 进化 枝 中 的 观点 相 矛 盾 的 。 为 此 缘故 ,格雷 等 (Gray 等 ,1989) 曾 提出 ,高 等 植物 的 线粒体 中 的 rRNA 基因 ,, 有 上 比 其 他 生物 线粒体 中 的 rRNA EE HE 此 假说 是 否 会 被 进 一 步 的 证 据 所 支持 ,我 们 将 拭目以待 。 5.11 分子 古 生物 学 从 微克 量 保存 下 来 的 组 织 中 得 到 的 不 纯 样本 的 DNA, 现 在 已 有 可 能 对 它 的 片段 加 以 定 序 了 。 所 采用 的 方法 是 聚合 酶 链 式 反 应 法 (PCR)。PCR 是 通过 应 用 两 种 已 知 引 物 来 使 某 序 列 混合 物 中 的 一 种 独特 序列 扩 增 的 方法 (图 5 一 17; Saiki 等 ,1985,1988;Scharf 等 ,1986;Engelke #,1988). 每 一 引物 和 一 个 DNA 的 互补 小 段 附 着 ,从 而 引发 DNA 多 聚 酶 的 结合 ,然后 拷贝 该 片段 。 由 于 每 一 新 产生 的 拷贝 都 可 充 作 进一步 复制 时 的 模板 ,所 以 靶 片 段 的 拷贝 数 将 呈 指 数 增长 用 此 法 有 可 能 将 混合 物 中 的 某 一 被 选 定 的 DNA 片段 合成 产生 许多 拷贝 ,此 时 混合 物 中 其 他 DNA 序列 可 能 会 远 为 超 量 地 存在 (Kocher 等 ,1989)。 因 此 ,采用 PCR 我 们 可 以 从 博物 馆 标 本 , 象 保存 下 来 的 有 机 物质 (主要 是 皮肤 和 肌肉 )、 严 重 损坏 的 考古 学 遗物 甚至 骨骼 中 找 回 某 些 特别 的 DNA 序列 (Hagelberg 等 ,1989) 。 应 用 此 法 现在 已 可 能 建立 某 些 已 灭绝 物种 , 象 南非 斑 肪 和 澳大利亚 袋 狼 间 的 系统 发 育 关 系 ,或 决 定 斯 堪 的 那 维 亚 铁 器 时 代 的 沼泽 地 人 和 埃及 木 万 伊 ,这 些 已 灭绝 人 类 群体 间 的 祖先 -后 毅 关 系 。 对 后 两 个 人 类 群体 的 形态 学 比较 ,得 到 的 结果 比较 含糊 。 应 用 PCR 法 ,托马斯 等 (Thomas 等 ,1989) 已 能 对 来 自 袋 狼 Thylacinus cynoce phalus 和 其 他 涡 大 利 亚 与 南美 有 袋 类 的 线粒体 的 219 个 核 苷 酸 加 以 定 序 和 比较 ,并 且 与 来 自 有 胎盘 类 的 同 源 顺 序 比 较 。 应 用 此 法 ,他 们 已 能 在 以 下 两 种 说 法 间作 出 取 含 :(a) 袋 狼 与 南美 的 有 袋 动物 类 群 有 亲缘 关系 ,和 (b) 袋 狼 与 其 他 澳大利亚 有 袋 类 的 亲缘 关系 很 近 。 从 这 些 顺 序 比 较 中 得 出 的 结论 是 , 袋 狼 与 另外 两 种 澳 大 利 亚 有 袋 类 , 儿 近 灭绝 的 塔 斯 马 尼 亚 魔鬼 (一 种 袋 获 ,Sarcopjzlus harrisii) AYR K All W. Fi (— PPAR fh. Dasyurus maculatus) A {BRIE RARKA (AS — BB HAAS AO (— BPE RR . Philander opossum an- dersoni) AA RHI MWRAKACA 5 一 18)。 于 是 , 袋 狼 和 南美 有 袋 动 物 间 形 态 学 上 的 相似 ,被 认为 是 一 个 形态 学 水 平 上 趋同 进化 的 例子 , 它 在 线粒体 DNA 中 没有 平行 关系 。 5.12 ” 深 色 海滩 省 :物种 保护 生物 学 中 的 一 次 教训 最 后 一 只 深 色 海滩 省 死 于 1987 年 6 月 16 日 ,地 点 在 佛罗里达 州 俄 伦 多 附近 沃 特 . 迪斯尼 世界 的 动物 园 里 。 深 色 海 滩 汰 在 1872 年 被 发 现 。 因 其 墨色 的 外 瑶 而 被 明确 地 归 类 成 一 AS WRC Ammodra- mus maritimus nigrescens) , A.m. nigrescens 的 地 理 分 布 被 限 制 在 佛罗里达 州 布 列 伐 得 县 中 的 盐 碱 沼泽 or 7 (a) a am. 高 等 植物 绿色 藻类 真菌 MY 纤毛 虫 类 绿色 藻类 一 线粒体 AMM, fy Fh, -=-=--- 叶绿体 一 an 20 oe (b) had ERA 高 等 植物 原生 生物 ee), 图 5 一 16 《〈a) 从 小 亚 基 rRNA 的 顺序 推测 出 的 无 根 树 中 真 细菌 一 叶绿体 一 线粒体 部 分 。 注 意 , 来 自 绿色 莹 类 和 植 物 的 叶绿体 顺序 都 是 单 源 发生 的 ,而 线粒体 顺序 则 是 多 源 发 生 的 。(b) 从 细胞 核 小 亚 基 rRNA 顺序 推测 出 的 无 根 树 。 步 聚 1( 用 圆圈 标 出) 是 早期 内 共生 、 假 定 已 产生 了 大 多 数 真 核 生 物 的 线粒体 基因 组 , 步 聚 2 是 后 期 共生 ,Gray 等 (1989) 假 定 它 贡 献 了 高 等 植物 线粒体 的 TRNA 基因 。 每 一 分 枝 的 长 度 与 其 两 个 内 部 点 间 的 替换 数 成 比例 ,比例 尺度 如 图 中 所 示 。 自 Gray 等 (1989) 修 改 而 成 。 地 带 ( 图 5 一 19), 到 了 1980 年 ,自然 界 中 只 能 找到 6 个 个 体 , 全 是 雄性 。 显 然 该 群体 的 灭绝 已 命中 注 定 , 于 是 ,一 个 人 工 杂 交 计 划 被 当 作 为 保护 该 亚 种 的 基因 的 最 后 一 搏 而 展开 了 。 在 这 种 情况 下 ,保护 方案 就 是 将 这 些 濒 临 灭 绝 的 亚 种 的 雄性 个 体 ,与 来 自我 们 所 能 找到 的 与 其 亲 缘 关 系 最 近 的 亚 种 的 峻 体 交 配 。 然 后 , 子 一 代 的 杂种 肉体 再 与 该 雄 体 回 交 ,它们 产生 的 后 代 又 再 次 与 原 雄 体 回 交 ,此 过 程 循环 往复 直至 该 雄 体 死去 为 止 。 该 实验 的 关键 是 要 决定 应 从 哪 种 群体 中 选取 峻 体 , 即 决定 哪 一 个 亚 种 在 系统 发 育 上 最 接近 该 濒临 灭绝 的 亚 种 。 «78° . Nearer eeeerenccee ee 扩 增 循环 | 引物 延长 ER | eam ai en 图 5 一 17 用 聚合 酶 链 式 反应 法 (PCR) 使 混合 物 中 的 特定 DNA 序列 扩 增 。DNA 经 加 热 解 链 成 单 链 分 子 。 两 个 合成 的 DNA 小 片段 (锯齿 状 波纹 线 ) 各 与 靶 序 列 (黑色 粗 线 ) 一 端 上 的 特别 顺序 互补 , 充 作 引物 。 每 一 引物 各 与 不 同 链 上 的 互补 顺序 结合 。 然 后 ,DNA 多 聚 酶 通过 在 引物 上 添加 核 苷 酸 来 使 其 延长 。 很 快 地 , 靶 序 列 的 精确 复制 品 即 产生 了 。 在 以 后 的 循环 中 ,原始 靶 序 列 及 其 复制 品 都 可 充 作 模板 。 相 反 , 不 含 与 引物 互补 的 顺序 的 DNA 分 子 则 不 被 扩 增 。 因 此 ,不 纯 的 DNA 混合 物 也 可 用 来 只 对 其 中 的 一 种 序列 进行 扩 增 ,即使 在 其 他 序列 远 为 过 量 地 存在 的 情况 下 , 这 一 点 也 能 办 到 。 更 详细 说 明 见 Mullis(1990) 。 在 海滩 省 的 例子 中 ,有 8 个 可 区 别 的 亚 种 供 选 取 。 这 些 物 种 的 地 理 分 布 范 围 如 图 5 一 19 Pe. 根 据 形 态 学 和 行为 特征 所 作出 的 决定 是 ,最 接近 深 色 海 滩 涛 的 亚 种 为 斯 科 特 的 海滩 淮 (4. mm. peninsulae) ,它们 栖息 在 佛罗里达 湾 的 沿岸 。 在 此 决定 下 ,xzgrescexns 亚 种 的 几 个 雄 体 与 来 自 peninsulae 亚 种 的 肉体 交配 。 已 取得 了 两 次 成 功 的 回 交 , 而 由 此 产生 的 群体 则 此 后 维持 近 交 ,以 期 有 一 天 能 将 这 “重建 2 的 亚 种 放 回 到 它 原来 的 栖息 地 中 去 。 为 了 看 一 看 该 肉体 的 选择 是 否 正 确 , 阿 维 斯 和 纳 尔 了 进 (Avise 和 Nelson ,1989) 曾 进行 过 有 关 线 粒 体 DNA 的 限制 酶 模式 的 比较 ,材料 的 一 方 来 自己 故 的 纯 种 xzgrescens 的 标本 , 另 一 方 来 自 海滩 省 现 存 8 个 亚 种 中 的 5 个 , 共 39 个 个 体 。 他 们 选择 线粒体 DNA AULT RA. BH. AH PR LK DNA 已 知 进化 非常 迅速 (第 四 章 ), 因 此 它 可 以 为 区 别 亲 缘 关 系 较 近 的 生物 提供 一 个 分 辩 率 较 高 的 解 决 途径 。 其 次 ,线粒体 是 母系 遗传 的 ,所 以 不 会 发 生 因 等 位 基因 分 离 而 造成 的 复杂 局 面 。 最 后 ,由 于 母 系 传 递 模 式 来 自己 故 雄 性 深 色 海滩 省 中 的 线粒体 DNA ,并 不 曾 转移 到 复原 育种 方案 中 的 杂种 个 体 里 .所 以 ,虽然 细胞 核 中 的 某 些 基因 已 在 杂种 中 生存 了 下 来 ,但 深 色 海 滩 和 做 的 线粒体 基因 却 不 一 样 , 它 们 是 真正 的 灭绝 了 。 根据 限制 酶 模式 , 阿 维 斯 和 纳尔逊 (Avise 和 Nelson,1989) 用 UPGMA 法 和 最 节省 法 ,构建 出 了 海滩 汰 几 个 亚 种 间 的 进化 关系 (图 5 一 20) 。 从 图 中 可 以 看 到 ,大 西洋 沿岸 群体 ,包括 深 色 海滩 省 在 内 , .79 。 (RB) Trichosurus 图 5 一 18 AR (Thylacinus) fo 6 tH AA RF ARG HH 12 SrRNA 顺序 作出 的 最 节省 树 。. 该 树 用 乳牛 (Bos) 作 组 外 单位 找到 了 根 . 分 枝 上 的 数字 代表 替换 数 。 自 Thomas 等 (1989) 。 大 西洋 mirabilis 墨西哥 湾 5-19 RE (Ammodrumus. ar 二 ) 的 可 本 基 汪 和 LA 区 别 的 亚 种 的 地 理 分 布 。 自 Avise 和 Nelson (1989). | 相互 间 几 乎 是 不 可 区 别 的 。 在 此 研究 中 3 个 海湾 沿岸 的 亚 种 也 有 同样 的 关系 。 相 比 之 下 ,大 西洋 沿岸 亚 种 与 海湾 沿岸 亚 种 间 则 有 相当 明显 的 区 别 。 这 两 大 类 群 间 的 每 位 点 核 苷 酸 蔡 换 数 估计 约 为 1 贤 。 如 果 海 滩 尖 的 线粒体 DNA 以 与 哺乳 类 和 其 他 鸟 类 的 线粒体 DNA 大 致 相同 的 速率 进化 ( 即 每 百 万 年 2 一 4 狼 的 顺序 分 岐 ) ,那么 ,这 两 大 类 群 的 群体 是 在 大 约 25 万 一 50 万 年 前 发 生 分 离 的 。 虽 然 这 些 对 分 岐 的 绝对 年 代 的 估 值 ,由 于 缺乏 确定 的 统一 标准 而 停留 在 定性 水 平 , 但 它们 却 与 已 得 到 的 海平 面 开 始 下 降 的 年 代 一 致 得 相当 好 。 由 于 海平 面 下 降 ,佛罗里达 半岛 露出 水 面 , 从 而 对 半岛 两 侧 的 群体 起 了 生 殖 屏障 的 作用 。 1 更 重要 的 是 , 阿 维 斯 和 纳尔逊 (Avise 和 Nelson ,1989) 的 分 子 研究 表明 , 深 色 海 滩 兴 亚 种 与 另 两 个 大 西洋 亚 种 ( 即 A. m. maritima Fl A. m. jaacgilliurazz) 在 分 子 上 不 可 区 别 ,而 它 与 海湾 亚 种 , 象 4. m. peninsulae 却 是 相当 不 同 的 ,但 繁殖 计划 中 却 从 后 者 里 选 出 肉体 。 结 果 , 深 色 海滩 省 的 救援 方案 也 许 是 建立 在 错误 的 系统 发 育 前 提 上 的 。 该 方案 可 能 不 是 在 重建 一 个 灭绝 了 的 亚 种 ,而 是 创造 了 一 个 新 亚 种 。 所 以 ,系统 发 育 关系 方面 的 知识 在 生物 多 样 性 的 保护 中 ,对 作出 合理 决定 是 至 关 重要 的 。 分 类 学 * 80° 亚 种 maritima, macgillvraii, nigrescens macgillvrait macgillvrait maritima fisheri, juncicola, peninsulae fisheri | peninsulae . , MEP HH peninsulae fisheri juncicola ned Sate PRED! leds ae 1.0 0.75 0.50 0.25 0 顺序 分 岐 (% ) (7) 图 5 一 20 UPGMA 系统 树 图 ,表示 海滩 和 瞧 的 大 西洋 沿岸 群体 和 海湾 沿岸 群体 间 的 线粒体 DNA 基因 型 区 别 。 应 用 最 节省 法 可 得 到 许多 同样 节省 的 树 , 其 中 包括 与 所 示 图 等 同 的 树 。 所 有 供 选 取 的 树 都 涉及 大 西洋 进化 枝 内 部 或 海 湾 进 化 枝 内 部 少量 的 分 枝 重 排 ,但 这 两 个 类 群 间 的 界线 却 维持 不 变 。 系 统 树 图 中 同样 的 亚 种 名 多 次 出 现 ,这 表示 属 于 同一 亚 种 的 不 同 个 体 展 现 出 不 同 的 限制 酶 模式 。 反 之 , 几 个 亚 种 名 在 一 个 分 枝 的 末端 处 出 现 则 表示 ,根据 形态 学 和 动物 地 理学 而 被 归于 不 同 亚 种 的 某 些 个 体 , 对 所 使 用 的 那些 酶 表现 出 相同 的 限制 酶 模式 。 自 Avise 和 Nelson (1989). 上 的 失误 也 许 会 使 那些 愿望 良好 的 努力 变 得 劳 而 无 功 。 习题 1. 对 4 个 OTU:A,B,C 和 D, 画 出 所 有 可 能 的 有 根 和 无 根 树 。 2. 找 出 以 下 5 个 假想 顺序 中 的 所 有 信息 位 点 eee. 2) he (AS eGiwh) Goede «Anse A eee eseG A T FT G A meee te 6G) UA Qin A ae mT GY by AgTy el iA MP A Coleg! And 人 $ 3. (a) 用 UPGMA 法 ,(b) 用 变形 距离 法 ,和 (c) 用 萨 塔 特 和 特 韦 尔 斯 基 的 近邻 关系 法 ,对 以 下 距 离 矩 阵 构建 系统 树 。 在 变形 距离 法 的 场合 ,假定 OTU E 对 所 有 其 他 OTU 而 言 是 一 个 已 知 的 组 外 单 fii . OTU OTU en 2 B 3 G a ‘7 D {Barkeig 3 | E Beihai haz * Gs 4. 图 5 一 15b 中 的 树 是 用 萨 塔 特 和 特 韦 尔 斯 基 的 近邻 关系 法 得 到 的 ( 见 第 66-67 页 和 74 一 75 e Site 页 ) 。 请 用 第 69-70 页 里 介绍 的 方法 证 明 在 该 树 上 所 标 出 的 枝 长 。 5. 在 经 典 昆 虫 分 类 学 中 ,不 完全 变态 类 (如 直 翅 目 ) 和 完全 变态 类 (如 双 翅 目 、 鳞 翅 目 , 同 翅 目 ) 间 的 分 岐 曾 被 假定 是 非常 远古 的 事件 。(a) 用 图 5 一 21 中 的 6 个 5SrRNA 顺序 和 UPGMA 法 来 构建 系 统 树 。(b) 用 其 中 5 个 顺序 (ab.c.e 和 1f 和 最 节省 法 来 构建 一 个 无 根系 统 树 。 把 根 放 在 联结 组 外 单位 | Artemia salina ({) #l #4 OTU 的 分 枝 上 。 这 两 种 树 与 经 典 分 类 学 结果 一 致 吗 ? 这 两 种 构建 法 结果 能 得 到 相同 的 拓扑 图 吗 ? 如 果 不 同 , 那 么 造成 这 种 差异 的 原因 是 什么 ? (a) GCCAACGTCCATACCACGTTGAAAGCACCGGTTCTCGTCCGATCACCGAAGTTAAGCAGC (b) GGCAACGACCATACCACGTTGAATACACCAGTTCTCGTCCGATCACTGAAGTTAAGCAAC | (C) GCCAACGTCCATACCACGTTGAAAACACCGGTTCTCGTCCGATCACCGAAGTCAAGCAAC (d) GCCAACGTCCATACCACGTTGAAAACACCGGTTCTCGTCCGATCACCGAAGTTAAGCAAC (e) GCCAACGACCATACCACGCTGAATACATCGGTTCTCGTCCGATCACCGAAATTAAGCAGC (人 ACCAACGGCCATACCACGTTGAAAGTACCCAGTCTCGTCAGATCCTGGAAGTCACACAAC (a) GTCGGGCGCGGTTAGTACTTGGATGGGTGACCGCCTGGGAACCCCGCGTGACGTTGGCA (bb) GTCGGGCGTAGTTAGTACTTGGATGGGTGACCGCTTGGGAACACTACGTGCCGTTGGCA (c) GTCGGGCGTAGTCAGTACTTGGATGGGTGACCGCCTGGGAACACTACGTGATGTTGGCT (d) GTCGGGCGCGGTCAGTACTTGGATGGGTGACCACCTGGGAACACCGCGTGCCGTTGGCT (e) ETCGGGCGCGGTTAGTACTTAGATGGGGGACCGCTTGGGAACACCGCGTGTTGTTGGCC () GTCGGGCCCGGTCAGTACTTGGATGGGTGACCGCCTGGGAACACCGGGTGCTGTTGGCA 图 5 一 21 ABA 6H PR AwH SS rRNA AHH DNA WMA. (a) & (Acheta domesticus, HA) (b) HF & (A- cyrthosi phon magnoliae , 8 A) (c) ¥& (Bombyx mori, H 38H )(d) # (Philosamia cynthia , $ 38 BH ) (e) 3 (Drosophila melanogaster , % #8 A) (f) F 7 HAM (Artemia salina, ¥ 7% A). HARK A Kawata 和 Ishikawa( 1982) ,Morton 和 Sprague (1982) ,Gu # (1982) ,Bagshaw # (1987) ,Cave 等 (1987) ,以 及 Samson 和 Wegnez(1988) 。 后 继 阅读 文献 Felsenstein, J. 1988. Phylogenies from molecular sequences: Inference and reliability. Annu. Rev. Genet. 22: 521—565 Goodman, M. (ed. ) . 1982. Macromolecular Sequences in Systematic and Evolutionary Biology. Plenum, New York. | Hillis, D. M. and C. Moritz (eds. ) . 1990. Molecular Systematics. Sinauer Associates, Sunderland. MA. _ Margulis, L. 1981. Symbiosis in Cell Evolution. Freeman, San Francisco. ~ Nei, M. 1987. Molecular Evolutionary Genetics. Columbia University Press, New York. Sneath, P. H. A. and R. R. Sokal. 1973. Numerical Taxonomy. Fréeman, San Francisco. Woese, C. R. 1987. Bacterial evolution. Microbiol. Rev. 51: 221—227. e 82 a ’ = wees veep 4 6 由 基因 重复 和 外 显 子 混 匀 造 成 的 进化 最 先 注意 到 基因 重复 在 进化 中 的 重要 性 的 是 霍 尔 丹 (Haldane,1932) 和 马 勒 (Muller,1935)。 他 们 认为 ,一 个 基因 的 多 余 复 本 也 许 能 发 生 引起 岐 化 的 突变 ,因而 最 终 将 会 以 一 个 新 基因 的 形式 出 现 。 大 BF (Ohno,1970) 以 分 子 的 .生物 化 学 的 和 细胞 学 的 证 据 为 赁 ,把 这 种 看 法 引 向 了 极端 ,主张 基因 重复 是 唯一 能 引起 新 基因 产生 的 途径 。 虽 然 ,现在 已 经 知道 还 有 一 些 别 的 产生 新 功能 的 方式 ( 见 第 95-96 页 ) ,但 大 野 的 观点 在 很 大 程度 上 还 是 成 立 的 。 断裂 基因 的 发 现 启 发 了 吉尔 伯 特 (Gilbert,1978) ,于 是 他 提出 ,内 含 子 间 的 重组 为 基因 间 外 显 子 序列 交换 提供 了 一 种 机 制 . 已 经 发 现 的 许多 这 类 外 显 子 交 换 的 例子 表明 ,这 种 机 制 在 真 核 生物 的 基因 以 出 现 新 功能 的 形式 进化 中 ,起 着 十 分 显著 的 作用 。 6.1 DNA 重复 的 类 型 — DNA 片段 的 拷贝 数 增 加 可 由 几 种 类 型 的 DNA 重复 (CDNA duplication) 所 引起 。 这 通常 根据 所 涉及 的 基因 组 区 域 的 幅度 来 分 类 。 已 经 知道 有 以 下 几 种 类 型 的 重复 :(1) 部 分 基因 重复 或 基因 内 重 (partial or internal gene duplication),(2) 全 基因 重复 (complete gene duplication) ) ,(3) 部 分 染色 体重 (partial chromosomal duplication)、,(4) 非 整数 倍 重复 或 染色 体重 复 (aneuploidy or chromosomal du- plication), 和 (5) 多 倍 性 重复 或 基因 组 重复 (polyploidy or genome duplication) 。 前 4 种 类 型 又 称 区 域 性 重复 (regional duplication) ,因为 它们 影响 的 不 是 整个 单 倍 的 染色 体 组 .大 野 (Ohno,1970) 曾 极 力主 张 ,基因 组 重复 一 般 要 比 区 域 性 重复 更 为 重要 一 些 , 因 此 在 后 一 种 情况 下 , 结构 基因 的 调节 系统 可 能 只 有 部 分 发 生 了 重复 ,而 这 种 不 平衡 可 能 会 破坏 重复 基因 的 正常 功能 .然而 ,正如 以 下 所 讨论 的 ,区 域 性 重复 显然 在 进化 中 也 起 着 非常 重要 的 作用 。 DNA 重复 长 期 以 来 一 直 被 认为 是 造成 基因 组 大 小 进化 的 一 个 重要 因素 ( 见 Ohno,1970)。 特 别 地 ,全 基因 组 重复 或 它 的 某 一 主要 部 分 ,如 一 条 染色 体 的 重复 ,可 能 会 造成 基因 组 大 小 突然 而 极 大 的 增长 。 基 因 组 重复 事件 曾 在 各 种 不 同 的 生物 类 群 的 进化 中 反复 地 被 记录 到 ,而 在 植物 、 真 骨 鱼 类 和 两 栖 类 中 最 为 突出 。 造 成 基因 组 扩大 的 进化 途径 将 在 第 八 章 中 进行 讨论 。 6.2 域 和 外 显 子 一 个 蛋白 质 域 (domain) 是 蛋白 质 中 一 个 定义 明确 的 区 域 , 它 区 别 于 蛋白质 中 的 其 它 部 分 ,或 者 执 行 某 一 特殊 功能 ,如 与 基质 结合 ,或 者 构成 该 蛋白 质 内 的 一 个 稳定 、 紧 密 的 结构 单位 ,前 者 称 为 功能 域 (functional domain) , 后 者 则 称 结构 域 (structural domain ) 或 组 件 (module)(Go 和 Nosaka,1987)。 定 义 一 个 功能 域 的 边界 常常 是 很 困难 的 ,因为 在 许多 情况 下 功能 是 由 散布 在 整个 多 肽 里 的 氨基 酸 残 基 执行 的 。 另 一 方面 ,一 个 结构 组 件 则 是 由 一 段 连续 的 氨基 酸 片段 所 构成 的 。 在 考虑 产生 多 重 域 蛋白 质 的 可 能 进化 机 制 时 ,以 上 区 别 是 相当 重要 的 .如 果 一 个 功能 域 相当 于 一 个 组 件 ,那么 , 它 的 重复 将 会 增加 功能 片段 的 数目 .反之 ,如 果 功 能 是 由 散布 在 不 同 组 件 中 的 氨基 酸 残 基 执 行 的 , 则 一 个 组 件 重 复 所 造成 的 影响 也 许 从 功能 上 看 是 不 成 气候 的 。 在 许多 蛋白 质 中 看 到 的 内 部 重复 常常 对 应 于 结构 组 件 或 者 单 组 件 的 功能 域 (Barker 等 ,1978 ) 。 从 理论 上 讲 ,结构 域 和 外 显 子 在 基因 中 的 排列 间 也 许 能 设想 出 几 种 可 能 的 关系 (图 6 一 1)。 乡 (Go,1981) 发 现 ,在 许多 内 部 结构 域 划分 已 经 确定 的 球状 蛋白 质 中 ,基因 的 外 显 子 和 该 域 之 间或 多 或 e 83e 加 | 外 显 子 1 HEF2 HEF3 外 显 子 4 基因 蛋白 质 (b) 外 显 子 1 外 显 子 2 外 显 子 3 外 显 子 4 基因 ZE 蛋白 质 G 外 显 了 1 外 显 子 2 基因 (dj) BFL ”外 显 子 2 外 显 子 3 “外 显 子 4 外 显 子 5 外 显 子 6 - 基因 人 SEF1 ”外 显 子 2 ”外 显 子 3 HBTS HBTS 图 6 一 1 基因 中 外 显 子 的 排列 与 它 所 编码 的 蛋白 质 的 结构 域 之 间 的 可 能 关系 :(a) 每 一 外 显 子 正 好 对 应 于 一 个 结 构 域 ;(b) 仅 近似 地 对 应 ;(c) 一 个 外 显 子 为 两 个 或 更 多 的 域 编 码 ;(d) 一 个 结构 域 由 2 个 或 多 个 外 显 子 编码 ;和 (e) 外 显 子 和 域 之 间 不 对 应 。 该 蛋白 质 的 4 个 结构 域 用 不 同 的 矩形 块 ( 画 有 斜 条 纹 的 ,黑色 的 、 白 色 的 和 打上 点 的 ) 表 示 。 少 地 存在 着 精确 对 应 (图 6 一 la\b)。 在 某 几 个 例子 中 ,可 看 到 一 个 组 件 由 一 个 以 上 的 外 显 子 编码 的 现 象 图 (6 一 1d)。 在 她 的 研究 中 ,没有 发 现 一 个 蛋白 质 的 组 件 结构 与 其 基因 的 外 显 子 划分 间 完 全 不 二 臻 的 情况 \ 图 6 一 le)。 然 而 ,在 为 数 不 少 的 例子 中 , 却 可 以 看 到 儿 个 邻近 的 域 是 由 同一 个 外 显 子 编码 的 (图 6 一 lc)。 例 如 ,血红 蛋白 和 有 分 别 由 4 个 域 构成 ,而 它们 的 基因 却 只 分 别 由 3 个 外 显 子 所 组 成 , 其 中 第 2 个 外 显 子 则 为 2 个 邻近 的 域 编码 。 乡 认为 ,由 于 两 个 外 显 子 间 的 内 含 子 丢失 ,结果 出 现 了 两 外 显 子 的 合并 。 事 实 上 ,存在 于 植物 中 的 同 源 蛋 白质 一 一 豆 血 红 和 蛋白, 其 基因 中 就 可 看 到 在 由 珠 蛋 白 的 域 结构 预测 的 位 置 处 (第 68 个 氨基 酸 之 后 ) 正 好 含有 一 个 额外 的 内 含 子 。 所 以 , 珠 蛋 白 基因 家 族 进 化 期 间 , 有 的 谱系 失去 了 一 些 或 者 全 部 内 含 子 (图 6 二 2)。 在 大 多 数 情 况 下 ,蛋白质 水 平 上 的 域 重复 常 指示 出 在 'DNA KE EMT EF ES. HUE 表明 外 显 子 重复 是 内 部 重复 的 最 重要 类 型 之 一 。 真 核 生 物 的 基因 一 般 由 许多 外 显 子 和 内 含 子 组 成 第, 一 章 六 而 相 邻 的 外 显 子 常常 是 等 同 的 或 相互 间 非 常 相似 的 。 这 些 事实 表明 ,现代 生物 中 许多 复合 基因 e。 8414。 Sao SaaS 人 ET 于 -二 -二 豆 血 红 蛋 白 基因 肌 红 蛋白 基因 冰 椎 动物 珠 蛋白 基因 He AeA | 全 部 内 合子 丢失 中 心 内 含 子 丢失 祖先 珠 蛋 白 基 因 图 6 一 2 珠 蛋 自 基 因 进 化 期 间 的 内 含 子 丢失 。 原始 珠 蛋 白 基 因 有 3 个 内 含 子 和 4 个 外 显 子 。 豆 血红 有 蛋白 基因 保留 着 祖先 结构 ,而 其 他 谱系 则 至 少 丢 失 了 一 个 内 含 子 。 注 意 , 内 合子 并 未 按 比例 大 小 画 。 哺 乳 动物 ( 牛 ,人 ,小 鼠 , 猪 和 海 鹏 ) 的 肌 红 有 蛋白 基因 中 的 两 个 内 含 子 长 各 为 一 4800bp 和 一 3400bp, ,而 珠 蛋 白 和 豆 血 红 蛋 白 基 因 的 同 源 内 含 子 则 分 别 只 有 108 一 192bp 和 103 一 904bp 长 。 豆 血红 蛋白 基因 的 中 间 内 仿 子 为 99 一 234bp 长 (Blanchetot 等 ,1983) 。 珠 蛋白 的 资料 来 自 许 多 两 栖 类 , 岛 类 和 哺乳 类 。 豆 血红 蛋白 的 资料 来 自 3 种 豆 类 (Phaseolus vulgaris, Glycine max 和 Vicia faba) 。 是 通过 原始 基因 的 内 部 重复 和 随后 的 修饰 进化 而 来 的 。 这 类 原始 基因 假定 只 含 1 个 或 少数 几 个 外 显 子 , 且 只 能 执行 简单 的 生物 学 功能 (Li,1983) 。 6.3 域 重 复 和 基因 的 延长 对 真 核 生物 的 现 有 基因 的 勘测 表明 ,内 部 重复 在 进化 中 是 频繁 发 生 的 。 这 种 在 基因 大 小 上 的 增 加 ,或 基因 的 延长 (gene elongation) ,是 简单 基因 回复 合 基因 进化 中 最 重要 的 步骤 之 一 。 理论 上 基因 的 延长 也 可 通过 其 他 方式 发 生 .。 例 如 ,将 一 个 终止 密码 子 转变 成 一 个 有 意义 的 密码 子 的 突变 也 能 使 基因 延长 (第 一 章 )。 类 似 地 ,一 个 外 来 DNA 片段 插入 某 一 外 显 子 中 ,或 出 现 删 除 拼接 位 点 的 突变 ,也 能 得 到 同样 的 结果 。 不 过 ,这 类 分 子 变 化 大 多 数 将 破坏 延长 后 的 基因 的 功能 ,因为 加 进去 的 区 域 是 由 几乎 随机 排列 的 氨基 酸 所 构成 的 。 事 实 上 ,在 绝 大 多 数 情 况 下 ,这 类 分 子 变化 是 与 病理 学 表象 一 起 而 被 发 现 的 。 例 如 ,异常 血红 蛋白 恒 春 (Constant Spring) 和 Icaria 分 别 是 由 将 终止 密码 子 变 成 谷 氨 酰 胺 和 赖 氨 酸 的 突变 所 引起 的 。 由 于 这 种 突变 ,这 些 变异 型 的 w 链 上 增加 了 30 $A (Weatherall 和 Clegg, 1979)。 相 比 之 下 ,一 个 结构 域 的 重复 倾向 不 会 造成 这 类 问题 。 事 实 上 ,这 类 重复 有 时 甚至 能 加 强 新 产 生 的 蛋 自 质 的 功能 ,例如 ,增加 活性 位 点 的 数目 即 可 达到 这 一 点 。 所 以 ,进化 期 间 基 因 的 延长 看 来 主要 靠 域 的 重复 来 实现 。 在 下 节 中 ,我 们 将 给 出 一 个 基因 内 重复 的 例子 ,以 说 明 进 化 期 间 基 因 延 长 的 后 果 。 卵 类 粘 蛋白 基因 卵 类 粘 蛋 白 是 一 种 存在 于 鸟 类 的 卵 白 中 的 蛋白 质 , 它 能 抑制 一 种 催化 蛋白 质 分 解 的 胰 蛋 白 酶 的 活性 。 卵 类 粘 蛋 白 多 肽 可 被 划分 成 3 个 功能 域 (图 6 一 3)。 每 一 个 域 都 能 和 一 个 分 子 的 胰 蛋 和 白 酶 或 其 他 丝氨酸 类 蛋白酶 结合 。 为 这 3 个 功能 域 编 码 的 DNA 区 域 明 显 地 有 着 共同 的 进化 起 源 , 且 相互 间 由 内 含 子 所 隔 开 (Stein 等 ,1980)。 这 3 个 区 域 中 ,每 一 个 都 是 由 被 一 个 内 含 子 隔 断 的 两 个 外 显 子 所 构 成 , 且 这 两 个 外 显 子 间 不 表现 出 相似 。 于 是 , 卵 类 粘 蛋 白 基 因 看 来 是 由 一 个 原始 的 单 域 基因 经 两 次 内 部 重复 而 得 来 的 ,其 中 每 次 重复 都 涉及 两 个 邻近 的 外 显 子 。 由 于 域 I 和 工 相互 间 比 它 们 中 的 任 一 个 和 域 革 之 间 都 更 为 相似 ,所 以 它们 可 能 是 经 第 2 次 重复 而 得 到 的 ,而 域 正则 是 第 1 次 重复 的 产物 。 RBS i Sie tt 表 6 一 1 列 出 了 几 个 证 据 表 明 它 们 在 其 进 史 中 发 生 过 内 部 重复 的 基因 名 单 。 这 些 基 因 全 85。 相似 性 百分数 域 AEB BEM I vs. I 46 66 II vs. II 30 42 I vs. II 33 50 图 6 一 3 分 尖 性 卵 类 粘 蛋 白 的 3 PAIR, PAMRRRKES MER K+ HMMA. A Stein F, (1980). 表 6 一 1 具有 内 部 域 重 复 的 蛋白 质 序 OB 蛋白 质 的 长 度 。 重复 的 长 度 重复 的 次 数 重复 的 百分比 免疫 球 蛋 白 E- 链 C 区 (人 ) 423 108 4 100 免疫 球 蛋白 7Y- 链 C 区 (人 ) 329 108 3 98 血清 白 蛋白 (人 ) 584 195 3 100 小 白 蛋白 (人 ) 108 a5 2 72 蛋白 酶 抑制 因子 ,Bowman-Birk 型 (大 豆 ) 71 28 2 79 蛋白 酶 抑制 因子 , 颌 下 腺 型 ( 吵 齿 类 ) 115 54 2 94 KAKA (Clostridium pasteurianum) 55 28 2 100 ii AF ES FE IR COA) 790 79 5 50 钙 依 赖 性 调节 蛋白 (人 ) 148 74 2 100 原 肌 球 蛋白 < 链 ( 人 ) 284 42 7 100 A Barker 4 (1978) a 氨基 酸 残 基数 。b. 由 重复 顺序 占据 的 部 分 占 蛋 白质 总 长 的 百分比 。 . 86 . 都 涉及 一 个 或 多 个 域 重 复 ,而 其 中 有 些 序列 则 是 由 一 个 原始 序列 经 多 次 重复 而 得 到 的 ,结果 使 这 种 重 复 性 结构 占据 了 整个 蛋白 质 的 长 度 。 在 这 些 例 子 中 ,每 一 例 的 重复 事件 都 可 从 和 蛋白质 或 DNA 顺序 的 类 似 而 轻易 地 推测 出 来 .也 许 还 有 许多 别 的 复合 基因 也 是 经 基因 内 重复 而 进化 的 ,但 它们 的 重复 区 域 相互 间 可 能 已 分 岐 到 这 样 一 种 程度 ,以 致 它们 间 的 顺序 同 源 性 已 经 不 能 被 辨认 出 来 了 。 在 某 些 情 况 下 ,如 免疫 球 蛋 白 基因 的 恒定 区 和 可 变 区 ,我 们 可 以 通过 比较 这 些 域 的 二 级 结构 来 推测 其 共同 祖先 , 因为 二 级 结构 有 比 氨 基 酸 顺序 更 强 的 保守 性 .所 以 ,蛋白 质 中 的 内 部 重复 极 有 可 能 比 经 验 数据 所 指示 的 更 多 地 普遍 地 存在 着 。 6.4 基因 家 族 的 形成 与 新 功能 的 获得 一 次 全 基因 重复 产生 两 个 等 同 的 拷贝 。 它们 将 如 何 进化 则 会 因 情 况 而 异 。 例 如 ,这 些 拷 贝 可 能 保 留 其 原始 功能 ,从 而 使 该 生物 产生 更 多 的 某 种 RNA 或 蛋白 质 。 此 外 ,其 中 一 个 拷贝 可 能 会 因 一 次 有 害 突变 而 丧失 能 力 , 从 而 变 成 一 个 无 功能 的 假 基 因 ( 见 第 89 页 )。 然 而 ,更 重要 的 是 ,基因 重复 可 能 会 导致 产生 遗传 新 型 或 新 基因 的 结果 。 如 果 重 复 中 一 个 拷贝 保留 其 原始 功能 ,而 另 一 个 则 累积 分 子 变 化 ,以 致 于 最 终 变 得 能 执行 完全 不 同 的 功能 ,那么 ,产生 遗传 新 型 或 新 基因 的 情况 就 会 出 现 了 。 重复 的 基因 可 以 分 成 两 类 :变异 的 重复 和 不 变 的 重复 。 不 变 的 重复 (invariant repeats) 相 互 间 在 顺 序 上 是 等 同 的 或 近似 地 等 同 的 。 在 有 些 情 况 下 表明 ,等 同 顺序 的 重复 与 某 一 基因 产物 的 增 量 合成 有 关 , 该 产物 则 是 生物 的 正常 功能 所 必需 的 。 这 样 的 重复 称 为 剂量 重复 (dose repetitions) 。 无 论 何 时 出 现 需 产 生 大 量 特别 的 RNA 或 蛋白 质 产物 的 代谢 需要 ,剂量 重复 就 会 十 分 普遍 的 出 现 (Ohno,1970)。 代 表 性 的 例子 有 :执行 翻译 功能 不 可 缺少 的 rRNA 的 基因 和 tRNA 的 基因 ,以 及 染色 体 首要 结构 蛋白 , 组 蛋白 的 基因 ,因此 必须 被 大 量 地 合成 。 变异 的 重复 (variant repeats) 由 一 个 基因 的 多 拷贝 所 构成 ,虽然 这 些 找 贝 相 互 类 似 , 但 在 其 顺序 方 面 却 或 多 或 少 地 有 一 定 程 度 的 差异 。 有 趣 的 是 ,变异 的 重复 有 时 能 执行 显然 不 同 的 功能 。 例 如 ,在 血 液 凝结 过 程 中 起 裂解 血 纤 蛋 白 原作 用 的 凝血 酶 ,和 消化 性 酶 胰 蛋 白 酶 ,都 是 源 自 一 个 原始 基因 的 重 复 。 类 似 地 , 乳 清 蛋白 ,催化 乳糖 合成 的 酶 的 一 个 亚 基 , 和 通过 裂解 某 些 细菌 细胞 壁 中 的 多 糖 成 份 来 溶 解 它们 的 溶菌 酶 ,在 谱系 上 是 相关 的 。 功 能 上 的 分 化 通常 需要 大 量 的 替换 。 不 过 ,在 某 些 情况 下 ,一 个 新 的 功能 有 可 能 在 数目 相对 较 小 的 替换 之 后 产生 (例如 , 见 Betz 等 ,1974) 。 在 一 个 基因 组 中 属于 某 一 群 重复 顺序 的 所 有 基因 , 合 起 来 被 称 为 一 个 基因 家 族 (gene family ) 或 多 基因 家 族 Cmultigene family) 。 一 个 基因 家 族 的 成 员 通 常 位 于 同一 染色 体 上 相互 间 极 靠近 的 地 方 。 在 某 些 情况 下 ,一 些 功能 性 的 或 非 功 能 性 的 家 族 成 员 可 能 会 位 于 别 的 染色 体 上 。 当 重 复 基因 在 功能 或 顺序 上 变 得 相互 间 差 异 很 大 时 ,再 把 它们 归 成 同一 基因 家 族 也 许 就 不 合适 了 。 戴 霍 夫 (Dayhoff,1978) 造 了 一 个 词 : 超 家 族 (superfamily) 来 描绘 关系 密切 和 关系 朴 远 的 蛋白 质 间 的 联系 。 据 此 ,在 氨基 酸 水 平 上 相互 至 少 展示 出 50% 相 似 性 的 蛋白 质 , 可 以 被 看 成 是 一 个 家 族 的 成 员 ; 而 当 同 源 蛋 白质 展示 出 的 相似 性 小 于 50% 时 则 被 看 成 是 一 个 超 家 族 的 成 员 。 例如 ,a 一 珠 蛋白 和 一 珠 蛋 白 被 分 类 在 两 个 不 同 的 家 族 中 ,而 它们 和 肌 红 蛋白 一 起 则 构成 了 珠 蛋 白 超 家 族 ( 见 第 99 页 ) 。 然而 ,这 两 术语 并 不 总 是 能 按 戴 霍 夫 的 标准 来 严格 地 应 用 的 。 例 如 ,人 和 鲁 的 w 珠 蛋 白 链 仅 展现 出 46 听 的 顺序 相似 性 ,这 就 低 于 为 归于 同一 基因 家 族 所 划 的 界限 。 为 此 缘故 ,将 蛋白 质 归 类 成 家 族 和 超 家 族 , 不 仅 要 根据 顺序 的 相似 性 ,而 且 还 要 考虑 关于 功能 类 似 性 或 组 织 特异 性 等 方面 的 辅助 证 据 才 能 决定 。 基因 家 族 内 的 基因 数 变化 极 大 。 有 些 基 因 仅 在 基因 组 内 重复 几 次 ,它们 被 称 为 轻 度 重复 (lowly repetitive) 。 另 一 些 则 可 能 在 基因 组 中 上 百 次 地 重复 ,因而 被 称 为 是 高 度 重 复 的 (highly repetitive) 。 在 以 下 几 节 中 ,rRNA 和 tRNA 基因 将 被 作为 例子 ,以 说 明 高 度 重 复 的 不 变 基因 。 轻 度 重复 的 基因 将 由 同 功 酶 和 色 敏 感 的 色素 蛋白 基因 作 代表 。 确定 RNA 的 基因 表 6 一 2 列 出 了 几 种 有 机 体 的 rRNA 和 tRNA 基因 的 数目 .哺乳 动物 的 线粒体 基因 组 只 含有 一 个 §/ © 拷贝 的 12SrRNA 基因 和 一 个 拷贝 的 16SrRNA 基因 。 这 对 线粒体 翻译 系统 来 说 显然 是 足够 了 ,因为 其 基因 组 仅 含 13 个 为 蛋白 质 编码 的 基因 (第 四 章 )。 枝 原 体 是 最 小 的 自我 复制 的 原核 生物 , 它 含 有 两 组 rRNA 基因 。 大 肠 杆菌 的 基因 组 大 小 是 它 的 4 一 5 倍 , 含 有 7 组 rRNA 基因 。 酵 母 中 TRNA 基因 的 数目 大 约 是 140.2 PAA THR AMW EK. MM Xenopus laevis 有 比 人 更 大 的 基因 组 和 更 多 的 rRNA 基因 。 所 以 ,rRNA 基因 的 数目 与 基因 组 大 小 间 存 在 着 很 强 的 正 相 关 。 这 一 规则 对 tRNA 基因 ( 表 6 一 2) 和 其 他 确定 RNA 的 基因 来 说 也 是 成 立 的 。 表 6 一 2 各 种 有 机 体 中 每 单 倍 体 基因 组 的 rRNA 和 tRNA 基因 数 rRNA 基因 的 tRNA 基因 组 的 基因 组 来 源 数目 基因 的 数目 近似 大 小 (bp) 人 线粒体 1 22 137 104 枝 原 体 Mycoplasma capricolum 2 ND» 11.08 KBHE E. coli ia ~100 4X 108 酵母 Saccharomyces cerevisiae ; ~140 320—400 5107 果 蝇 D. melanogaster 130—250 HT 5 Que > 2X108 4 人 ~ 300 ~1300 3x 109 IN WE Xenopus laevis 400—600 ~7800 8X 10° A Li(1983) a. 对 于 rRNA 基因 ,该 值 指 整 个 rRNA 基因 组 的 数 。 b. ND=X#. ny Be BS HY SE, 2 rRNA 基因 ,一 般 相 互 间 是 非常 相似 的 。 造 成 这 种 同 源 性 的 一 个 因素 可 能 是 纯洁 化 选择 ,因为 这 些 基 因应 该 遵守 非常 特殊 的 功能 和 结构 要 求 。 然 而 , 同 源 性 常常 会 延伸 到 没有 任 何 功 能 意义 的 区 域 , 而 这 类 同 源 性 的 维持 就 需要 求助 于 别 的 机 制 ( 见 第 99 页 ) 了 。 fe] Tp ais 除了 不 变 的 重复 以 外 ,高 等 生物 的 基因 组 还 含有 许多 其 成 员 相 互 间 已 发 生 不 同 程度 岐 化 的 多 基 因 家族 . 其 中 最 能 说 明 问题 的 例子 是 为 同 功 酶 编码 的 基因 家 族 , 象 乳酸 脱 氢 酶 、 醛 缩 酶 . 肌 酸 激酶 和 两 酮 酸 激 酶 等 。 同 功 酶 (isozymes) 是 催化 同样 的 生化 反应 、 但 在 组 织 特异 性 .生长 调控 .电泳 移动 性 或 生 化 特性 等 方面 相互 间 可 能 有 差别 的 一 类 酶 。 注 意 , 同 功 酶 是 由 不 同 的 基因 座位 ,通常 是 重复 后 的 基因 来 编码 的 ,这 与 异型 酶 (allozymes) 不 同 , 后 者 是 由 同一 个 基因 座位 上 的 不 同等 位 基因 编码 的 、 某 种 酶 的 不 同形 式 。 让 我 们 来 考虑 为 兰 椎 动物 中 乳酸 脱 氢 酶 (LDH) 的 A 和 了 B 亚 基 编 码 的 两 个 基因 。 这 两 种 亚 基 可 形 成 5 种 四 聚 体 同 功 酶 :Ai,A:B,A:B,,AB: 和 了 B,, 所 有 这 些 酶 都 可 在 氧化 态 辅酶 ,尼克 酰胺 腺 味 叭 二 核 音 酸 (NAD+) 的 存在 下 催化 将 乳酸 转变 成 丙酮 酸 的 反应 ,或 在 还 原 态 辅酶 (NADH) 的 存在 下 催化 相 反方 向 的 反应 。 曾 经 有 人 提出 ,LDH 一 B, 和 另外 一 些 富 含 B 亚 基 的 同 功 酶 对 NAD+* 有 较 高 的 亲 和 人 性, 它们 在 一 些 行 有 氧 代谢 的 组 织 如 心脏 中 ,行使 着 真正 的 使 乳酸 脱氧 酶 的 功能 ,而 LDH 一 A, 和 另 一 些 富 含 A 亚 基 的 同 功 酶 则 对 NADH 有 较 高 的 亲 和 性 ,所 以 ,它们 在 一 些 无 氧 代谢 的 组 织 如 骨骼 肌 里 , 被 特别 地 安排 作为 丙酮 酸 还 原 酶 而 起 作用 (Everse 和 Kaplan,1975;Nadal-Ginard 和 Markert,1975). 图 6 一 和 展示 了 心脏 中 产生 的 LDH 的 发 育 次 序 。 我 们 看 到 ,心脏 存在 的 环境 越 是 厌 氧 ,特别 是 在 怀孕 的 早期 阶段 , 则 富 含 A 亚 基 的 LDH 同 功 酶 所 占 的 比例 就 越 高 。 于 是 ,这 两 个 重复 基因 已 对 不 同 的 组 织 和 不 同 的 发 育 阶 段 发 生 了 特 化 。 因 为 这 两 种 亚 基 存在 于 几乎 所 有 曾 做 过 年 代 测 定 研究 的 兰 椎 动物 中 ,所 以 ,产生 LDH--A 1 LDH—B 的 基因 重复 可 能 发 生 在 养 椎 动物 进化 的 早期 阶段 之 前 或 期 间 。 LDH 的 一 个 有 趣 特 性 是 ,这 两 个 亚 基 能 形成 异 源 多 聚 体 , 从 而 进一步 增加 了 该 酶 的 生理 学 功能 多 样 性 。 ° 88 ° § i i : 1 = igi er 3 人 PaCn er eos om, — Oo oo oo mm OO aa tae | OO 88 LDH-2 DO OO 8e@e fe He OO OO 8 a6 a 面 LDH-3 OO @@ 0680 @@ OO OO 丁力 | ae Pig ‘ipyns OO @@ @@ Oo 二 OO O88 OB oe i. Coe rps OG deGew--O O é a | Gs ian | @ Maat i vhs alli ed a -9 -5 -1 +12 +21 成 年 图 6 一 4 心脏 中 5 种 乳酸 脱 氢 酶 (CDHJ) 同 功 酶 的 发 育 次 序 。 负 数 和 正 数 分 别 表示 出 生前 、 后 的 天 数 。 方 块 表示 B 亚 基 、 圆 圈 表 示 A 亚 基 。 被 涂 黑 了 的 图 形 表 示 在 数量 上 占 优 势 的 形式 。 注 意 在 个 体 发 育 期 间 从 A LABQBLAHHK 移 。 资 料 取 自 Markert 和 Vrsprung(1971). 色 敏 感 色素 蛋白 人 、 狼 和 古 世 界 猴 具 有 3 种 色 敏 感 色素 蛋白 。 蓝 色素 由 一 个 常 染 色 体 基因 编码 ,而 红色 素 和 绿色 素 则 各 由 一 个 X- 连 锁 基 因 编 码 (Nathans 等 ,1986)。 红 和 绿色 素 的 氨基 酸 顺 序 有 UKESAN ME 们 与 蓝 色 素 的 相似 性 却 只 有 43% 。 蓝 色素 基因 和 绿 、 红 色素 基因 的 祖先 在 大 约 5 亿 年 前 发 生 分 岐 。 相 比 之 下 , 红 和 绿色 素 间 的 紧密 连锁 和 高 度 的 同 源 性 指出 ,它们 来 源 于 非常 近期 的 基因 重复 。 因 为 新 世 界 猴 只 有 一 个 X- 连 锁 的 色素 基因 ,而 古 世 界 猴 和 人 则 有 2 个 或 多 个 色素 基因 ,所 以 可 以 假定 ,重复 发 AERA 3500 一 4000 万 年 以 前 \ 古 世界 猴 与 新 世界 猴 分 岐 以 后 的 祖先 中 。 作 为 该 重复 的 结果 ,人 、 猿 和 十 世界 猴 能 分 辨 3 种 颜色 ( 即 它们 是 三 色 性 的 ) ,而 新 世界 猴 , 如 松鼠 猴 , 则 只 能 对 蓝 与 绿 或 蓝 与 红 加 以 区 别 ,但 不 能 对 绿 与 红 加 以 区 别 ( 即 它们 是 二 色 性 的 )。 有 趣 的 是 ,两 个 X- 连 锁 的 等 位 基因 呈 杂 合 状 态 的 雌性 松鼠 猴 是 三 色 性 的 (Jacobs 和 Neitz,1986) 。 另 一 方面 ,只 携带 一 条 X 染色 体 的 雄 体 则 从 未 获得 过 三 色 性 视觉 。 于 是 ,在 人 和 古 世 界 猴 的 场合 ,三 色 性 视觉 是 通过 类 似 于 同 功 酶 的 机 制 ( 即 ,两 个 有 区 别 的 蛋白 质 由 不 同 的 基因 座位 编码 ) 而 获得 的 ,而 杂 合 体 峻 性 松鼠 猴 达到 同样 目的 , 则 是 通过 应 用 两 种 异型 酶 ( 即 , 同 一 基因 座位 上 两 个 不 同 的 等 位 基 因 形 式 ) 来 实现 的 (图 6 一 5)。 如 果 三 色 性 视觉 能 给 予 其 携带 者 以 选择 优势 ,那么 ,新 世界 猴 的 一 基因 座位 上 的 两 个 色 敏 感 等 位 基因 的 长 期 维持 ,可 能 是 通过 一 种 超 显 性 选择 形式 来 实现 的 (第 二 章 )。 6.5 重复 基因 的 无 功能 化 多余 的 重复 基因 更 可 能 是 变 成 无 功能 基因 、 而 不 是 进化 成 一 个 新 基因 ,因为 有 害 突变 远 比 有 利 突 变 发 生得 频繁 。 一 个 重复 基因 的 无 功能 化 即 产生 一 个 假 基因 。 这 样 产生 的 假 基因 称 未 加 工 的 (unpro- cessed) 假 基因 ,这 与 将 在 第 七 章 中 讨论 的 经 过 加 工 的 假 基因 相反 。 表 6 一 3 列 出 了 在 几 种 珠 蛋 白 假 基 因 中 发 现 的 结构 缺陷 .这些 未 加 工 的 假 基因 大 多 数 含有 多 重 缺 陷 , 象 阅读 框架 移动 成熟 终止 前 终止、 和 拼接 位 点 或 调控 位 点 的 删除 等 ,以 至 很 难看 出 哪 种 突变 是 使 基因 沉默 的 直接 原因 。 在 有 几 个 例子 里 ,也 许 能 找到 “元 凶 ”。 例 如 ,人 的 由 只 含有 一 个 严重 缺陷 ,无 义 突变 ,所 以 它 可 能 是 无 功能 化 的 直接 原因 。 (符号 小 用 来 将 假 基因 与 其 有 功能 的 对 应 物 加 以 区 别 .) 有 些 假 基因 , 象 在 山羊 B 一 珠 蛋 白 多 基 因 家 族 中 的 PB 和 灿 ', 则 是 由 一 个 预先 存在 的 假 基因 重复 而 得 来 的 。 .89 。 X 染色 体 BREE 视觉 ————= een ////////// 1/71 sam a gx ——=—= 一 zz 三 名 性 人 —=—_ -一 CA 一 三 色 性 {LLL 一 [一 -一 CT 一 局 9 新 世界 猴 纯 合 子 上 aa 二 色 性 or a -一 CT 一 二 色 性 一 LLIB — 一 DZ 一 bs 9 新 世界 猴 杂 合子 ae zz —___+— 一 CA 克 一 = Ga 新 世界 猴 一 色 性 or 一 一 二 二 ES 一 一 2ZZZZDZ 罗 一 ZL 二 色 性 图 6 一 5 人 和 新 世界 猴 (NWM) 的 雄性 和 雌性 中 ,三 色 性 视觉 的 分 子 基础 。 注 意 , 雄 性 新 世界 猴 不 能 获得 三 色 性 视 觉 。 涂 黑 了 的 、 空 心 的 和 画 斜 线 的 矩形 分 别 表示 绿 、 红 和 蓝 色 素 基 因 。 表 6 一 3 珠 蛋 和 白 假 基因 中 的 缺陷 ” 阅读 框架 MAKI REG 拼接 GT/ 改变 了 的 终 SRR Ma 假 基因 TATA 起 始 密码 子 移动 前 终止 AER AGM 止 密码 子 ”号 AATAAA 人 gal 十 十 十 十 十 十 十 A 9 + 小 鼠 a3 十 在 十 十 小 鼠 pad + - 小 山 ph3 ? "4 + oF + + ? we ge + + + + + + + 山羊 op" 二 十 十 十 十 7 免 gp2 十 十 十 十 A Li(1983) a\ 加 号 表示 存在 一 种 特别 类 型 的 缺陷 ;问号 表示 有 存在 该 缺陷 的 可 能 性 。 6.6 基因 重复 的 年 代 测 定 两 个 基因 ,如 果 它 们 是 从 一 次 重复 事件 中 得 来 的 则 称 为 平行 相关 的 (paralogous) ,如 果 它 们 是 从 一 次 物种 形成 事件 中 得 来 的 则 称 为 垂直 相关 的 (orthologous) 。 例 如 在 图 6 一 6 中 ,基因 ao 和 有 B 是 从 一 个 祖先 基因 的 重复 中 得 到 的 ,因而 是 平行 相关 的 ,而 来 自 物种 1 的 基因 MRA WH 2 的 基因 w 则 是 垂 . 直 相 关 的 ,来 自 物 种 1 的 B 基 因 和 来 自 物 种 2 的 B 基 因 间 的 关系 也 是 如 此 。 如 果 我 们 知道 基因 c 和 基因 有 B 中 的 替换 速率 , 则 我 们 即 可 从 序列 资料 中 估 出 重复 的 年 代 , 即 To. 而 替换 速率 则 可 根据 垂直 相关 的 基因 间 的 替换 数 ,结合 有 关 物 种 1 和 物种 2 间 分 岐 时 间 Ts 的 知识 (图 6 一 6) 来 佑 出 。 下 面 我 们 将 说 明 Tp 的 估 值 是 怎样 得 到 的 。 。90 。 et ET 全 = L@ bx 8 | 分 开 EEC 物种 1 物种 2 图 6 一 6 用 来 估计 一 个 基因 重复 事件 的 时 间 (Tp) 的 模型 。a 和 有 B 这 两 个 基因 来 自 Tp 单位 时 间 以 前 一 个 祖先 物种 中 发 生 的 重复 事件 。 后 来 该 物种 分 裂 成 两 个 物种 ,1 和 2, 这 发生 在 Ts 时 间 单 位 以 前 。 在 物种 1 和 物种 2 中 的 两 个 a 基 因 是 重 直 相关 的 ,两 个 B 基 因 也 是 如 此 ,但 wa 基 因 和 B 基 因 间 则 是 平行 相关 的 。 对 于 基因 KK. 为 这 两 个 物种 间 的 每 位 点 替换 数 。 那 么 ,在 基因 ax 中 的 替换 速率 则 由 Rik« TS 来 估计 。 在 基因 有 B 中 的 替换 速率 ,rs 可 用 同样 方式 得 到 。 这 两 个 基因 的 平均 替换 速率 则 为 : we (6. 1) lat TR CSE. (6. 2) — 为 了 估 出 Te, 我 们 需要 知道 基因 和 有 间 的 每 位 点 替换 数 (K。)。 这 个 数 可 从 以 下 4 个 对 子 的 比较 中 得 到 :(1) 来 自 物种 1 的 基因 c 和 来 自 物 种 2 的 基因 8B,(2) 来 自 物 种 2 的 基因 xc 和 来 自 物 种 1 的 基因 B, 3) 来自 物种 1 的 两 个 基因 ,(4) 来 自 物 种 2 的 两 个 基因 。 从 这 4 个 估 值 我 们 能 算出 Kot FH (Ke) ,进而 我 们 能 估 出 To 为 : Tp = 300 ~260 150 - 200 100 - 140 40 - 80(?) 40 = 50 ~35 ae ™ hi G A 肌 红 蛋白 1 yal 91 y + 5 B aaa SO a RIK RIK 图 6 一 8 人 的 珠 蛋 白 基 因 的 进化 史 . 虚线 表示 一 个 假 基因 谱系 。 图 中 只 标 出 了 两 个 G 一 珠 蛋白 基因 中 的 一 个 ,因为 它们 相互 间 发 生 分 岐 的 年 代 还 未 确定 : - 在 4000 万 年 前 (Dayhoff ,1972;Efstratiadis 等 ,1980) ,但 最 近 DNA 顺序 资料 表明 , 它 可 能 早 于 真 兽 类 的 辐射 , 即 在 约 8000 万 年 前 出 现 (Hardison 和 Margot,1984;Goodman 等 ,1984)。 从 以 上 讨论 中 我 们 注意 到 ,在 两 个 家 族 中 ,基因 间 分 岐 时 间 与 基因 间 功 能 或 调节 方面 的 分 岐 程度 之 间 ,存在 着 明显 的 相 Bt 6.8 Fh it FIBA 有 两 类 外 显 子 混 匀 (exon shuffling) :外 显 子 重复 和 外 显 子 搬入。 外 显 子 重复 指 一 个 基因 中 的 一 个 或 多 个 外 显 子 的 重复 ,所 以 它 是 一 种 内 部 重复 ,这 已 在 基因 的 延伸 一 节 中 讨论 过 ( 见 第 81 页 )。 外 显 子 反 入 是 这 样 一 种 过 程 ,通过 该 过 程 结 构 域 或 功能 域 在 蛋白 质 之 间 发 生 交换 ,或 者 被 插 人 一 个 蛋白 质 之 中 。 这 两 类 混 匀 都 曾 在 产生 新 基因 的 进化 过 程 中 被 采用 。 这 里 ,我们 将 讨论 一 个 外 显 子 从 一 个 基 因 插 人 另 一 个 基因 ,结果 产生 镶 府 或 嵌 合 蛋白 质 的 情况 (Doolittle,1985;Patthy,1985) 。 Rik SAR 第 一 个 被 发 现 的 灸 谋 蛋 白质 是 组 织 血 纤 蛋 白 溶 酶 原 活 化 因子 (TPA)( 图 6 一 9)。 血 纤 蛋 白 溶 酶 原 经 TPA 作用 转化 成 它 的 活化 形式 : 血 纤 蛋白 溶 酶 ,后 者 则 将 血 纤 蛋白 、. 血块 中 的 一 种 可 溶性 的 纤维 状 蛋 白质 溶解 。 在 底 物 血 纤 蛋白 的 存在 下 , 血 纤 蛋白 溶 酶 原 转化 成 血 纤 蛋 白 溶 酶 的 过 程 将 被 大 大 加 速 。 血 纤 蛋 白 能 与 血 纤 蛋 白 溶 酶 原 和 TPA 两 者 结合 ,从 而 将 它们 联系 起 来 而 起 催化 作用 。 这 种 分 子 排列 方式 允许 血 纤 蛋白 溶 酶 仅 以 非常 接近 血 纤 蛋白 的 形式 产生 ,从 而 给 予 血 纤 蛋 白 溶 酶 原 以 对 血 纤 蛋白 的 特异 性 。 相 比 之 下 , 尿 激 酶 (UK) ,一 种 尿 液 中 的 血 纤 蛋 白 溶 酶 原 活化 因子 , 则 缺乏 血 纤 蛋 白 特 异性 。 对 TPA 和 UK 的 前 体 尿 激 酶 原 的 氨基 酸 顺 序 比 较 表 明 ,TPA 在 其 氨基 末端 含有 43 个 残 基 序 Fi, im UK 中 却 没有 相应 的 对 应 物 (Banyai 等 ,1983) 。 这 一 片段 能 形成 一 种 手指 样 结构 (图 6 一 9a) ,而 它 和 另 一 种 蛋白 质 的 与 血 纤 蛋白 亲 合 性 有 关 的 指 状 域 是 同 源 的 。 后 一 种 蛋白 质 是 一 种 存在 于 血浆 中 © 93. 组 织 血 纤 蛋 白 溶 酶 原 活 化 因子 FAT 尿 激酶 oa (a) Af AS BE If Be UR OR ant tr 364 Re (b) EG K K TPA GE K . puK ZZ. ro. - Pet- “Eee F Fee + 8 ae Wo W SH. Pee A—{ HH G CGE Gs SCENE EGFP 图 6 一 9 (a) 组 织 血 纤 蛋白 溶 酶 原 活 化 因子 (TPA) 与 其 他 涉及 血液 凝结 和 血 纤 蛋白 溶解 的 蛋白 质 中 观察 到 的 各 种 结构 组 件 。 方 框 插图 显示 了 非 蛋 白 酶 区 域 中 组 件 的 结构 : 氏 , 纽 结 杆 状 组 件 ;G, 生 长 因子 组 件 ; 下 , 指 状 组 件 ;C RR RAK 的 钙 结 合 组 件 。 画 有 斜 线 的 杆 状 图 形 表 示 与 胰 有 蛋白 酶 同 源 的 蛋白 酶 区 域 。 自 Patthy(1985) 修 改 而 成 。 (b) 通 过 外 显 子 插入 组 织 血 纤 蛋 白 溶 酶 原 活化 因子 (TPA) 和 有 蛋白质 而 获得 的 组 件 的 起 源 。pPUK , 尿 激 酶 原 ,EGFP, 表 皮 生 长 因子 前 体 ;FN , 纤 粘 连 有 蛋白 (fibronectin ) 。 或 细胞 表面 上 的 起 促进 细胞 粘着 作用 的 大 分 子 糖 蛋白 称 纤 粘 连 和 蛋白 (EN)( 图 6 一 9b)。 若 指 状 域 片 段 缺 失 会 导 至 TPA 的 血 纤 蛋白 亲 合 性 丧失 。TPA 与 EN 的 同 源 性 限制 在 这 种 指 状 域内 。 所 以 ,外 显 子 混 匀 必定 是 与 TPA M FN 或 某 一 类 似 蛋 白质 那里 获得 该 域 的 事件 有 关 的 。 TPA 还 含有 一 个 与 表皮 生长 因子 (EGF) 和 另 一 些 蛋 白质 的 类 生长 因子 区 域 同 源 的 片段 。 另 一 些 蛋白 质 是 指 象 因子 KK 和 因子 X 之 类 的 蛋白 质 , 它 们 是 在 血液 凝结 过 程 中 促使 血液 结 块 的 酶 。 此 外 , TPA 的 羧基 端 区 域 与 胰 蛋 白 酶 和 其 他 胰 和 蛋白酶 样 的 丝氨酸 蛋白 酶 的 酶 蛋白 部 分 同 源 ,这 些 酶 都 起 着 将 蛋白 质 水 解 成 多 肽 片段 的 作用 。 最 后 ,TPA 的 非 酶 蛋白 部 分 含有 两 个 类 似 于 血 纤 蛋白 溶 酶 原 的 纽 结 杆 (Kringle) 的 结构 。( 一 个 纽 结 杆 是 一 个 富 含 半 胱 氨 酸 的 序列 ,序列 中 含有 3 个 内 部 二 硫 桥 并 形成 一 种 有 点 象 丹 麦 蛋 糕 的 纽 结 杆 状 结构 ,这 种 丹麦 蛋糕 的 名 字 是 (Kringle)。 所 以 ,在 TPA 的 进化 期 间 , 它 至 少 从 其 他 3 个 基因 : 血 纤 蛋白 溶 酶 原 , 表 皮 生 长 因子 和 纤 粘 连 蛋 白 那里 ,夺取 了 至 少 4 个 DNA 片段 (图 6 一 9b)。 而 且 , 这 些 得 来 的 单位 的 连结 处 和 外 显 子 与 内 含 子 间 的 边界 精确 地 一 致 ,于 是 ,就 使 得 关于 外 显 子 事实 上 曾 从 一 个 基因 转移 到 另 一 个 基因 的 想法 更 加 可 信 。 有 关外 显 子 混 匀 的 更 多 例子 , 可 见 Doolittle(1985) 和 Patthy(1985) 。 外 显 子 混 匀 上 的 相位 限制 为 了 使 一 个 插入 某 一 基因 的 内 含 子 中 的 外 显 子 不 至 于 引起 阅读 框 如 上 的 框架 移动 ,接受 基因 时 的 相位 限制 就 必须 遵守 。 为 了 把 这 种 限制 搞 清楚 ,让 我 们 根据 内 含 子 相对 于 编码 区 的 可 能 位 置 来 将 内 合子 归于 不 同 的 类 型 。 位 于 两 编码 区 之 间 的 内 含 子 , 根 据 编码 区 被 打 断 的 方式 可 被 分 成 3 种 类 型 。 WAAR SEAS HES Zi MERA AM 0 的 内 含 子 ; 如 果 它 位 于 一 个 密码 子 的 第 1 和 第 2 TERR MERAH I 1; 如 果 它 位 于 一 个 密码 子 的 第 2 和 第 3 个 核 苷 酸 之 间 , 则 它 具 有 相位 2 e。 94。 人 外 显 子 类 型 相位 0 相位 0 ay (c) 3 om 1 2 * 3 相位 0 相位 2 区 图 6 一 10 ASH AFH LF HK 。 外 显 子 用 和 矩形 块 表 示 。 外 显 子 一 内 含 子 连结 处 上 的 数字 指示 外 显 子 的 最 后 一 个 核 苦 酸 的 密码 子 位 置 ,内 含 子 一 外 显 子 连结 处 上 的 数字 则 指示 外 显 子 的 第 一 个 核 音 酸 的 密码 子 位 置 .9 种 可 能 的 外 显 子 类 型 中 只 有 3 种 在 图 中 表示 出 来 了 。 ”,(b) 1 (c) 1 3 图 6 一 11 HktFMAASTHER. BHR ERE RI TMRER BA. (a)—Ph0-1 不 对 称 外 显 子 插入 一 个 相位 一 0 内 含 子 ;(b) 一 个 0 一 0 对 称 外 显 子 插 入 一 个 相位 一 1 内 含 子 ;(c) 一 个 0 一 0 对 称 外 显 子 插入 一 个 相位 一 0 内 含 子 。(a) 和 (b) 中 的 插入 为 不 成 功 的 插入 。 〈 图 6 一 10)。 外 显 子 则 根据 其 两 侧 的 内 含 子 而 组 合 归 类 。 例 如 ,图 6 一 10b 中 处 在 中 间 的 外 显 子 ,其 5 端 与 相位 一 0 内 含 子 相 邻 , 其 3' 端 与 相位 一 1 内 含 子 相 邻 ,因而 说 它 是 0 一 1 类 型 。 两 端 由 同样 相位 的 内 含 子 包 围 的 外 显 子 称 为 对 称 的 外 显 子 (symmetrical exon) ,否则 即 为 非 对 称 的 (asymmetrical) 。 例 如 ,图 6 一 10a 中 处 在 中 间 的 外 显 子 是 对 称 的 。 在 9 种 可 能 的 外 显 子 类 型 中 ,3 种 是 对 称 的 (0 一 0,1 一 1 和 2 一 2),6 种 是 非 对 称 的 。 只 有 对 称 的 外 显 子 才能 被 插 和 人 内 含 子 中 。 例如 ,图 6 一 11a 中 ,一 个 0 一 1 外 显 子 插入 一 个 相位 一 0 内 含 子 ,结果 造成 后 面 所 有 外 显 子 的 阅读 框架 移动 。 而 且 , 对 称 外 显 子 的 插 人 也 是 有 限制 的 ;一 个 0 一 0 外 显 子 只 能 插入 相位 为 0 的 内 含 子 ,类 似 地 ,一 个 1 一 1 外 显 子 只 能 插 和 人 相位 为 1 的 内 含 子 ,一 个 2 一 2 外 显 子 也 只 能 插 和 人 相位 为 2 的 内 含 子 , 以 图 6 一 llb 的 情况 为 例 , 一 个 0 一 0 外 显 子 插入 了 一 个 相 位 为 1 的 内 含 子 ,结果 造成 被 插入 外 显 子 和 在 它 3' 端 侧 所 有 外 显 子 的 阅读 框架 移动 。 图 6 一 1lc 则 显 示 ,一 个 0 一 0 外 显 子 插 入 一 个 相位 为 0 的 内 含 子 之 中 将 不 会 引起 阅读 框架 移动 。 6.9 产生 新 功能 的 变通 途径 除了 基因 重复 和 外 显 子 混 匀 以 外 ,还 有 许多 别 的 产生 新 基因 或 新 多 肽 的 机 制 。 以 下 将 考虑 3 种 这 FF AY BL iil 。 重奏 基因 已 经 发 现 , 一 个 DNA 片段 能 通过 用 不 同 阅读 框架 来 为 一 个 以 上 的 基因 编码 。 这 一 现象 在 病毒 、 细胞 器 和 细菌 中 普遍 存在 。 图 6 一 12a 展示 了 一 个 单 链 DNA MP A OX174 的 遗传 图 。 其 中 已 观察 到 LAH RA. ign 基因 也 整个 地 被 包含 在 基因 A DAME K 在 5 端 与 基因 A 重奏 ,在 3' 端 与 基因 C 重 友 。 后 一 情况 的 更 详细 分 析 于 图 6 一 12b 给 出 。 2 个 DNA 序列 的 两 条 互补 链 而 产生 。 wi iu. 人 线粒体 基因 组 中 ,确定 tR- NA 和 tRNAcn 的 基因 分 别 位 于 不 同 的 链 上 ,并 且 它 们 之 间 有 一 个 3 一 核 昔 酸 重 到 ,前 者 中 读 成 纪 一 CTA 一 3' ,后 者 中 读 成 5 —TAG—3’ (Anderson 等 ,1981) 。 间 题 是 ,在 进化 期 间 重奏 基因 可 能 是 怎样 产生 的 呢 ? 为 了 回答 这 一 问题 ,我 们 注意 到 ,开放 阅读 杠 架 在 整个 基因 组 中 大 量 存在 .因此 ,相当 长 度 的 潜在 编码 区 存在 于 已 有 基因 的 不 同 阅读 框架 中 或 互补 链 上 ,这 是 完全 可 能 的 。 因 为 64 种 可 能 的 密码 子 中 只 有 3 种 是 终止 密码 子 , 所 以 ,即使 一 个 随机 的 (a) 4 (8 DNA 合成 的 起 始 ) 壳 形 成 ) KSA ; ) K -(?) 状 蛋白 ) 和 c (DNA 成 熟 ) D (外壳 形 成 ) E (Lysin) (7 #) ( 主 外 壳 钉 状 蛋白 ) (DNA 凝 缩 时 的 内 部 蛋白 ) F ( 主 外 壳 蛋 白 ) (b) K 蛋白 : M SS RK: Ld UL EL a re See oS DUES RN Yi TT A. ne .C 蛋白 : DNA FFF] =: TCTGATGAGTCGAAAAATTATCTTGATAAAGCAGGAATTACTACTGCTTGTTTACGAATT ~ K&A: No uR? SG WU is ALLS FRR ot P Tee Sr) A ee ARG. : Ky cS. ky Well Aes Goi | CHa : Wenereete > LS L Ra a DNA JF] : AAATCGAAGTGGACTGCTGGCGGAAAATGAGAAAATTCGACCTATCCTTGCGCAGCTCGAG cea: PLS ee fo Pe VK N AA: CEH: 5 S Y F AST F SR ee GL hUcSlCKCUWT:CU#D” A DNA FEA) =: © AGCTCTTACTTTGCGACCTTTCGCCATCAACTAACGATTCTGTCAAAAACTGACGCGTTG 图 6 一 12 OX174 噬菌体 单 链 环 状 DNA 图 。 注 意 , 为 B 蛋 白质 编码 的 基因 (黑色 ) 被 完全 包含 在 为 A 有 蛋白质 编 码 的 基因 内 ,而 基因 开 则 与 两 个 基因 A 和 C 重 登 。 自 Kornberg(1982) 修 改 而 成 。(b) 显 示 出 与 基因 A 的 5 部 分 和 基因 CHS 部 分 重 三 的 K 基因 的 顺序 。 星 号 表示 终止 密码 子 。( 关 于 氨基 酸 的 单字 母 缩写 见 表 1 一 1)。 。96 。 DNA 顺序 也 可 能 含有 成 百 个 核 苷 酸 长 度 的 开放 阅读 框架 .如果 碰巧 这 样 一 个 阅读 框架 中 含有 一 个 起 始 密码 子 和 一 个 转录 起 始 位 点 ,或 者 通过 突变 产生 了 这 些 位 点 ,那么 ,一 条 额外 的 mRNA 就 将 会 被 转 录 出 来 ,并 随后 被 翻译 成 一 个 新 蛋白 质 。 这 一 新 产物 是 否 有 有 利 功能 那 就 是 另 一 回 事 了 ,但 如 果 它 确 有 , 则 这 种 性 状 就 可 能 会 在 群体 中 固定 。 我 们 也 注意 到 ,为 重 秋 基 因 编 码 的 DNA 区 段 上 的 进化 速率 ,预期 要 低 于 只 用 一 种 阅读 框架 的 类 似 DNA 序列 。 其 原因 是 ,在 重 至 基因 中 非 简 并 位 点 的 比例 要 高 于 非 重 友基 因 中 的 同类 比例 ,这 就 大 大 降低 了 同 义 突变 在 总 突变 中 的 比例 (Miyata 和 Yasunaga,1978). 变通 性 的 拼接 原始 RNA 转录 产物 的 变通 性 拼接 ,可 能 会 造成 从 同一 个 DNA 片段 产生 不 同 多 肽 产物 的 结果 。 在 这 种 情况 下 ,外 显 子 和 内 含 子 间 的 界限 就 不 再 是 绝对 的 了 ,而 是 有 赖 于 所 涉及 的 mRNA。 许 多 RNA 变通 性 加 工 的 例子 已 在 多 细胞 生物 中 被 发 现 。 变通 性 拼接 常 被 用 作 生 长 调节 的 手段 。 在 涉及 果 蝇 D. melanogaster 的 性 别 决定 过 程 的 几 个 基因 中 , 曾 看 到 一 种 非常 有 趣 的 情形 。 至 少 有 3 个 基因 :性 致死 基因 (Szl)、 转 化 基因 (tra) 和 倍 性 基因 (dsz) ,在 雄性 和 峻 性 中 是 以 不 同 的 方式 进行 拼接 的 (图 6 一 13)。 在 dsrz 的 情况 中 ,该 基因 有 6 个 外 显 F SBF 1.2.3 和 4 用 于 雌性 ,而 外 显 子 1.2.3、5 和 6 则 用 于 雄性 。 在 Sol 和 cra 的 情况 下 ,雄性 中 变通 性 拼接 的 产物 含有 成 熟 前 终止 密码 子 , 因 而 是 无 功能 的 。 例 如 ,Szl 的 外 显 子 3 中 含有 一 个 框架 内 的 终止 密码 子 . 但 雌性 的 mRNA 却 不 含 这 种 外 显 子 。 HEHE 前 -mRNA 雄性 mRNA 拼接 sxl 拼接 mRNA 1] 2[4]5]6]7| 8 一 一 4t-—{5 67H 8] 一 一 本 终止 tra 3 4 [2] 3 4] a aS Ae 终止 dsx Pr] “2-[3[ 4] | fi] 2 [3] 5 | 6 | 图 6 一 13 R# D. melanogaster #2 (A) Fo BEA) P KIRA (Sz), 转化 基因 (ira) 和 售 性 基因 (dsz) 的 拼 接 模 式 。“ 人 停止? 指示 一 个 终止 密码 子 , 它 截断 成 误 mRNA 的 编码 区 ,从 而 造成 产物 无 功能 。 自 Baker(1989) 。 变通 性 拼接 的 一 个 特例 可 用 由 内 含 子 编码 的 蛋白 质 的 例子 来 加 以 说 明 (Perlman 和 Butow, 1989) 。 在 这 类 例子 中 ,该 内 含 子 含 有 一 个 开放 阅读 框架 , 它 为 功能 完全 不 同 于 其 两 侧 外 显 子 所 编码 的 蛋 自 质 的 某 种 蛋白 质 全 部 或 其 一 部 分 编码 .在 有 些 情 况 下 ,这 类 开放 阅读 框架 是 其 上 游 外 显 子 的 延伸 物 ,例如 ,酵母 线粒体 基因 cor | 中 的 内 含 子 al4a( 图 6 一 14a) 。 在 另 一 些 情况 下 ,内 含 子 不 仅 包 括 一 个 游离 态 的 编码 蛋白 质 的 基因 ,而且 还 含有 关于 转录 起 始 和 终止 的 必要 信和 号 (图 6 一 14b)。 内 含 子 al4a 十 分 有 趣 ,因为 它 为 一 种 被 称 为 成 熟 酶 的 酶 蛋白 编码 。 成 熟 酶 对 这 个 内 含 子 从 它 的 前 体 mRNA 上 准 确 地 自我 拼接 去 除 是 必要 的 。 这 种 成 熟 酶 在 DNA 重组 中 还 起 着 内 切 核酸 酶 的 作用 。 要 出 现 变通 性 拼接 的 进化 ,就 需要 重新 产生 一 个 变通 性 拼接 的 联结 位 点 。 因 为 拼接 信和 号 通常 长 为 5 一 10 个 核 苷 酸 ,所 以 通过 突变 这 类 位 点 以 一 种 可 以 查 觉 的 频率 产生 是 有 可 能 的 。 事 实 上 ,从 文献 中 知道 已 有 许多 这 样 的 例子 。 例 如 ,图 6 一 15 所 示 的 例子 中 ,甘氨酸 密码 子 中 的 一 次 同 义 蔡 换 即 把 茶 一 编码 区 变 成 了 拼接 部 位 。 在 图 6 一 15 关于 有 和 #- 地 中 海 贫血 症 的 病理 学 查证 的 例子 中 ,新 的 拼接 位 点 通 常 比 老 的 拼接 位 点 更 强 ( 即 ,该 突变 发 生 后 合成 的 mRNA 大 多 数 为 已 发 生 改 变 的 那 种 类 型 )。 这 样 的 突变 显然 具有 有 害 的 后 果 ,预期 绝 不 会 在 群体 中 固定 。 然 而 ,如 果 新 产生 的 拼接 位 点 要 弱 得 多 , 则 大 多 ° 97» (a) 5 bone party yf (b) 57 3’ 图 6 一 14 内 含 子 为 蛋白 质 编码 的 例子 :(a) 一 个 开放 阅读 框架 ( 画 有 斜 条 纹 ), 它 是 上 游 外 显 子 (空心 矩形 块 ) 的 一 个 延伸 物 (例如 , 酶 母线 粒 体 基因 cor 工 中 的 内 含 子 al4a);(b) 一 个 游离 存在 的 开放 阅读 框架 ,其 转录 起 始 和 终止 信号 位 于 内 含 子 之 中 (例如 ,噬菌体 T4 P sumY RAHAST). KARA Perlman 和 Butow(1989) 。 CaccTGact 寻常 应 有 的 拼接 CAGGTTGGT 时 GIT GGT GGT GAG, GEG, GTC .G6C, AG. cTcen B- 珠 蛋白 基因 Wes) Val Gly Gly Glu Ala Leu Gly Arg ASF B+ -地 中 海 贫 血 症 基因 GTT GGA GGT GAG GCC GTG GGC AG GTTGGT 人 GAGGTGAGG @eeoeoeoe ee 寻常 应 有 的 拼接 = RAGGTRACT 、 图 6 一 15 来 自 正 常 个 体 和 吉日 -地 中 海 贫血 症 的 病人 的 8- 珠 蛋 白 基 因 中 ,外 显 子 1 和 内 含 子 工 间 区 域 的 核 昔 酸 顺序 。 发 生 了 突变 的 核 昔 酸 以 黑体 字 表 示 。 箭 头 指示 拼接 位 点 。 每 个 拼接 部 位 都 与 寻常 应 有 的 拼接 部 位 进行 顺序 比较 , 园 点 表示 这 些 拼接 部 位 与 寻常 应 有 的 拼接 部 位 间 有 相同 的 核 苦 酸 。 数 mRNA 将 是 原始 类 型 , 上 且 只 有 少量 的 新 型 mRNA 产生 出 来 。 这 样 的 改变 将 不 会 抹杀 旧 功 能 ,也 为 产生 一 种 具有 新 功能 的 有 用 的 蛋白 质 创 造 了 一 个 机 会 。 基因 分 享 从 产生 新 功能 的 观点 看 , 当 一 个 基因 产物 不 作 任何 氨基 酸 顺 序 方面 的 改变 而 用 来 行使 另外 的 功 能 时 ,一 种 令 人 极 感 兴趣 的 情形 就 出 现 了 。 这 一 现象 曾 被 命名 为 "基因 分 享 ”"( "gene sharing”) (Piatig- orsky 等 ,1988)。 基 因 分 享 的 意思 是 ,一 个 基因 在 没有 重复 也 没有 失去 原始 功能 的 情况 下 获得 了 并 保 持 着 第 二 种 功能 .不 过 ,基因 分 享 可 能 会 要 求 在 组 织 特异 性 或 发 育 时 序 性 的 调节 系统 方面 发 生 一 点 变 化 。 基因 分 享 最 初 在 晶状体 中 发 现 , 这 里 晶状体 是 构成 眼睛 的 水 晶体 赖 以 维持 透明 和 适当 的 光线 折 射 的 物质 。 最 初 的 发 现 是 ,来 自 乌 类 和 鲍 类 的 皇 晶 状 体 在 氨基 酸 顺 序 上 与 乳酸 盐 脱 氢 酶 BILLDH 一 B4, 见 第 84 页 ) 等 同 ,上 且 具 有 同样 的 LDH 活性 (Wistow 等 ,1987) 。 后 来 的 工作 表明 ,这 “两 种 ”蛋白 质 事实 上 是 同一 种 蛋白 质 , 而 且 是 由 同样 的 基因 来 编码 的 (Hendriks 等 ,1988)。 第 二 种 晶状体 8 存在 于 所 有 鸟 类 和 疏 行 类 之 中 ,也 已 被 证 明 在 顺序 方面 与 另 一 种 酶 等 同 。 这 种 酶 即 精 氨 琥 珀 酸 裂解 酶 , 它 催化 将 精 氨 焉 珀 酸 转 化 成 精 氨 酸 的 反应 。 这 两 个 蛋白 质 好 象 也 是 由 同样 的 基因 编码 的 (Piatigorsky 等 , 1988) 。 类 似 地 ,七 鳃 鳗 , 真 骨 鱼 类 , 疏 行 类 和 鸟 类 中 的 r 一 晶状体 ,已 被 证 明 与 "一 烯 醇 酶 等 同 并 由 同 样 的 基因 编码 。co 一 烯 醇 酶 是 糖 酵 解 中 的 一 种 酶 ,将 2 一 磷酸 甘油 酸 转化 成 磷酸 烯 醇 式 丙酮 酸 (Piatig- orsky 和 Wistow,1989)。 于 是 ,3 一 、 插 一 和 一 晶状体 的 例子 说 明 ,一 个 未 经 重复 的 基因 能 通过 基因 分 享 而 获得 额外 的 功能 。 另 一 方面 ,ac.8 和 7 晶状体 则 是 另 一 类 蛋白质 的 经 典 例子 ,这 类 蛋白质 通过 基因 重复 ,以 及 其 后 由 祖先 基因 分 化 成 为 不 同 蛋白 质 编码 的 基因 而 进化 (例如 , 热 震 惊 基因 ,为 暴露 于 过 热 环 境 后 才 表 达 的 蛋白 质 编码 ) 。 s ORs ~~ ba,“ "ae EC 证 aa 基因 分 享 可 能 是 相当 普通 的 现象 。 事 实 上 ,在 以 上 例子 中 ,那些 酶 和 晶状体 自身 就 可 能 有 两 种 以 上 的 功能 。 例 如 ,r* 一 品 状 体 /% 一 烯 醇 酶 也 能 象 一 个 热 震 惊 蛋白 质 那样 起 作用 。 显 然 基因 分 享 增添 了 基 因 组 的 简洁 性 ,即使 在 真 核 生 物 中 简洁 性 看 来 并 没有 很 高 的 优越 性 (第 八 章 )。 还 要 注意 ,在 晶状体 基 因 分 享 的 例子 中 ,同一 个 多 肽 既 起 着 酶 的 作用 又 有 结构 蛋白 质 的 功能 ,这 就 搅乱 了 酶 和 非 酶 、 或 结构 和 蛋白质 之 间 的 传统 界限 。 6. 10 多 基因 家 族 的 协同 进化 从 十 九 世 纪 七 十 年 代 中 期 到 十 九 世纪 八 十 年 代 中 期 ,关于 DNA 重 退 火 和 DNA 杂交 的 研究 大 量 涌现 ,目的 在 于 探 明 真 核 生物 基因 组 的 结构 和 组 织 。 这 些 研究 揭示 , 较 高 等 生物 的 基因 组 是 由 高 度 重 复 顺序 .中 度 重复 顺序 和 单 拷贝 顺序 等 3 类 序列 所 构成 的 (第 八 章 )。 它 们 还 揭示 出 一 个 有 趣 的 进化 现 象 , 即 :一 个 重复 顺序 家 族 的 成 员 在 一 个 物种 内 相互 间 一 般 是 非常 相似 的 ,而 来 自 不 同 物种 的 该 家 族 的 成 员 ,即使 这 些 物种 间 亲 缘 关 系 很 近 , 相 互 间 也 可 能 是 很 不 一 样 的 。 这 一 现象 最 先 被 布 即 等 (Brown 等 ,1972) 查 觉 ,他 们 是 在 比较 来 自 非 洲 蟾 蜂 Xenopus laevis 和 X. borealis 的 核糖 体 DNA 时 发 现 的 ,后 — FP RB RR AB AT) BIRU AEX. mulleri, 在 Xenopus 38 BAK BS HA HED PE 18S 和 28S 核糖 体 RNA 的 基因 以 成 百 的 拷 贝 数 存在 着 , 且 以 一 列 或 几 个 串联 的 列 的 形式 排列 着 。 每 一 重复 单位 由 一 个 转录 片段 和 一 个 不 转录 片 段 构成 (图 6 一 16)。 转 录 片 段 产生 一 个 45S RNA 前 体 ,该 前 体 经 酶 切割 而 被 划分 成 有 功能 的 18S 和 28S 核糖 体 RNA。 这 种 转录 重复 片段 通过 不 转录 间隔 片段 (NTS) 而 相互 隔 开 。 在 对 X. laevis Fl X. borealis 间 的 核糖 体 RNA 基因 的 比较 中 ,布朗 等 (Brown 等 ,1972) 发 现 ,虽然 这 两 个 物种 的 18S 和 28S 基因 极为 相似 ,但 这 两 个 物种 间 的 NTS 区 域 却 大 不 相同 . 相 比 之 下 ,在 每 一 个 体内 以 及 一 个 物种 的 不 同 个 体 间 .该 NTS 区 域 则 是 非常 相似 的 。 于 是 ,看 起 来 好 象 是 这 样 一 种 情 Bi: BY NTS 区 域 在 不 同 物种 间 迅 速 分 岐 ,但 它们 在 每 一 物种 中 却 是 一 起 进化 的 .布朗 等 (Brown 等 , 1972) 的 结论 是 ,一 定 有 一 种 “校正 ?机 制 在 起 作用 ,以 使 某 一 突变 从 一 个 间隔 顺序 传 向 邻近 的 间隔 顺 序 , 其 速度 快 于 在 这 些 顺序 中 出 现 新 的 变化 。 他 们 称 这 种 在 一 个 个 体内 显现 的 现象 为 水 平 进化 (hori zontal evolution) , 以 用 来 与 垂直 进化 相对 照 。 垂 直 进 化 是 指 某 一 突变 在 一 个 繁殖 群体 中 的 传播 . 后来, 有 人 提出 了 并 发 进化 (coincidental evolution) 或 协同 进化 (concerted evolution) 等 等 术语 。 后 一 个 术语 由 齐 默 尔 等 (Zimmer 等 ,1980) 提 出 ,是 目前 文献 中 最 通用 的 术语 。 45S 图 6 一 16 #44 rRNA 基因 的 一 个 典型 重复 单位 的 图 解 表示 。 黑 色 杆 线 表 示 重 复 单 位 ,箭头 指示 转录 单位 。 ETS, 外 转录 间隔 ;ITS, 内 转录 间隔 ;NTS, 不 转录 间隔 。 自 Arnheim(1983). 随 着 限制 酶 分 析 和 DNA 顺序 测定 等 技术 的 出 现 ,已 有 大 量 资料 证 明 多 基因 家 族 中 协同 进化 的 普遍 性 ( 见 Ohta,1980;Dover,1982;Arnheim ,1983 等 综述 ) 。 图 6 一 17 展示 了 一 个 来 自 人 和 黑猩猩 核 糖 体 基因 的 限制 酶 分 析 的 例子 .人 类 中 ,每 一 重复 单位 在 28S 基因 3' 端 的 NTS K PA —4 Hoya | fh 点 , 而 在 黑猩猩 和 其 他 大 型 猿 类 中 则 缺少 这 一 位 点 。 该 瓦 pa I 位 点 很 有 可 能 是 在 人 一 猿 分 枝 之 后 而 在 人 谱系 中 产生 的 ,并 且 最 终 在 每 一 个 人 的 重复 中 固定 了 。NTS 区 中 其 他 限制 性 位 点 也 同 祥 展 示 出 物种 特异 的 同 源 性 。 协同 进化 本 质 上 意味 着 ,一 个 基因 家 族 的 某 个 成 员 并 不 是 与 该 家 族 的 其 他 成 员 剖 不 相干 地 进化 着 的 。 通 过 其 成 员 间 的 遗传 相互 作用 ,一 个 多 基因 家 族 是 以 协同 的 方式 , 象 一 个 整体 一 样 地 一 起 进化 , 299 人 黑猩猩 EcoRI Hindll Belll EcoRI Hind 185 vee ae Poull Hpal Hindll Poull Poull 图 6 一 17 人 和 黑猩猩 18S 和 28S 核糖 体 基 因 中 的 限制 性 位 点 。 所 用 限制 酶 为 EcoR 1 ,Hind1 ,Puul ,Bglll ,和 末 paI 。 基 因 上 面 标 出 的 限制 位 点 在 物种 中 是 多 态 的 。 基 因 下 面 的 那些 位 点 则 是 单 态 的 。 个 三 角形 表示 NTS 中 长 。 度 上 的 多 态 性 。 自 Arnheim(1983) 修 改 而 成 。 协同 进化 的 机 制 不 等 价 交换 Cunequal crossing-over) 和 基因 转变 (gene conversion) (图 6 一 18) 近 来 被 认为 是 造成 协 (a) (b) eee. ok etek ee 和 二 起 十 RPh ye pe rue te eu 6-18 (a) 不 等 价 交换 模型 和 (b) 基 因 转变 模型 。 不 等 价 交换 的 结果 是 ,两 条 子 染 色 体 都 出 现 了 重复 数 上 的 改变 和 两 种 重复 类 型 (其 中 一 种 用 星 号 标 出 ) 的 频率 上 的 改变 ,后 者 是 与 亲本 频率 (50% ) 相 比较 而 言 的 。 另 一 方面 ,基因 转变 则 仅 在 其 中 一 条 子 染 色 体 中 改变 两 类 重复 的 频率 ,而 且 对 两 条 染色 体 都 不 改变 它们 的 总 重复 数 。 自 Arnheim (1983) 修 改 而 成 。 同 进化 的 两 个 最 重要 的 机 制 。 不 等 价 交换 可 以 发 生 在 生殖 细胞 减 数 分 裂 时 某 一 染色 体 的 两 条 姐妹 染 色 单 位 体 间 ,也 可 以 发 生 在 有 丝 分 裂 时 的 两 同 源 染色 体 间 。 一 个 交互 重组 的 过 程 就 是 在 一 条 染色 单 体 或 染色 体 中 产生 某 一 顺序 的 重复 ,而 在 另 一 条 中 则 造成 相应 的 缺失 .图 6 一 18a 展示 出 的 例子 中 ,一 次 不 等 价 交换 事件 导 至 一 条 子 染色 体 上 出 现 3 个 重复 段 的 增幅 ,而 在 另 一 条 上 则 出 现 3 个 重复 段 的 缺 失 。 这 种 不 等 价 交换 的 结果 是 ,两 个 子 染 色 体 都 变 得 比 它们 的 亲本 染色 体 更 为 同 源 化 。 如 果 这 种 过 程 反复 发 生 , 则 每 种 变异 型 重复 在 染色 体 上 的 数目 将 会 随时 间 而 波动 ,最 后 将 有 一 种 类 型 会 在 该 家 族 中 处 于 优势 . 图 6 一 19 是 一 个 假想 出 来 的 例子 ,其 中 类 型 一 4 基因 通过 反复 多 轮 的 不 等 价 交换 而 传 遍 了 某 一 个 基因 家 族 。 不 等 价 交换 曾 用 数学 方法 详细 研究 过 ,并 且 已 取得 了 相当 程度 的 实验 支持 ( 见 O- hta,1980;Dover,1982;Li 等 ,1985a 等 综述 ) 。 基因 转变 是 一 种 非 交 互 重 组 的 过 程 , 在 此 过 程 中 两 个 序列 相互 作用 的 方式 为 ,其 中 一 个 被 另 一 个 转化 ( 见 Lewin,1990)。 从 协同 进化 过 程 的 观点 看 ,基因 转变 中 最 重要 的 类 型 是 非 等 位 基因 转变 ( 即 , 位 于 不 同 基因 座位 的 基因 间 的 转变 ,而 不 是 不 同 的 等 位 基因 形式 间 的 转变 )。 图 6 一 18b 是 一 个 非 等 位 基因 转变 的 例子 ,其 中 野生 型 重复 中 有 两 个 转化 成 了 突变 型 。 结 果 ,第 一 条 子 染 色 体 变 得 比 亲 本 染色 体 更 为 同 源 些 ,而 在 第 二 条 子 染 色 体 中 却 未 发 生变 化 。 理 论 研究 表明 ,和 不 等 价 交换 一 样 , 基 因 转 变 也 能 产生 协同 进化 (Ohta,1984; Nagylaki, 1984) 。 基 因 转 变 曾 经 作为 7Y- 珠 蛋白 基因 (Jeffreys,1979; Scott 等 ,1984) 和 另外 许多 基因 中 ( 见 Dover,1982) 出 现 同 源 化 的 机 制 而 提出 来 过 。 作为 一 种 协同 进化 的 机 制 , 基 因 转变 看 来 有 几 个 胜 过 不 等 价 交换 的 优点 。 首 先 , 不 等 价 交 换 使 一 个 家 族 中 的 重复 基因 的 数目 发 生 改 变 , 故 而 有 时 可 能 会 造成 严重 的 份量 不 平衡 。 基 因 转 变 则 相反 ,并 不 造成 基因 数目 改变 。 其 次 ,基因 转变 不 仅 能 对 串联 的 重复 、 而 且 能 对 分 散 的 重复 起 着 校正 机 制 的 作 - 用 。 相 比 之 下 ,不 等 价 交换 在 所 涉及 的 重复 散布 于 非 同 源 染 色 体 上 时 就 受到 了 限制 。 如 果 这 些 重复 基 。100 。 图 6 一 19 由 不 等 价 交换 导 至 的 协同 进化 。 不 等 价 交 换 事 件 反 复 循 环 使 得 每 一 染色 体 上 重复 基因 变 得 越 来 越 同 源 化 。 该 过 程 还 会 影响 每 一 染色 体 上 重复 顺序 的 数目 。 自 Ohta,(1980)。 因 位 于 染色 体 的 端 粒 部 位 (染色 体 臂 的 末端 ), 象 在 人 和 猿 的 rRNA 基因 中 的 情况 那样 ,或许 它 能 对 非 同 源 染 色 体 起 有 效 作 用 ;而 阁 分散 的 重复 位 于 染色 体 的 中 间 , 象 在 小 鼠 的 rRNA 基因 中 的 情况 那 样 , 则 它 将 受到 极 大 限制 (Arnheim,1983)。 如 果 这 些 重 复 散 布 在 一 条 染色 体 上 , 则 不 等 价 交换 可 能 会 导致 重复 段 间 基因 的 缺失 或 重复 这 样 的 结果 。 例 如 ,图 6 一 20 表示 两 重复 簇 间 不 等 价 交换 的 一 个 假想 重复 重复 图 6 一 20 涉及 散布 重复 (空心 矩形 块 ) 的 交换 。 画 有 针 条 纹 的 憩 形 块 表示 一 个 唯一 的 基因 。 该 交换 事件 后 ,这 一 基 因 在 一 条 染色 体 上 缺失 ,而 在 另 一 条 染色 体 上 则 重复 。 的 例子 ,结果 是 一 条 染色 体 中 某 一 唯一 基因 的 缺 失 , 而 在 另 一 条 染色 体 中 则 相应 地 重复 。 其 中 一 条 染 色 体 或 者 全 部 两 条 染色 体 ,可 能 会 对 携带 它们 的 生物 带 来 有 害 影 响 。 第 三 ,基因 转变 可 以 有 偏向 性 的 方向 。 来 自 真菌 的 实验 资料 已 经 表明 ,基因 转变 方向 上 的 倾斜 是 普遍 的 、 而 且 和 常常 是 强烈 的 (Lamb 和 Helmi, 1982) ,而 理论 研究 业已 证 明 , 轻 微 的 倾斜 就 可 能 对 重复 突变 的 固定 概率 有 很 大 影响 (Nagylaki 和 Petes,1982;Walsh,1985) 。 在 串 联 重复 顺序 的 大 家 族 中 ,不 等 价 交 换 可 能 象 基因 转变 一 样 是 一 个 可 接受 的 过 程 。 首 先 , 在 这 类 家 族 中 ,重复 的 数目 显然 能 极 大 地 波动 而 不 至 引起 显著 的 逆 效 应 。 这 是 从 以 下 观察 中 得 出 的 结论 : © 10] * 果 蝇 中 确定 RNA 的 基因 的 数目 在 同一 物种 的 不 同 个体 间 ,以 及 不 同 物种 间 变 化 幅度 大 (Ritossa 等 , 1966;Brown 和 Sugimoto,1973)。 在 人 类 中 ,已 发 现 几 个 串联 重复 的 家 族 , 它 们 在 拷贝 数 方面 展现 出 异乎 寻常 的 变化 程度 (Nakamura 等 ,1987》。 其 次 ,在 一 次 基因 转变 事件 中 ,通常 只 有 一 个 小 区 域 ( 异 源 双 链 区 ) 涉 及 ,而 在 不 等 价 交 换 中 ,染色 体 间 交换 的 重复 数 则 可 能 非常 大 。 显 然 , 交 换 的 重复 数 越 大 , 协同 进化 的 速率 就 越 高 (Ohta,1983)。 在 有 些 情形 下 ,不 等 价 交换 的 这 一 优点 可 大 到 足以 与 基因 转变 的 优点 相 抗衡 。 除 不 等 价 交 换 和 基因 转变 之 外 ,还 有 一 些 其 他 机 制 , 象 复制 滑脱 和 转 座 ( 第 一 章 和 第 七 章 ), 也 能 造成 某 一 家 族 中 变异 型 基因 的 获得 或 丢失 (Dover,1982)。 最 后 ,应 注意 到 ,协同 进化 不 仅 要 求 突变 在 该 家 族 成 员 间 的 水 平 转移 ( 同 源 化 ) ,而 且 要 求 突变 向 群体 中 的 所 有 个 体 传播 (固定 )。 所 以 ,我 们 还 需 要 考虑 随机 遗传 潭 变 的 效应 。 多 费 (Dover,1982,1986) 对 在 DNA 转移 和 随机 遗传 漂 变 等 各 种 机 制 联 合作 用 下 ,多 基因 家 族 的 协同 进化 过 程 , 起 了 一 个 名 称 , 即 分 子 驱动 (molecular drive) 。 协同 进化 的 进化 论 含意 协同 进化 使 得 某 一 变异 型 重复 能 传 向 所 有 基因 家 族 的 成 员 。 这 种 水 平地 传播 的 能 力 有 着 深远 的 进化 后 果 , 因 为 这 样 一 来 ,一 个 有 利 突变 型 重复 就 能 替代 所 有 其 他 重复 而 在 该 家 族 中 固定 。 我 们 注意 到 ,单单 一 个 变异 型 所 能 给 予 生物 的 选择 优势 通常 是 很 有 限 的 。 然 而 ,如 果 该 突变 传 给 了 许多 甚至 所 有 成 员 的 话 , 则 这 种 优势 就 会 大 大 地 加 强 。 于 是 ,通过 协同 进化 ,一 个 较 小 的 选择 优势 可 以 变 成 较 大 的 选择 优势 。 在 这 方面 ,协同 进化 优 于 基因 家 族 各 个 成 员 的 独立 进化 ( 见 Arnheim, ,1983;Walsh,1985) 。 阿 恩 海 姆 (Arnheim ,1983) 曾 对 RNA 多 聚 酶 | 的 转录 调控 信号 和 RNA 多 聚 酶 工 的 转录 调控 信 号 的 进化 进行 过 比较 。RNA 多 聚 酶 I 只 转录 rRNA 基因 ,而 RNA 多 聚 酶 工 则 转录 所 有 为 蛋白 质 编 码 的 基因 (第 一 章 )。RNA 多 聚 酶 I 的 转录 调控 信号 的 进化 看 来 比 RNA 多 聚 酶 工 的 该 信号 的 进化 要 快 得 多 。 例 如 ,在 无 细胞 转录 系统 中 ,一 种 小 鼠 rRNA 克隆 不 能 在 人 的 细胞 提取 物 中 转录 ,但 来 自 差 异 极 明显 的 物种 的 蛋白 质 编码 基因 的 克隆 却 能 够 在 异 源 系统 中 转录 (例如 ,家 短 的 基因 在 人 的 细胞 提 取 物 中 ,和 哺乳 类 的 基因 在 酵母 的 提取 物 中 )。 阿 恩 海 姆 (Arnheim,1983) 认 为 ,在 关于 RNA SRB | 的 转录 单位 的 例子 中 ,倾向 于 影响 转录 起 始 的 那些 有 利 突变 , 因 协 同 进化 所 造成 的 后 果 可 能 已 传播 到 整个 rRNA 多 基因 家 族 。 与 之 不 同 的 是 ,在 关于 RNA 多 聚 酶 工 的 转录 单位 的 例子 中 ,在 任何 二 个 基 因 中 发 生 的 影响 转录 起 始 的 有 利 突变 ,预期 将 不 会 传 禹 所 有 基因 ,因为 它们 属于 许多 不 同 的 家 族 。 关于 新 基因 产生 的 传统 观点 是 , 先 发 生 一 次 基因 重复 事件 ,然后 该 重复 产生 的 两 个 基因 之 一 逐渐 分 化 而 变 成 一 个 新 基因 。 现 已 搞 清 ,该 过 程 可 能 不 象 以 前 所 假定 的 那样 简单 。 只 要 两 个 基因 分 岐 的 程 度 不 是 很 大 , 则 那个 发 生 分 化 的 拷贝 就 有 可 能 通过 不 等 价 交换 而 被 清除 ,或 者 通过 基因 转变 而 转化 成 保持 原样 的 拷贝 。 在 前 一 种 情况 下 , 它 需 要 再 发 生 一 次 重复 以 产生 一 个 新 的 多 余 拷 贝 ;而 在 后 一 种 情 况 下 则 必须 从 头 开始 分 化 。 所 以 ,重复 基因 的 岐 化 进程 可 能 比 传统 上 认为 的 要 慢 得 多 ,为 此 缘故 一 个 新 基因 从 某 一 多 余 拷 贝 中 产生 的 机 会 就 减少 了 。 另 一 方面 ,基因 转变 也 可 能 会 阻止 一 个 多 余 的 拷贝 长 时 期 地 成 为 无 功能 状态 ,或 者 也 许 能 有 选择 地 使 一 个 “ 死 基因 ”( 假 基因 ) 复 活 过 来 (Walsh,1987) 。 我 们 已 经 习惯 于 假定 ,在 一 次 基因 重复 之 后 ,两 个 随 之 而 来 的 基因 将 随时 间 单调 地 上 岐 化 着 。 在 这 样 的 假定 下 ,我 们 前 面 已 经 证 明 ,推测 重复 事件 的 时 间 是 相当 简单 的 。 例 如 ,人 B 一 和 8 一 珠 蛋 白 的 蛋 白质 顺序 相互 间 相 似 的 程度 比 与 兔 Bl 或 与 小 鼠 B 的 主要 和 次 要 顺序 的 要 高 (Dayhoff,1972)。 因 此 曾 有 过 这 样 的 推测 :人 的 这 两 个 基因 是 从 约 4000 万 年 以 前 的 一 次 重复 事件 中 衍生 而 来 的 ,这 个 时 间 远 在 哺乳 类 辐射 ( 约 8000 万 年 以 前 ) 之 后 。 考 虑 到 重复 基因 能 相互 较 正 这 样 一 个 事实 , 则 这 一 结论 就 可 能 是 错误 的 。 事 实 上 ,近来 已 经 有 人 提出 ,8 和》 基因 起 源 于 发 生 在 哺乳 类 辐射 之 前 的 一 次 重复 (Hardison 和 Margot,1984)。 该 提议 是 根据 这 样 的 观察 事实 而 作出 的 , 免 假 基因 灿 2 的 大 内 含 子 和 3’ 不 翻译 区 与 人 的 8 的 相似 程度 比 与 免 Bl 的 高 ,小 鼠 的 假 基因 Bh3 相似 于 其 3 未 端 上 的 8。 如 果 这 一 候 说 结果 是 正确 的 , 则 以 上 例子 极 好 地 说 明了 ,基因 一 校正 事件 将 会 怎样 部 分 或 全 部 地 抹 擦 掉 重 复 基因 间 分 歧 进 化 的 历史 .在 大 的 多 基因 家 族 中 ,基因 一 校正 事件 预期 是 频频 发 生 的 ,在 这 种 情况 下 ,追踪 家 族 成 员 间 的 进化 关系 将 会 更 为 困难 。 。 102。 从 进化 论 的 观点 看 ,多 基因 家 族 的 进化 和 分 群体 的 进化 之 间 存 在 着 某 种 类 比 。 我 们 可 以 把 多 基因 家 族 中 的 每 一 种 重复 看 成 是 分 群体 中 的 一 种 同类 群 。 那 么 重复 间 信 息 的 传递 就 等 价 于 同类 群 间 基 因 或 个 体 的 迁移 。 众 所 周知 ,迁移 将 减少 两 同类 群 间 遗 传 差 异 的 量 , 但 会 增加 一 个 同类 群 中 的 遗传 变异 的 量 ( 例 如 等 位 基因 的 数目 )。 类 似 地 ,重复 间 的 信息 传递 将 会 减少 重复 间 的 遗传 差异 但 将 增加 某 一 基 因 座 位 上 的 遗传 变异 的 量 (Ohta,1983,1984;Nagylaki,1984)。 小 鼠 主 组 织 相 容 复 合体 中 某 些 基因 座 位 是 高 度 多 态 的 ,事实 上 ,已 观察 到 某 一 基因 座位 上 的 等 位 基因 数 多 达 50 个 .所 以 , 曾 有 人 提出 ,这 种 程度 较 高 的 多 态 性 是 由 基因 转变 所 造成 的 (例如 Weiss 等 ,1983; 但 可 参阅 Hughes 和 Nei,1989 ) 。 习题 1、 与 某 一 随机 选 出 的 DNA 片段 的 重复 相 比 ,外 显 子 重复 有 什么 优点 ? 2、 在 重 琵 基 因 中 , 简 并 位 点 的 数目 能 大 大 地 被 削减 。(a) 如 果 下 面 的 顺序 仅 按 第 1 个 阅读 框架 翻 译 , 那 么 将 有 多 少 非 简 并 位 点 ? 多 少 四 重 简 并 的 位 点 ? (b) 如 果 除 了 第 一 个 阅读 框架 外 ,该 顺序 也 按 第 2 个 阅读 框架 翻译 ,那么 将 有 多 少 非 简 并 位 点 和 四 重 简 并 位 点 ? 〈c) 如 果 3 个 阅读 框架 都 进行 翻译 , 那 么 该 顺序 中 的 非 简 并 位 点 和 四 重 简 并 位 点 将 是 多 少 ? 〈3 个 阅读 框架 的 起 始点 各 用 箭头 标 出 )。 CATTCGTCTTTATTCGAAATCGCGTGGACAGCGGTGGATCTCTTTGCGCTGTGCAAAGCAGCGCTGGCGGTT 2 3 3、\ 许 多 多 聚 体 蛋白 质 是 由 重复 基因 编码 的 亚 基 所 构成 。 有 两 种 可 能 情况 :(a) 这 些 亚 基 可 能 全 部 来 自 一 个 基因 座位 ,也 可 能 来 自 不 同 的 基因 座位 。 在 前 一 种 情况 下 该 蛋白 质 被 称 为 是 “ 同 质 型 的 ”, 而 后 一 种 情况 下 则 是 “ 异 质 型 的 "。 假 定 该 蛋白 质 象 乳酸 脱 氢 酶 (LLDH, 见 第 84 页 原版 ) 那 样 是 一 种 四 聚 体 酶 , 且 其 所 有 亚 基 由 两 个 基因 座位 编码 .那么 ,能 产生 多 少 种 不 同 的 同 功 酶 ?(b) 这 样 的 蛋白 质 常 常 是 异 质 型 的 ( 即 ,常常 是 由 不 同 基因 座位 产生 的 亚 基 所 构成 的 )。 例 如 ,哺乳 类 成 体 的 血红 蛋白 是 一 个 由 两 条 链 和 两 条 有 B 链 构成 的 四 聚 体 . 假 定 在 某 一 种 哺乳 动物 中 有 3 个 % 样 基因 座位 和 2 个 B 样 基因 座 位 。 那 么 ,如 果 每 一 个 四 聚 体 是 由 两 个 a 样 基因 座位 产生 的 亚 基 和 两 个 B 样 基因 座位 产生 的 亚 基 所 构 成 的 话 , 则 能 产生 多 少 不 同 的 异 质 型 四 聚 体 ? 4 在 大 鼠 和 小 鼠 的 基因 组 中 有 两 个 为 胰岛 素 编码 的 基因 (前 胰岛 素 原 工 和 I), 而 在 除 呈 齿 类 以 外 的 哺乳 动物 中 则 只 有 一 个 胰岛 素 基 因 。 前 胰岛 素 原 I 基因 被 认为 是 通过 一 个 上 所谓“ 反 录 转 座 “”( 第 七 章 ) 的 过 程 而 产生 的 。 前 胰岛 素 原 I 和 工 这 两 个 基因 都 在 5' 不 翻译 区 中 含有 一 个 小 内 含 子 (长 为 118 个 核 苷 酸 )。 大 鼠 和 小 鼠 中 的 内 含 子 对 子 间 , 核 苷 酸 差异 数 如 下 : 内 合子 内 含 子 小 鼠 1 小 鼠 I KA 1 yf 1 21 A fat I 15 25 AK fa 16 24 18 Ca) REE AY BCE aS 4 ly BT BE EDC BR) BE BL PY A) EDA A 进化 快 ,为 什么 ?(b) 假 定 核 苷 酸 替 换 的 速率 恒定 ,并 且 假 定 小 鼠 和 大 鼠 在 1500 万 年 前 发 生 分 岐 ,请 用 小 鼠 I 和 大 鼠 工 但 排除 小 鼠 工 ,来 估计 前 胰岛 素 原 1 和 工 间 的 分 岐 时 间 。 5、 在 以 下 顺序 的 内 含 子 (虚线 ) 中 插入 一 个 0 一 0 对 称 外 显 子 。 那 么 对 阅读 框架 而 言 将 会 发 生 什么 ? 如 果 插 入 一 个 2 一 2 对 称 外 显 子 会 发 生 什 么 呢 ? 如 果 插 入 一 个 不 对 称 外 显 子 又 会 发 生 什 么 ? SCOTTCGITCT TTA TTC GAA ATC GCG 一 一 一 TGG ACA GCG GTG AAT CTC TTT GAC GCT GTG—3’ 6 ,为 什么 一 个 串联 重复 的 家 族 能 比 一 个 散布 重复 的 家 族 更 容易 经 历 协同 进化 ? 请 解释 « 103 。 后 继 阅读 文献 Cold Spring Harbor Symposium on Quantitative Biology. 1987. Evolution of Catalytic Function, Vol. 52. Cold Spring Harbor Laboratory. Cold Spring Habor, NY. Dayhoff, M. O. 1972. Atlas of Protein Sequence and Structure, Vol. 52. National Biomedical Re- search Foundation, Silver Spring, MD. ) , Dover, G. A. and R. B. Flavell. (eds) . 1982. Genome Evolution, Academic Press, New Reales Li, W. 一 H. 1983. Evolution of duplicate gene and pseudogene, pp 14—37. In M. Nei and R. K. Koehn (eds. ) , Evolution of Genes and Protein. Sinauer Associates, Sunderland MA. Ohno , S. 1970. Evolution by Gene Puplication, Springer-Verlag, Berlin. ; Ohta, T. 1980. Evolution and Variation of M wegen Families. Springer- -Verlage, JR oath, Le «104 « 7 由 转 座 造成 的 进化 基因 组 曾经 被 认为 是 相当 静止 的 实体 ,在 其 中 可 以 给 基因 指定 一 个 界限 明确 的 基因 座位 。 因 此, 基因 被 想象 成 在 漫长 的 进化 时 期 里 一 直 停 留 在 它们 正好 所 处 的 染色 体位 置 上 。 当 芭 芭 拉 .麦克 林 托 克 (Barbara McClintock ) 在 十 九 世 纪 四 十 年 代 发 现 玉米 中 的 某 些 遗传 成 份 能 从 一 个 基因 组 座位 " 跳 到 ?” 另 一 个 上 ,不 时 地 改变 着 结构 基因 的 表达 时 ,基因 组 的 这 种 静态 图 景 开 始 崩 省。 然而 ,这 种 凝固 静止 的 图 景 在 科学 思想 界 中 已 积 习 难 改 , 以 至 于 人 们 花 了 近 40 年 的 时 间 才 认识 到 麦克 林 托 克 这 一 开创 性 发 现 的 意义 。 今 天 我 们 认识 到 ,基因 组 的 结构 组 织 比 以 前 所 想象 的 要 更 富 于 流动 性 ` 且 更 易于 发 生 进 化 变化 。 在 这 一 章 里 ,我 们 将 描述 大 量 有 助 于 遗传 物质 从 一 个 基因 组 处 位 向 另 一 个 处 位 运动 的 可 转 座 因 子 , 并 且 讨 论 这 类 因子 对 进化 过 程 可 能 会 产生 的 影响 。 7.1 转 座 与 反 录 转 座 转 座 (transposition ) 的 定义 是 ,遗传 物质 从 一 个 染色 体位 置 向 另 一 个 位 置 的 运动 。 具 有 能 改变 其 基因 组 位 置 这 种 内 在 光 能 的 DNA 序列 ,被 称 为 易 动 因子 (mobile elements) 或 可 转 座 因子 (transpos- able elements) .根据 可 转 座 因 子 是 否 被 复制 来 区 分 , 则 有 两 种 类 型 的 转 座 。 在 保守 型 (conservative ) 转 座 中 ,该 因子 从 一 个 位 点 移 到 另 一 个 位 点 (图 7 一 la) , 供 体位 点 上 发 生 了 什么 则 不 清楚 .有 一 种 模型 提 tH, PEAR DNA 的 末端 不 是 相互 连结 的 ,因而 转 座 后 剩余 下 来 的 分 子 就 瓦解 了 。 然 而 ,如 果 细 胞 含有 该 供 体 序列 的 重复 , 则 该 供 体 DNA 种 即 可 避免 从 细胞 谱系 中 丢失 。 在 这 种 情况 下 ,虽然 消耗 了 一 个 拷 贝 ,但 另 一 个 却 幸 存 了 下 来 ,由 此 而 产生 的 谱系 将 在 原始 位 点 上 有 一 个 因子 ,而 在 新 位 点 上 有 第 2 个 因 子 (Berg 等 ,1984) 。 另 一 种 模型 提出 ,该 双 链 断裂 是 由 宿主 的 修复 系统 所 修复 的 。 在 复制 (型 )(replicative) 或 重复 (型 ) (duplicative) 转 座 中 ,可 转 座 因 子 被 拷贝 ,并且 其 中 一 个 拷贝 留 在 原 位 点 处 , 另 一 个 则 插入 一 个 新 位 点 中 (图 7 一 1b)。 所 以 ,复制 型 转 座 的 特征 是 可 转 座 因子 的 拷贝 数 的 增加 .有些 可 转 座 因子 只 采用 一 种 类 型 的 转 座 , 而 另 一 些 则 对 保守 型 和 复制 型 两 种 方式 全 采用 。 在 以 上 转 座 类 型 中 ,遗传 信息 由 DNA 所 携带 。 已 知 遗 传 信息 也 能 通过 RNA 而 转 座 。 在 这 种 模式 中 ,DNA 被 转录 成 RNA, 然 后 RNA 再 反 转 录 成 cDNA( 图 7 一 1C)。 为 了 将 这 两 种 模式 加 以 区 别 ,我 们 把 由 RNA 中 介 的 模式 称 为 反 录 转 座 (retroposition ) 。 转 座 与 反 录 转 座 都 曾 既 在 真 核 生物 中 又 在 原核 生物 中 发 现 ( 见 Weiner 等 ,1986;Temin,1989)。 与 由 DNA 中 介 的 转 座 相 比 , 反 录 转 座 总 是 复制 型 的 , 因为 被 转 座 的 是 该 因子 的 反 转 录 拷 贝 , 而 不 是 该 因子 本 身 。 当 一 个 可 转 座 因 子 插入 一 个 宿主 基因 组 中 时 ,在 该 插入 位 点 处 的 一 小 段 宿 主 DNA( 通 常 为 4 一 12bp) 被 复制 (图 7 一 1)。 这 种 经 复制 的 重复 有 同一 取向 ,因而 被 称 为 顺 向 重复 (direct repeats) 。 这 是 转 座 和 反 录 转 座 的 特征 标记 。 有 些 可 转 座 因子 能 转 座 到 所 有 细胞 中 去 ;而 另 一 些 则 是 高 度 特异 的 。 例 如 , 果 蝇 DD. melanogaster 的 已 因子 通常 仅 在 生殖 细胞 中 是 易 动 的 。 转 座 的 接受 位 点 的 基因 组 位 置 在 不 同 可 转 座 因 子 中 也 表现 出 有 变异 。 有 些 因子 对 某 一 特别 的 基因 组 位 置 表 现 出 不 寻常 的 偏爱 。 例 如 ,7S4 总 是 精确 地 将 自己 控 人 到 大 肠 杆 菌 的 半 乳 糖苷 酶 操纵 子 中 的 同一 点 上 ,所 以 ,每 个 细菌 只 能 含有 一 个 拷贝 的 TS4(Klaer 等 ,1981) 。 另 外 一 些 , 象 噬菌体 Mw, 则 能 随机 地 转 座 到 几乎 任何 基因 组 位 置 上 。 许 多 可 转 座 因 子 则 表 现 出 中 等 程度 的 基因 组 位 置 偏向 性 。 例 如 , 玖 .coii 的 Tzl10 转 座 子 ,其 40 被 发 现 位 于 ac Z 基因 中 ,成 为 基因 组 的 精细 结构 部 分 ; 己 因 子 对 X 染色 体 有 亲 合 性 , 且 偏 向 于 插 人 从 5 端 靠 近 基 因 编 码 区 的 序列 中 ,而 不 是 编码 区 之 中 .有 些 可 转 座 因子 对 某 种 特别 的 核 苷 酸 组 成 展示 出 有 更 高 的 亲 合 性 .例如 ,Ts1 . 105 (a) 可 转 座 因子 = Oe ree A Se 一 一 和 一 一 Ee Rs ? —_—_—_ — 本 一 供 体 接受 物 村 , (b) 可 转 座 因 子 = . oy A a a esd ee | xm EN 三 上 —S—_ YY 供 体 接受 物 (c) 可 转 座 因子 ca ca, 一 一 -一 加 -一 一 一 | 二 eS WS | | mas 2 SA 整合 —_ 二 -一 一 供 体 接受 物 图 7 一 1 (ay) 保 守 型 转 座 。 该 因子 从 供 体 位 点 转 座 到 靶 位 点 。 供 体位 点 处 发 生 了 什么 则 不 清楚 。 该 供 体 分 子 可 能 会 瓦解 ,这 对 于 具有 一 个 以 上 染色 体 找 贝 的 细菌 而 言 是 可 以 忍 受 的 。 另 一 种 可 能 性 是 ,该 双 链 的 断裂 处 被 宿主 的 修复 系统 所 修复 。(b) 复 制 型 转 座 。 该 因子 被 复制 ,并 且 有 一 个 拷贝 插入 一 个 靶 位 点 处 ,而 另 一 个 拷贝 则 保留 在 供 体位 点 上 。 关 于 保守 型 和 复制 型 转 座 的 更 详细 解释 可 参阅 Lewin (1990)。(c) 反 录 转 座 。 该 因子 转录 成 RNA, 然 后 RNA 再 反 转 录 成 DNA。 该 DNA 拷贝 插入 宿主 基因 组 。 作 为 反 录 转 座 的 一 个 例子 可 见 图 7 一 4。 注 意 , 转 座 与 反 录 转 座 都 会 在 新 插入 成 份 的 两 端 各 产生 一 小 段 重 复 ( 黑 矩形 块 )。 偏爱 富 含 AT 的 插入 位 点 (Devos 等 ,1979) 即 是 如 此 。 7.2 可 转 座 因 子 可 转 座 因子 ,根据 其 转 座 模式 和 其 所 含 基因 的 数目 与 类 型 ,可 分 成 三 类 :插入 序列 、 转 座 子 和 反 录 因子 。 插入 序列 4fi A FF 9 Cinsertion sequences) 是 最 简单 的 可 转 座 因 子 。 它 们 除 具 有 为 转 座 所 必需 的 部 分 外 不 带 上 。106。 toe See ig > Senin Se ea | ee. 9 + tang FE fal it 18 fs B.A Fe HE KK Eb i HF 700 — 2500bp, & Ze AM BA, EB PS RA FE OK PA fa A Fr 5) eB a TS 加 上 后 随 的 类 型 号 数 来 表示 。 一 个 来 自 肠 道 细 菌 E. coli Shigella dysinteria 的 插 人 序列 ,7S1 的 结构 ,如 图 7 一 2a 所 示 。7531 在 长 度 上 约 为 770 个 核 苷 酸 , 包 括 两 个 颠倒 的 非 等 同 末 端 重 复 ,每 个 各 23bp。 它 含有 两 个 阅读 框架 ,7zs4 和 7zsB,, 它 们 为 一 种 或 两 种 形式 的 转 座 酶 (transposase) 编码 。 转 座 酶 是 一 种 催化 可 转 座 因子 向 插入 位 点 插入 的 酶 在 五 .co 中 有 几 十 种 不 同类 型 的 插入 人 序 列 , 从 自然 界 分 离 出 的 品系 ,其 大 多 数 的 基因 组 中 所 含 每 种 序列 的 数 是 可 变 的 (Sawyer 等 ,1987) 。 转 座 子 转 座 子 (transposons) 是 易 动 因子 ,通常 长 为 2500 一 7000bp 左右 ,大 多 数 在 基因 组 中 作为 散在 重 复 顺 序 的 家 族 而 存在 。 它 们 与 插入 序列 的 区 别 是 还 带 有 所 谓 外 源 性 基因 (exogenous genes) , il — #6 4 除 与 转 座 有 关 的 功能 之 外 的 功能 蛋白 质 编 码 的 基因 。( 注 意 , 在 有 些 文献 中 命名 方式 较 混 乱 , 有 时 转 座 子 这 个 术语 被 用 来 指 所 有 可 转 座 因子 ,包括 插入 序列 ` 反 录 转 座 子 等 .) 在 细菌 中 , 转 座 子 用 前 组 Tn 和 后 随 的 类 型 号 数 来 表示 .有 些 细菌 转 座 子 是 复合 转 座 子 (complex tremsposons) 或 混合 转 座 子 (com- posite transposons) ,这 样 命 名 是 因为 ,有 两 个 完整 而 独立 的 可 转 座 插入 序列 以 任意 一 种 排 向 从 两 个 侧 面 夹 拥 着 一 个 或 多 个 外 源 性 基因 (图 7 一 2b). 有 趣 的 是 ,在 复合 转 座 子 情况 下 ,不 仅 整个 转 座 子 能 作为 一 个 整体 转 座 , 而 且 两 侧 的 一 个 或 两 个 择 和 序列 还 能 独立 地 转 座 .。 因 为 转 座 的 功能 是 由 揪 人 序列 编码 的 ,所 以 .复合 转 座 子 通常 不 含有 一 种 独立 的 转 座 酶 基因 。 (a) 1st Plea] cB (b) Tr9 》 151 IS (c) Tr -(d) oj pm dtm xe Uma YORE 图 7 一 2 maPHOPTE RAT HRA. ZEACATMEEZ. (AKA E. coli f° Shigella dysenteria 的 插 入 序列 TS1 两 侧 由 长 为 23bp 的 不 完美 颠倒 重复 所 夹 拥 。(b) 来 自 巨 .coiz 的 复合 转 座 子 Tnz9, 含 有 两 拷贝 7S1, 分 别 位 于 co 基因 两 侧 。cat 基 因为 具有 和 氟 霉 素 抗 性 的 蛋白 质 编 码 。(c) 来 自 玖 .coli 的 转 座 子 Tmn3, 能 产生 链 霉 素 抗 性 ,含有 3 个 基因 , 其 中 两 个 (tmzzpR 和 pa) 在 一 条 链 中 转录 ,第 三 个 (imp4) 则 在 另 一 条 中 转录 。T7mz3 两 侧 都 有 长 为 38bp 的 完美 fi) SB .(d) & A Staphilococcus aureus 的 T7z554 缺 少 末 端 重复 ,含有 5 个 基因 和 1 个 开放 阅读 框架 (ORF)。 其 中 3 个 A (inpA.tnpB 和 z 加 pbpC) 为 转 座 酶 编码 , 且 作 为 一 个 单位 而 被 转录 。spc 和 ermA ARAM FMR EME FR fo SEHK spo 基因 为 依赖 S 一 腺 若 甲 硫 氨 酸 的 甲 基 化 酶 编码 ,是 在 与 别 的 基因 不 同 的 链 中 转录 的 。ORF 被 大 量 转录 ,但 是 否 被 翻译 则 尚 不 得 而 知 。 画 有 斜 条 纹 的 矩形 块 不 含 开放 阅读 框架 。 其 他 的 细菌 转 座 子 ,以 及 许多 真 核 生 物 的 转 座 子 ,其 两 侧 只 有 较 短 的 不 同 取向 的 重复 顺序 (图 7 一 2c) ,并 且 不 含 插入 序列 。 然 而 ,并 非 所 有 转 座 子 都 是 在 结构 上 对 称 的 .有 些 具 有 不 对 称 的 末端 ,缺少 颠 倒 的 或 顺 向 的 末端 重复 (图 7 一 2d)。 动 物 中 有 些 转 座 子 (例如 果 蝇 中 的 尸 因子) 的 编码 区 被 内 含 子 所 隔断 (图 7 一 3)。 Lt mT | 图 7 一 3 X88 D. melanogaster 的 书 因 子 的 模式 结构 图 .该 因子 两 仙 有 长 为 31bp 的 短 颠 倒 重复 ,其 编码 区 含有 4 个 外 显 子 ( 白 和 矩形 块 ), 由 3 个 内 含 子 ( 黑 和 矩形 块 ) 所 隔断 。 该 因子 长 为 2900bp 左右 。 细菌 中 的 转 座 子 常常 带 有 这 样 一 些 基 因 ,它们 能 给 予 携带 者 以 抗生素 抗 性 (如 T”*554) ,重金 属 搞 性 (如 Tz21) 或 抗 热 性 (如 Tz1681)。 质 粒 则 可 把 这 样 一 些 转 座 子 从 一 个 细胞 带 到 另 一 个 细胞 , 结 采 , w 了 OA 抗 性 就 能 迅速 传 遍 到 整个 暴露 于 这 样 一 些 环境 因子 中 的 细菌 群体 中 。 有 几 种 吹 菌 体 事 实 上 是 细菌 中 的 转 座 子 ,或 转 座 性 鸣 菌 体 (transposing bacteriophages) 例 如 , WE tk Mu 就 是 一 个 非常 大 的 转 座 子 (一 38000bp) , 它 不 仅 为 那些 调控 其 转 座 的 酶 编码 ,而且 还 为 大 量 构 成 其 DNA 包装 所 必需 的 结构 蛋白 质 编码 。 许多 类 型 的 转 座 子 在 动物 、 植 物 和 真菌 的 基因 组 中 广泛 分 布 .例如 果 蝇 DD. melanogaster 就 含有 50 一 100 种 不 同类 型 的 转 座 子 ,而 且 都 是 多 重 拷贝 的 (Rubin,1983) 。 反 录 因子 反 录 因子 (retroelements) 是 含有 一 个 为 反 转 录 酶 编码 的 基因 的 DNA 序列 或 RNA 序列 , 反 转 录 酶 则 催化 以 RNA 为 模板 的 DNA 的 合成 。 由 此 而 产生 的 DNA 分 子 称 互补 (的 )DNA (complementary DNA. cDNA)。 这 些 的 确 转 座 的 反 录 因子 是 通过 反 录 转 座 过 程 而 转 座 的 .有 一 些 不 同类 型 的 反 录 因 子 ,我 们 采用 由 特 明 (Temin,1989) 提 出 的 分 类 ,并 将 它们 列 于 表 7 一 1。 反 录 病毒 (retroviruses) 是 一 些 结构 上 类 似 于 转 座 子 的 RNA 病毒 .虽然 它们 是 所 有 反 录 因子 中 最 复杂 的 ,但 我 们 还 是 最 先 讨 论 它 们 ,因为 反 录 转 座 概 念 起 源 于 对 反 录 病毒 生命 周期 (图 7 一 4) 的 发 现 。 反 录 病 毒 的 颗粒 称 为 病毒 粒子 (virion), 它 侵入 某 一 宿主 细胞 以 后 ,其 基因 组 RNA 即 被 反 转 录 成 病毒 DNA。 该 DNA 能 整合 到 宿主 基因 组 中 , 变 成 一 个 前 病毒 (provirus) 。 接 下 来 ,前 病毒 DNA 转录 成 RNA, 它 们 既 可 作为 合成 病毒 蛋白 质 的 mRNA, 又 可 作为 病毒 的 基因 组 ,并 被 包装 到 具有 感染 性 的 病毒 粒子 中 。 病 毒 粒 子 一 旦 形成 ,周期 即 可 再 次 开始 。 表 7 一 1 反 录 因子 和 反 录 序列 的 分 类 因 cia 反 转 录 酶 转 座 LTR’ 是 否 存在 病毒 粒子 反 录 子 是 否 否 否 反 转 录 子 是 是 否 否 反 录 转 座 子 是 是 是 否 反 录 病毒 是 是 是 是 拟 反 录 病 毒 是 否 是 是 反 录 序列 否 否 否 ra 自 Temin(1989). a,LTR, KA Sn HR . 反 录 病毒 至 少 具 有 3 个 基因 :gag,zpol 和 ex( 图 7 一 5)。 这 些 基 因 分 别 为 几 种 内 部 蛋白 质 、 几 种 酶 (包括 一 种 反 转 录 酶 ) 和 一 种 被 膜 蛋白 编码 .许多 反 录 病毒 还 有 别 的 基因 :例如 艾滋 病毒 至 少 有 6 个 额 外 基因 。 反 录 病 毒 的 编码 区 两 侧 有 长 未 端 重复 (long terminal repeats, LTRs) .LTR 含有 与 转录 (在 前 病毒 阶段 ) 有 关 的 启动 子 和 与 反 转 录 ( 在 病毒 阶段 ) 有 关 的 启动 子 。 反 转 录 子 (retroposons) 和 反 录 转 座 子 (retrotransposons) 是 不 构成 病毒 粒子 的 可 转 座 因 子 , 所 以 , 它们 与 反 录 病毒 不 同 , 不 能 独立 地 穿越 细胞 而 转 座 .它们 间 的 相互 区 别 是 ,是 否 存在 末端 重复 顺序 (CLTR)( 表 7 一 1)。 注 意 , 有 些 作 者 是 将 反 转 录 子 和 反 录 转 座 子 当 作 同义词 来 用 的 。 果 蝇 中 的 copia A 子 代 表 一 种 典型 的 反 录 转 座 子 ; 它 的 两 端 都 具有 LTR ,并 且 还 含有 一 段 长 的 开放 阅读 框架 ,其 中 有 类 似 于 反 录 病毒 的 pol 基因 的 区 域 . 图 7 一 5b 所 示 的 是 另 一 个 反 录 转 座 子 的 例子 , 即 粘 性 霉菌 Dic- tyostelium discoideum 中 的 DTIRS 一 1 因子 。D. discoideum 平均 含有 40 个 左右 的 完整 DTIRS 一 1 拷贝 ,以 及 大 约 200 一 300 个 的 DTIRS 一 1 片段 。 有 趣 的 是 ,DTIRS 一 1 有 一 种 将 自己 插入 别 的 DTIRS 一 1 序列 中 ,从 而 抵消 它们 的 作用 的 倾向 ,这 或 许 是 粘性 霉菌 基因 组 中 存在 许多 有 缺陷 的 DTIRS 一 1 片段 的 原因 (Cappello 等 ,1984) .DTRS 一 1 基因 的 转录 受 发 育 阶段 诱导 ,也 受热 震惊 的 诱导 。 与 反 录 转 座 子 不 同 , 反 转录 子 不 含 LTR. YA D. melanogaster 中 的 C34 因子 是 一 个 反 转 录 子 (图 7 一 5c)。 这 种 反 转 录 子 含有 两 个 ORF。.ORF 一 1 含有 一 个 与 反 录 病毒 的 pol 基因 类 似 的 区 域 ,而 OREF 一 2 则 含有 7 个 由 非常 短 的 间隔 顺序 隔 开 的 外 显 子 。 反 录 子 (retrons) 是 最 简单 的 反 录 因子 (图 7 一 5d) 。 它 们 曾 在 某 些 细菌 基因 组 中 发 现 (Inouye 等 , “108。 一 反 录 病毒 受 体 HH Iz Fe a 复制 成 DNA 病毒 mRNA 整合 了 的 前 病毒 细胞 幸存 并 继 终 不 定时 地 产生 病毒 图 7 一 4 一 个 反 录 病毒 生命 周期 的 概貌 。 反 录 病 毒 的 病毒 粒子 附着 到 细胞 表面 的 一 个 受 体 上 .基因 组 RNA 注入 细 胞 质 中 ,在 那里 通过 反 转 录 酶 的 作用 而 被 反 转 录 。cDNA 穿 入 细胞 核 ,并且 可 能 会 整合 到 宿主 细胞 的 基因 组 之 中 。 整合 进去 的 前 病毒 被 转录 成 ,(1) 用 于 合成 病毒 蛋白 的 mRNA, 和 (2) 基 因 组 RNA。 该 基因 组 RNA 与 结构 蛋白 质 和 酶 性 蛋白 质 装 配 成 有 感染 性 的 病毒 粒子 ,以 出 芽 的 形式 穿 出 细胞 膜 。 自 Watson 等 (1987) 。 1989;Lampson 4, 1989), th, & 4E 44 'W Oenothera berteriana 的 线粒体 基因 组 中 发 现 (Schuster 和 Bren- nicke. 1987) ,它们 的 开放 阅读 框架 中 有 与 其 他 反 转 录 酶 基因 类 似 的 顺序 。 然 而 , 反 录 子 不 切 离 , 因 而 是 构成 基因 组 整体 的 必要 部 分 .与 前 病毒 不 同 , 反 录 子 没有 LTR ,也 不 能 构成 病毒 粒子 。 拟 反 录 病毒 (pararetroviruses) ,如 乙 型 肝炎 病毒 ,是 结构 上 类 似 于 反 录 病毒 ,但 已 失去 了 将 自己 插 入 宿主 基因 组 中 的 能 力 的 一 类 病毒 .由 于 这 个 缘故 它们 是 不 够 作为 可 转 座 因 子 的 资格 的 ,虽然 它们 显 然 与 反 录 病毒 有 着 共同 的 进化 起 源 。 所 有 反 录 因子 的 反 转录 酶 都 有 某 些 氨基 酸 等 同性 ,这 一 事实 表明 了 这 些 因 子 有 一 种 共同 的 进化 起 源 .由 于 反 录 子 与 反 录 病毒 的 复杂 结构 相反 具有 简单 性 ,又 由 于 细菌 的 古老 性 ,所 以 , 特 明 (Temin, 1989) 认 为 ,进化 的 途径 是 从 反 录 子 到 反 转 录 子 、 到 反 录 转 座 子 . 到 反 录 病毒 .到 拟 反 录 病毒 (图 7 一 6)。 当然 , 某 些 现存 的 反 录 转 座 子 有 可 能 是 从 反 录 病毒 衍生 而 来 ,而 不 是 从 它 周围 的 另 一 通路 衍生 而 来 。 gag pol env ORE-1 (b) Gil Pure — (c) 图 7 一 5 RRAFHRABH TAM ERATARHABGHRAHEK; MPAA MH SRAM A ZEURAT; BRAEAH ERARKA ME AZ(LTR) ORF, PHA RER (a) MMRRME MAE HH AM AAA 等 同 的 LTR ,各 长 482 和 472bp。 该 编码 区 为 两 个 多 重 蛋 和 白 前 体 编码 。 由 gag-poll 区 编码 的 多 重 蛋 白 前 体 将 分 裂 成 两 个 多 重 蛋 白 , 分 别 对 应 于 gag 和 pol.gag 多 重 蛋 白 产生 4 种 内 部 病毒 蛋白 质 , 分 别 用 p15,p12,p27,p10 表 示 。zpol 多 重 蛋 白 则 分 裂 成 3 种 酶 ,一 种 蛋白 酶 ,一 种 反 转 录 酶 ,和 一 种 内 切 核酸 酶 /整合 酶 。 由 ezm 编码 的 多 重 蛋 白 前 体 分 裂 成 两 种 被 膜 蛋 白 、 分 别 用 p70 和 plsxA A. (b) HH | B (Dictyostelium discoideum) 4 KR 4 HF DIRS—1. MI) #4 LTR 长 为 200 一 350bp.ORF 一 2 含有 一 个 顺序 与 反 录 病毒 的 pol 基因 类 似 的 区 域 ;(c) 果 晶 D. melanogaster 的 反 转 RF G34.ORF 一 1 含有 一 个 顺序 与 反 录 病毒 的 pol 基因 类 似 的 区 域 。 注 意 LTR 缺乏 这 一 特征 。(d) 来 自 粘 球菌 M yxococcus xanthus 的 反 录 子 。 其 中 ,masr- 基因 被 转录 成 RNA; 而 isQd 基因 则 从 互补 的 链 上 转录 ,然后 再 经 由 该 反 录 子 的 ORF 编码 的 反 转 录 酶 反 录 成 DNA。 反 录 产 生 的 两 个 分 子 接着 通过 2' 、5'- 磷 酸 二 酯 键 而 相互 连结 ,从 而 形成 被 称 为 复 找 贝 单 链 DNAIOnmESDNA) 的 分 枝 形 分 子 。 注 意 这 里 没有 LTR。 环 状 DNA 病毒 失去 反 转 录 酶 拟 反 录 病毒 失去 转 座 能 力 反 录 病毒 | 获得 结构 基因 反 录 转 座 子 获得 LTR 反 转 录 子 获得 转 座 能 力 发 于 图 7 一 6 反 录 因 了 于 的 一 种 可 能 进化 路 线 的 模式 图 。 7.3 反 录 序列 反 录 序列 (retrosequences 或 retrotranscripts) ,是 通过 RNA 的 反 转 录 而 得 到 、 接 着 整合 到 基因 组 中 、 但 缺乏 产生 反 转 录 酶 能 力 的 基因 组 的 序列 ( 表 7 一 1)。 产 生 反 录 序 列 的 模板 通常 是 某 一 基因 的 RNA 转录 本 .有 些 作者 把 反 录 序列 称 为 “ 非 病 毒 的 反 转 录 子 ”例如 Weiner 等 ,1986) 。 一 种 产生 反 录 序列 的 过 程 如 图 7 一 7 所 示 .如 果 某 一 基因 不 在 任何 种 系 细 胞 中 转录 ,那么 ,产生 反 录 序列 就 需要 RNA 跨越 细胞 障碍 .这 可 以 通过 以 下 方式 实现 , 即 RNA 分 子 被 包 进 某 一 反 录 病毒 的 病毒 粒子 中 ,然后 传 . 送 到 种 系 细 胞 ,并 在 那里 被 反 转 录 (Linial,1987) 。 这 一 过 程 被 命名 为 反 录 转 染 (retrofection ) 。 es。 1]110。 | | 由 于 反 录 序列 起 源 于 RNA 序列 ,所 以 它们 带 有 一 些 进行 过 RNA 加 工 的 标记 ,因而 又 称 为 加 工 后 序列 (processed sequences) 。 反 录 序 列 的 特征 包括 :(1) 缺 少 内 含 子 ,(2) 与 基因 的 转录 区 域 有 精确 一 致 的 边界 ,(3) 在 3' 端 有 poly-A 延伸 物 ,(4) 在 两 端 都 有 短 的 顺 向 重复 ,这 指示 可 能 已 涉及 转 座 ,(5) 各 种 转录 后 的 修饰 ,如 短 核 苷 酸 延 伸 物 的 加 入 或 去 除 ,以 及 (6) 序 列 所 在 染色 体 上 的 位 置 已 不 同 于 转录 产生 RNA 的 原始 基因 的 基因 座位 。 存在 有 两 种 类 型 的 反 录 序列 :加 工 后 基因 (或 反 录 基因 ) 和 加 工 后 假 基因 (或 反 录 假 基因 ) | #2 ee ea | 加 工 cap BM pApaps~~ RNA | ses Mt etpt DNA | ee __ #4 DNA | DNA 修复 a 加 工 后 的 基因 图 7 一 7 加工 后 反 录 序列 的 产生 . 黑 块 状 体 表示 外 显 子 .波纹 线 表 示 mRNA 中 的 多 聚 A 尾 巴 和 cDNA 中 的 互补 多 % T.DNA 被 转录 成 前 体 mRNA ,然后 被 加 工 成 mRNA。mRNA 再 被 反 转 录 成 cDNA,cDNA 则 整合 进 基 因 组 DNA 中 。 裂 缝 被 修复 ,这 样 在 插入 的 反 录 序列 两 段 侧 就 产生 了 两 段 顺 向 的 短 重 复 ( 黑 水 平 箭头 )。 如 果 cDNA 从 合 成 RNA 的 细胞 转播 入 到 一 个 不 同 细 胞 的 基因 组 中 , 则 产生 反 录 序列 的 过 程 就 需要 mRNA 包装 进 一 个 反 录 病毒 料 子 中 ,并 且 转 移 到 那个 郑 细胞 里 。 这 样 的 过 程 称 反 录 转 染 。 反 录 基因 加 工 后 基因 (processed gene) 或 反 录 基因 (retrogene) 是 一 种 有 功能 的 反 录 序列 , 它 产 生 的 蛋白质 与 产生 该 反 录 基因 的 原 基 因 所 产生 的 蛋白 质 等 同 或 接近 等 同 。 有 几 个 原因 可 以 说 明 为 什么 一 个 反 转 录 的 基因 保留 其 功能 的 可 能 性 很 小 .第 一 , 反 转 录 过 程 是 很 不 精确 的 ,以 至 RNA 模板 与 cDNA 之 间 可 能 会 出 现 许 多 差异 (突变 )。 第 二 ,除非 加 工 后 基因 是 从 一 个 由 RNA 多 聚 酶 下 转录 的 基因 衍生 而 来 ,否则 它 通常 不 含有 那些 位 于 不 转录 区 中 的 必需 调控 序列 .第 三 ,加 工 后 基因 有 可 能 被 插 人 到 不 适 于 其 正确 表达 的 基因 组 位 置 上 .事实 上 ,在 绝 大 多 数 情况 下 ,一 个 加 工 后 基因 就 是 一 个 “垂死 者 ”。 令 人 惊奇 的 是 ,加 工 后 的 有 功能 基因 已 被 发 现 , 虽 然 它们 看 来 是 非常 罕见 的 .人 的 磷酸 甘油 酸 激 酶 CPGK) 多 家 族 由 一 个 活性 的 X 一 连锁 基因 、 一 个 加 工 后 的 X 一 连锁 基因 和 一 个 额外 的 常 染 色 体 基 因 所 组 成 .该 X 一 连锁 基因 含 11 个 外 显 子 和 10 个 内 合子 。 另 一 方面 , 它 的 常 染 色 体 同 源 物 却 是 不 寻常 的 , 它 没有 内 含 子 并 且 它 的 3' 端 由 一 个 poly-A 尾巴 的 剩余 物 构成 侧翼 ,这 极 有 力 地 表明 曾 发 生 过 涉 及 mRNA 的 反 转 录 过 程 。 有 趣 的 是 ,该 常 染色 体 的 PCK 基因 几乎 独特 地 在 备 丸 中 表达 .于 是 , 反 转 录 而 成 的 PGK 基因 不 仅 保留 了 完整 的 阅读 框架 和 转录 并 产生 有 功能 的 多 肽 的 能 力 , 而 且 还 获得 了 一 种 新 的 组 织 特异 性 (McCarrey 和 Thomas,1987) 。 鸡 中 的 肌肉 特异 的 钙 调 素 (calmodulin) 基 因 也 是 无 内 含 子 的 ,显然 也 是 经 由 反 转 录 酶 中 介 的 事件 而 产生 的 (Gruskin 等 ,1987)。 大 鼠 和 小 鼠 的 前 胰岛 素 原 II 基因 可 能 是 半 加 工 反 录 基因 (semiprocessed retrogene) 的 一 个 代表 性 例子 .该 基因 在 5' 不 翻译 区 中 有 一 个 长 119bp 的 内 含 子 。. 相 比 之 下 , 它 的 同 源 物 前 胰岛 素 原 工 ,含有 与 etl * 它 同样 的 小 内 含 子 , 另 外 还 有 一 个 存在 于 ec 肽 编码 区 中 的 较 大 (499bp) 内 含 子 。 来 自 其 他 哺乳 类 ,包括 其 他 路 齿 类 在 内 的 所 有 前 胰岛 素 原 基因 也 含有 两 个 内 含 子 。 而 且 , 前 胰岛 素 原 1 基因 两 侧 由 短 重 复 夹 拥 , 且 在 多 聚 腺 苷 化 信号 后 有 一 段 短 多 聚 AGpoly-A) 区 (Soares 等 ,1985) 。 这 些 特征 表明 ,前 胰岛 素 原 I 基因 可 能 是 从 被 部 分 加 工 的 前 胰岛 素 原 工 基因 的 前 体 mRNA 衍生 而 来 的 半 加 工 反 录 基 因 。 事 实 上 ,根据 这 两 个 前 胰岛 素 原 基因 间 的 比较 ,前 胰岛 素 原 I 看 来 是 从 一 个 偏离 了 正轨 的 前 体 mRNA 转 录 本 衍生 而 来 的 ,该 转录 本 起 始 于 正常 帽子 部 位 上 游 的 500 个 碱 基 对 处 , 且 只 有 第 一 个 内 含 子 从 它 里 面 切 离 了 。 正 是 因为 该 偏离 了 正轨 的 转录 本 含有 未 被 正常 转录 的 5' 调 探 序列 , 反 录 基因 在 整合 到 一 新 基因 组 位 置 后 才 保 留 了 它 的 功能 。 加 工 后 假 基因 加 工 后 假 基 因 (processed pseudogene) 或 反 录 假 基 因 (retropseudogene) 是 一 个 失去 其 功能 的 反 录 序列 . 它 带 有 一 切 有 功能 的 反 录 序列 的 标记 ,但 却 有 一 些 妨碍 其 表达 的 分 子 缺 陷 。 一 个 有 功能 的 基因 Mm. A 了 工 广 AL » Cane be Ue 556s 2 eee SOD-1 ATG GCG ACG AAG GCC G¥C TCC Gee CTG AAG GGC GAC GGC CCA Gia 69.1 ATA ATG AIG AAG CECHATC. TAC. Se TTG AAG GGc CAG AGC ccc Tc f° M M «Kk °¥° MM (-Y "\ RR K 6 CG) O°” See SOD-1 Q G I I N i E Q K ' E 9 N G CAG GGC ATC. ATC AAT TTC.) GAC ACAGSARG 469 Ciiticon hae AGT AAT GGA 69.1 CAG ccc A 'E°ATC CAT’ TY “CAG CHO Bee AA AAT GAA. Co. uv: 5 S ky 242% P V 二 S I K G L 下 E - 可 转 座 因 子 的 个 体 而 言 的 平均 适合 度 为 a, ta: w= ee | 和 Kee (Charlesworth ,1985) 。 4£ FR WD. melanogaster 的 情况 中 ,有 约 50 个 转 座 子 家 族 , 每 个 家 族 平 均 在 基因 组 中 出 现 10 次 (Finnegan 和 Fawcett,1986) ,于 是 n 王 500。 因 为 比 u 至 少 小 一 个 数量 级 ,所 以 u 一 Yu 一 10 +。 解 等 式 7.1, 我 们 得 只 =0. 95。 于 是 ,适合 度 上 的 降低 为 s 王 1 一 0.95 王 0.05。 由 等 式 7. 1 给 出 的 平衡 的 稳定 性 ,要 求 适合 度 的 对 数 衰减 比 n 的 线性 增加 更 陡峭 (Charlesworth,1985) .不 过 ,为 了 运算 简单 ,我 们 候 定 呈 线性 ,那么 ,每 增加 一 个 转 座 子 适合 度 的 降低 近似 为 0.05/500 王 10“。 这 样 小 的 选择 系数 本 质 上 意味 着 ,一 个 生物 体 中 的 可 转 座 因子 的 拷贝 数 主要 是 由 随机 遗传 漂 变 所 决定 的 .如 果 一 个 生物 体 含 有 数目 更 大 的 可 转 座 因 子 , 甚 至 在 果 蝇 中 可 转 座 因子 数 大 大 超过 500 的 可 能 性 也 是 存在 的 (Rubin, 1983) ,那么 ,一 个 转 座 子 对 适合 度 的 效应 也 许 要 比 上 面 所 得 到 的 更 小 。 关于 对 抗 拷贝 数 增 加 的 选择 的 一 个 可 采用 形式 是 自我 调控 转 座机 制 , 即 转 座 的 频率 随 拷贝 数 的 增加 而 降低 ,或 切 离 的 频率 随 拷 贝 数 的 增加 而 增加 ( 见 Chenlesworth # Langley ,1989). 7.8 水 平 基 因 转 移 水 平 基因 转移 (horizontal gene transfer) 被 定义 成 遗传 信息 从 一 个 基因 组 向 另 一 个 基因 组 ,特别 是 在 两 个 物种 之 间 的 转移 .这 个 术语 的 提出 是 为 了 把 这 类 转移 与 通常 的 “垂直 转移 ”区 别 开 来 ,后 者 则 是 亲 代 把 遗传 信息 传 给 子 代 的 转移 。 水 平 基因 转移 要 求 ,(1) 在 各 生物 体 和 各 细胞 间 转 输 遗 传 信息 的 交通 工具 ,和 (2) 将 外 源 DNA 片段 插入 宿主 基因 组 中 的 分 子 机 制 。 反 录 病 毒 能 完成 这 两 个 任务 ,因为 它们 既 能 把 染色 体 的 DNA 挫 和 到 它们 的 基因 组 中 ,又 能 跨越 物种 界线 (Benveniste 和 Todaro,1976; Bishop ,1981) 。 在 转 座 子 以 及 其 他 类 型 的 DNA 中 介 的 转 座 中 ,跨越 细胞 的 传输 必须 由 一 个 传染 因子 来 提供 ,如 质粒 事实 上 ,许多 自然 界 中 出 现 的 质粒 都 含有 可 转 座 因 子 , 这 些 因子 可 以 从 质粒 上 离开 而 向 细菌 染色 体 移动 ,也 可 相反 方向 地 移动 。 通过 发 现 某 一 具体 基因 的 系统 发 育 分 布 中 的 显著 不 连续 性 ,也 许 能 检 出 一 个 水 平 基因 转移 事件 。 例如 ,细菌 Salmonella typhimurium 含有 一 个 类 组 蛋白 基因 , 据 我 们 所 知 它 在 其 他 细菌 中 没有 对 应 物 (Higgins 和 Hillyard,1988) 。 当 发 现 基 因 系 统 发 育 和 物种 系统 发 育 之 间 明 显 地 存在 矛盾 时 ,特别 是 顺 序 类 似 性 看 来 反映 了 地 理 上 的 近似 而 不 是 系统 发 育 上 的 亲缘 性 时 ,或许 也 可 以 怀疑 有 水 平 基因 转移 。 作为 例子 ,我们 考虑 一 下 图 7 一 15a 中 的 系统 发 育 树 .假定 B 从 A 那里 分 岐 后 ,发 生 了 一 个 DNA 片段 从 物种 也 向 物种 C 的 转移 。 在 除 发 生 了 水 平 转移 的 基因 外 的 任何 基因 的 顺序 比较 的 基础 上 ,我 们 可 望 得 到 一 个 正确 的 物种 间 系统 发 育 关 系 。 对 比 之 下 ,如 果 我 们 采用 发 生 了 水 平 转移 的 DNA 片段 , 则 我 们 将 得 到 如 图 7 一 15b 中 那样 的 错误 树 。 不 过 ,我 们 也 注意 到 , 除 水 平 基因 转移 外 还 有 别 的 因素 也 能 造成 物种 树 和 基因 树 之 间 的 矛盾 (第 五 章 )。 (a) (b) 基因 转移 B a: A B 图 7 一 15 水 平 基因 转移 的 情况 下 系统 树 的 构建 Ca) 真实 树 ,(b) 推 测 树 。 两 类 序列 能 被 水 平地 转移 : (1) 从 可 转 座 因子 衡 生出 的 序列 ,和 (2) 基 因 组 序列 ,基因 组 序列 的 水 平 基因 转移 的 例子 中 ,很 少 有 已 被 令 人 信服 地 证 实 了 的 。 许 多 原来 这 样 声 称 的 例子 ,后 来 发 现 并 不 能 得 到 分 子 证 据 的 支持 .而 且 , 我 们 注意 到 ,一 个 发 生 了 水 平 转移 的 基因 在 宿主 中 保留 其 功能 性 的 情况 是 很 罕见 的 ,预期 比 一 个 在 同一 物种 内 从 一 个 基因 组 位 置 到 另 一 个 位 置 转移 的 基因 ( 见 第 111 页 ) 更 少 病毒 基因 从 狮 狂 到 猫 的 水 平 转移 脊 椎 动物 基 因 组 中 含有 许多 与 反 录 病毒 同 源 的 序列 .这 些 序列 是 真 核 生物 细胞 核 DNA 的 正常 组 份 , 称 为 内 源 性 反 录 病毒 序列 (endogeneous retroviral sequences) 或 病毒 基因 (virogene) .有 几 个 内 源 性 反 录 病毒 序列 在 肴 椎 动物 的 种 间 转 移 的 例子 (综述 见 Benveniste, 1985). H+ — fil 53% A Bb BEY c 型 病毒 基因 有 关 ( 图 7 一 16)。 与 独 独 的 病毒 基因 同 源 的 序列 已 在 所 有 古 世 界 猴 的 细胞 DNA 中 检 出 。 它们 间 的 顺序 类 似 性 是 与 物种 间 的 分 类 学 关系 紧密 相关 的 。 于 是 ,该 病毒 基因 在 灵 长 类 中 至 少 存在 了 3 千 万 年 .有趣 的 是 6 种 RM (Felix catxs) 亲 缘 关 系 密 切 的 猫 也 含有 这 一 序列 ,虽然 在 亲缘 关系 较 远 的 猫 科 动 物 、 象 狮 , 豹 和 短 尾 猫 , 以 及 任何 其 他 食肉 动物 中 ,都 不 存在 这 一 序列 .所 以 ,这 一 序列 极 有 可 能 是 在 过 去 某 一 时 刻 在 物种 间 水 平 转移 的 。 水 平 传递 的 年 代 和 方向 可 从 两 类 资料 中 推出 :(1) 顺 序 类 似 性 和 (2) 古 地 质 学 信 ¢ 120° 1B ttt Fr ae 猫 科 2 其 他 食肉 动物 “ 图 7 一 16 十 世界 猴 和 猫 的 系统 发 育 树 。 含 有 型 病毒 基因 的 物种 用 实 线 标 出 。 来 自 狂 独 和 狮 尾 独 狂 的 c 型 病毒 基 因 展 现 出 与 猫 的 c 型 病毒 基因 有 最 大 的 类 似 性 。 因 此 ,在 大 约 1 千 万 前 可 能 发 生 了 一 次 水 平 基因 转移 ,该 转移 是 从 狂 狂 和 狮 尾 狂 狂 的 祖先 到 与 狮 \ 鹏 和 猎豹 等 的 谱系 分 岐 后 的 现代 猫 的 祖先 。 自 Benveniste (1985) 修 改 而 成 。 息 。 所 有 含 狂 独 病毒 基因 的 猫 种 都 来 自 地 中 海地 区 ,而 来 自 东 南亚 、 新 世界 和 非洲 的 猫 科 动物 则 缺少 该 序列 .因此 ,转移 发 生 在 猫 科 动物 的 大 辐射 之 后 , 且 被 限制 在 一 个 地 理 区 域 中 。 这 一 结论 指出 ,水 平 基因 转移 的 年 代 在 500 一 1000 万 年 前 。 传 递 方向 则 可 这 样 推出 :一 方面 考虑 该 序列 在 灵 长 类 中 的 分 布 , 另 一 方面 考虑 它 在 猫 类 中 的 分 布 。 因 为 所 有 古 世 界 猴 都 具有 该 病毒 基因 ,而 只 有 几 种 猫 才 具 有 该 基 因 . 所 以 ,只 能 假定 猫 类 是 从 儿 独 那里 获得 该 序列 ,而 不 是 相反 ,这 才 是 合理 的 .这 一 结论 在 考虑 到 以 下 事实 后 得 到 强化 : 猫 类 与 3 种 独 独 (Pazio cynoce phalus, P. papio 和 已 .haxozacdzyas) 和 亲缘 关系 密切 AY Bi FE Bb Bi (Theropithecus gelada) 中 的 病毒 基因 ,它们 的 相似 程度 比 猫 类 与 任何 其 他 灵 长 类 序列 的 相似 程度 要 更 高 一 些 . 因 此 ,该 序列 一 定 是 独 卯 和 狮 尾 独 狮 与 山 灰 分 岐 后 不 久 而 从 它们 的 祖先 转移 到 猫 类 中 去 的 (图 7 一 16)。 从 对 独 狂 的 研究 中 得 出 的 年 代 与 从 对 猫 类 的 研究 中 得 出 的 年 代 一 致 得 相当 . 尸 因子 在 果 蝇 的 种 间 的 水 平 转移 水 平 基因 转移 的 另 一 个 例子 与 刀 . melanogaster 中 的 书 因 子 有 关 。 正 如 前 面 所 讲 的 ,在 近 40 年 的 时 间 里 已 因子 已 迅速 传 遍 了 D. melanogaster 的 自然 群体 ( 见 第 114 页 )。 而 己 因 子 不 存在 于 与 melanogaster 亲缘 关系 很 近 的 一 些 种 , 象 D. mauritania,D. sechellia, D. simulans 和 D. yakaba 等 之 中 。 那么 这 些 因子 是 从 哪里 来 的 呢 ? 丹尼尔 斯 等 (Daniels 等 ,1990) 曾 对 成 百 种 果 蝇 进行 了 普查 ,结果 表 明 , 除 D. melanogaster 外 ,zzelazogaster 类 亚 组 的 任何 其 他 种 中 都 未 发 现 已 序列 .相反 ,亲缘 关系 下 远 的 willistoni 24 Fl saltans 组 的 所 有 种 都 含有 书 因子 和 类 尸 因 子 。 尤 其 是 ,D, willistoni 的 己 因 子 被 发 现 除了 一 个 碱 基 蔡 换 外 完全 等 同 于 D. melanogaster 中 的 因子 ,这 指示 D. willistoni 在 P A ¥% 2!) D. melanogaster 的 水 平 基 因 转 移 中 ,起 着 供 体 物种 的 作用 。 有 几 个 原因 使 得 我 们 怀疑 这 种 水 平 基因 转移 是 最 近 才 发 生 的 .首先 ,来 自 刀 .aelanogaster 和 来 目 D. willistoni 的 书 序 列 间 的 接近 等 同 ,表明 发 生 分 岐 的 时 间 非 常 短 .其 次 ,来 自 地 理 位 置 相距 很 还 处 的 D. mmzelanogaster, 它 们 的 书 序 列 间 几乎 没有 遗传 变异 性 ,这 指示 自己 因子 导入 万 .melanzogaster 以 来 时 2 121 * 间 还 很 短 ,以 至 还 来 不 及 积累 遗传 变异 性 .最 后 ,已 因子 在 也. melanogaster 中 出 现 的 地 理 模 式 , 以 美洲 大 陆 中 的 群体 最 先 获 得 它 ,看 来 它 指示 着 涉及 了 一 次 非常 近期 的 侵 和 人 事件 ,时 间或 许 在 近 50 年 之 内 。 习题 1. 反 录 因 子 和 反 录 序列 间 的 差异 是 什么 ? 2. 给 出 一 个 基因 组 序列 ,你 怎么 能 讲 出 它 是 不 是 一 个 反 录 序列 呢 ? 3. 怎样 才能 将 加 工 后 假 基因 和 未 加 工 假 基因 加 以 区 别 ? 4. 大 多 数 加 工 后 假 基因 都 是 “垂死 者 ”。 请 解释 ,为 什么 这 一 条 件 使 它们 成 了 推测 点 突变 模式 的 极 好 材料 ( 见 第 四 章 和 Li 等 ,1984) 。 5. 解释 为 什么 反 录 基因 很 少见 。 6. 为 什么 Alu 序列 在 人 类 和 其 他 灵 长 类 的 基因 组 中 含量 会 如 此 丰富 ? 7. Alu 序列 曾 被 认为 是 有 功能 的 ,但 现在 却 普遍 相信 它们 是 加 工 后 假 基 因 。 在 此 假说 下 ,4zx 序列 应 该 象 其 他 假 基 因 那 样 迅 速 地 进化 。 那 么 , 表 7 一 3 中 的 数据 与 这 一 假说 相 容 吗 ? 表 7 一 3 4/x 序列 之 间 以 及 1 一 珠 蛋 自 假 基因 之 间 顺 序 岐 化 的 程度 百分比 岐 化 度 物种 对 一 一 Alu 序列 7 BEA AM BBE De 2 lak 1.7 AM KBE 3.7+1.9 ail % 4 A Koop 等 (1986a) 和 Li 等 (1987a) a. 7 个 垂直 相关 的 序列 被 用 来 计算 平均 值 和 标准 偏差 。 8. 试 列 举 转 座 对 宿主 可 能 产生 的 有 利和 不 利 效应 。 后 继 阅 读 文献 Berg. D. E. and M. M. Howe (eds). 1989. Mobile DNA. Academic Society for Microbiology. Washington DC. Compbell, A. 1983. Transposons and their evolutionary significance. pp. 258— 279. In M. Nei and R. K. Koehn (eds) . Evolution of Genes and Proteins. Sinauer Associates. Sunderland. MA. Charlesworth, B. and C. H. Langley. 1989. The population 了 of Drosophila transposable el- ements. Annu. Rev. Genet. 23: 251— 287. | Doolittle. R. F., D-F. Feng. M.S. Johnson and M. A. McClure. 1989. Origins and evolutionary rela- tionships of retroviruses. Quart. Rev. Biol. 64: 1— 30. Lewin, B. 1990. Genes IV. Oxford University press. Oxford. Scaife, J.. D. Leach and A. Galizzi (eds. ). 1985. Genetics of Bacteria. Academic Press, New York. Shapiro, J. A. (eds) . 1983. Mobile Genetic Elements. Academic Press, New York. Varmus, H. 1988. Retroviruses. Science 240: 1427—1435. Weiner, A.M., P. L. Deininger and A . Efstratiadis. 1986. Nonviral retroposons: Genes, pseu- dogenes. and transposable elements generated by the reverse flow of genetic information. Annu. Rev. Biochem. 55: 631— 661 * Tee 8 基因 组 的 组 织 化 和 进化 关于 基因 组 的 组 织 化 和 进化 的 讨论 应 该 包括 3 个 不 同 的 课题 .第 一 个 是 基因 组 大 小 ,这 在 不 同 生 物 间 变 化 极 大 .这 种 变化 是 如 何 形成 的 ?增加 和 降低 基因 组 大 小 以 产生 这 种 变化 的 机 制 是 什么 ?第 二 个 是 基因 组 中 的 遗传 信息 。 基 因 组 主要 是 由 基因 的 DNA 构成 的 吗 ? 还 是 主要 是 由 非 基 因 的 序列 构成 的 ?基因 组 中 有 许多 重复 序列 吗 ? 而 如 果 是 这 样 那么 重复 序列 的 染色 体 分 布 模式 是 什么 ? 非 基因 部 分 有 功能 吗 ?或 者 它 只 是 "废物 ?第 三 个 课题 涉及 基因 组 的 核 苷 酸 组 成 。 基 因 组 的 不 同 区 域 中 在 组 成 上 有 蜡 质 性 吗 ? 什 么 机 制 使 核 苷 酸 在 组 成 方面 造成 区 域 性 差异 ? 二 单 倍 体 基因 组 , 象 在 精子 细胞 核 中 的 那样 ,其 DNA 的 量 称 基 因 组 大 小 (genome size) 或 C 值 (C value) ,这 里 C 来 自 “constant”( 常 数 ) 或 “characteristic”( 特 征 ) ,表示 单 倍 体 基 因 组 的 大 小 在 任何 一 个 物种 中 都 是 相当 恒定 的 这 样 一 个 事实 。 反 之,C 值 在 原核 生物 和 真 核 生 物 的 各 物种 间 则 变化 幅度 极 二 表 8 一 1 常用 于 测试 基因 组 大 小 的 单位 换算 换算 因子 单位 微微 克 its WIE x 微微 克 1 6. 02X10" 0. 98 X 109 道 尔 顿 1.66 10-12 1 1.62X10-3 碱 基 对 1.021079 618 1 真 核 生物 中 细胞 核 基因 组 的 大 小 通常 用 微微 克 (pg)DNA 来 度量 (1pg 王 10 “g)。 较 小 一 些 的 原 核 生物 的 基因 组 则 通常 用 道 尔 顿 来 度量 , 道 尔 顿 即 一 个 原子 或 分 子 的 相对 质量 单位 .还 有 更 小 的 基因 组 , 象 细胞 器 和 病毒 等 的 基因 组 ,以 及 某 些 特殊 的 DNA 延伸 物 , 它 们 的 大 小 则 常用 双 链 DNA 或 RNA 的 碱 基 对 (bp) 或 千 碱 基 对 (kb) 来 表示 (1kb 王 1000bp)。 为 避免 混乱 ,我们 将 只 用 bp 和 kb。 单 位 换算 因子 可 见 表 8 一 1。 8.2 细菌 的 基因 组 大 小 的 进化 细菌 的 基因 组 大 小 其 变化 幅度 超过 了 20 倍 ,从 某 些 限制 性 细胞 间 寄 生物 中 的 约 6X 10°bp 到 几 种 蓝 细 菌 中 的 10"bp 以 上 ( 表 8 一 2)。 最 小 的 游离 生活 的 原核 生物 , 枝 原 体 , 含 有 包括 50 种 核糖 体 蛋 昌 在 内 的 350 个 为 蛋白 质 编 码 的 基因 ,两 组 rRNA 基因 (5S,16S 和 23S), 和 大 约 40 个 tRNA 基因 .因此 ,一 个 枝 原 体 的 基因 组 由 大 约 400 个 基因 所 构成 ,这 接近 于 所 猜测 足够 维持 机 体 自 主 性 生活 的 最 小 数目 (Muto 等 ,1986) 。 其 他 细菌 中 的 基因 数 大 致 在 500 到 8000 的 范围 内 变化 , 换 句 话说 ,在 特征 细菌 的 种 类 中 ,基因 数 上 的 变异 与 C 值 方面 的 变异 相同 .因此 ,细菌 看 来 不 会 含有 大 量 的 非 基 因 的 DNA. 细菌 的 基因 组 可 被 划分 成 3 个 部 分 :(1) 染 色 体 DNA,(2) 源 于 质粒 的 DNA, 和 (3) 可 转 座 因 子 (Hartl 等 ,1986) 。 染 色 体 部 分 含有 为 生长 和 代谢 功能 所 必需 的 蛋白 质 编码 基因 (70 一 80% ) ,间隔 序列 和 各 种 信号 序列 (20 一 30%)、 编 码 RNA 的 基因 (一 1%), 以 及 一 些 通 常 长 度 在 几 十 个 碱 基 对 这 一 级 别 上 的 短 重复 序列 。 细 菌 常 带 有 许多 作为 染色 体外 遗传 成 份 的 质粒 ,然而 ,在 有 些 例 子 中 ,一 些 来 自 质 粒 的 基因 却 发 现 被 整合 在 细菌 染色 体 中 。 可 转 座 因 子 是 某 些 细 菌 基因 组 的 普通 组 分 。 例 如 , 正 .coli 的 .123 。 染色 体 , 至 少 含 有 6 个 不 同类 型 的 插入 序列 各 1 一 10 个 拷贝 (第 七 章 )。 基 因 组 的 非 染 色 体 部 分 (包括 染 色 体 中 的 插入 序列 和 来 自 质 粒 的 基因 ) 看 来 要 比 染 色 体 部 分 小 一 个 数量 级 。 表 8 一 2 ”细菌 中 C 值 的 范围 分 类 单位 基因 组 大 小 的 范围 (kb) 比例 (最 高 /最 低 ) 真 细菌 650 一 13200 20 革 兰 氏 阴 性 650 一 7800 12 革 兰 氏 阳 性 1600 一 11600 7 蓝 细 菌 3100 一 13200 4 枝 原 体 650 一 1800 3 古 细菌 1600 一 4100 3 资料 自 Cavalier-Smith(1985). 细菌 中 基因 组 大 小 的 分 布 是 不 连续 的 ,在 模 值 约 0.8X10",1.6X10 和 4.0 久 10*bp 处 呈现 出 主 峰 , i ZE7. 2X 10°M8. OX 10°bp 处 有 几 个 副 峰 (Herdman ,1985)。 这 种 分 布 引出 了 这 样 的 看 法 : 较 大 的 基因 组 是 从 较 小 的 基因 组 经 连续 循环 的 基因 组 重复 进化 而 来 的 .由 于 基因 组 大 小 和 细菌 的 系统 发 育 间 看 来 没有 显著 关系 ,所 以 ,已 经 出 现 了 这 样 一 个 提议 :基因 组 重复 在 细菌 谱系 的 进化 中 是 频频 出 现 的 (Wallace 和 Morowitz,1973). 应 用 根据 rRNA 顺序 比较 而 得 出 的 尝试 性 细菌 系统 发 育 , 替 德 曼 (Herdman,1985) 曾 找 出 了 基 因 组 大 小 变化 与 系统 发 育 史 的 关系 。 其 结果 指示 ,基因 组 重复 在 不 同 细 菌 谱 系 中 是 独立 地 发 生 的 .。 有 趣 的 是 ,许多 重复 看 来 曾 在 进化 中 的 某 一 相当 特别 的 时 刻 , 即 氧 在 大 气 层 中 出 现 后 不 久 , 大 约 在 18 亿 年 前 ,同时 出 现在 几 种 不 同 的 细菌 谱系 中 的 。 概括 起 来 ,细菌 中 基因 组 大 小 的 分 布 能 用 几 个 过 程 的 结合 来 加 以 解释 :(1) 某 些 谱系 中 呼吸 代谢 独立 进化 期 间 的 基因 组 重复 ,(2) 独 立地 出 现在 许多 谱系 中 的 ,随后 的 基因 组 重复 。(3) 小 规模 的 缺失 和 插入 ,(4) 复 制 性 转 座 ,(5) 主 要 来 自 质 粒 的 基因 的 水 平 转移 ,和 (6) 许 多 寄生 性 谱系 中 大 量 DNA 丢 三 8.3 真 核 生 物 的 基因 组 大 小 和 C-- 值 悖 论 真 核 生物 中 的 C 值 通常 比 原核 生物 中 的 要 大 得 多 ,但 也 有 例外 。 例 如 ,酵母 Saccharomyces cere- visiae 的 基因 组 就 比 许多 革 兰 氏 阳 性 菌 和 大 多 数 蓝 细菌 的 小 .因为 真 核 生物 的 基因 组 有 多 重 的 复制 原 点 ,而 大 多 数 原核 生物 看 来 只 有 一 个 ,所 以 ,在 复制 出 较 小 原核 生物 基因 组 所 需 的 相同 的 时 间 里 , 真 核 生物 复制 出 的 DNA 的 量 就 要 大 得 多 。 真 核 生 物 中 的 C 值 变化 要 比 细菌 中 的 大 得 多 ,从 8.8X10*bp 9. 9X 10" bp, He Fel HE Ut 80000 FF ( 表 8 一 3)。 单 细胞 的 原生 生物 ,特别 是 肉 足 类 变形 虫 ,在 C 值 上 表现 出 的 变化 最 大 。3 个 羊膜 类 的 纲 《哺乳 类 、 乌 类 和 疏 行 类 ) 则 相反 ,在 真 核 生物 中 以 它们 在 基因 组 大 小 上 的 变化 小 (最 高 相差 4 倍 ) 而 显 , 得 不 同 寻常 。 其 他 的 纲 ,对 那些 C 值 数 据 大 体 上 存在 者 而 言 ,表现 出 至 少 100 倍 的 变异 。 有 趣 的 是 , 真 核 生 物 间 基因 组 大 小 上 的 巨大 种 间 差 异 看 来 与 生物 的 复杂 性 和 生物 所 编码 的 可 能 基因 数 没有 什么 关系 。 例 如 , 几 种 单 细 胞 的 原生 动物 具有 上 比 哺乳 动物 要 多 得 多 的 DNA( 表 8 一 4) ,而 后 者 据 推 测 应 要 更 复杂 一 些 。 而 且 , 一 些 复杂 性 看 来 相似 的 生物 (例如 , 果 蝇 与 蝗虫 ,洋葱 与 百合 ,双核 草 履 虫 (Paramecium azelia) 与 尾 草 履 虫 (P. caxdatxx) 却 展示 出 极 大 的 C 值 差 异 ( 表 8 一 4) AC 与 基因 组 中 所 含 的 遗传 信息 的 认定 数量 间 缺 乏 对 应 的 现象 ,以 C a Hit KOC 值 矛盾 (CC value paradox) ) 而 著称 于 文献 之 中 。 在 姐妹 种 ( 即 一 些 相互 在 形态 学 上 极为 相似 ,以 至 表 型 上 不 可 区 分 的 种 ) 的 比较 中 CC 值 矛 盾 也 是 明显 的 。 在 原生 生物 、 真 骨 鱼 类 ,两栖 类 和 显 花 植物 中 ,许多 姐妹 种 ,尽管 根据 姐妹 种 的 定义 这 些 生 物 间 的 复杂 性 没有 什么 差异 ,但 在 它们 的 C 值 上 却 差别 极 大 。 我 们 可 以 假定 一 个 物种 不 可 以 具有 少 于 保证 其 生命 功能 所 必需 的 DNA 的 量 , 但 我 们 必须 解释 为 什么 有 那么 多 物种 含有 远 远 过 剩 的 DNA 的 量 。 9 12a" Pin Tay a amin « wet te a 表 8 一 3 不 同 真 核 生 物 类 群 中 的 C 值 范围 分 类 单位 基因 组 大 小 范围 (kb) 比例 (最 高 /最 低 ) 原生 生物 23,500 一 686,000,000 29,191 眼 虫 类 98,000 一 2,350,000 24 纤毛 ( 亚 门 ) 类 23,500 一 8,620,000 367 肉 足 (总 纲 ) 类 35,300 一 686,000,000 19,433 真菌 8,800—1,470,000 167 动物 49,000 一 139,000,000 23837 海绵 49,000—53,900 1 环节 动物 882,000 一 5,190,000 6 软体 动物 421,000 一 5,290,000 13 甲壳 类 686,000 一 22,100,000 32 昆虫 98,000 一 7,350,000 75 棘皮 动物 529,000 一 3,230,000 6 Ke ait 637,000— 2,790,000 4 B45 1,470,000—15 800,000 11 真 骨 鱼 类 .382,000 一 139,000,000 364 两 栖 类 931,000 一 84,300,000 91 MAT 1,230,00—5,340,000 4 BX 1,670,000—2,250,000 1 哺乳 类 1,420,000 一 5,680,000 4 植物 50,000 一 307,000,000 6,140 2s 80,000—30,000,000 375 蕨 类 植物 98,000 一 307,000,000 3,133 裸子 植物 4,120,000 一 76,900,000 17 被 子 植物 50,000 一 125,000,000 2,500 资料 自 Cavalier-Smith(1985) 及 其 他 来 源 。 要 搞 清 楚 的 第 一 个 问题 是 ,基因 组 大 小 和 基因 的 数目 间 是 否 存 在 相关 .换言之 ,基因 组 大 小 上 的 差异 应 归 因 于 基因 的 DNA 还 是 非 基因 的 DNAY? 真 核 生 物 在 为 蛋白 质 编码 的 基因 数 上 表现 出 约 有 50 倍 的 变异 ,从 酵母 中 的 约 3000 个 到 哺乳 动物 中 的 150000 个 左右 (Cavalier-Smith,1985) 。 这 种 50 倍 的 差 异 显然 不 足以 解释 细胞 核 DNA 在 含量 上 的 80000 倍 的 变异 。 再 者 ,基因 数 是 与 结构 复杂 性 正 相 关 的 , 而 基因 组 大 小 则 不 是 .mRNA 分 子 长 度 上 的 种 间 差 异 也 不 能 解释 C 一 值 矛 盾 。 在 不 同 生物 间 编 码 区 和 非 编码 区 的 平均 长 度 都 有 着 差异 的 情况 下 ,基因 长 度 和 基因 组 的 大 小 间 就 不 会 存在 相关 。 几 种 编码 RNA 的 基因 的 重复 程度 与 基因 组 大 小 间 的 正 相 关 业 已 被 发 现 ( 第 六 章 )。 类 似 地 , 象 端 粒 、 着 丝 粒 和 复制 器 基因 ,这样 一 些 在 有 丝 分 裂 和 减 数 分 裂 期 间 为 染色 体 复 制 、 分 离 和 重组 所 必需 的 调控 序列 ,它们 的 拷贝 数 与 基因 组 大 小 间 也 存在 相关 性 .不 过 ,所 有 这 些 基因 只 构成 基因 组 的 一 小 部 分 ,以 至 RNA 基因 和 调控 序列 等 的 在 数量 上 的 差异 并 不 能 解释 基因 组 大 小 上 的 差异 。 总 之 ,我 们 只 剩 下 非 基因 DNA 部 分 作为 造成 C 一 值 矛 盾 的 唯一 嫌疑 犯 。 换 句 话说 , 真 核 基因 组 的 主要 部 分 是 由 不 含 遗传 信 息 的 DNA 所 构成 的 . 曾 有 估计 认为 ,每 基因 组 非 基因 IDNA 的 量 在 真 核 生 物 中 从 约 3.0X10sbp 到 1.0X10abp 以 上 (10 万 倍 范围 ) 之 间 变 化 , 且 构 成 了 基因 组 的 量 的 不 到 302 至 几乎 100% (Cavalier-Smith ,1985) 。 R84 按 基因 组 大 小 等 级 的 真 核 生物 的 C 值 物种 C 值 (kb) Navicola pelliculosa tt ¥ ) 35,000 Drosophila melanogaster (FR: #8) 180,000 Parameciunm aurelia( # € 4) 190,000 Gallus domesticus (34) 1,200,000 Erysiphe cichoracearum( Ei fai) 1,500,000 Cyprinus car pio( M##) 1,700,000 Lam preta planeri(+t #8 #8 ) 1,900,000 Boa constrictor (WE) 2,100,000 Parascaris equorum (4. #3] ) 2,500,000 Carcarias obscurus( # ) 2,700,000 Rattus norvegicus(K fa) 2,900,000 Xenopus laevis (#f) 3,100,000 Homo sapiens K ) 3,400,000 Nicotiana tabaccum (48 ©) 3,800,000 Paramecium caudatum(#f € 4) 84600,000 Schistocerca gregaria (4 2 ) 9,300,000 Allium cepa i) : 18,000,000 Coscinodiscls asterom phalus #E 9) 25,000,000 Lilium Poe (AF) 36,000,000 Am phiuma means (4 #6) 84,000,000 Pinus resinosa(# ) 68,000,000 Proto pterus aethiopicus (fiii £4. ) 140,000,000 Ophioglossum petiolatum Bk) 160,000,000 Amoeba proteus AE FG #2) 290,000,000 Amoeba dubia (AE 6 8) 670,000,000 资料 自 Cavalier-Smith(1985) ,Sparrow 等 (1972) 和 其 他 参考 文献 。 8.4 真 核 生物 基 因 组 的 重复 结构 真 核 生 物 的 基因 组 有 两 大 特征 :(1) 序 列 的 重复 ,和 (2) 组 成 分 隔 化 ,分 隔 成 以 特别 的 核 苷 酸 组 成 而 相互 区 别 的 特征 片段 .重复 DNA(repetitive DNA) 是 由 不 同 长 度 和 组 成 的 核 苷 酸 序列 所 构成 ,这 些 序列 以 串 接 或 散在 的 形式 在 基因 组 中 几 次 出 现 。 不 发 生 重 复 的 DNA 片段 被 称 为 单 拷贝 DNA(single- copy DNA) 或 单一 DNA(Cunique DNA) .基因组 中 由 重复 序列 占据 的 部 分 在 各 分 类 单位 间 变 化 极 大 。 在 酵母 中 ,该 部 分 的 量 约 为 20% ;而 在 哺乳 类 中 , 则 高 达 60%% 的 DNA 是 重复 性 的 .在 植物 中 ,该 部 分 可 超过 80% ,而 且 比 它 更 高 的 值 也 曾 被 记录 到 (Flavell,1986 ) 。 布 里 滕 和 科恩 (Britten 和 Kohne ,1968) 所 做 的 关于 DNA 双 链 重新 结合 的 经 典 研 究 表明 , 较 高 , 等 的 真 核 生物 ,其 基因 组 大 致 分 分 成 4 部 分 : 折 回 DNA (foldback DNA), BBS DNA (highly repeti- tive DNA) ,中 度 重 复 DNA(Cmiddle-repetitive DNA) 和 单 拷贝 DNA( 图 8 一 1) 。 折 回 DNA 由 回 文 DNA 顺序 所 构成 ,一 旦 这 种 变性 了 的 DNA 被 允许 复 性 时 ,该 顺序 可 以 形成 发 夹 式 的 双 链 结构 。 高 度 重复 部 分 是 由 长 度 从 几 个 到 成 百 个 核 苷 酸 的 短 序列 所 构成 ,其 重复 数 平均 为 50 万 次 .中 度 重复 部 分 由 平均 达成 百 或 成 千 碱 基 对 的 长 序列 所 构成 ,它们 在 基因 组 中 以 成 百 的 次 数 出 现 。 根据 重复 在 基因 组 中 散在 的 模式 ,重复 部 分 已 被 发 现 是 由 两 类 重复 家 族 所 构成 的 :区 域 性 重复 家 * 126° 族 和 散在 的 重复 家 族 。 0 20 高 度 重复 DNA DNA 2 . 局 = 40 | 中 度 重复 DNA >0. 9, Ar LA u/v<0. 11. 除 GC 突变 压力 外 ,突变 引起 的 变化 也 受 选择 限制 。 换 句 话 说 ,替换 的 模式 是 由 突变 模式 和 对 抗 某 些 突变 的 纯洁 化 选择 的 模式 所 决定 的 (第 四 章 )。 某 一 特定 区 域 中 的 选择 限制 越 弱 ,GC 突变 压力 对 GC 组 成 的 影响 就 越 强 .图 8 一 5 展示 了 总 GC 含量 与 3 个 密码 子 位 置 上 GC 含量 间 的 相关 ,数据 来 自 11 ° 132" iy 86g 4 ke ee 2 2H 2 Bee a it at tk gh th ke OK HR BS am we x ke FF go RS MR eo Bal 上 pHkK © et eee we 100 ; f | we * 密码 子 GC 含量 (% ) 20 40 60 80 基因 组 GC 含量 ( % ) 图 8 一 5 总 基因 组 DNA 和 第 一 、 第 二 以 及 第 三 密码 子 位 置 间 GC 含量 的 相关 。 虚 线 表示 基因 组 中 与 密码 子 中 GC 含量 间 完 全 对 应 时 的 理论 期 望 关 系 。 自 Muto 和 Osawa (1987). 种 细菌 ,覆盖 了 范围 相当 广 的 GC 含量 值 . 我 们 看 到 ,第 三 密码 子 位 置 上 的 相关 与 无 选择 情况 下 的 预 期 相关 类 似 。 另 一 方面 ,第 一 和 第 二 密码 子 位 置 上 的 相关 ,在 正 相 关 的 情况 下 , 则 表现 出 平缓 得 多 的 坡 度 。 根 据 下 面 所 说 的 事实 这 很 容易 得 到 解释 , 即 作用 在 大 多 数 简 并 的 密码 子 第 三 位 置 上 的 选择 , 远 不 如 第 一 和 第 二 位 上 的 那样 严峻 (第 四 章 ) ,以致 于 第 三 位 上 的 GC 水 平 很 大 程度 上 是 由 突变 压力 来 决 定 的 。 8.8 兰 椎 动物 基因 组 的 组 成 上 的 组 织 化 图 8 一 6 展示 了 不 同 生 物 类 群 中 的 GC 含量 .有趣 的 是 ,虽然 多 细胞 的 真 核 生 物 的 基因 组 大 小 一 般 要 比 原核 生物 的 大 ,但 真 核 生物 中 的 GC 含量 却 表现 出 了 小 得 多 的 变异 .特别 地 , 关 椎 动物 的 基因 组 显示 出 有 相当 一 致 的 GC 含量 ,处 在 从 约 40%% 到 45% 的 范围 中 (Sueoka,1964)。 兰 椎 动物 中 的 GC 含量 处 于 一 个 较 小 的 范围 内 的 部 分 原因 也 许 是 , 肴 椎 动物 与 细菌 不 同 ,它们 相互 分 岐 的 时 间 还 不 够 长 ,所 以 还 不 能 在 GC 含量 上 积累 较 大 的 差异 。 虽然 脊椎 动物 在 基因 组 的 GC 含量 上 有 一 致 性 ,但 它 的 基因 组 却 有 着 比 原核 生物 基因 组 更 复杂 的 组 成 上 的 组 织 化 。 当 养 椎 动物 的 基因 组 被 随机 地 裁剪 成 长 30 一 100kb 的 片段 ,并且 将 这 些 片 段 按 其 碱 基 组 成 分 离 时 ,这 些 片段 即 聚 类 成 为 数 不 多 的 、 可 通过 其 GCC 含量 而 相互 区 别 的 ( 富 GC 片段 比 富 AT 片段 重 ) 类 型 .每 一 类 都 以 有 虽 不 等 同 但 却 相 似 的 碱 基 组 成 带 为 特征 (Bernardi 等 ,1985 ; Bernardi, 上 0 FS5.* IT wR & 植物 #5 ® 时 Pa e w | Fees iis 3 1 Q | saw wy 10 le 20 30F 0 50 60 70 80 GC 含 量 (% ) 图 8 一 6 不 同 生物 美 群 中 的 GC 组 成 。 自 Sueoka(1964)。 1989) 。 温 血 和 冷血 状 椎 动物 的 基因 组 间 在 组 成 上 的 组 织 化 方面 有 明显 差异 (Bernardi 等 ,1985,1988) 。 图 8 一 7a 展示 了 ,来 自 鲤 Cyzprzzzs carpio 和 两 栖 类 Xenopus laevis AA) WURK B 3A ih HED D : MW RAA GRD NH EB DNA 组 分 的 相对 量 和 浮力 密度 .在 鸡 . 小 鼠 和 人 的 基因 组 中 ,有 两 个 轻 组 SLA LD) ,代表 了 约 三 分 之 二 的 基因 组 ,以 及 两 个 或 三 个 重组 分 (Hi ,H:, 和 了:75 代 表 余 下 的 三 分 之 一 。 相 比 之 下 ,来 自 大 多 数 冷 血 兰 椎 动物 的 基因 组 DNA 则 主要 为 轻 组 分 (图 8 一 7a) .例如 ,在 Xeno- pus 中 ,密度 高 于 1.704g/cm 的 DNA 片段 占 基 因 组 的 比例 少 于 10%%, 相 比 之 下 温 血 兰 椎 动物 则 占 30 —40%, DNA 片段 的 组 成 上 的 分 布 很 大 程度 上 是 与 这 类 片段 的 大 小 独立 的 ,这 指示 出 在 非常 长 的 DNA 链 中 有 某 种 组 成 上 的 同 质 性 .这 种 同 质 的 长 段 术语 称 为 同 质 段 (isochore)。 图 8 一 7b 展示 了 来 自 温 血 SHAD Hh) AK DNA 的 镰 典 式 组 织 化 ( 即 , 轻 与 重 同 质 段 轮流 出 现 )。 当 这 些 同 质 段 在 DNA 裁剪 期 间断 裂 时 ,4 种 较 大 的 有 不 同 GC 含量 的 分 子 家 族 即 产生 了 。 贝 尔 纳 迪 等 (Bernardi 等 ,1985) 的 结论 是 , 富 GC 的 ( 重 的 ) 同 质 段 约 占 温 血 状 椎 动物 基因 组 的 三 分 之 一 ,而 在 冷血 养 椎 动物 中 则 几乎 没有 。 温 血 肴 椎 动物 的 基因 组 是 灸 挫 式 的 ,这 一 发 现 与 染色 体 分 带 研究 的 结果 是 一 致 的 。 温 血 肴 椎 动物 的 中 期 染色 体 , 当 用 莉 光 染料 ` 蛋白酶 水 解 , 或 有 差别 的 变性 条 件 处 理 时 ,将 显现 出 清晰 的 吉姆 萨 (CGiemsa) 暗 带 (G 一 带 ) 和 亮 带 (R 一 带 ) 。 与 之 成 对 照 的 是 ,冷血 糊 椎 动物 的 中 期 染色 体 则 只 显 出 很 少 的 分 带 ,或 完全 不 分 带 。 因 此 , 曾 有 建议 认为 , 少 GC 和 富 GC 同 质 段 大致 上 分 别 对 应 于 G 一 带 和 民 三 带 (Comings,1978;Cuny 等 ,1981) 。 关 于 基因 的 复制 时 序 的 研究 表明 ,位 于 富 GC 同 质 段 (R 一 带 ) 中 的 基因 在 细胞 周期 的 早期 复制 , 而 位 于 少 GC 同 质 段 (G 一 oo se 等 , 1984; Bernardi 等 ,1985;Bernardi,1989 ) 。 同 质 段 中 基因 的 位 置 很 多 来 自 人 和 其 他 温 血 肴 椎 动物 的 基因 组 中 的 基因 , 曾 用 与 适当 的 探 针 杂交 的 方法 而 被 定位 在 这 类 组 成 上 的 同 质 段 上 (Bernardi 等 ,1985)。 这 些 研究 指出 ,基因 在 整个 基因 组 中 的 分 布 是 明显 地 非 随机 的 ,大 多 数 基因 位 于 仅 占 基因 组 的 3 一 5 狼 的 最 重组 分 (H3) 中 。 在 大 多 数 情况 下 ,基因 是 处 在 有 与 其 自身 类 似 的 GC 含量 的 DNA 片段 中 。 这 一 发 现 为 同 质 段 的 存在 提供 了 独立 的 证 据 , 风骨 天生 人 国生 术 人 的 全 于 和 这 省 。 事实 上 ,因为 构成 DNA 制备 物 的 这 些 片段 是 经 随机 降解 而 产生 的 ,所 以 ,这 些 带 有 基因 的 片段 在 组 成 上 处 于 较 狭 窗 的 范围 中 的 现象 表明 ,它们 在 约 两 倍 于 这 些 片段 自身 大 小 的 区 域内 ( 即 高 到 200kb), 有 着 非常 同 质 的 碱 基 组 。134,。 ree a oa en m 全 by O jg 占 基因 组 的 分 量 (% ) 占 基因 组 的 分 量 (% ) a L, 2 = H, 人 iy 0 1.700 1.705 1700 1705 A FH 8 BE (g/cm?) (b) : IT DNA 分 子 MA | | | HI Lae (tei, Hy Gy | Hy 主要 DNA 成 分 图 8 一 7 (AA RRA,.RKA Cyprinus car pio( 4) fe Xenopus Laevis( 爪 歇 )( 左 图 ) 和 来 自 鸡 、 小 筷 与 人 ( 右 图 ) 的 主 要 DNA FRR HH ES HF HER. DAR MHA LK DNA 的 镶 风 组 织 化 的 模式 图 。 当 这 些 同 质 段 在 DNA 制备 期 间 随机 断裂 时 ,4 种 较 大 的 具 不 同 GC 含量 的 分 子 家 族 即 产生 了 .还 有 几 种 较 小 的 杂种 家 族 产生 。 自 Bernardi 等 (1985) 。 成 。 8 DNA 序列 数据 分 析 已 揭示 出 ,在 基因 、 外 显 子 和 内 含 子 的 GC 水 平 , 与 它们 处 于 其 中 的 大 段 DNA 区 域 的 GC 水 平 间 存 在 正 相 关 (Bernardi 和 Bernardi,1985;Bernardi 等 ,1985;Ikemura,1985;Ao- ta 和 Ikemura,1986) .图 8 一 8 将 人 类 中 的 % 一 和 有 一 珠 蛋 日 驴 进 行 了 对 比 .B 和 类 有 昌 珠 蛋白 基因 是 低 GC 含量 的 , 且 它 们 处 在 低 GC KM RZ. 和 类 w 珠 蛋 白 基 因 是 富 含 GC 的 , 则 它们 处 在 富 含 GC 的 区 域 中 。 同 样 的 情形 也 曾 在 免 、. 山 羊 和 小 鼠 中 发 现 。 在 鸡 中 ,B 一 和 一 珠 蛋 白 基 因 都 是 富 含 GC 的 ,而 且 两 者 都 处 在 富 GC 的 区 域 中 。 相 比 之 下 ,Xenopaus( 爪 蟾 ) 中 的 一 和 8 一 珠 蛋 白 基 因 则 是 少 GC 的 ,并 且 两 者 都 处 在 少 GC 的 区 域 中 。 在 绝 大 多 数 情 况 下 ,编码 区 中 的 GC 含量 有 高 于 侧 区 中 含量 的 倾向 (图 8 一 9)。 我 们 还 看 到 ,第 三 密码 子 位 置 上 的 GC 水 平 , 平 均 下 来 高 于 内 含 子 中 的 水 平 , 而 后 者 则 又 比 5 和 3' 侧 区 域 中 的 水 平 高 。5/ 侧 区 中 的 GC 水 平 又 高 于 3' 侧 区 中 的 ,这 或 许 是 因为 启动 子 及 其 周围 区 域 倾向 于 富 含 GC 的 缘故 。 e 全 局 入 (a) 人 及 珠 蛋白 复合 物 (b) 人 w- 珠 蛋白 复合 物 100 GC 含量 (%)、 位 置 (Kb) 图 8 一 8 GC 含量 活 人 的 珠 蛋 白 DNA 顺序 的 分 布 :(a)B 一 珠 蛋 白 基 因 徐 ;(b)a 一 珠 蛋 白 基 因 族 (不 完全 )。 这 些 基因 ( 粗 线 ) 以 与 图 6 一 7 中 同样 的 次 序 排 列 。 这 些 基 因 的 名 称 显 示 在 该 图 的 底部 ;区 域 1 是 5 和 居 之 间 的 基因 间 区 。 在 尼 一 珠 蛋 白 签 和 履 盖 qdl 一 和 a2 一 珠 有 蛋白 基因 的 区 域 中 ,每 一 点 代表 围绕 该 点 的 2001 个 核 音 酸 的 GC 组 成 的 平均 值 , 而 其 他 区 域 中 的 每 一 点 则 代表 1401 个 核 苦 酸 的 平均 值 。. 水 平 的 虚线 表示 整个 人 的 基因 组 的 GC 含量 (40% ) 。 自 站 e- mura 和 Aota(1988) 修 改 而 成 。 # * of 4a & 个 40 x 0 ee GC 含量 (% ) GC 含量 (% ) ) 第 三 密码 子 位 置 ion 第 三 密码 子 位 置 & 5 aw) oe Fa és io & ix] x = i = = 及 = wn Va) GC & #(%) GC 含量 (% ) 第 三 密码 子 位 置 内 含 子 四 5 = is 8 加 bx! a = 忌 = 尽 cm 00 50 100 0 50 100 GC 含量 (% ) GC 含量 (% ) 内 含 子 5 侧 序列 区 图 8 一 9 基因 的 各 个 区 域 中 的 GC 百分比 含量 间 的 关系 。(a) 第 三 密码 子 位 置 与 5 侧 区 。(b) 第 三 密码 子 位 置 与 内 会 子 。(c) 第 三 密码 子 位 置 与 3' 侧 区 。(d) 内 仿 子 与 5 侧 区 。(e) 内 例子 与 3` 侧 区 。(f)5' 侧 区 与 3 侧 区 。 自 Aota 和 Ikemura (1986). ° 136° 同 质 段 的 起 源 一 如 其 被 争论 的 那样 神秘 莫 测 .注意 , 问 题 在 于 DNA 的 长 区 段 (30kb 或 更 长 一 些 ), 它 的 普遍 趋势 是 或 者 是 富 GC 的 或 者 是 少 GC 的 ,而 不 是 在 GC 含量 上 发 生 局 部 变异 一 象 我 们 在 基因 的 各 不 同 区 域 中 所 看 到 的 那样 。 贝 尔 纳 迪 等 (Bernardi 等 ,1985;1988) 提 出 , 同 质 段 是 因 功 能 上 的 ( 即 选择 上 的 ?优势 而 产生 的 。 他 们 的 主要 论据 是 ,在 温 血 生物 中 ,GC 含量 上 的 增加 可 以 保护 DNA、 RNA 和 和 蛋白 质 免 受热 的 降解 ( 见 下 面 ) ,因为 G 一 C 键 是 比 A 一 T 键 强 的 化 学 键 (第 一 章 )。 我 们 称 这 个 观点 为 选择 论 者 的 假说 (selectionist hypothesis) 。 沃 尔 夫 等 (Wolfe 等 ,1989a) 提 出 , 同 质 段 是 种 系 DNA 复制 期 间 , 由 于 前 体 核 苷 酸 库 中 的 组 成 变 化 而 造成 的 突变 倾斜 所 引起 的 。 富 含 GC 的 同 质 段 由 在 种 系 细 胞 周期 的 早期 复制 的 DNA 区 域 所 扒 带 , 而 在 那 一 期 间 前 体 库 有 较 高 的 GC 含量 ,因而 就 有 一 种 突变 成 GC 的 偏向 。 反 之 , 富 含 AT 的 同 质 段 在 细胞 周期 的 晚期 复制 , 那 时 前 体 库 有 较 高 的 AT 含量 ,故而 有 一 种 突变 成 AT 的 倾向 。 我 们 称 它 为 突变 论 者 的 假说 (mutationist hypothesis) 。 此 假说 是 根据 这 样 的 观察 而 作出 的 : 核 苷 酸 前 体 库 的 组 成 在 细胞 周期 内 会 发 生变 化 ,而 这 些 变化 事实 上 能 导致 新 合成 的 DNA 中 碱 基 比 改变 (Leeds 等 , 1985 )。 必 须 清 楚 , 哺 乳 动物 基因 组 的 复制 是 一 个 相当 漫长 的 过 程 , 要 花 8 小 时 或 者 更 多 时 间 (Holmquist , 1987). 一 个 支持 选择 论 者 假说 的 理由 是 ,第 一 和 第 二 密码 子 位 置 上 GC 含量 的 增加 可 给 予 蛋 白质 以 热 稳定 性 ,而 内 含 子 , 第 三 密码 子 位 置 和 不 翻译 区 中 GC 含量 的 增加 , 则 既 能 增加 原始 mRNA 转录 本 的 热 稳 定性 ,又 能 稳定 染色 体 的 结构 ,后 者 或 许 是 通过 影响 DNA 一 蛋白 质 的 相互 作用 而 实现 的 。 事 实 上 , 嗜 热 细菌 强烈 地 倾向 于 采用 富 GC 密码 子 的 情况 已 有 报导 ( 见 第 131 页 )。 然 而 , 温 血 肴 椎 动物 的 体 温 要 比 嗜 热 细 菌 所 经 受 的 温度 低 得 多 ,所 以 ,对 关 椎 动物 的 蛋白 质 和 DNA 序列 的 进化 来 说 ,温度 可 能 并 不 是 一 个 非常 重要 的 因素 。 选择 论 者 假说 所 面临 的 一 个 困难 是 ,大 部 分 哺乳 动物 和 鸟 类 的 基因 是 低 GC 含量 的 这 样 一 个 事 实 。 此 假说 也 不 能 解释 为 什么 有 些 重 复 基 因 有 着 相反 的 GC 含量 。 例 如 ,在 哺乳 类 中 ,8 一 珠 蛋 白 簇 是 低 GC 的 ,而 一 珠 蛋 白 簇 则 是 语 GC 的 (图 8 一 8) ,尽管 这 两 类 珠 蛋 白 基 因 是 在 同一 细胞 内 、 同 一 时 间 里 表达 的 , 且 有 着 同样 的 功能 .类 似 地 ,有 些 免 疫 球 蛋 白 基 因 位 于 富 GC 区 ,而 另 一 些 则 位 于 富 AT 区 (KL Aota 和 Ikemura, 1986) .贝尔 纳 迪 等 (Bernardi 等 ,1985,1988) 的 解释 是 , 同 质 段 代 表 选 择 的 单 位 ,而 哺乳 动物 中 的 o RE KD BIT BGC E.G ER A EK GC 同 质 段 中 。 根 据 这 一 理由 , 鸡 中 的 和 8B 复 应 该 都 被 易 位 到 富 GC 同 质 段 了 。 然 而 ,这 一 理由 却 引 出 了 一 个 富 GC 同 质 段 的 功能 优势 问题 .如 果 这 一 优势 不 是 来 自 它 所 含有 的 基因 ,那么 它 来 自 何方 呢 ? 突变 论 者 的 假说 能 解释 哺乳 类 基因 组 中 一 和 8 一 珠 蛋 白 簇 间 GC 含量 上 有 较 大 差异 的 成 因 , 即 假定 它们 分 别 位 于 早期 和 晚期 复制 的 区 域内 。 不 过 , 它 也 面临 着 一 些 困 难 (Bernardi 等 ,1988) 。 例 如 , 结构 异 染 色 质 ,如 卫星 DNA ,大 多 数 是 富 GC 的 ;而 功能 异 染 色 质 ,如 非 活 性 的 X 染色体, 在 细胞 周期 的 尾声 阶段 复制 ;在 这 些 情 况 下 , 核 苷 酸 库 和 DNA 组 成 上 的 变化 间 看 不 到 有 什么 联系 。 结论 是 , 现 有 的 资料 看 来 还 不 足以 对 这 两 种 假说 加 以 评判 .也 有 可 能 突变 压力 和 自然 选择 两 者 , 都 在 形成 温 血 肴 椎 动物 基因 组 的 组 成 上 的 组 织 化 中 起 着 作用 。 习题 1、 表 8 一 5 列 出 了 4 种 原生 动物 的 基因 数 , 平 均 基 因 大 小 的 大 致 估 值 和 C 值 .(a) 假 定 基 因 组 的 基 因 部 分 仅 由 为 蛋白 质 编码 的 基因 构成 ,那么 ,每 一 种 生物 中 非 基 因 DNA 的 比例 是 多 少 ?(b) 基 因 组 大 小 和 非 基 因 DNA 的 比例 间 存 在 某 种 关系 吗 ?( 注 意 C 值 以 pg 一 微微 克 为 单位 )。 表 8 一 5 4 种 原生 动物 的 前 体 mRNA 的 平均 大 小 和 数目 的 大 致 估 值 和 C 值 物种 基因 组 大 小 (pg) 基因 大 小 ( 核 苷 酸 ) 基因 数 Physarum polycephalum 0. 57 1500 20000 Oxytricha nova 0.4 2200 24000 Euplotes aediculatus 0. 3 1800 40000 Dictyostelium discoideum 0. 036 1500 6500 资料 取 自 Cavalier-Smith(1985) 。 2、 表 8 一 6 列 出 了 4 种 生物 的 前 体 mRNA 和 成 熟 mRNA 的 平均 大 小 的 大 致 估 值 和 C 值 .C AEN 差异 ,能 用 这 些 生 物 的 基因 间 在 非 编 码 区 的 大 小 上 存在 差异 来 加 以 解释 吗 ?( 注 意 C AW pg 为 单位 给 出 )。 表 8 一 6 4 种 动物 的 平均 基因 大 小 和 mRNA 大 小 的 大 致 估 值 和 C 值 属 基因 组 大 小 (pg) 前 体 mRNA 大 小 ( 核 苷 酸 ) mRNA 大 小 ( 核 苷 酸 ) Drosophila( # #8 ) 0.18 4200 2100 Aedes ( 8X ¥ ) 0. 837 8400 2100 Strong ylocentrotus (3% fA) 0. 89 8800 2100 Homo(\) 3. 50 10000 2100 资料 取 自 Cavalier-Smith(1985) 。 a\ 不 同 物种 平均 后 得 到 的 值 。 3 假定 在 某 一 生物 中 ,整个 基因 组 都 是 由 为 蛋白 质 编码 的 基因 所 构成 ,20 种 氮 基 酸 以 相等 的 频率 使 用 ,(a) 如 果 同 义 密码 子 的 选取 由 尽 可 能 导 至 最 高 GC 含量 的 选择 所 决定 ,那么 这 种 生物 的 GC 含 量 将 是 多 少 ?(b) 如 果 同 义 密码 子 的 选取 由 尽 可 能 导致 最 低 GC 含量 的 选择 所 决定 ,那么 这 种 生物 的 GC 含量 又 是 多 少 。 4、 假 定 在 某 一 DNA 序列 中 ,每 核 背 位 点 每 世代 的 替换 速率 从 G 或 C 到 工 或 A 为 则 从 A 或 工 到 G 或 C 为 v。 设 Pt 是 世代 t+ 时 G 和 C 核 苷 酸 在 该 序列 中 的 比例 .那么 ,GC 在 下 一 世代 中 的 比例 为 下 根据 这 一 等 式 , 证 明 平 衡 点 GC 比例 由 等 式 8. 1 给 出 。 5、 如 果 某 一 序列 的 起 始 GC 会 量 为 Po, 则 可 证 明 世 代 t 时 的 GC 比例 由 下 式 给 出 : ern A tara gee ort ore ut+uv (AE u=3X10°°, v=5X10*, A P,)=0. 20,18 t=10° HA Pt A. EXHAH PE GCCSBENBEK 是 一 个 缓慢 过 程 还 是 一 个 快速 过 程 ? 后 继 阅 读 文献 Ca (u+v)t Bernardi, G., B. Olofsson, J. Filipski, M. Zerial, J. Salinas, G. Cuny, M. Meunier-Rotival and F. Rodier. 1985. The Mosaic genome of warm-blooded vertebrates. Science 228: 953—958. Blake. R. D. and S. Early. 1986. Distribution and Evolution of sequence characteristics in the E. coli genome. J. Biomol. Struct. Dynamics 4: 291—307. Britten. R. J.and D. E. Kohne. 1968. Repeated sequences in DNA. Science 161:529—540. Brutlag. D. L. 1980. Molecular arrangement and evolution of heterochromatic DNA. Annu. Rev. Genet. 14:121— 144. Cavalier-Smith. T. (ed). 1985. The Evolution of Genome Size. Wiley. New york. Cold Spring Habor Symposia on Quantitative Biology. 1986. Moleculur Biology of Homo sapiens. Vol. 51. Cold Spring Habor Laboratory. Cold Spring Habor, NY. Deininger. P. L. and G. R. Daniels. 1986. The recent evolution of mammalian repetitive DNA ele- ments. Trends Genet. 2: 76—80 « Tae Dover. G. A. and R. B. Flavell (eds. ) . 1982. Genome Evolution. Academic Press, New York. Jelinek. W. R. and C. W. Schmid. 1982. Repetitive sequences in eukaryotic DNA and their expres- sion. Annu. Rer. Biochem. 51: 813—844. John, B. and G. Miklos. 1988. The Eukaryotic Genome in Development and Evolution. Allen & Un- win, London. Singer. M. F. 1982. Highly repeated sequences in mammalian genomes. Int. Rev. Cytol. 76: 67 — 112. — - 139° 第 二 章 2g (Woe Wy) 和 a” Gat ee 4. @)P,=9. 776 X10 *; (bP. —0, 2467 .—9. 778 X10" 5. N./N=8/9 6. N.=59. 701 7.P=s17e9 X10‘ 8. (a) 1-s A 2-s 19 aS KS Al, A 2; =2/3,2,=1/3, A m= 1. 729X10 *; (-b)x=3. 891K 10-3 第 三 章 6. (a) P,=0. 615; (b) Pa=0. 244, 9. 4r=4N,(a)K=0. 061 f(b) K=0. 056 “4 r=6 WY,(a)K=0. 041 #l(b)K =0. 037 # 2. fi K, =0.012,K, =0. 048 #l Ky =0. 295 HH 3. (a) LH K = 0.076 PH; (b) HLA K = 0.075 替换 。 4. 小 鼠 序列 的 进化 比 大 鼠 序列 的 快 1.63 倍 。 5. (a) BEF BEAL Pinas = 0.057 FR; (Cb) BF BLE nin = 0.004 FR, * 140 * (b) (c) 5 (b) FA fA . Ca) (a) (d) (c) (b) (e) (f) TES Pi} 8 《c) 和 (d) 不 形成 一 个 进化 枝 。 \b) 得 到 两 个 同样 节省 的 树 : 上 II (a) (e) (b) (c) (f) (b) (c) (e) (a) (f) PY HP Te) Hy Bb). Cc) A (Ce) HG R— THE LK I EG Balle Jp Ee - i Ba ik 2. (ad 47 个 非 简 并 位 点 和 13 个 四 重 简 并 位 点 ;(b)70 个 非 简 并 位 点 且 无 四 重 简 并 位 点 ;(c) 所 有 ° 141° 72 个 位 点 都 是 非 简 并 的 。 3.(a)5;(b)6, 4. (b)17. 24X10 4, 第 八 章 1. (a) Physarum polycephalum ,5. 37% ;Oxytricha 7ova,13. 46% ; Euplotes aediculatus, 24. 48% ; Dictyostelium discoideum ,27. 637% ; (b) 3é A 4A K7) 5 ESE DNA 所 占 比 例 之 间 存 在 着 负 相 关 。 3. (a)56.76%;(b)30. 00% 5. P,=0. 43 “ ° 142° ao <—_eor A(1)#E DNA K RNA ARE RH, DERARAA AR. acceptor site 受 体 部 位 。 内 含 子 的 3) tig. active site 活性 部 位 。 一 种 蛋白 质 , 通 常 为 一 种 酶 中 的 部 位 ,其 结构 完整 性 为 行使 功能 (例如 基质 结合 ) 时 所 必 不 可 少 的 。 additive tree 加 性 的 树 。 一 种 系统 树 ,其 中 任何 两 个 终端 节点 间 的 距离 等 于 将 它们 联结 起 来 的 枝 长 之 和 。 advantageous mntation 有 利 突 变 。 一 种 能 增加 其 携带 者 的 适合 度 的 突变 。 alignment 线性 排比 。 为 了 找 出 缺失 和 插入 的 位 置 而 将 两 同 源 序 列 进行 配 比 似 的 排列 。 allele(allelomorph) 等 位 基因 (等 位 基因 型 )。 一 个 基因 座位 上 可 供 选择 的 基因 形式 。 allele frequency (gene frequency) 等 位 基因 频率 (基因 频率 )。 和 群体 中 某 一 给 定 基 因 座 位 上 某 一 等 位 基因 拷贝 所 占 的 百分比 。 allozyme(allelozyme) 异 型 酶 (等 位 酶 )。 一 种 酶 的 某 种 等 位 形式 。 alternative splicing 选择 性 拼接 。 通 过 采用 不 同 的 受 体 和 给 体 部 位 ,而 从 一 种 前 体 一 mRNA 序列 产生 出 两 种 或 多 种 mRNA 分 子 。 amino acid 氨基 酸 。 一 种 具有 通 式 R-CHCNH;)COOH 的 有 机 分 子 , 既 有 碱 性 基 团 (NH,) 又 有 酸性 基 团 (COOH) ,还 有 为 各 种 氨基 酸 所 特有 的 侧 链 基 团 (R)。 蛋 白质 的 亚 单位 和 结构 砖 块 。 amino terminal(N-terminal) 氨基 末端 CN 一 末端)。 一 个 多 肽 的 NH2: 端 。 amplification 扩 增 。 某 一 基因 或 DNA 序列 的 拷贝 数 的 大 幅度 增加 ,增加 量 超 出 了 作为 该 生物 单 倍 体 基 因 组 的 特征 所 具有 的 量 。 analogy 类 似 。 由 趋同 进化 、 而 不 是 由 共同 的 进化 祖先 所 导致 的 相似 。 aneuploidy (chromosomal duplication ) 非 整数 倍 重复 (染色 体重 复 )。 存 在 着 额外 染色 体 , 以 至 一 个 细胞 的 染色 体 组 成 不 是 单 倍 体 组 的 整数 倍 。 anticodon 反 密 码 子 。tRNA 分 子 中 的 核 苷 酸 三 联 体 ,在 翻译 期 间 通 过 互补 碱 基 配 对 而 与 mRNA 中 的 特定 密码 子 结合 ,从 而 在 翻译 期 间 确定 某 一 具体 氨基 酸 的 位 置 。 antiparallel 反 向 平行 。DNA 双 螺 旋 的 两 条 互补 链 的 相反 取 回 。 apoprotein 脱 辅 基 蛋 白 。 一 种 没有 为 其 功能 所 必需 的 辅酶 、 辅 因子 和 辅 基 的 蛋白 质 ( 例 如 载 脂 蛋 A). archaebacteria 古 细菌 。 细 胞 壁 中 不 含 胞 壁 酸 的 原核 生物 , 是 一 个 高 度 多 样 化 的 类 群 ,包括 产 甲烷 细菌 , 嗜 热 、. 嗜 酸 的 菌 和 嗜 盐 ( 在 高 盐 浓 度 中 生活 ) 菌 , 据 推 测 是 生物 界 3 个 原始 的 后 代 品 系 之 一 。 arithmetic mean 算术 平均 。n 项 之 和 用 mn 来 除 。 asymmetrical exon 不 对 称 外 显 子 。 两 侧 由 不 同 相 位 类 型 的 内 含 子 所 夹 拥 的 外 显 子 。 autosome 常 染色 体 。 除 性 染色 体外 的 任何 一 种 染色 体 。 back (backward) mutation 回复 突变 。 使 某 一 核 苷 酸 位 点 回复 到 以 前 状态 的 突变 。 bacteriaphage( 缩 写 为 phage) 叭 菌 体 。 寄 生 于 细菌 中 的 病毒 。 balanced polymorphism 平衡 多 态 。 一 种 长 时 期 内 稳定 而 由 平衡 选择 来 维持 的 多 态 。 balancing selection 平衡 选择 。 其 结果 造成 群体 中 某 一 基因 座位 上 维持 着 两 个 或 多 个 等 位 基因 的 选择 体制 (例如 超 显 性 )。 banding 分 带 。 染 色 体 上 明和 暗 地 染 色 区 域 。 base( 见 nucleotide) 碱 基 。 base pair 碱 基 对 。(1) 某 一 核酸 中 一 条 链 上 的 核 苷 酸 , 按 嗓 叭 与 喀 啶 间 的 配对 规则 与 另 一 条 链 上 的 核 苷 酸 形成 氢 键 。(2) 度 量 双 链 DNA 长 度 的 单位 。 biased codon usage( 见 unequal codon usage) 倾 向 性 的 密码 子 应 用 。 bifurcation (dichotomy) 两 分 又 (两 分 枝 )。 系 统 树 中 一 次 物种 形成 的 进化 事件 的 图 形 表 示 ,和 藉 此 一 个 祖先 分 类 单位 分 裂 为 二 。 bottleneck 瓶颈 。 和 群体 大 小 上 的 锐 减 。 box 块 ( 框 )。 邻 近 或 位 于 某 一 基因 内 的 短 DNA 序列 ,起 着 某 种 调控 作用 (例如 TATA #). branch 分 枝 。 系 统 树 中 某 种 进化 关系 的 图 形 表 示 。 C (1) 在 DNA 或 RNA 中 为 胞 喀 啶 核 苷 ,(2) 在 蛋白 质 中 为 半 胱 氨 酸 。 C 一 terminal( 见 carboxy terminal) C 一 末端 。 C value(genome size)C 值 ( 基 因 组 大 小 ) 。 某 一 物种 的 单 倍 体 基 因 组 所 具有 的 特征 性 DNA 的 量 。 C 一 value paradox C- 值 矛盾 (C- 值 悖 论 ) 。C 一 值 和 形态 学 复杂 性 水 平 间 明 显 地 缺乏 相关 性 的 现 象 。 capping 戴 帽子 。 真 核 生 物 中 前 体 mRNA 的 5' 端 的 修饰 过 程 ,在 此 过 程 中 GTP 经 5-5' 三 磷酸 刍 而 加 入 到 该 分 子 之 中 。 cap site(transcription initiation site) 帽 子 部 位 (转录 起 始 部 位 )。 在 DNA 中 是 转录 开始 的 部 位 ,在 RNA 中 是 mRNA 成 熟 过 程 期 间 被 加 上 帽子 的 部 位 。 carboxy terminal(C-tenninal) 羧 基 末 端 (C 一 未 端 )。 一 个 多 肽 的 COOH 端 。 carrying capacity 负载 力 、 容 纳 量 。 在 一 个 有 限 的 栖息 地 中 , 某 一 给 定 物 种 所 能 维持 的 最 大 个 体 数 。 catalyst 催化 剂 。 一 种 能 降低 某 一 化 学 反应 所 需要 的 活化 能 , 却 不 被 该 反应 所 消耗 或 改变 的 化 合 物 。 cDNA( 见 complementary DNA) census population size( 见 papulation size) 统 计 记 录 的 群体 大 小 。 central dogma 中 心 法 则 。 以 DNA 为 遗传 物质 的 生物 中 、 信 息 流 动 的 路 线 CDNA->~RNA 一 蛋白 质 ) 。 chimeric protein( 见 mosaic protein) # @ & A Jit . chloroplast 叶绿体 。 一 种 含 叶 绿 素 的 .由 膜 包 被 的 细胞 器 , 它 是 植物 和 某 些 原生 生物 的 细胞 中 进 行 光合 作用 的 场所 。 chromatid 染色 单 体 。(1) 由 染色 体 复 制 而 产生 的 两 个 拷贝 之 一 。(2) 构 成 该 染色 体 的 两 个 双 链 DNA 分 子 之 一 。 chromosomal duplication( 见 aneuploidy ) 4 f& fA HZ 。 chromosome 染色 体 。 在 原核 生物 中 指 包含 基因 组 的 DNA 分 子 。 在 真 核 生 物 中 , 指 线性 DNA 分 子 与 蛋白 质 复 合 而 形成 的 含有 遗传 信息 的 线 状 结构 。 cis 顺 。 两 个 序列 或 基因 位 于 同一 染色 体 上 的 排列 。 clade 进化 枝 。(1) 按 严格 定义 , 即 由 一 个 物种 及 其 所 有 代表 着 进化 树 上 的 一 个 单 系 分 枝 的 后 代 所 构成 的 某 一 分 类 单位 。(2) 若 较 不 严格 地 应 用 , 则 在 前 面 的 范围 中 可 将 不 代表 该 分 枝 的 后 代 除 外 。 (3) 关 于 现存 生物 , 即 指 在 所 考虑 的 一 大 群生 物 中 ,一 个 有 共同 祖先 的 亚 群 ,该 共同 祖先 不 是 此 群 中 其 他 生物 的 祖先 。 cladogenesis( 见 speciation ) 分 枝 进 化 、 系 统 发 生 。 cladogram 进化 分 枝 图 、 进 化 树 。 描 绘 或 力图 描绘 一 些 群 体 、 物 种 ,或 更 高 的 分 类 单位 间 的 进化 关 系 的 图 形 表示 。 classification( 见 taxonomy) 分 类 。 coding region 编码 区 ( 域 ) 。 一 个 为 蛋白 质 编码 的 基因 中 ,最 终 将 被 翻译 的 所 有 外 显 子 部 分 。 。 144» codominance(genic selection) ) 共 显 性 (基因 选择 )。 二 倍 体 基因 组 中 某 一 基因 座位 上 的 两 个 等 位 基 因 对 适合 度 有 等 同 的 贡献 。 codon 密码 子 。mRNA 中 相 邻 核 苷 酸 构成 的 三 联 体 ,为 由 某 一 特定 tRNA 携带 的 氨基 酸 编码 ,或 者 确定 翻译 过 程 的 终止 。 codon family 密码 子 族 。 所 有 为 同一 氨基 酸 编码 的 密码 子 , 它 们 相互 间 仅 在 第 三 密码 子 位 置 上 有 差异 (例如 ,为 亮 氨 酸 编码 的 6 个 密码 子 中 ,UUA 和 UUG 组 成 一 个 族 ,CUU、CUC、CUA 和 CUG 则 组 成 另 一 族 ) 。 codon usage 密码 子 应 用 。 一 个 密码 子 族 中 的 成 员 在 为 蛋白 质 编码 的 基因 中 被 使 用 的 频率 。 coenzyme 辅酶 。 一 种 不 与 酶 结合 ,但 作为 一 种 电子 、 原 子 或 原子 基 团 的 中 间 载 体 而 为 该 酶 的 功能 所 必需 的 非 蛋 白质 有 机 分 子 。 cofactor 辅 因 子 。 为 某 种 酶 行使 功能 所 必需 的 无 机 分 子 。 coincidental evolution( 见 concerted evolution ) 并 发 进化 。 coincidental substitution 并 发 蔡 换 。 两 同 源 序列 中 的 同一 核 苷 酸 位 点 上 发 生 的 两 个 替换 。 colinearity 线性 对 应 。 无 内 含 子 基 因 的 DNA 顺序 和 其 所 编码 蛋白 质 的 氨基 酸 顺 序 间 的 精确 对 complementarity 互补 (性 )。 双 链 DNA、 双 链 RNA 或 DNA 一 RNA 双 链 中 核 苷 酸 的 反 向 平行 配 complementary DNA(CcCDNA) 互 补 DNA。 以 RNA 为 模板 由 反 转 录 酶 合成 的 DNA。 complex(composite)transposon 复合 (合成 ) 转 座 子 。 两 侧 由 两 个 完整 而 独立 的 可 转 座 插 人 序列 夹 拥 的 转 座 子 。 compositional assimilation 组 成 同化 。 假 基因 中 由 于 点 突变 的 积累 最 终 抹 掉 了 它 与 产生 它 的 功能 基因 间 的 顺序 相似 性 ,从 而 使 其 核 苷 酸 组 成 与 其 邻近 DNA 序列 的 相似 。 ‘concerted evolution (horizontal evolution ,coincidental evolution ) 协 同 进 化 (水 平 进 化 、 并 发 进化 )。 一 个 物种 中 某 一 基因 家 族 的 成 员 间 核 苷 酸 序列 的 同 质 性 的 维持 ,尽管 核 苷 酸 序列 随 着 时 间 而 改变 。 conditional fixation time 条 件 固定 时 间 。 一 个 最 终 将 会 在 群体 中 固定 的 突变 型 等 位 基因 达到 固定 的 时 间 。 consensus sequence 共同 顺序 。 在 许多 同 源 序列 中 ,每 一 个 位 点 上 都 代表 了 占 绝 大 多 数 的 核 苷 酸 或 氨基 酸 的 那 种 顺序 。 conservative substitution 保守 替换 。 某 一 氨基 酸 被 另 一 个 有 相似 的 化 学 性 质 的 氨基 酸 蔡 换 。 conservative transposition 保守 (型 ) 转 座 。 可 转 座 因子 不 复制 而 从 一 个 基因 组 位 置 移 到 另 一 个 位 置 的 运行 。 constant site or constant region 恒定 位 点 (不 变 位 点 ) 或 恒定 区 。 在 所 有 被 比较 的 同 源 序列 中 , DNA 内 由 同样 的 核 苷 酸 占据 的 位 点 或 区 域 。 convergence 趋同 。 相 似 的 遗传 或 表 型 性 状 的 独立 进化 。 convergence substitution 趋同 替换 。 在 两 同 源 序列 中 的 同一 核 苷 酸 位 点 上 ,两 个 不 同 的 核 苷 酸 由 同一 核 苷 酸 所 替换 。 crossing-over 交换 。 两 同 源 染 色 体 间 导 致 连锁 基因 重组 的 遗传 物质 交换 的 过 程 。 假定 该 过 程 是 两 染色 体 先 在 同 源 位 点 处 断裂 ,然后 交换 、 接 着 重新 连结 而 完成 。 cyanobacteria 蓝 细菌 。 具 有 光合 作用 能 力 的 一 类 光合 真 细 菌 。 以 往 称 蓝 绿 藻 。 D 天 冬 氨 酸 。 Darwinian fitness( 见 fitness) 达 尔 文 适合 度 。 decoding( 见 translation) 解 码 。 degenerate code 简 并 密码 。 一 种 遗传 密码 ,其 中 有 意义 密码 子 的 数目 大 于 氨基 酸 总 数 , 结 果 有 些 氨基 酸 将 由 一 个 以 上 的 密码 子 来 确定 。 所 有 已 知 的 遗传 密码 都 是 简 并 的 。 degenerate site 简 并 位 点 。 一 个 密码 子 中 能 由 一 个 以 上 的 核 代 酸 占据 而 仍 为 同样 的 氨基 酸 编码 的 . 145 。 AB RPK RL. degree of divergence 岐 化 程度 。 两 同 源 序 列 相 互 间 的 差异 程度 。 deleterious mutation 有 害 突变 。 降 低 其 携带 者 的 适合 度 的 突变 。 deletion 缺失 。 从 某 一 DNA 序列 中 移 去 了 一 个 或 多 个 碱 基 。 denaturation 变性 。 和 蛋白 质 的 三 级 结构 的 丧失 。 有 时 被 用 作 DNA 熔 解 的 同义词 。 deoxyribonucleic acidCDNA) 脱 氧 核糖 核酸 。 核 苷 酸 连 结 而 成 的 一 种 大 分 子 聚 合 物 ,其 中 糖 基 为 脱 氧 核糖 。 通 常 是 双 链 的 。 在 所 有 真 核 生 物 和 原核 生物 中 ,以 及 许多 病毒 中 , 它 是 遗传 信息 的 携带 者 。 deterministic process 决定 性 过 程 。 其 结果 能 从 有 关 起 始 条 件 的 知识 来 精确 地 预测 的 过 程 。 diagnostic position ( 见 informative site) 判 定位 置 。 dichotomy( 见 bifurcation ) 两 分 枝 。 digestion 消化 ` 水 解 。 双 链 DNA 被 某 一 限制 性 内 切 核酸 酶 所 切割 。 diploid 两 倍 体 。 一 套 染 色 体 ,其 中 每 种 染色 体 都 有 两 个 拷贝 。 directional selection 定向 选择 。 按 一 种 特别 的 方向 ,或 者 走向 固定 或 者 走向 灭绝 ,来 改变 某 种 等 位 F 基因 的 频率 的 选择 体制 。 4 disjunction 去 联结 。 减 数 分 裂 期 间 同 源 染 色 体 的 分 离 ,或 有 丝 分 裂 期 间 互补 的 染色 单 体 的 分 裂 。 4 distance( I, genetic distance) FE BS 。 distance matrix 距离 矩阵 。 被 研究 的 类 群 中 各 分 类 单位 间 的 遗传 距离 值 组 成 的 矩阵 。 divergence 分 岐 。 一 个 分 类 学 单位 分 成 两 个 的 分 梳 。( 还 可 见 sequence divergence) DNA( 见 deoxyribonucleic acid ) DNA-DNA hybridization DNA-DNA 杂交 。 形 成 异 源 的 DNA 双 链 。 domain ( Ji, functional domain ) 域 。 dominance 显 性 。 在 杂 合 子 中 某 一 等 位 基因 显示 其 完全 的 表 型 效应 的 性 质 donor site 供 体 部 位 。 一 个 内 含 子 的 5 Site dose repetition 剂量 重复 。 某 一 DNA 序列 存在 着 多 重 拷贝 ,这 可 由 某 基 因 产 物 以 相对 于 单 拷贝 序 列 而 言 呈 增加 量 的 形式 产生 来 表明 。 dot matrix 点 (和 矩 ) 阵 。 一 种 序列 的 线性 排比 方法 , 其 中 两 序列 分 别 写成 矩阵 的 首 列 和 首 行 、 而 点 WAT AAR MO BAT BoP. downstream 下 游 。 一 个 核酸 上 的 某 一 参考 点 的 ITE. BRENT. drift( 见 random genetic drift) 2% . duplex 双 链 、 双 螺旋 。 一 个 双 链 DNA BK IL HE RNA ,或 一 个 由 单 链 DNA 与 RNA 分 子 互补 配对 而 形成 的 双 螺 旋 。 duplication 重复 ,复制 。 基 因 组 中 某 一 DNA 片段 的 两 个 拷贝 存在 或 产生 。 duplicative transposition( 见 replicative transposition ) 复 制 型 转 座 。 E#aAR. effective population size 有 效 群 体 大 小 。 与 随机 遗传 漂 变 有 关 的 群体 大 小 。 群 体 中 从 事 生殖 的 实际 个 体 数 。 electromorph 电泳 型 。 由 电泳 移动 性 差异 检 出 的 蛋白 质变 异型 ( 同 功 酶 或 异型 酶 ) 。 electrophoresis 电泳 。 将 浴 解 的 或 胶体 的 颗粒 在 由 场 下 根据 它们 的 移动 性 分 离 的 技术 。 电 泳 移 动 性 有 赖 于 该 颗粒 的 大 小 .三维 几 何 形状 和 电 和 荷 。 endosymbiosis 内 共生 。 两 种 生物 间 的 互利 关系 ,其 中 一 种 生物 .内 共生 者 (endosymbiont) ,生活 在 另 一 种 和 生物、 宿主 Chost) 的 组 织 或 细胞 内 。 endosymbiotic theory 内 共生 学 说 。 该 学 说 认为 ,自我 复制 的 细胞 器 ,如 线粒体 和 叶绿体 ,原初 本 是 自由 生活 的 生物 ,后 来 进入 有 核 的 细胞 并 与 之 建立 了 共生 关系 ,进而 失去 了 独立 生存 的 能 力 。 enzyme 酶 。 能 催化 特异 化 学 反应 的 蛋白 质 或 蛋白 质 复合 物 。 eubacteria 真 细 菌 。 细 胞 壁 中 挫 人 了 胞 壁 酸 的 原核 生物 。 即 除 古 细菌 外 的 所 有 细菌 。 生 物 界 中 三 * 146° WaS aa o —_ 个 原始 祖先 品系 之 一 。 eukaryote 真 核 生物 。 具 有 一 个 真正 的 细胞 核 和 一 些 由 膜 包 被 的 细胞 器 的 生物 。 生 物 界 中 三 个 原 始祖 先 品 系 之 一 。 exon 外 显 子 。 基 因 的 一 个 DNA 片段 ,其 转录 本 在 成 熟 的 RNA 分 子 中 出 现 。 exon duplication 外 显 子 重复 。 一 个 基因 内 的 某 一 外 显 子 的 重复 拷贝 的 产生 。 exon insertion 外 显 子 插入。 一 个 或 多 个 外 显 子 从 一 个 基因 挫 人 到 另 一 个 基因 子 。 exon shuffling 外 显 子 混 义 。 严 格 地 讲 指 外 显 子 重复 和 外 显 子 插 入 。 常 常 与 外 显 子 插入 同 义 地 应 expected heterozygosity( 见 heterozygosity, gene diversity) 期 望 杂 合 度 、 预 期 杂 合 度 。 extinction 灭绝 。 一 个 进化 谱系 的 终止 。 FARA AR. fecundity 生殖 力 。 一 种 适合 度 分 量 。 某 一 给 定 基因 型 每 个 体 的 生育 数 或 产 卵 量 。 fertility 能 育 性 。 一 种 适合 度 分量 。 某 一 给 定 基因 型 每 个 体 的 成 活 后 代数 。 fitness (Darwinian fitness) 适 合 度 (达尔 文 适 合 度 ) 。 某 一 个 体 或 某 一 基因 型 的 生存 和 繁殖 上 的 相 对 成 就 的 测度 。 某 一 个 体 或 某 一 基因 型 对 将 来 世代 的 相对 贡献 。 fixation 固定 。 当 某 一 等 位 基因 在 群体 中 的 频率 达到 100% 时 所 出 现 的 情况 。 一 个 两 倍 体 群 体 中 的 所 有 成 员 对 同一 等 位 基因 而 言 都 是 纯 合 的 时 的 情况 。 fixation probability 固定 概率 。 某 一 特定 等 位 基因 将 在 群体 中 固定 的 可 能 性 。 fixation time 固定 时 间 。 某 一 突变 型 等 位 基因 在 群体 中 达到 固定 所 花 的 时 间 。 flanking sequence 侧 ( 区 ) 序 列 。 被 转录 基因 的 5' 和 3' 端 处 的 不 转录 序列 。 foldback DNA 8 Sif # DNA。 含 有 完美 或 接近 完美 回 文 的 DNA , 当 其 为 单 链 时 可 通过 自身 折 回 而 形成 发 夹 状 的 结构 。 fourfold degenerate site 四 重 简 并 位 点 。 密 码 子 中 的 一 个 核 苷 酸 位 点 ,在 该 位 点 上 一 切 可 能 的 替换 都 是 同 义 的 。 frameshift mutation 阅读 框架 移动 突变 。 一 种 扰乱 了 为 蛋白 质 编码 基因 的 阅读 框架 的 突变 。 一 个 DNA 片段 的 缺失 或 插入 , 当 该 片段 的 长 度 不 是 3 或 3 的 倍数 个 核 苷 酸 时 , 即 可 造成 这 类 突变 。 frameshifted protein 阅读 框架 移动 后 的 蛋白 质 ,由 于 阅读 框架 变 得 与 基因 的 原初 或 主要 阅读 框 架 不 同 ,而 编码 出 一 种 完全 或 部 分 地 不 同 的 蛋白 质 。 functional constraint (selective constraint) 功 能 限制 (选择 限制 )。 一 个 位 点 或 一 个 基因 座位 对 核 苷 酸 蔡 换 所 具有 的 特征 性 忍受 程度 。 functional domain(domain) 功 能 域 ( 域 ) 。 蛋 白质 内 的 一 个 界限 明确 的 区 域 ,能 行使 某 一 特殊 的 功 能 。 它 可 能 不 是 由 连续 的 氨基 酸 段 所 构成 ,虽然 就 所 涉及 的 蛋白 质 的 三 级 结构 而 言 , 它 几乎 总 是 由 那 些 相互 邻近 的 氨基 酸 所 构成 。 GD 在 DNA 或 RNA 中 为 鸟 味 叭 ,(2) 在 蛋白 质 中 为 甘氨酸 。 gamete 配子 。 具 单 倍 体 数 染 色 体 的 生殖 细胞 。 gap 裂 篷 。 一 段 插入 或 缺失 。 在 序列 线性 排比 中 则 为 一 个 含有 空缺 碱 基 的 对 子 。 gap penalty 裂 颖 处 罚 。 与 点 替换 发 生 的 频率 相 比 裂缝 事件 在 进化 中 发 生 的 频 度 如 何 ? 对 此 问题 作 出 的 估价 即 裂 矣 处 罚 。 在 线性 排比 算法 上 ,或 者 用 一 个 因子 来 乘 以 裂 锋 的 总 长 度 , 或 者 将 某 一 给 定 长 度 有 裂 矣 的 数目 乘 以 一 个 函数 ,应 用 这 些 值 才 有 可 能 对 裂 锋 和 替换 加 以 比较 。 gene 基因 。 基 因 组 DNA 或 RNA 中 的 一 个 序列 , 它 是 某 一 特别 功能 的 根本 。 gene conversion 基因 转变 。 一 种 非 相 互 重组 过 程 , 结 果 是 一 个 序列 变 得 与 另 一 序列 等 同 。 gene duplication 基因 重复 。 广义 地 , 指 一 个 DNA 序列 的 两 个 拷贝 产生 。 狭义 而 言 , 指 一 个 完整 的 基因 序列 的 重复 。 gene family( 见 multigene family) 基 因 家 族 。 gene frequency( 见 allele frequency) 基 因 频 率 。 gene pool 基因 库 。 一 个 有 性 生殖 的 群体 中 的 所 有 基因 。 gene sharing 基因 分 享 。 一 个 基因 在 不 重复 且 失 去 其 原始 功能 的 前 提 下 ,获得 并 维持 第 二 种 功能 的 现象 。 gene substitution 基因 替换。 一 种 过 程 , 厌 此 一 个 新 的 突变 型 等 位 基因 在 群体 中 达到 固定 。 gene tree 一 种 由 来 各 每 物种 的 一 个 或 几 个 基因 构成 的 系统 树 。 generation time 世代 时 间 。 两 个 连续 世代 之 间 的 平均 时 间 间 隔 。 有 时 定义 成 双亲 在 生产 其 顺序 处 在 中 间 的 孩子 时 ,所 具有 的 平均 年 龄 。 genetic code 遗传 密码 。 一 组 将 密码 子 翻译 成 氨基 酸 的 规则 。 genetic distance(distance) 遗 传 距 离 (距离 )。 广 义 地 , 指 个 体 、 群 体 , 或 物种 间 遗 传 差 异 程度 的 几 种 测度 中 的 任何 一 种 。 对 分 子 进 化 而 言 , 则 是 两 同 源 DNA 序列 自分 岐 以 来 ,它们 间 累 积 的 每 核 苷 酸 位 点 的 核 苷 酸 蔡 换 数 的 测度 。 genetic drift( 见 random genetic drift) 遗 传 漂 变 。 genetic polymorphism( 见 polymorphism) ) 遗 传 多 态 性 现象 。 genetic DNA 基因 (的 )DNA。 基 因 组 中 含 基 因 的 部 分 。 genetic selection (J, codominance) 基 因 选 择 。 genome 基因 组 。 由 一 个 细胞 或 个 体 所 携带 的 整套 遗传 物质 。 genome doubling( 见 polyploidy) 基 因 组 加 倍 。 genome duplication( 见 polyploidy) 基 因 组 重复 。 genome size( 见 value) 基 因 组 大 小 。 genomic compartmentalization 基因 组 的 区 域 化 。 指 细胞 中 独立 地 复制 的 基因 组 的 存在 。 通 常 , 指 细胞 需 的 基因 组 。 genotype 基因 型 。 某 一 生物 的 特别 的 等 位 基因 组 成 ,包括 那些 不 在 表 型 水 平 上 表现 出 来 的 等 位 基 因 。 常 常 指 被 研究 的 一 个 或 少数 几 个 基因 的 等 位 基因 组 成 。 geometric mean 几何 平均 ( 值 )。n 个 项 相 乘 以 后 开 mn 次 方 所 得 到 的 根 。 germ-line cell 种 系 细 胞 ,生殖 细胞 。 精 细胞 或 卵细胞 ,或 一 个 它们 的 前 身 细胞 。 HAAR. haploid 单 倍 体 。 具 有 一 套 不 成 对 的 染色 体 的 细胞 或 生物 。 haploid set 单 倍 体 组 。 一 个 单 倍 体 细 胞 或 生物 中 的 染色 体 。 haplotype 单 倍 型 。 一 条 染色 体 的 特别 的 等 位 基因 组 成 。 和 常常 指 被 研究 的 一 个 或 几 个 连锁 基因 的 等 位 基因 组 成 。 Hardy-Weinberg equilibrium 哈 迪 一 温 伯 格 平衡 。 一 个 两 倍 体 群 体 中 基因 型 的 频率 等 于 有 关 等 位 基因 的 频率 之 积 的 局 面 。 heteroduplex 异 源 双 链 。 两 条 链 各 来 自 不 同 个 体 的 双 链 核酸 分 子 。 heterogeneous nuclear RNA (heterogeneous RNA. heteronuclear RNA, hnRNA) & WW A #-RNA (FR RNA, 5H RNA hnRNA), 4K PH RNA 转录 本 ,表示 rRNA .mRNA Al tRNA 的 前 体 和 经 加 工 的 中 间 产 物 ,以 及 成 熟 但 未 传送 到 细胞 质 中 的 RNA 转录 本 。 heterosis( 见 overdominance) Ay Ff ft # . heterozygosity 杂 合 度 、 杂 合 性 。 对 群体 中 遗传 变异 的 一 种 测度 ,可 用 杂 合 子 对 所 有 基因 座位 的 平 均 频 率 算出 (观察 杂 合 度 ,observed heterozygosity) ,或 者 用 杂 合 子 在 一 个 处 于 哈 迪 一 温 伯 格 平衡 的 群 体 中 预期 的 平均 频率 算出 (期 望 杂 合 度 ,expected heterozygosity, Kt A Bt .gene diversity), heterozygote 杂 人 合子。 在 被 研究 的 基因 座位 上 有 不 同等 位 基因 的 两 倍 体 个 体 。 heterozygote advantage (hl, overdominance) 48 4 -F tit #* . higher taxon 高 级 分 类 单位 。 种 以 上 水 平 的 分 类 单位 。 highly repetitive DNA 高 度 重复 的 DNA.。 由 平均 重复 成 百 上 千 次 的 序列 构成 的 基因 组 DNA 的 部 ° 148 和 ee OE ese ee I — SS - ae highly repetitire genes 高 度 重 复 的 基因 。 在 单 倍 体 基 因 组 中 出 现 许 多 拷贝 的 有 功能 基因 。 homoduplex 同 源 双 链 。 一 种 双 链 DNA ,其 两 条 互补 的 链 来 自 同 一 个 体 。 homology 同 源 (性 )。 因 有 共同 祖先 或 遗传 相关 而 类 似 。 homozygote 纯 合 子 。 在 一 个 或 多 个 基因 座位 上 有 相同 的 等 位 基因 的 两 倍 体 个 体 。 horizontal evolution( 见 concerted evolution ) 水 平 进化 horizontal gene transfer 水 平 基 因 转 移 , 横 向 基因 转移 。 遗 传 信 息 从 一 个 基因 组 向 另 一 个 基因 组 的 转移 ,特别 是 不 同 物种 间 的 转移 。 hotspot of mutation 突变 (的 ) 热 点 .基因 组 DNA 的 一 个 片段 ,对 自发 的 或 某 种 特别 诱 变 剂 作 用 下 的 突变 表现 出 较 高 的 倾向 性 。 hybrid dysgenesis 杂种 劣势 。 一 组 相关 的 异常 症状 ,在 某 种 相互 作用 的 果 蝇 品系 间 的 一 种 类 型 的 杂种 中 能 自发 地 诱 生 、 但 在 相反 类 型 的 杂种 中 则 不 出 现 。 hybrid vigor( 见 overdominance ) AY FH fit # , AR FH YM HE hydrogen bond 氧 键 。 氢 原子 和 一 个 电 负 性 的 原子 .如 氧 、 之 间 的 弱 的 、 非 共 价 键 。 hypervariable site or hypervariable region 高 可 变 部 位 或 高 可 变 区 域 。 展 示 出 超过 了 种 间 变 异性 的 一 段 DNA 或 蛋白 质 。 如 此 大 的 变异 性 的 维持 ,通常 需要 该 基因 座位 经 受 某 种 形式 的 平衡 选择 ,如 超 显 性 选择 。 LEAR. independent assortment (Mendel’s second law) 独 立 分 配 ( 备 德尔 第 二 定律 ) 。 在 非 连锁 的 基因 座位 中 ,一 个 座位 上 的 等 位 基因 的 分 离 与 另 一 个 座位 上 的 分 离 无 关 。 inferred tree 推测 树 .推论 树 。 根 据 属于 现存 分 类 单位 的 经 验资 料 作出 的 系统 树 。 informative site(diagnositic position ) 信 息 位 点 (判定 位 置 )。 用 于 从 所 有 可 能 的 系统 树 中 选取 最 节 省 树 的 位 点 。 在 分 子 进化 中 ,是 其 中 至 少 有 两 种 不 同类 型 的 核 苷 酸 或 氨基 酸 , 且 它们 中 的 每 一 种 至 少 在 两 个 序列 中 出 现 的 位 点 。 initiation codon 起 始 密码 子 。 为 蛋白 质 编码 基因 的 阅读 框架 中 的 第 一 个 密码 子 ;: 通 常 , 在 真 核 生 物 中 是 ATG 编码 的 甲 硫 氢 酸 ,在 原核 生物 中 则 编码 甲 酰 甲 硫 氮 酸 。 in-phase overlapping 相位 内 重 肆 。 两 个 或 多 个 蛋白 质 按 同一 阅读 框架 翻译 的 现象 : insertion 插 人 。 一 个 或 多 个 核 苷 酸 揪 入 一 个 DNA 序列 中 的 突变 。 insertion sequence 捅 和 人 序列。 一 种 除 带 有 转 座 所 必需 的 片段 外 不 带 任 何 遗传 信息 的 可 转 座 因 子 。 internal gene duplication (partial gene duplication) 基 因 内 重复 (部 分 基因 重复 )。 基 因 内 的 重复 序 列 , 由 比 整 个 基因 序列 小 的 有 关 重 复 所 派生 而 来 。 internal node 内 部 节点 。 系 统 树 中 代表 某 一 祖先 生物 或 基因 的 图 形 。 interon (intervening sequence) 内 含 子 ( 间 隔 序列 )。 一 种 可 转录 基因 的 DNA 片段 ,其 转录 本 在 RNA 成 熟 的 过 程 中 被 除去 ,因而 不 出 现在 成 熟 的 RNA 分 子 中 。 它 位 于 外 显 子 之 间 。 invariant repetition 不 变 重复 。 在 顺序 上 相互 等 同 或 几 近 等 同 的 重复 DNA 片段 的 存在 。 inversion 倒 位 。 造 成 某 一 DNA 片段 极 性 颠倒 的 突变 。 isoaccepting tRNA 同 受 体 tRNA, 同 功 tRNA。 人 能 携带 同样 氨基 酸 的 不 同类 型 tRNA. isochore 同 质 段 。 在 碱 基 组 成 上 同 质 的 基因 组 DNA Jr Be. isozyme(isoenzyme) 同 功 酶 。 有 相同 或 接近 相同 的 化 学 性 质 ,但 由 不 同 基因 座位 所 编码 的 一 些 不 同型 式 的 酶 。 junk DNA 废物 DNA。 基 因 组 DNA 中 的 无 功能 部 分 。 K i AR. L 3AM. lagging strand 后 随 链 。 以 不 连续 方式 ,从 5 到 3' 沿 背离 复制 叉 的 方向 合成 的 DNA 链 。 leading strand 前 导 链 。 以 连续 的 方式 ,从 5' 到 3' 沿 朝向 复制 叉 的 方向 合成 的 DNA 链 。 length abridgment 长 度 缩短 。 假 基因 在 进化 期 间 由 于 缺失 超过 插 人 而 造成 的 逐渐 缩短 。 ee 149 « lethal mutation 致死 突变 。 造 成 其 纯 合 携带 者 死亡 或 不 育 的 突变 。 ligation 连接 。 将 双 链 DNA 中 由 缺口 分 开 的 两 个 相 邻 碱 基 联 接 、` 而 形成 的 磷酸 二 酯 键 。 用 于 联接 的 粘性 未 端 由 限制 性 内 切 核 酸 酶 水 解 产 生 。 连接 过 程 由 连接 酶 (ligase) 催 化 。 LINE (Long INterspersed Element 的 首 字 母 缩 略 ) 长 散在 因子 。 一 种 散在 的 重复 序列 ,典型 的 LINE 长 5000 碱 基 对 以 上 ,在 多 细胞 真 核 生物 的 基因 组 中 其 拷贝 数 为 10' 或 超过 10*。 又 称 长 的 散在 重复 序列 。 linkage 连锁 。 两 个 或 多 个 非 等 位 的 基因 位 于 相互 很 接近 的 位 置 处 ,并 倾向 于 一 起 遗传 的 现象 。 localized repeated sequences 区 域 性 重复 序列 。 串 接 排 列 的 重复 序列 , 通 篆 由 短 的 单纯 重复 单位 所 构成 (例如 卫星 DNA). locus( 复 数 loci) 基 因 座 位 。 染 色 体 上 某 一 特定 基因 或 DNA 片段 所 处 的 位 置 。 lowly repetitive genes 低 度 重复 基因 。 在 单 倍 体 基 因 组 中 仅 以 几 个 拷贝 存在 的 基因 。 M HAR. match 匹配 。 在 序列 排列 时 ,两 序列 的 同 源 位 置 上 存在 同样 的 碱 基 的 现象 。 maturation KA, May mRNA 形成 mRNA。 maximum parsimony(parsimony) 最 节省 (节省 )。 从 所 有 可 能 的 系统 树 中 选 出 所 需 蔡 换 数 最 少 的 那 种 系统 树 , 以 它 作为 真实 系统 树 。 meiosis (reduction division ) 减 数 分 裂 。 在 从 两 倍 体 细胞 产生 单 倍 体 配子 时 采用 的 真 核 细 胞 分 裂 过 程 。 减 数 分 裂 的 特征 是 分 裂 后 染色 体 数 目 减 半 ,以 保证 每 个 配子 有 各 对 常 染 色 的 一 个 代表 和 一 半 性 染 色 体 。 meiotic drive( 见 segregation distortion ) 减 数 分 裂 驱 动 。 melting fff. OEM ARR. WHR MA BHM KR. Mendelian segregation (Mendel's first law ,segregation ) ) 孟 德尔 ( 式 ) 分 离 ( 备 德尔 第 一 定律 、 分 离 )。 杂 合 子 中 某 一 基因 对 的 两 个 不 同等 位 基因 在 减 数 分 裂 中 分 离 , 以 同样 比例 产生 两 类 配子 ,每 类 配子 各 带 一 个 不 同 的 等 位 基因 。 Mendelian second law( 见 independent assortment) 备 德尔 第 二 定律 。 一 mer 表示 和 蛋白质 中 亚 基 数 的 后 缀 .前 缀 表示 亚 基 的 数目 (例如 , monomer, dimer, tetramer ,mul- timer ) ,或 单元 间 的 相似 性 (例如 ,homomer,heteromer) ,或 既 表 示 单 元 数目 又 表示 单元 的 类 型 (例如 , homotrimer ,heteromultimer ) 。 messenger RNACmRNA) 信 使 RNA。 从 某 种 初级 RNA 转录 本 加 工 而 成 RNA 分 子 , 用 于 合成 由 氨基 酸 组 成 的 多 肽 的 翻译 中 。 middle-repetitive DNA 中 (等 程 ) 度 重复 DNA。 基 因 组 DNA 中 ,长 度 相 对 较 长 .重复 数 平均 在 几 十 次 到 几 百 次 之 间 的 那 一 部 分 序列 。 migration 迁移 。 指 群体 遗传 学 中 个 体 或 基因 在 各 群体 间 的 移动 。 mismatch 匹配 错误 。 在 顺序 的 线性 排比 中 ,两 序列 的 某 一 同 源 位 置 上 有 不 同 碱 基 的 现象 。 missense mnutation( 见 nonsynonymous mnutation ) 误 义 突 变 。 mitochondrion (复数 mitochondria) 线 粒 体 . 真 核 细胞 中 一 种 含 DNA 的 细胞 器 , 它 用 一 种 需 氧 的 电子 传递 系统 ,把 由 食物 分 子 分 解 所 得 到 的 化 学 能 转换 成 ATP 储 能 。 mitosis 有 丝 分 裂 。 真 核 细 胞 的 分 裂 模式 ,通过 这 种 分 裂 能 产生 两 个 具有 与 亲本 细胞 同样 染色 体 套 的 子 细胞 。 mobile element (J, transposable element) 可 ( 移 ) 动 因子 。 moderately repetitive genes 适度 重复 基因 。 单 倍 体 基 因 组 中 具有 适度 拷贝 数 的 基因 。 module(struclural domain) 组 件 ( 结 构 域 ) 。 球 状 蛋白 质 中 的 、 某 个 结构 上 独立 的 .稳定 的 \ 且 紧密 的 室 间 单位 。 该 单位 能 与 其 他 部 分 相 区 别 ,通常 是 由 一 段 连续 的 氨基 酸 段 所 组 成 。 molecular clock 分 子 ( 时 ) 钟 。(1) 指 突变 在 某 一 给 定 基因 组 片段 中 积累 的 速率 。(2) 指 假说 , 即 就 在 一 给 定 基 因 或 DNA 序列 而 言 , 突 变 在 所 有 进化 谱系 中 以 接近 恒定 的 速率 积累 ,只 要 该 基因 或 该 ° 150 » DNA 序列 保留 其 原初 功能 。 将 该 时 钟 用 于 所 有 基因 和 所 有 生物 的 推广 尚 有 争议 。 monomorphic 单 态 (性 ) 的 。 一 个 群体 中 所 有 个 体 在 某 一 基因 座位 上 实际 上 有 同样 的 等 位 基因 , 则 称 是 单 态 的 。 monophyletic 单 源 的 。 享 有 一 个 共同 祖先 的 现象 。 mortality 死亡 率 。 适 合 度 的 一 个 分 量 。 某 一 给 定 基因 型 的 个 体 在 达到 某 一 年 龄 之 前 死亡 的 平均 概 率 ( 例 如 ,到 平均 生育 年 龄 的 死亡 率 ) 。 mosaic protein (chimeric protein ) 镶 舱 蛋 白质 ( 嵌 合 蛋白 质 ) 。 由 一 个 有 来 自 不 同 基因 的 区 域 的 基因 编码 的 蛋白 质 。 也 指 通过 遗传 工程 而 得 到 的 人 工 蛋 白质 。 .mRNA( 见 messenger RNA) ff ff RNA. multifurcation 多 ( 重 ) 分 又 。 包 括 3 个 以 上 的 分 类 学 单位 的 系统 树 中 ,等 级 不 明 的 分 枝 的 图 象 表 示 。 偶 尔 , 也 是 同时 产生 两 个 以 上 物种 的 物种 形成 事件 的 图 象 表示 。 ~ multigene family(Cgene family) 多 基因 家 族 ( 基 因 家 族 )。 由 某 一 祖先 基因 重复 而 产生 的 一 套 基因 , 它们 间 的 相似 度 大 于 50% 。 它 们 相互 间 常 常 紧密 连锁 ,具有 相似 或 重 释 的 功能 。 multiple substitution 多 重 替 换 。 在 某 一 DNA 序列 的 同一 核 苷 酸 位 点 上 相继 发 生 两 次 或 多 次 替 换 。 mutagen 诱 变 剂 。 使 突变 率 增加 的 物理 学 或 化 学 实体 。 mutant 突变 型 。 某 一 些 基 因 的 一 种 新 变异 型 。 mutation 突变 。 使 某 一 DNA 序列 变 成 不 同 于 其 原来 状态 的 改变 。 mutation rate 突变 率 。 某 一 个 体 中 ,每 单位 时 间 里 每 核 苷 酸 位 点 或 每 基因 产生 的 突变 数 。 mutational bias 突变 偏 斜 。 四 种 核 苷 酸 表 现 出 有 不 同 的 突变 倾向 ,或 者 产生 某 一 核 苷 酸 多 于 其 他 核 苷 酸 这 样 结果 的 突变 模式 。 常 常 是 由 各 核 苷 酸 不 均等 地 积累 所 造成 的 。 N (1) 在 DNA 或 RNA 中 ,表示 某 一 未 知 的 核 苷 酸 。(2) 在 蛋白 质 中 表示 天 冬 酰 胺 。 ”natural selection (selection ) 自然 选择 (选择 )。 由 于 各 个 体 或 各 基因 型 间 适 合 度 上 的 变异 性 ,造成 某 一 物种 的 不 同 成 员 的 生殖 差异 ,从 而 导致 了 等 位 基因 频率 随 着 时 间 的 改变 而 改变 。 negative selection 负 选 择 ( 见 purifying selection ) neighboring taxa 近邻 分 类 学 单位 ( 见 sister taxa). neutral mutation 中 性 突变 。 不 改变 该 生物 的 适合 度 的 突变 。 neutral theory (neutral-mutation theory 或 neutral-mutation hypothesis) 中 性 学 说 (中 性 突变 学 或 中 性 突变 假说 )。 认 为 分 子 水 平 上 的 进化 主要 是 由 突变 输入 和 随机 遗传 漂 变 所 决定 ,而 不 是 由 自然 选择 所 决定 。 node 节点 。 系 统 树 中 某 一 现存 的 或 祖先 的 OTU 的 图 象 表示 。 nondegenerate site 非 简 并 位 点 。 编 码 区 中 所 有 替换 都 是 非 同 义 蔡 换 的 核 苷 酸 位 点 。 nondisjunction 不 分 离 。 减 数 分 裂 期 间 同 源 染 色 体 的 分 离 失 败 。 nonfunctionalization (silencing) 无 功能 化 (沉默 )。 继 丧失 功能 的 突变 之 后 ,功能 基因 变 成 假 基 因 的 转变 。 nongenic DNA 非 基 因 DNA。 基 因 组 中 不 含 基因 的 部 分 。 nonsense codon 无 意义 密码 子 ( 见 termination codon) 。 nonsense mutation 无 ( 意 ) 义 突变 。 使 有 意义 密码 子 变 成 终止 密码 子 的 突变 。 nonsense strand 无 义 链 。 基 因 的 一 条 链 转 录 产 生 RNA, 另 一 条 不 产生 RNA 的 链 即 无 义 链 , 其 转 录 本 的 顺序 与 RNA 的 互补 。 nonsynonymous substitution (missense substitution ) 非 同 义 替 换 ( 误 义 替 换 )。 使 某 一 密码 子 变 成 为 另 一 氨基 酸 编 码 的 密码 子 的 替换 。 N-terminal N-( 末 ) 端 ( 见 amino terminal) nucleic acid KRM. DNA Bk RNA. nucleotide (base ) % #f B (HRAE) . HH — 4 A HE. — KE. A — ERE RA 2. PK « bow « 酸 的 基本 建筑 砖 块 。 nucleotide diversity 核 苷 酸 多 样 度 。 用 于 测度 核酸 序列 的 多 态 性 的 尺度 。 从 某 一 群体 随机 选取 的 任何 两 个 序列 间 的 每 位 点 平均 核 苷 酸 差异 数 。 nucleotide substitution 核 苷 酸 蔡 换 。 发 生 了 一 个 核 苷 酸 被 另 一 核 苷 酸 蔡 换 的 一 种 突变 。 在 进化 中 指 一 个 核 苷 酸 被 另 一 个 将 在 群体 中 固定 的 核 苷 酸 蔡 换 。 nucleotypic 核 类 型 的 。 指 DNA 序列 的 除 作 为 遗传 信息 的 携带 者 以 外 的 某 种 功能 (例如 ,起 作为 细 胞 核 骨 架 的 作用 )。 nucleus( 复 数 nuclei) 细 胞 核 。 真 核 生物 中 ,一 个 由 膜 包 被 而 含有 染色 体 的 细胞 器 。 observed heterozygosity 观察 到 的 杂 合 度 ( 见 heterozygosity ) 。 ontogeny 个 体 发 育 、 个 体 发 生 。 生 物 从 合子 到 成 体 的 发 育 中 的 事件 序列 。 open reading frame(CORF) 开 读 框 架 。 具 有 可 翻译 成 蛋白 质 潜力 的 DNA 序列 。 operational taxonomic unit(OTU ) 操 作 中 的 分 类 单位 。 任 一 被 研究 的 现存 分 类 学 单位 。 operon 操纵 子 。 一 种 遗传 学 单位 或 由 一 个 或 多 个 基因 构成 的 基因 复 , 这 些 基因 作为 一 个 单位 而 被 转录 ,而 且 以 协调 的 方式 表达 。 ORF (Ji open reading frame) 。 organelle 细胞 器 。 严 格 地 说 指 真 核 生物 细胞 内 由 功能 膜 包 被 的 结构 (例如 ,细胞 核 ,线粒体 , 叶 绿 体 )。 通 常 都 把 细胞 核 排 除 在 外 。 orthology 垂直 相关 。 作 为 物种 形成 事件 的 结果 而 产生 的 顺序 相似 。 OTU Cl operational taxonomic unit) 。 outgroup 组 外 单位 。 在 一 群 物种 中 ,与 其 他 物种 亲缘 关系 最 疏远 的 一 个 或 一 组 物种 。 该 分 类 单位 在 其 他 分 类 单位 相互 分 岐 之 前 ,已 从 这 群 分 类 单位 中 分 岐 出 来 了 。 out-of-phase overlapping 4b} HB. [A]— DNA 序列 中 以 不 同 读 码 框架 为 两 个 或 多 个 蛋白 质 编 码 。 overdominance(heterosis ,heterozygote advantage,hybrid vigor) 超 显 性 (杂种 优势 、 杂 合子 优势 、 杂 种 优势 )。 由 杂 合 子 比 两 种 纯 合 子 有 更 高 适合 度 而 产生 的 选择 形式 。 P fi AR . palindromic sequence 回 文 顺 序 。 对 两 条 互补 链 读 出 相同 结果 的 DNA 或 RNA 顺序 (如 AATG- CATT)。 表 现 出 关于 某 一 中 心 轴 点 对 称 的 DNA 或 RNA 顺序 。 parallel substitution 平行 替换 。 在 两 个 或 更 多 谱系 中 独立 地 发 生 位 于 同一 核 苷 酸 位 点 上 的 相同 突 变 。 paralogy 平行 相关 。 重 复 的 祖先 基因 的 后 代 间 的 顺序 相似 。 pararetrovirus 拟 反 录 病 毒 。 含有 一 个 为 反 转 录 酶 编码 的 基因 ,但 自身 不 能 插 和 人 宿主 染色 体 的 病 parsimony 节省 。 从 字面 上 解释 , 即 以 最 少 的 操作 而 达到 目的 。( 见 maximum parsimony) partial gene duplication( 见 internal gene duplication ) 部 分 基因 重复 。 pattern of mutation 突变 的 模式 。 指 相对 频率 ,一 种 核 苷 酸 以 这 种 频率 突变 成 另 一 种 核 背 酸 。 pattern of substitution Csubstitution scheme ) 替 换 的 模式 (替换 方式 )。 指 相对 频率 ,在 进化 过 程 中 一 种 核 苷 酸 或 氨基 酸 以 该 频率 变 成 为 另 一 种 。 PCR( 见 polymerase chain reaction ) phage( 见 bacteriophage ) Mit Pa TK phase class 相位 类 型 。 内 含 子 所 处 的 位 置 ,相对 于 两 邻近 的 为 蛋白 质 编码 的 外 显 子 的 阅读 框架 的 类 型 。 phase -0 intron 相位 -0 内 含 子 . 位 于 两 密码 子 之 间 的 内 含 子 。 phase-1 intron 相位 一 1 内 含 子 。 位 于 某 一 密码 子 的 第 一 和 第 二 核 苷 酸 之 间 的 内 含 子 。 phase—2 intron 相位 一 2 内 含 子 。 位 于 某 一 密码 子 的 第 二 和 第 三 核 苷 酸 之 间 的 内 含 子 。 下 é | phenogram 表 型 关系 图 。 根 据 一 些 个 体 、 物 种 、 或 更 高 级 的 分 类 单位 之 间 的 所 有 相似 性 ,以 描绘 或 试图 描绘 它们 间 的 分 类 学 关系 的 一 种 图 形 表示 。 phenotype 表 型 。 某 种 遗传 控制 性 状 的 可 观察 特征 。 phylogenetic tre 系统 (发 育 ) 树 。 表 示 一 群 分 类 单位 或 一 群 基 因 的 系统 发 育 的 图 形 。 phylogenetics 系统 发 育 学 。 重 建 一 群 分 类 单位 或 一 群 基因 的 进化 史 的 科学 。 phylogeny 系统 发 育 。 一 群 分 类 单位 或 一 群 基因 及 其 祖先 的 进化 史 。 plasmid 质粒 。 一 种 自治 且 自 我 复制 的 染色 体外 环 状 DNA。 point mutation 点 突变 。 仅 涉及 一 个 核 苷 酸 位 点 的 突变 。 通 常 为 一 次 核 苷 酸 蔡 换 。 polarity 极 性 。 核 酸 从 5 到 3 “方向 被 阅读 的 性 质 ,其 结果 与 按 相 反方 向 阅读 的 不 同 。 polyadenylation signal 多 聚 腺 苷 酸化 信号 。 大 多 数 真 核 生 物 mRNA 分 子 上 都 有 的 一 个 区 块 ,决定 多 聚 腺 苷 酸 位 点 的 定位 。 polyadenylation site(poly(A)-addition site) 多 聚 腺 苷 酸化 位 点 (多 聚 (A) 添 加 位 点 )。 真 核 生物 中 大 多 数 mRNA 分 子 的 3 端 部 位 。 在 该 位 点 处 将 被 添上 一 个 多 聚 A BE. polygamy 多 配偶 制 。 一 种 交配 体制 ,在 这 种 体制 中 或 者 一 个 雄性 与 一 个 以 上 的 肉 性 交配 (一 夫 多 妻 制 妨 或 者 一 个 雌性 与 一 个 以 上 的 雄性 交配 (一 妻 多 夫 制 ) 。 polymerase chain reaction(PCR ) 多 聚 酶 链 式 反 应 。 从 未 纯化 的 混合 物 中 选 定 DNA 序列 加 以 扩 增 的 方法 。 polymorphism (genetic polymorphism) 多 态 性 (遗传 多 态 性 )。 某 一 基因 座位 上 两 个 或 多 个 等 位 基 因 共 存 的 现象 。 polypeptide 多 肽 。 由 氨基 酸 通过 肽 键 而 相互 共 价 连接 而 成 的 分 子 。 通 常 , 它 用 来 指 某 一 蛋白 质 的 功能 性 三 维 构 型 确定 前 的 氨基 酸 链 。 polyphyletic 多 源 (发 生 ) 的 。 从 不 同 祖先 传 下 来 的 。 polyploidy (genome doubling ,genome duplication ) 多 倍 体 , 多 倍 性 重复 (基因 组 加 们 ,基因组 重复 ) 。 一 个 细胞 或 一 个 个 体 中 存在 多 于 两 个 单 倍 染色 体 组 的 现象 (例如 ,四 倍 体 . 六 倍 体 ) 。 polyprotein 多 和 蛋白。 一 种 翻译 后 分 裂 成 两 个 或 多 个 蛋白 质 的 多 肽 。 population 群体 。 某 一 物种 中 共有 一 个 基因 库 的 一 群 个 体 。 population size(census population size) 群 体 大 小 (统计 群体 大 小 )。 一 个 群体 的 个 体 数 。 positive selection 正 选 择 。 对 某 一 有 利 突变 等 位 基因 的 选择 。 pre-messenger RNA(pre-mRNA) 前 体 信 使 RNA。 某 一 为 蛋白 质 编 码 基因 的 初级 转录 本 ,处 于 成 熟 前 状态 。 preproprotein 前 蛋白 原 。 处 于 任何 翻译 后 变化 发 生 之 前 的 初级 翻译 产物 。 pretermination codon 前 终止 密码 子 。 只 需 一 次 突变 即 可 变 成 终止 密码 子 的 密码 子 。 primary amino acid 基本 氨基 酸 。 由 普 适 遗传 密码 决定 的 20 种 氨基 酸 中 的 任何 一 种 。 primary structure 一 级 结构 。 多 肽 链 中 氨基 酸 的 顺序 。DNA 或 RNA 分 子 中 核 背 酸 的 顺序 。 processed gene( 见 retrogene) 加 工 后 基因 。 processed pseudogene( 见 retropseudogene) 加 工 后 假 基 因 。 processed sequence( 见 retrosequence) 加 工 后 序列 。 prokaryote(bacterium) 原核 生物 (细菌 )。 一 种 缺乏 核 膜 . 与 DNA 结合 的 组 蛋白 .和 细胞 器 的 生 物 。 包 括 真 细菌 和 十 细菌 。 proprotein 蛋白 原 。 一 种 信号 肽 被 去 除 而 附加 的 翻译 后 修饰 还 未 进行 的 翻译 产物 。 “prosthetic group 辅 基 。 与 脱 辅 基 蛋 白 结合 以 满足 功能 性 要 求 的 非 蛋白 分 子 (例如 血红 蛋白 中 的 血 红 素 ) 。 protein 蛋白 质 。 由 一 条 或 多 条 多 肽 链 组 成 的 分 子 。 可 含有 也 可 不 含有 辅 基 。 protein-coding gene 为 蛋白 质 编码 的 基因 。 包 含 一 个 阅 渎 框架 的 基因 ,其 mRNA 将 被 翻译 成 蛋白 质 。 一 «153 ¢ provirus 前 病毒 。 整 合 进 宿 主 细胞 基因 组 中 的 病毒 基因 组 。 pseudogene 假 基 因 。 在 顺序 上 与 某 一 功能 基因 同 源 、 但 无 功能 的 DNA 片段 。 某 一 基因 家 族 中 的 非 功 能 性 成 员 。 purifying selection (negative selection ) 纯 洁 化 选择 ( 负 选 择 )。 造 成 使 某 一 等 位 基因 从 群体 中 去 除 这 样 的 结果 的 选择 体制 。 purine 味 叭 。 一 类 存在 于 核 苷 酸 中 的 含 氮 碱 基 , 由 两 个 联 在 一 起 的 环 式 结 构 组 成 ,一 个 为 五 员 环 、 另 一 个 为 六 员 环 。DNA Al RNA AY ER DE A RR A SRK, pyrimidine 喀 啶 。 存 在 于 核 苷 酸 中 的 一 种 含 氮 碱 基 类 型 ,由 一 个 六 员 环 组 成 。DNA 中 的 喀 啶 碱 基 是 胞 喀 喧 和 胸腺 喀 啶 。RNA 中 的 喀 喧 碱 基 为 胞 喀 啶 和 尿 喀 啶 。 Q FABRE. quaternary structure 四 级 结构 。 具 有 两 个 或 多 个 亚 基 的 和 蛋白质 分 子 中 ,两 个 或 多 个 多 肽 链 间 相互 作用 的 类 型 和 方式 , 即 代表 了 该 蛋白 质 的 四 级 结构 。 R HAR. radical substitution 激进 的 替换 。 某 一 氨基 酸 被 另 一 化 学 性 质 明 显 不 同 的 氨基 酸 所 替换 。 random genetic drift(Cdrift,genetic drift) 随 机 遗传 漂 变 ( 漂 变 、 遗 传 漂 变 )。 因 偶然 事件 ,例如 配子 的 取样 ,而 造成 的 等 位 基因 频率 随 世 代 的 波动 。 rate of gene substitution 基因 替换 的 速率 。 每 单位 时 间 每 基因 座位 的 基因 替换 数 。 rate of mutation 突变 率 。 每 单位 时 间 ( 通 常 以 每 世代 时 间 ) 每 基因 座位 或 每 核 苷 酸 位 点 的 突变 数 。 rate of nucleotide substitution 核 苷 酸 替 换 速 率 。 每 单位 时 间 每 核 苷 酸 位 点 的 核 背 酸 蔡 换 数 。 reading frame 阅读 框架 , 读 码 框架 。 一 个 以 起 始 密码 子 开头 以 终止 密码 子 结束 的 为 蛋白 质 编码 基 因 中 ,密码 子 的 直线 顺序 。 recessiveness 隐 性 。 杂 合子 中 某 一 等 位 基因 不 表现 出 来 的 现象 。 recognition sequence 识别 顺序 。 被 某 一 限制 性 内 切 核 酸 酶 识别 的 顺序 。 在 很 多 情况 下 是 一 个 短 的 回 文 顺序 。 recombination 重组 。 染 色 体 交叉 后 产生 的 结果 ,可 看 到 顺 反 子 中 等 位 基因 的 新 组 合 。 recombinator gene 重组 子 基 因 。 一 种 给 重组 酶 提供 识别 位 点 的 调节 基因 。 reduction division( 见 meiosis) 减 数 分 裂 。 regional duplication 区 域 性 重复 。 重 复 量 小 于 全 基因 组 的 重复 都 称 区 域 性 重复 。 regulatory gene 调节 基因 。 一 种 非 转录 基因 。 有 时 用 来 指 调节 其 他 基因 的 表达 的 结构 基因 。 relative - rate test 相对 速率 测验 。 一 种 无 需 标 度 的 测验 。 以 检验 不 同 谱系 在 其 进化 过 程 中 核 苷 酸 替换 速率 的 恒定 性 ,从 而 确定 分 子 钟 在 不 同 谱系 中 是 否 以 同样 的 速率 运转 。 repetitive DNA 重复 DNA。 以 许多 拷贝 存在 于 单 倍 基因 组 中 的 DNA 序列 。 replacement 替代 、 取 代 。 在 蛋白 质 水 平 上 一 次 非 同 义 替 换 所 造成 的 结果 。 replication 复制 。DNA 在 某 一 DNA 模板 上 合成 的 过 程 。 replication slippage 复制 滑脱 。DNA 复制 期 间 , 某 一 DNA 序列 作为 模板 不 止 一 次 地 连续 起 作用 , 从 而 在 新 合成 的 DNA 上 产生 了 一 段 串 接 重复 的 序列 ,这 样 的 过 程 称 复制 滑脱 。 replicative transposition (duplicative transposition ) 复制 (型 ) 转 座 。 可 转 座 因子 的 一 个 拷贝 插 人 新 的 染色 体位 置 ,而 该 因子 自身 仍 留 在 原初 位 置 的 现象 。 replicator gene 复制 子 基 因 。 一 种 指定 DNA 复制 的 起 始 和 终止 位 点 的 调节 基因 。 replicon 复制 子 。 一 个 染色 体 区 域 , 它 含 有 为 DNA 复制 所 必需 的 DNA 序列 ,并 且 它 作为 一 个 单 位 而 被 复制 。 reproductive barrier(reproductive isolation) 生 殖 障 碍 (生殖 隔离 )。 阻 止 群体 间 基 因 交 换 的 几 种 生 物 学 的 、 或 环境 的 机 制 中 的 任何 一 种 。 restriction endonuclease(restriction enzyme) 限 制 性 内 切 核 酸 酶 (限制 酶 )。 水 解 DNA 的 内 部 磷酸 二 酯 键 的 酶 。 © 154° EP See OE ID ie PS a wag So Te < Say ere, Se ee ep 6 eee _ eee ee See ee 7 - restriction-fragment pattern 限制 片段 模式 。 某 一 DNA 序列 被 限制 性 内 切 核酸 酶 消化 后 , 它 所 产 生 的 限制 片段 的 数目 和 大 小 的 情况 。 restriction site 限制 位 点 。 限 制 性 内 切 核酸 酶 水 解 (切割 )DNA 的 某 一 内 部 磷酸 二 酯 键 时 的 作用 点 。 位 置 可 能 非常 接近 识别 序列 ,也 可 能 不 接近 识别 位 点 。 VV restriction-site map 限制 位 点 图 谱 。 显 示 限 制 位 点 所 处 位 置 的 DNA 序列 的 图 形 。 retroelement 反 录 因子 。 具 有 产生 反 转 录 酶 能 力 的 DNA 或 RNA 序列 。 retrofection 反 录 感染 (传染 )。RNA 分 子 通过 反 录 病毒 粒子 (RNA 被 包 在 里 面 ) 而 从 一 个 细胞 向 另 一 个 细胞 (特别 是 种 系 细胞 ) 转 移 , 然 后 RNA 被 反 转 录 并 整合 进 宿 主 细胞 ,这 样 的 过 程 称 反 杂 感 染 。 即 通过 反 录 病毒 而 转 导 。 retrogene (processed gene) 反 录 基 因 ( 加 工 后 基因 )。 一 种 有 功能 的 反 录 序列 , 它 产 生 的 蛋白 质 与 mRNA 原来 的 基因 所 产生 的 蛋白 质 等 同 或 接近 等 同 。 retron 反 录 子 。 一 种 有 反 转 录 酶 密码 信息 但 缺乏 转 座 能 力 的 基因 组 序列 。 retroposition 反 录 转 座 。 一 种 由 RNA 中 介 的 转 座 模式 。 retroposon 反 录 座 子 ,又 译 “ 反 转录 子 ”。 一 种 既 不 构成 病毒 子粒 子 , 又 无 两 侧 末 端 完 余 序列 的 可 转 座 反 录 因子 。 retropseudogene (processed pseudogene) 反 录 假 基因 (加 工 后 假 基 因 )。 一 种 由 RNA 分 子 反 转录 而 来 ,其 后 的 cDNA 整合 进 基因 组 而 出 现 的 假 基因 。 判 定 反 录 假 基 因 的 标志 有 :缺乏 内 含 子 .多 聚 腺 苷 酸 尾 巴 ,两 侧重 复 ; 表 现 出 截 尾 等 转录 后 修饰 迹象 ;以 及 与 该 基因 家 族 的 有 功能 成 员 或 非 加 工 后 的 无 功能 成 员 都 无 连锁 关系 (无 位 置 上 的 关联 )。 retrosequence(retrotranscript, processed sequence) 反 录 序 列 ( 反 录 本 ,加 工 后 序列 ) 一 种 由 RNA 反 转 录 而 来 的 基因 组 序列 ,但 仅 靠 它 自身 则 缺乏 产生 反 转 录 酶 的 能 力 。 反 录 基 因 和 反 录 假 基 因 都 是 反 录 序 列 。 retrotransposon 反 录 转 座 子 。 一 种 不 构成 病毒 子粒 子 而 两 侧 有 末端 宛 余 序列 的 可 转 座 反 录 因 子 。 retrovirus 反 录 病毒 。 一 类 有 反 转 录 酶 密码 信息 的 小 单 链 RNA 病毒 。 reverse transcriptase 反 转 录 酶 。 催 化 逆向 转录 的 酶 。 reverse transcription 反 转 录 。 以 RNA 为 模板 而 进行 的 单 链 DNA 分 子 的 合成 。 ribonucleic acidCRNA) 核 糖 核酸 。 由 核 苷 酸 连接 而 成 的 大 分 子 多 聚 物 ,其 中 糖 基 为 核糖 。 通 常 , RNA 呈 单 链 。 ribosomal RNACRNA) 核 糖 体 RNA。 作 为 核糖 体 中 的 结构 成 份 的 RNA 分 子 。 ribosome 核糖 体 。 由 rRNA 和 和 蛋白质 组 成 的 一 种 细胞 内 颗粒 ,为 mRNA 的 翻译 提供 场所 。 RNA( 见 ribonucleic acid) RNA-specifying gene 编码 RNA 的 基因 。 可 转录 但 产生 的 RNA 不 被 翻译 的 基因 。 其 RNA 转录 本 是 有 功能 者 的 基因 。 rollimg-circle replication 滚 环 复制 。 一 种 扩 增 模式 , 按 此 模式 某 一 DNA 序列 的 环 状 染色 体外 拷贝 产生 、 并 以 连续 方式 复制 。 \ | root 根 。 在 有 根 树 中 ,所 有 被 研究 的 分 类 单位 的 共同 祖先 。 ”root tree 有 根 树 。 一 种 指明 祖先 和 后 代 物 种 ,从 而 指出 了 进化 途径 的 方向 的 系统 树 。 ITRNA( 见 ribosomal RNA) S 丝氨酸 。 secondary structure 二 级 结构 。 在 蛋白 质 和 核酸 中 ,分 别 由 氨基 酸 之 间或 核 苷 酸 之 间 形 成 氢 键 而 导致 的 结构 。 对 蛋白 质 而 言 , 是 多 肽 链 中 的 区 域 性 结构 (例如 一 螺旋 、B 一 片 状 、 转 折 )。 对 单 链 DNA 或 RNA 来 说 , 则 为 区 域 性 双 链 结构 (例如 发 卡 )。 segregation( 见 Mendelian segregation) 分离 。 segregation distortion(meiotic drive) 分 离 偏 斜 ( 减 数 分 裂 驱 动 )。 在 杂 合 子 的 配子 间 出 现 的 分 离 比 偏离 。 «155 seqregator gene 分 离子 基因 。 一 种 在 减 数 分 裂 和 有 丝 分 裂 期 间 为 分 离 机 构 提供 染色 体 附 着 部 位 的 调节 基因 。 selection( 见 natural selection) 选择 。 selection coefficient 选择 系数 。 某 种 基因 型 与 群体 中 最 适 基 因 型 相 比 , 其 适合 度 降 低 的 定量 测度 。 一 种 对 选择 不 利 性 的 测度 。 selection intensity (stringency of selection ) 选 择 强度 (选择 的 严峻 程度 )。 和 群体 中 各 种 基因 型 间 适 合 度 值 上 的 差异 。 selective constraint( 见 functional constraint) 选 择 限 制 。 selfish DNA 自私 DNA。 一 种 对 其 携带 者 (或 宿主 ) 可 能 无 任何 好 处 ,而 仅 关 心 其 自身 传播 的 DNA 片段 。 可 转 座 因子 被 认为 是 自私 DNA。 self-splicing intron 自 ( 我 ) 拼 接 内 含 子 。 一 种 无 需 外 来 催化 剂 帮助 而 能 从 前 mRNA 中 分 裂 出 来 的 内 含 子 。 sense codon 有 义 密 码 子 。 确 定 某 种 氨基 酸 的 密码 子 。 sense strand 有 义 链 。 基 因 的 非 转录 链 , 该 链 的 DNA 顺序 与 RNA 转录 本 的 等 同 。 sequence divergence(divergence) 序 列 分 岐 ( 分 岐 )。 两 同 源 序列 由 于 各 自在 其 谱系 中 独立 地 积累 遗 传 变化 ,而 出 现 的 相互 间 的 差异 。 sex-linkage 性 连锁 。 位 于 性 染色 体 上 的 基因 所 处 的 处 境 。 该 术语 常 限于 指 x 一 染色 体 上 的 基因 。 sibling species 姐妹 种 ,同胞 种 。 形 态 上 不 可 区 分 但 生殖 上 出 现 隔离 的 物种 。 signal peptide 信和 号 肽 。 在 多 肽 合成 后 且 在 该 蛋白 质 确定 其 正确 的 三 级 结构 之 前 ,而 从 多 肽 中 分 裂 出 来 的 领头 肽 。 silencing( 见 nonfunctionalization ) 沉 默 ( 化 )。 silent substitution 沉默 替换 。 不 改变 其 携带 者 的 表 型 的 替换 。 包 括 非 基因 DNA 中 的 替换 和 同 义 替换 。 simple transposon 简单 转 座 子 。 不 含 插 入 序列 的 转 座 子 。 SINE(Short Interspersed Element 的 首 字 母 缩 略 ) 短 散在 因子 。 多 细胞 真 核 生物 的 基因 组 中 ,长 度 短 于 500 碱 基 对 、 拷 贝 数 为 10: 或 更 多 的 散在 重复 序列 ,都 可 称 为 SINE( 短 散在 因子 )。 single-copy DNA( 见 unique DNA) 单 拷贝 DNA, sister taxa(neighboring taxa) 姐 妹 分 类 单位 (近邻 分 类 单位 )。 一 般 用 来 指 一 群 物种 中 相互 在 进化 程度 上 最 接近 的 物种 对 。 在 系统 树 中 , 即 两 个 仅 通 过 一 个 内 部 节点 联系 起 来 的 分 类 单位 。 somatic cell 体 细 胞 。 注 定 不 会 变 成 配子 的 细胞 。 somatic mutation 体 细 胞 突变 。 体 细胞 中 发 生 的 突变 。 spacer DNA 间隔 DNA。 处 于 两 个 基因 之 间 的 DNA。 可 以 被 转录 也 可 以 不 被 转录 。 speciation (cladogenesis) 物 种 形成 (分 枝 进化 ) 。 一 个 群体 分 裂 成 两 个 或 多 个 生殖 隔离 的 群体 的 过 程 。 新 物种 通过 此 过 程 产生 。 species 物种 .分 类 中 的 一 个 基本 范畴 ,对 此 有 一 些 不 同 的 定义 :(1) 一 群 真实 的 或 潜在 的 可 相互 杂 交 的 个 体 , 它 们 与 别 的 这 样 的 类 群生 殖 隔 离 ( 生 物 学 物种 概念 );(2) 一 个 与 别 的 谱系 在 进化 上 分 离 的 谱系 (进化 论 物 种 概念 ); (3) 一 群 彼此 相似 的 生物 ,它们 间 的 相似 远 胜 于 与 群 外 生物 的 相似 (分 类 学 物 种 概念 ) 。 species tree 物种 树 。 表 示 一 群 物种 间 的 进化 关系 的 系统 树 。 splicing 拼接 。 在 RNA 走向 成 熟 的 加 工 中 ,去 除 内 含 子 的 过 程 。 splicing site or junction 拼接 位 点 或 拼接 点 。 外 显 子 和 内 例子 间 的 界 点 。 split gene 断裂 基因 。 含 有 内 含 子 的 基因 。 standard nucleotide 标准 核 苷 酸 。 即 腺 味 叭 核 苷 酸 (A)、 胞 喀 啶 核 苷 酸 (C)、 乌 味 叭 核 苷 酸 (G)、 胸 Fie Wa Wie AK EF RCT), BK, ae ME FF PR CU). sticky ends 粘性 未 端 。 从 双 螺 旋 DNA 相对 的 两 端 伸 出 的 DNA 单 链 。 通 常 是 双 链 DNA 被 某 种 “6 Coe” eee aa ere eee 限制 酶 错开 式 地 切割 而 产生 的 。 stochastic process 随机 过 程 . 结 果 不 能 从 初始 条 件 知识 而 精确 地 预测 到 的 过 程 即 随机 过 程 。. 不 过 , 根据 给 定 的 初始 条 件 ,对 该 过 程 的 每 一 可 能 出 现 的 结果 可 得 出 一 定 的 概率 。 stop( 见 termination codon) 终 止 ,休止 符 。 stringency of selection( 见 selection intensity) 选 择 的 严峻 程度 。 strong bond 强 键 。 与 双 键 的 核酸 或 片段 (例如 密码 子 一 反 密 码 子 相互 作用 ) 有 关 的 、 存 在 于 C 和 G 间 的 三 个 氢 键 。 强 键 能 增加 稳定 性 ,提高 熔 解 温度 。 structural domain( 见 module) 结 构 域 。 structural gene 结构 基因 。 一 段 为 蛋白 质 编码 或 确定 一 种 RNA 分 子 的 DNA 序列 。 另 一 些 作 者 则 仅 把 为 蛋白 质 编 码 的 基因 当 作 结构 基因 。 subspecies 亚 种 。 某 一 物种 中 的 一 个 地 理学 上 或 形态 学 上 有 区 别 的 群体 。 substitution (i, gene substitution 和 nucleotide substitution) 替换 。 substitution matrix 替换 矩阵 。 以 矩阵 的 形式 表示 的 替换 模式 ,其 中 的 元 则 表示 某 两 个 核 苷 酸 间 的 相对 替换 速率 。 substitution scheme( 见 pattern of substitution ) 蔡 换 方 式 。 superfamily 超 家 族 。. 相 互 间 有 一 定 程度 分 岐 的 一 些 基 因 的 集合 ,把 基因 重复 的 一 切 产物 都 包括 在 内 〈 对 为 蛋白 质 编码 的 基因 来 说 ,通常 氨基 酸 水 平 上 的 相似 性 小 于 50%% )。 symbiosis 共生 。 两 个 或 多 个 生物 以 互利 关系 共存 。 symmetrical exon 对 称 外 显 子 。 位 于 两 个 同 相 位 内 含 子 之 间 的 外 显 子 。 synonymous substitution (silent substitution ) 同 义 替 换 ( 沉 默 替 换 )。 核 苷 酸 蔡 换 后 的 密码 子 确定 的 氨基 酸 与 以 前 的 相同 ,这样 的 蔡 换 称 同 义 蔡 换 。 systematics 系统 学 。 即 分 类 学 和 系统 发 育 学 T(1) 在 DNA PRA wR MER. DEBRA RA HAR. tandem duplication 串 接 重复 。 重 复 产 物 位 于 染色 体 上 相互 紧 挨 在 一 起 处 的 重复 形式 。 taxon( 复 数 taxa) 分 类 单位 、 分 类 群 。 指 任何 等 级 的 分 类 学 群 ( 例 如 种 、 属 ` 界 ), sa ial 28 标准 而 被 归于 各 和 群 之 中 。 taxonomy (classification ) 分 类 学 (分 类 )。 指 将 物种 命名 并 归于 分 类 学 群 中 的 原则 和 程序 。 terminal node 末端 节点 。 系统 树 中 表示 一 个 现存 分 类 单位 的 图 形 。 termination codon (nonsense codon ,stop) 终 止 密码 子 (无 意义 密码 子 、 休止 符 ) 。 一 种 不 存在 与 其 对 应 的 正常 tRNA 的 密码 子 , 其 出 现 可 终止 翻译 过 程 。 普 适 遗 传 密码 中 的 三 个 终止 密码 子 为 UAG、 UAA 和 UGA。 tertiary structure 三 级 结构 。 在 蛋白 质 和 核酸 中 ,由 其 自身 的 折 和 大 而 导致 的 分 子 的 三 维 结构 即 三 级 结构 。 thermal stability 热 稳 定性 。 表 示 抗 变性 或 抗 熔 解 程度 的 一 种 性 质 。 Tm 双 螺 旋 DNA 熔 解 时 的 中 间 温 度 。 AT 同 源 双 螺旋 DNA 与 异 源 双 螺旋 DNA 的 中 间 熔 解 温度 之 间 的 差 。 topology 拓扑 学 .拓扑 图 。 系 统 树 的 分 梳 模 式 。 trans 反 式 。 两 个 序列 或 基因 排列 在 不 同 染色体 上 。 transcription 转录 。 在 DNA 模板 上 合成 RNA 分 子 。 transcription-initiation site( 见 cap site) 转 录 起 始 部 位 。 transcription-termination site 转录 终止 部 位 。RNA 转录 终止 所 在 的 位 点 。 与 被 多 聚 腺 苷 化 了 的 RNA 对 照 ,该 部 位 可 能 与 多 聚 腺 苷 酸 部 位 等 同 , 也 可 能 不 同 。 transduction 转 导 。 宿 主 的 遗传 信息 通过 病毒 从 一 个 细胞 癌 另 一 个 细胞 的 转移 。 transfer RNACtRNA) 转 移 RNA。 一 种 小 分 子 核酸 , 带 有 一 个 反 密 码 子 ,一 个 与 特异 氨基 酸 结 侣 的 位 点 ,以 及 与 核糖 体 和 酶 相互 作用 的 识别 位 点 。 这 里 的 酶 起 着 将 tRNA 与 特异 氨基 酸 连 结 的 作用 。 ° 157° transition 转换 。 哇 叭 被 味 叭 或 喀 啶 被 喀 啶 替换 。 translation (decoding) 翻 译 、 转 译 ( 解 码 )。 经 tRNA 中 介 而 从 mRNA 分 子 的 核 苷 酸 顺 序 得 到 多 肽 的 氨基 酸 顺 序 的 过 程 , 此 过 程 是 在 与 核糖 体 结 合 中 发 生 的 。 transposable element (mobile element) 可 转 座 因 子 ( 可 移动 因子 )。 一 种 能 在 某 种 生物 的 基因 组 中 到 处 移动 的 序列 。 transposition 转 座 。 遗 传 物质 从 一 个 基因 组 位 置 向 另 一 个 位 置 的 移动 。 transposon 转 座 子 。 除 了 携带 与 转 座 功能 有 关 的 基因 外 还 带 有 附加 基因 的 可 转 座 因 子 。 transversion 颠 换 。 味 叭 被 喀 啶 替换 ,或 相反 情形 的 替换 。 trisomy 三 体 。 在 别 的 染色 体 为 两 倍 体 的 细胞 中 , 某 一 染色 体 存 在 三 个 拷贝 的 现象 。 tRNA CK transfer RNA). true tree 真实 树 。 代 表 了 一 群 分 类 单位 的 真实 进化 史 的 系统 树 。 twofold degenerate site 二 重 简 并 位 点 。 编 码 区 中 的 某 一 核 苷 酸 位 点 , 若 三 种 可 能 的 核 背 酸 改 变 中 有 一 种 是 同 义 的 ,而 另 两 种 是 非 同 义 的 , 则 该 位 点 即 为 二 重 简 并 位 点 。 U 尿 喀 喧 核 背 。 unequal codon usage(biased codon usage) 密 码 子 的 不 等 价 应 用 (偏向 性 密码 子 应 用 )。 在 为 蛋白 质 编码 的 基因 里 , 某 一 密码 子 ( 家 ) 族 中 的 一 个 或 多 个 密码 子 被 不 成 比例 地 应 用 。 unequal crossing-over 不 等 价 交换 。 两 同 源 序列 在 不 同 染色 体 位 置 处 交换 ,新 产生 的 染色 体 出 现 某 些 区 域 的 拷贝 数 不 相 同 的 现象 。 | unidentified reading frameCURF) 未 定 阅 读 框 架 。 一 种 其 产物 未 知 的 ORF. unique DNA (single-copy DNA) 单 一 DNA( 单 拷贝 DNA). 在 单 倍 基因 组 中 仅 以 一 个 拷贝 存在 的 DNA 序列 。 universal genetic code 普 适 (通用 ) 遗 传 密码 。 左 右 绝 大 多 数 基因 组 的 翻译 的 遗传 密码 。 unprocessed pseudogene 未 加 工 的 假 基 因 。 通 过 基因 重复 得 到 ,而 随后 其 中 一 个 拷贝 无 功能 化 或 沉默 化 ,这 样 产生 的 假 基 因 即 未 加 工 的 假 基 因 。 unrooted tree 无 根 树 。 一 种 既 未 确定 根 , 也 未 指出 进化 途径 的 方向 的 进化 树 。 untranscribed sequence( 见 flanking sequence) 不 转录 序列 。 upstream 上 游 。 核 酸 上 某 一 参考 点 的 5 方向 (与 转录 方向 相反 )。 URE( 见 unidentified reading frame) 。 V RAR. variable site or region 可 变 位 点 或 可 变 区 域 。(1) 在 被 比较 的 DNA 序列 中 ,由 不 同 核 苷 酸 占据 的 位 点 或 区 域 。(2) 严 格 地 说 , 指 DNA 中 能 随时 间 而 变 的 位 点 或 区 域 。 variant repetition 变异 的 重复 。 自 重复 事件 发 生 以 来 ,基因 重复 的 产物 相互 分 岐 ,而 出 现 略 有 差异 的 重复 。 viability 生活 力 。 一 种 适合 度 成 份 。 某 一 给 定 基因 型 的 个 体 从 妊娠 活 至 生殖 年 龄 的 概率 。 virion 病毒 子 。 一 种 病毒 颗粒 。 virus 病毒 。 一 种 微小 的 寄生 生物 ,依赖 宿主 细胞 复制 其 遗传 物质 和 合成 其 蛋白 质 。 其 基因 组 可 能 是 RNA 也 可 能 是 DNA, 可 以 是 单 链 的 也 可 以 是 双 链 的 。 W AR. weak bond 弱 键 .与 双 链 核酸 (例如 密码 子 一 反 密 码 子 相互 作用 ) 有 关 的 存在 于 A MT RA MU 之 间 的 二 个 氢 键 。 弱 键 使 热 稳定 性 和 熔 解 温度 降低 。 wild type 野生 型 。 群 体 中 某 一 基因 座位 上 最 常见 的 等 位 基因 ,只 要 这 样 的 等 位 基因 存在 。 wobble pairing 摇摆 配对 。 某 些 tRNA 通过 反 密 码 子 第 一 位 与 密码 子 第 三 位 之 间 的 非 标准 配对 (例如 , 反 密 码 子 中 的 U 与 密码 子 中 的 G 配 对 ), 而 能 识别 一 个 以 上 的 密码 子 , 这 样 的 配对 称 摇摆 配 at). x-linkage( I, sex-linkage)x 一 连锁 。 ° 158 xenology 宿主 学 。 作 为 某 一 水 平 基因 转移 事件 的 后 果 的 序列 相似 性 。 Y BAR. zygote 合子 。 由 单 倍 体 配 子 细胞 核 融 合 产生 的 两 倍 体 细 胞 。 4 下 + 题 A #4 EB (amino acids) , 另 见 蛋白 质 中 的 条 目 。 缩写 (abbreviations)10 遗传 信息 翻译 (translation of genetic information into) 9-11 氨基 酸 顺 序 (amino acid sequences) 线性 排比 (Calignment)34-37 乳牛 与 叶 猴 溶菌 酶 中 的 (in cow and langur lysozymes) 47-48 氨基 酸 蔡 代 (amino acid replacements)25, 另 见 非 同 义 蔡 换 AK Al WA 4 36 (Australian marsupials) , 分 子 古 生物 学 Hie B & % & Z (paromomycin)77 AA (albumin), Rime A 白细胞 中 介 素 1 2EA interleukin | gene)43-44 白血病 (leukemia) , ## 110 半 加 工 反 录 基因 (semiprocessed retrogene)111 Hid HE WE (cytosine) 6,7 保守 (型 ) 转 座 (conservative transposition) 105-107 倍 性 基因 (doublesex (Csz) gene)97-98 被 子 植物 (angiosperms) ,C 值 125 编码 区 (coding regions) ,42-44 另 见 为 蛋白 质 编 码 基 因 变通 的 拼接 (alternative splicing)97-98 变形 距离 法 (transformed distance method), 用 于 系统 树 构建 的 65-66,68,81 变异 的 重复 (variant repeats)87 表皮 生长 因子 (epidermal growth factor,EGF)94 表 型 关系 图 (phenogram)68 表 型 学 (phenetics), 与 进化 枝 学 对 应 68-69 保护 生物 学 (conservation biology)77-81 丙酮 酸 激 酶 (pyruvate kinase), 同 功 酶 88 并 发 进化 (coincidental evolution)99 , 另 见 协同 进化 病毒 基因 (virogenes)120 从 独 独 向 猫 的 水 平 转移 (horizontal transfer from ba- boons to cats)120-121 病毒 子 Cvirion)108-109 哺乳 动物 的 C 值 Cmammalian C values)125 * 160° 索 Sl 哺乳 动物 线粒体 的 遗传 密码 (mammalian mitochondria ge- os, netic code) 10-11,34 哺乳 动物 线粒体 基因 组 (mammalian mitochondria genome )52-53, 87-88 AR AE BE ZF (invariant repeats) 87,88 不 等 价 交换 (Cunequal crossing-over) 12-13,127 协同 进化 与 (concerted evolution and)92, 99-103 基因 组 大 小 与 (genome size and)88 低 密 度 脂 蛋白 受 体 基 因 (low-density-lipoprotein recep- tor gene)116 不 翻译 区 (untranslated region)7 中 的 核 苷 酸 蔡 换 速 率 (rates of nucleotide substitutions in)28,30-31 42 ¢ 不 加 权 算 术 平 均 组 对 法 (unweighted pair group method with arithmetic mean ,UPGMA)64-65,68-69,72-74, 78-81 不 完全 变态 昆虫 (hemimetabola)82 不 转录 间隔 (nontranscribed spacer,NTS) 99 « 让 + + C 操纵 基因 (operator)8 操纵 子 (operon )8-9 操作 中 的 分 类 单位 (operational taxonomic units,OTUs) 另 见 系 统 树 复合 的 (composite)111 侧 ( 区 ) 序 列 (flanking sequences) 为 蛋白 质 编码 基因 与 (protein-coding genes and)7-8, 25 中 的 核 苷 酸 替 换 速 率 (rates of nucleotide substitution in)45,50-51 ff A (insertions) 11-14,34,116 4 A FF I (insertion sequences) 107,124 IS1 106,107 1S4 105 tk FF ez BL Chylobatidae) 73 长 度 缩短 Clength abridgment) 115 长 未 端 重复 (long terminal repeats, LTRs)109,116.128 长 期 有 效 群 体 大 小 (long-term effective population size)22 长 散在 的 重复 序列 (long interspersed repeated sequences) , 同 LINEs128-129 超 家 族 (superfamily)88, 另 见 基因 家 族 珠 蛋 白 Cglobin)92 i 超 显 性 (overdominance )17,18-19,45 沉默 (化 )(silencing)55 另 见 无 功能 化 沉默 替换 (silent substitution )11 成 熟 酶 (maturase)97 i @ HH (overlapping genes)96-97 if & (duplication) 的 类 型 的 (types of )83 重复 基因 (duplicate genes) 另 见 基因 重复 无 功能 化 (nonfunctionalization )89-91 重复 型 转 座 (duplicative transposition)105-106 另 见 复制 型 转 座 重组 (recombination)16,100,117 重组 酶 (recombination enzyme)9 重组 子 基因 (recombinator gene)9 初 龙 亚 网 (archosauria)72 垂直 进化 (vertical evolution) ,与 水 平 进 化 对 应 99 垂直 相关 (orthology)90 纯 合 子 (homozygotes) 共 显 性 与 (codominance and)18 纯洁 化 选择 Cpurifying selection)17,45, 47-48, 52 HRA 害 突变 醇 脱 氢 酶 基因 座位 (alcohol dehydrogenase (Adh) gene) 核 苷 酸 多 样 度 Cnucleotide diversity)25-26 KRY BF CGnosine) , XH ALF 56 促 红 细胞 生成 素 基 因 (erythropoietin gene) 43 促 黄体 生成 激素 基因 (luteinizing hormone gene)43 促 甲 状 腺 激素 基因 (thyrotropin gene)43 促进 子 (promotors)7,9,79,115 促进 子 区 (promotor region)7 D 达尔 文 ,查尔斯 (Darwin ,Charles)72-73 达尔 文 主义 (Darwinism)26 大 鼠 (rats), 核 苷 酸 蔡 换 速 率 50 大 猩猩 亚 科 (gorillinae)73 单 倍 体 (haploid)16,17 单 拷贝 DNA(Csingle-copy DNA)798-99,126-127 单一 DNA(Cunique DNA)126-127,129 单子 叶 植 物 (monocotyledons)53-54,129 AB [Al 8 (cholesterol) 116 蛋白 酶 抑制 因子 (protease inhibitors) 内 部 域 重复 86-87 蛋白 质 (protein(s)) 基因 家 族 (gene families)87-89 球状 的 (globular)84-85 中 的 内 部 域 重 复 (internal domain duplications in)85-87 由 内 含 子 编码 的 (intorn-encoded)97-98 #E ik AY (mosaic) 93-94 & A Jit C(protein c)93 蛋白 质 域 (protein domain) ) , 见 域 倒 位 (inversions)11-12,116 等 位 基因 (allele(s))16,25 共 显 性 的 (codominant)18-19 有 害 的 (deletious)11-14,34-35,52,114,116 的 固定 (fixation of)20-21,22-25,28 的 丢失 (loss of)20-21 中 性 的 Cneutral)22-23, 另 见 中 性 突变 野生 型 (wild type)22 等 位 基因 频率 (allele frequencies)16,17-19 fy Yk Bh (fluctuations in)18-20 2% 5 (polymorphism and) 24-26 低 密 度 脂 蛋白 受 体 基因 (low-density-lipoprotein receptor gene) ,不 等 价 交 换 116 低 水 平 表达 的 基因 (lowly expressed genes)56-57 颠 换 (transversions)11-12,30-32,33-34 点 突变 (point mutations)11 模式 (pattern)53,55 点 阵 法 (dot matrix method) ,顺序 线性 排列 中 的 35,36,41 电泳 型 等 位 基因 (electrophoretic alleles)25-26 定向 选择 (directional selection )18 豆 血 红 和 蛋白 (leghemoglobin) ,内 含 子 84-85 端 粒 (telomere)125-126 短 散 在 重复 序列 (short interspersed repeated sequences) , 同 SINEs128-129 断裂 基因 (split genes)83 多 倍 体 (polyploidy)83,129 另 见 基 因 组 重复 多 次 “ 击 中 ”(multiple“hits”)31-32 多 基因 家 族 Cmultigene families)88, 另 见 基 因 家 族 协同 进化 (concerted evolution)98-103, 另 见 协同 进化 多 聚 酶 链 式 反 应 (polymerase chain reaction, PCR)78-80 多 聚 (A) 添 加 部 位 (poly(A)-addition site)6-7 多 聚 腺 苷 化 信号 (polyadenylation signal)7-8,90 多 拷贝 单 链 DNA(Cmulticopy singlestranded DNA, ms DNA)109-110 多 配偶 制 物种 (polygamous species) ,的 有 效 群 体 大 小 21 多 态 ( 性 .现象 )(polymorphism)20-21,24-26 基因 转变 与 (gene conversion and)127 新 达尔 文 主义 与 (neo-Darwinism and)26 中 性 学 说 与 (neutral theory and)26-27 E 二 重 简 并 核 苷 酸 位 点 (twofold degenerate nucleotide sites) 34-35 ,44-45 二 氧 叶酸 还 原 酶 基因 (dihydrofolate reductase gene)113 二 色 性 (dichromatism7)89-90 — I st eh KM (binomial probability function )19-20 Tol * F 翻译 (translation)7 ,9-10,77 翻译 效率 (translational efficiency) , 密码 子 应 用 模式 与 55-57 反 录 病毒 (retroviruses)107-110,115-116 反 录 病毒 的 序列 (retroviral sequences) ,内 源 的 120 反 录 感 ( 传 ) 染 (retrofection)111 反 录 基因 (retrogenes)111-112,122 另 见 反 录 序 列 半 加 工 的 (semiprocessed)111 反 录 假 基因 (retropseudogene)111,112-116 另 见 反 录 序 列 进化 (Cevolution)115-116 : 反 录 序列 (retrosequences) 108-109, 110-111, 121-122, 128- 129, 另 见 反 录 基 因 , 反 录 假 基因 判定 特征 (diagnostic features)111 类 型 (types)111 反 录 因子 (retroelements)107-110,121-122 分 类 (classification ) 108-109 可 能 的 进化 途径 110 反 录 转 座 (retroposition)103,105-107,107-108,129 对 宿主 基因 组 的 影响 (effects on host genome)115-116 反 录 转 座 子 (retrotransposons)107,108-110,129 copia 108-109 DIRS-108-109 JZ F (retrons) 108-110 JQ 3% HE F (retroposons) 108-110,128-129 cin 4 AF (cin 4 factor)128 D 因子 (CD factor)128 F 因子 CE factor)128 G 因子 (G factor)128 G3A 108-109 I AF C1 factor) 128 Ingil28 L1 128-129 的 假 基 因 (pseudogenes of )128 R2 因子 (R2 factor)128 反 密 码 子 (anticodon)56-57 反 转 录 示 (retrotranseiipts) 见 反 录 序列 反 转 录 酶 (reverse transcriptase)108-109,111,128 放 线 菌 酮 (cycloheximide), 即 (成 二 酰 ) 亚 胺 环 已 酮 77-79 “ 非 病 毒 的 反 录 座 子 ”(“nonviral retroposons2”) 见 反 录 序列 非 肌 的 原 肌 球 和 蛋白 基因 (Cnonmuscle tropomyosin gene)113 非 基 因 DNA (nongenic DNA)129 C (A t#ié 455 (c-value paradox and)125-127 的 维持 Cmaintenance of )131 4E fai FF AK FB 7A (nondegenerate nucleotide sites)34-35, 44-46 4£ [a] 2 #& (nonsynonymoussubstitution)11-13,91 另 见 核 ° 162° (possible evolutionary pathway ) 109- 苷 酸 蔡 换 速率 (rates)42-45,52-54 选择 强度 与 (selection intensity and)45-47 与 同 义 蔡 换 对 应 46 两 为 蛋白 质 编码 序列 间 的 (between two protein-coding sequences)33 ,34 非 同 义 位 点 Cnonsynonymous site)46, 另 见 非 简 并 位 点 ,二 重 简 并 位 点 非 整 数 倍 重复 (aneuploidy)83,129 另 见 染 色 体 重复 废物 DNA Gunk DNA)127-128,131 Bb Hb (baboons) , 77 BF 3k Al [ey] A BY) 7K FB 120-122 分 类 学 单位 (taxonomic units), 操 作 中 的 , 见 操作 中 的 分 类 学 单位 分 离 偏 斜 (segregation distortion )117 分 离子 基因 (segregator gene)9-10 分 岐 (divergence ) 协同 进化 与 (concerted evolution and)102 核 苷 酸 序列 间 的 (between nucleotide sequences) 31-32, 32-34,44-45 分 岐 时 间 (divergence time)42 的 估计 (人 (estimation of)70-71 人 与 猿 的 (of humans and apes)49,72-73 分 子 的 系统 发 育 (molecular phylogeny) 见 系统 发 育 分 子 古 生物 学 (molecular paleontology)77-80 分 子 进 化 (molecular evolution ) ,定义 5 分 子 进 化 的 中 性 学 说 (Cneutral theory of molecular evolu- tion)26-27 ,46 分 子 驱 动 (molecular drive)101-102 分 子 生 物 学 (molecular biology)5 分 子 ( 时 ) 钟 (molecular clock(s)48-52 对 假说 的 挑战 (challenges to hypothesis)49 人 与 猴 中 的 比较 (comparison in humans and monkeys) 50-51 小 鼠 与 大 鼠 中 的 比较 (comparison in mice and rats)50 路 齿 类 与 灵 长 类 中 的 比较 (comparison in rodents and primates)51-52 相对 速率 测验 与 (relative-rate test and)49-50 谱系 间 的 变异 (variation among lineages)50-52,71 分 枝 进 化 (cladogenesis), 转 座 与 118-119 负 选 择 Cnegativeselection)17, 另 见 有 害 突变 附着 位 点 (Cattachment site)9-10 复合 转 座 子 (complex transposons)107 复制 滑脱 (replication slippage)12-13,14,101-102,131 复制 (型 ) 转 座 (replication transposition)105-107,128 复制 子 基因 (replicator genes)9-10,125-126 (synonymous substitutions versus) 45- G 5 GE 48 {4 (calcium-binding module) ,依赖 维生素 开 的 Te 94 钙 调 素 基 因 (calmodulin gene) 111 钙 依 赖 性 调节 蛋白 (calcium-dependent regulator protein) , 内 部 域 重 复 85-87 概率 (probability) 二 项 式 的 (binomial)19-20 固定 (fixation)22-23 干扰 素 基 因 (interferon genes)42-43 甘油 醛 -3- 磷 酸 脱 氢 酶 基因 (glyceraldehyde-3-phosphate dehydrogenase gene)113 rh AY RK FF RE HR BE HK (rate of nucleotide substitutions in) 43-44 高 胆固醇 血 症 (hypercholesterolemia)116 高 度 重复 的 DNA(highly repetitive DNA 126-127 散在 序列 (dispersed sequences)127-129 区 域 性 序列 (localized sequences 126-128 高 水 平 表 达 的 基因 (highly expressed gene)56-57 划 兰 氏 阳 性 菌 (Gram-positive bacteria)123 ,124-125,132 革 兰 氏 阴 性 菌 (Gram-negative bacteria, 123,132 给 ( 供 ) 体 部 位 (donor site)8,116 功能 限制 (functional constraints) 进化 速率 与 45-47 功能 域 (functional domain) 83 共同 顺序 (consensus sequence)25 共 显 性 (codominance)18-19 构建 系统 树 的 距离 矩阵 法 (distance matrix methods for tree reconstruction ) 64-67 , 68-69 用 于 人 与 猿 的 (for humans and apes) 74-75 古生物 学 (paleotology) ,分 子 的 77,80 古 细 菌 (archaebacteria)123 定 (fixation)16,19-21,22-25,26 等 位 基因 (allele)20-21,22-25,28 协同 进化 与 (concerted evolution and)101-102 定 概 率 (fixation probability)20-21,22-23,24-25,45 定时 间 (fixation time)22,23-24 条 件 的 (conditional)23 光合 细菌 (photosynthetic cyanobacteria)76-77 滚 环 复 制 (rolling-circle replication)130-131 H 哈 迪 - 温 伯 格 平衡 (Hardy-Weinberg equilibrium) 17 ¥ 4A (sponges) ,C 值 125 i HE FE (seaside sparrow )80-81 4 i #8 HF (composite transposons) 107 K $F RB (nucleotides) #8 A& (composition) 131 4 FF YE (diversity ) 25-27 DNA 序列 中 的 (in DNA sequences) 6 4E th HE (nonstandard )7 RNA 序列 中 的 (in RNA sequences)7 标准 (standard)7 核 苷 酸 顺 序 (nucleotide sequences)28-37 线性 排比 (Calignment)34-37 #a 5 HE (dissimilarity ) 36 分 岐 (divergence) 31-32 ,32-35,42 rRNA 77-78 #A {DL HE (similarity ) 36 K AF WRF MR (nucleotide substitutions) 11-13, 28-35, 42-59, 64,91-92 回复 (backward) 32 速率 变异 的 原因 (causes of rate variations) 45-47 并 发 的 (coincidental)32 趋同 的 (convergent)32 人 和 猿 与 (humans and apes and)74 朱 克 斯 和 坎 托 的 一 参数 模型 (Jukes and Cantor's one- parameter model)28-31,32-34,41 木村 的 两 参数 模型 (Kimura's two-parameter model)30- 32,33-34 FL 4+ 45 Ot AY YS BA BBP A Cin lysozymes of cows and langurs)48 哺乳 动物 线粒体 中 的 (in mammalian mitochondria )52- 53 分 子 时 钟 假 说 (molecular clock hypothesis)48-52 多 重 (multiple)31-32 同 义 密码 子 的 非 随 机 应 用 与 (nonrandom usage of syn- onymous codons and)55-59 两 DNA 序列 间 的 数目 Cnumber between two DNA se- quences) 31-35 两 非 编 码 序列 间 的 数目 (number between two noncod- ing sequences) 32-34 两 为 蛋白 质 编 码 序列 间 的 数目 (number between two protein-coding sequences)34 平行 的 (parallel)32 ,48 假 基 因 中 的 模式 (pattern in pseudogenes)53-55 植物 核 基因 组 中 的 (in plant nuclear genomes)53 速率 (rates) 42 细胞 器 DNA 中 的 速率 (rates in organelle DNA)52-53 速率 变异 (rate variations)45-47 沉默 的 (silent)11-12 物种 比较 (species comparisons)49=52 物种 分 岐 时 间 估 计 与 (Species-divergence time estima- tions and)71 同 义 的 (synonymous)11=3 核 苷 酸 蔡 换 的 两 参数 模型 (two-parameter modelof nu- cleotide substitution ) 31-34 核 苷 酸 蔡 换 的 一 参数 模型 (one-parameter model of nu- cleotide substitution ) 28-30, 32-34 , 核 苷 酸 替 换 速 率 (rate of nucleotide substitution ) 24-25, *. 163 ¢ 28,30-31542 RK FF RL A (nucleotide sites) , 另 见 信息 位 点 简 并 类 型 (degeneracy classes)34-35 核 骨 架 Cnucleoskeleton)181 核 类 型 的 DNA(CnucleotypBic DNAJ)131 核 仁 素 Cnucleolin)59 核糖 (ribose)6 核糖 核酸 (ribonucleic acid) 见 RNA 核糖 体 (ribosome)9-10,77 核糖 体 蛋 白 17 基因 (ribosomal protein L7 gene)113 核糖 体 蛋白 L30 基因 113 核糖 体 蛋白 L32 基因 113 核糖 体 RNA(Cribosomal RNA) WL rRNA 核 小 体 Cnucleosome)47,131 颌 下 腺 型 蛋白 酶 抑制 因子 (submandibular-gland type pro- tease inhibitor) 内 部 域 重 复 86-87 黑猩猩 (chimpanzees)72-76 红 霉 素 (erythromycin)107 红色 素 基 因 (red-pigment gene)89 #& (monkeys) , KF BF HHH 50-51 & #h DNA (complementary DNA) WL cDNA a fbi St iB Bc (slipped-strand-mispairing ) 12-14, 101-102, 131 另 见 复制 滑脱 环节 动物 (Cannelids),c 值 125 环 状 DNA 病毒 (circular DNA viruses)109-110 回 交 (backcrosses)79 回 文 (palinodromes)126-127 中 的 突变 (mutations in)14 识别 顺序 与 (recognition sequences and)37-38 J PL] AR AB A HE (mechanical incompatibility) , 物种 形成 与 119 肌 动 蛋白 基因 (actin genes) 43 肌 动 蛋白 (actin «)43,50 肌 动 蛋白 BCactin B)43,50,113 肌 红 蛋白 基因 (myoglobin;gene)84-85,88,92 另 见 珠 蛋 白 基因 li 中 的 核 苷 酸 蔡 换 速 率 (rates of nucleotide substitutions in)43 肌 球 蛋白 轻 链 基 因 (Cmyosin light chain gene) 113 AL YK BiH (creatine kinase), 同 功 酶 88 肌 酸 激酶 M 基因 (creatine kinase M gene)43,44 基因 (gene(s)), 另 见 特异 基因 或 基因 类 型 编码 区 (coding regions)7-8 “ 死 的 ?>(“dead”) , 见 假 基因 定义 (Cdefined)7 外 源 性 的 (exogenous)106-107 侧 区 ( 域 ) (flanking regions)8 。164。 高 度 重复 的 (highly repetitive)88 水 平 转移 (horizontal transfer)119-122 低 度 重复 的 (lowly repetitive)88 不 转录 区 ( 域 )Cnontranscribed regions)8 垂直 相关 的 (orthologous)90-91 Hi ® (overlapping ) 95-97 XE 47 AX AW (paralogous) 90-91 til JG (processed) 111-112 重复 的 (repeated)87 的 沉默 Csilencing of)55 另 见 无 功能 化 断裂 (split)83 间 的 替换 速率 变异 (substitution rate variations among) 47 内 的 替换 速率 变异 (substitution rate variations within) 46 BY 4% $ AY (transcribed )8-10,129 可 转录 区 ( 域 )(transcribed regions)8 类 型 (types)7 不 翻译 区 ( 域 ) Cuntranslated regions)7-8 基因 表达 (gene expression) ,可 转 座 因子 与 116 基因 重复 (gene duplication) 38-39,83 AL DNA 重复 , 域 重 复 , 外 显 子 重复 完全 的 (complete)83 年 代 估 计 (estimation of date)90-=92 内 部 的 (internal)83 无 功能 化 与 Cnonfunctionalization and)89-91 部 分 的 (partial)83 基因 (的 ) 延 长 (gene elongation)85-87 基因 多 样 性 (gene diversity)24-25 基因 分 化 (gene splitting), 和 群体 分 化 与 63 基因 分 享 (gene sharing)97-99 基因 家 族 (Cgene families)87-89 th fal BEAK (concerted evolution)98-103 另 见 协同 进化 3k E A (globins) 92-93 基因 结构 (gene structure)7-10 为 蛋白 质 编码 基因 (protein-coding genes)7-9 调节 基因 (regulatory genes)9-10 确定 RNA 的 基因 (RNA-specifying genes)9 基因 频率 (gene-frequencies) 见 等 位 基因 频率 St A Mf (gene tree)63 基因 替换 (gene substitution) 22-25, 31-32 的 固定 概率 (fixation probability of )22-23 的 固定 时 间 (fixation time of)23-25 新 达尔 文 主义 与 (neo-Darwinism and)26 中 性 学 说 与 (neutral theory and)26-27 的 速率 (rate of)24-25 基因 型 (genotypes) 适 合 度 17-18 基因 选择 (genic selection)18-19 另 见 共 显 性 固定 概率 (fixation probability)22-23 基因 转变 (gene conversion ) 127 协同 进化 与 (concerted evolution and)100-102 方向 (Cdirection)101 非 等 位 基因 的 Cnonallelic)101 基因 组 (genome(s))123-138 另 见 具 体 类 型 ,如 线粒体 基 因 组 C 值 Cc values)123 另 见 基因 组 大 小 真 核 生物 的 结构 (eukaryotic structure)126-129 细菌 中 的 GC 含量 与 (GC content in bacteria and)131- SS 遗传 重 排 (genetic resetting)118-119 非 基 因 DNA 与 Cnongenic DNA and)131 细胞 器 (organelle)52-54 对 一 的 转 座 影响 (transposition effects on)115-116 #$ HE DP A AAA 4k (vertebrate organization) 132-138 基因 组 重复 (genome duplication) 83,129 基因 组 大 小 (genome size)88 DNA 重复 与 (CDNA duplication and)83 真 核 生物 的 (of eukaryotes)125-126 在 细菌 中 的 进化 evolution in bacteria)123-125 增加 机 制 (mechanisms for increasing)129-131 区 域 性 增加 (regional increase)130-131 基因 组 的 重 排 Cgenomic rearrangements) , 受 可 转 座 因子 促进 的 116 基因 组 加 倍 (Cgenome doubling) 见 基因 组 重复 基因 组 假说 (genome hypothesis)55-56 基因 座位 (loci)16 上 的 基因 多 样 性 (gene diversity at)24-25 多 态 的 (polymorphic)24-25 另 见 多 态 性 激素 基因 (hormone gene)43 吉姆 萨 分 带 (Giemsa banding)134 4 HE oh ® 2 4A (vertebrate genome), 组 成 上 的 组 织 化 132-138 RX 26 (echinoderms) ,c 值 125 剂量 重复 (dose repetitions) 87 加 工 后 基因 (processed genes),111-112 另 见 反 录 基因 加 工 后 假 基因 (processed pseudogenes)111,112-116 的 进化 Cevolution of)115-116 加 工 后 序列 (processed sequences)111 另 见 反 录 序列 甲 基 化 (methylation)55 甲壳 类 (crustaceans),c 值 125 FA iit 2 AR (methionine) 10 FA ig FA iit 2 AB (formylmethionine) 10,77 甲状 旁 腺 激素 基因 (parathyroid hormone gene)43,44 FAR AR ER EA BCthyroglobulin 8)50 {fi 3£ FA (pseudogenes ) 44-45, 50-51, 75-76, 87, 90, 92-93, 102-103,122,128 fy) FF WR AF HB AA SK (pattern of nucleotide substitutions) 53-55 tn JG & (processed )89,111-116,122 另 见 反 录 假 基 因 AY K FF OR FF PR GE HK Crates of nucleotide substitutions in) 44-46 通过 基因 转变 复活 (resurrection by gene conversion) 102 未 加 工 的 (unprocessed)89-91,122 间隔 序列 (intervening sequences) , 见 内 含 子 简 并 类 型 (degeneracy classes) , 核 苷 酸 位 点 34 减 数 分 裂 (meiosis)9-10,100-101,125-126,131 交换 (crossing-over), 不 等 价 , 见 不 等 价 交换 酵母 (yeast) 另 见 saccharomyces cerevisiae 同 义 密码 子 的 非 随机 应 用 Cnonrandom usage of synony- mous codons)55-57 rRNA 基因 (rRNA gene)88 可 转 座 因子 (transposable elements)116 结构 基因 (structure genes)7 另 见 为 蛋白 质 编码 的 基因 , 确定 RNA 的 基因 植物 线粒体 中 的 (in plant mitochondria)52 原核 生物 中 的 (in prokaryotes)8-9 在 细菌 中 的 转录 (transcription in Easyg 和 结构 组 件 (structural module(s)83 , 另 见 域 截 尾 (truncation), 加 工 后 假 基 因 112-113 金属 琉 基 组 氨 酸 三 甲 ( 基 ) 内 盐 工 基因 (metallothionein 1 gene)44 进化 的 维 苏 威 模式 (Vesuvian mode of evolution)114-116 进化 的 综合 学 说 (synthetic theory of evolution )26-27 支 序 图 (cladogram ) ,又 译 进化 树 68,72 进化 速率 (evolutionary rate) ,功能 限制 与 ,45-47 支 序 (clades)71-72 A. 53 (humans and apes)73 支 序 系统 学 (cladistics) ,与 表 型 学 对 应 68-69 近邻 结合 法 (neighbor-joining method), 用 于 系统 树 构 建 的 67 精 氨基) 琥珀 酸 合成 酶 基因 (argininosuccinate synthetase gene)113 精 氨基) 琥珀 酸 裂解 酶 (argininosuccinate lyase)98-99 距离 法 (distance methods) 69 距离 指数 (distance index), 线 性 排列 中 的 36-37 决定 互补 性 的 区 域 (complementarity determining regions, CDRs)45-46 决 ( 确 ) 定 性 模型 (deterministic models)16 绝对 适合 度 (Cabsolute fitness)17 蕨 类 (pteridophytes),C 值 125 K 开 读 框架 (open reading frames, ORFs) 52,107,109-110, 128 * 165° 可 ( 移 ) 动 因子 (mobile elements) JL hy JE AT 可 转录 因子 (transcribed genes), # AA tu B 129 可 转 座 因子 (transposable elements) 106-110, 119-120,123- 124,129-130 f€ X (defined) 105 供 体 部 位 (donor site) 106-107 拷贝 数 的 进化 动力 学 (evolutionary dynamics of 0 number)119-120 基因 表达 与 (gene expression and)115-116 插入 序列 (insertion sequences)106-107,123-124 P-M 劣势 与 (P-M dysgenesis and)117-118 J & AF retroelements) 107-110 #P 3B fiz (target site) 106 #& WE F-(transposons) 106-108 . 空缺 碱 基 Cnull base) ,线性 排列 中 的 34-36 框架 移动 突变 (frame:shift mutation)14,89-90 昆虫 (insects)c 值 125 L 蓝 色 素 基 因 (blue-pigment gene) 89 蓝 细 菌 (cyanobacteria)77-78,123,124-125 类 人 猿 科 (hominoidea) 系 统 发 育 72-76 相似 性 指数 (similarity index) 线 性 排比 中 的 36 #8 (Cyprinus car pio) ,C 值 134-135 All #8 7 (rifampicin )77 if $8 BH (ligase) 37 ke RF (streptomycin) 77 BA 1% 1K (diploid) 17,19 PA A 2E (amphibian) ,C {@ 124-125 ¥ H# (dysgenesis) ,杂种 116-119 33 4% (gap(s))14,34-36 最 小 化 (minimization )35-36 末端 的 (terminal)35-36 裂缝 处 罚 (gap penalty)36-37 磷酸 丙 糖 异 构 酶 基因 (triosephosphate isomerase gene)113 磷酸 二 酯 键 (phosphodiester bonds)6-7 磷酸 甘油 酸 激 酶 多 (基因 ) 家 族 (phosphoglycerate kinase (PGK) multifamily)111, 113 ig $4 A (lepidoptera) 81-82 RKA (primates) , KH BF RH 51-52 绿色 素 基因 (green-pigment gene)89 绿色 菠 类 (gree algae)77-78 毛 霉 素 (chloramphenicol)77 卵 类 粘 蛋 白 基 因 (ovomucoid gene) , 域 重 复 与 85-87 裸子 植物 (gymnosperms),C 值 125 M Hi (cats), 来 自 独 独 的 病毒 基因 水 平 转移 120-122 猪 白 血 病 反 录 病毒 (feline leukemia retrovirus)109-110 ¢ ge 。 Hi Bt (felidae) 120-122 帽子 部 位 (cap site)7-8,111 酶 (enzymes) 异型 酶 (allozymes)88 同 功 酶 (isozymes)88-89 限制 酶 restriction ) 见 限制 性 内 切 核 酸 酶 备 德 尔 式 分 离 (Mendelian segregation)19 备 德 尔 主 义 (Mendelism)26 喀 啶 (pyrimidines)6,11-12 密码 子 (codon)9-10 中 的 核 苷 酸 替 换 (nucleotide substitution in)11-13 同 义 的 (synonymous) 见 , 同 义 密码 子 类 型 10 应 用 模式 (usage pattern)55-59 密码 子 一 反 密 码 子 配对 (codon-anticodon pairing)56-57 密码 子 族 (codon family)10 免疫 球 蛋 白 基 因 (immunoglobulin genes)43 高 可 变 区 (hypervariable regions)45-46 内 部 域 重 复 (internal domain duplications)85-87 中 的 非 同 义 与 同 义 替 换 对 应 synonymous substitutions in )45-46 中 的 核 苷 酸 蔡 换 速率 (rates of nucleotide substitutions in)43 灭绝 (Cextinction ) ,等 位 基因 20-21 膜 翅 目 (hymenoptera)129 木村 的 两 参数 模型 (Kimura's two-parameter model) 30- 32,33-34,41 (nonsynonymous versus N Pa dE Bt FP (quagga) 80 南 4 4 4 (south American marsupials), RAA| WAR 4 5 80-81 内 部 重复 (internal repeats)83,114 内 共生 学 说 (endosympbiotic theory)77-78 内 & Ff (intron (s)7-8,25,52,58-59,83,85-87 ,93-94,103 a14a97-98 . 4b ft 4 A (exon insertion into) 的 丧失 (loss of )84-85 的 数目 (number of )8-9 的 相位 (phases of )95-96 内 含 子 编码 的 蛋白 质 (intron-eacoded iti 变通 的 拼 接 与 97-98 内 切 核酸 酶 (endonucleases)97 内 源 性 反 录 病毒 序列 (endogehous retroviral sequences) 120-122 内 转录 间隔 (internal transcribed spacer)99 拟 反 录 病 毒 (pararetroviruses)108-110 “粘性 末端”(“sticky ends”)37 鸟 类 (bird),C 值 125 鸟 味 叭 外 显 子 混 匀 (Cguanine)6-7 尿 激 酶 Curokinase)93-94 尿 激 酶 原 (prourokinase)94 尿 激 酶 一 血 纤 蛋白 溶 酶 原 活化 因子 基因 (urokinase-plas- minogen activator gene)43 BR BE ME Curacil)7 mie Py AE (rodents ) KE BE HK HF (nucleotide substitutionrates)50,51-52 反 录 假 基 因 (retropsendogenes) 113 凝血 酶 (thrombin)87 凝血 酶 原 (prothrombin)93-94 纽 结 杆 状 组 件 (Kringle module)93-94 P N@ 4 2K (reptiles) ,72 C {fi (c values) 125 Ac F (gametes) ,随机 取样 20-21 配子 的 随机 取样 (random sampling of gametes)19-20 匹配 碱 基 (Cmatched bases) ,对 子 34-36 1 (purines) 6, 11-12 HH (splicing), 438 A) 97 拼接 功能 Csplicing function) 见 拼接 位 点 拼接 位 点 Csplicing sites)8,37,85,97-98 平衡 选择 (balancing selection)18-19,20-21,26 平行 相关 (paralogy)90-91 瓶颈 (battleneck)22 ,27 普 里 伯劳 块 (Pribnow box)8-9 普 适 遗传 密码 (universal genetic code)10,34-35 Q 期 望 杂 合 度 (expected heterozygosity)24-25 起 始 密码 子 (initiation codon) 迁移 (migration)16,20 前 病毒 (provirus)108-109 前 mRNA (pre-mRNA)7-8,111 前 生物 进化 (prebiotic evolution) 5 前 胰岛 素 原 I 基因 (preproinsulin I gene)103,111-112 前 胰岛 素 原 工 基 因 (preproinsulin I gene)103,111-112 Fe Bi RS BERK HE EH & BS A Chydroxanthine phos- phoribosyltransferase gene) 43 强化 因子 (enchancers)115-116 强 键 (strong bond)6 切 离 修 复 (excisionrepair)14 @ # (hydrogen bonds) ,形成 互补 碱 基 配 对 6 区 域 性 重复 (regional duplication )83 区 域 性 重复 序列 (localized repeated sequences)125-128 趋同 进化 (convergent evolution)80 取样 (sampling) ,随机 19-20 醛 缩 酶 (aldolase) , 同 功 酶 88 醛 缩 酶 A 基因 (aldolase A gene)43-44,50 缺失 (deletions)11-14,34-35,52,114,116 确定 RNA 的 基因 (RNA-specifying genes)7,8-10,88,125- 126 另 见 结构 基因 群体 大 小 (population size)19-20 有 效 (Ceffective)20-22 [Al = #44 45 fixation probability and)22-23 随机 遗传 漂 变 与 (random genetic drift and)20-21 群体 分 化 (population splitting) ,基因 分 化 与 63 群体 遗传 学 (population genetics)5,16 等 位 基因 频率 变化 (allele frequency changes)16-17 有 效 群 体 大 小 (effective population size)20-22 基因 替换 (gene substitution) 22-25 自然 选择 Cnatural selection)17-19 新 达尔 文学 说 (Cneo-Darwinian theory)26-27 中 性 突变 假说 Cneutral mutation hypothesis) 26-27 _ 4 4 tt (polymorphism) 24-26 随机 遗传 漂 变 (random genetic drift) 18-20 R Ye f4 8 {AK (chromatid )110-101 Ye f4 {K (chromosome) 83 基因 转变 与 (gene conversion and) 100-102 机 制 不 相 容 性 (mechanical incompatibility)83 不 等 价 交 换 与 (unequal crossing-over and)69,71 染色 体重 复 (chromosomal duplication)83 ,129-130 部 分 的 (partial)83 热 冲 击 蛋白 质 (heat-shock proteins)98-99 人 -大 猩猩 -黑猩猩 三 分 又 (human-gorilla-chimpanzee)73- 76 人 的 基因 (human genes) 密码 子 应 用 模式 (codon-usage patterns)56-58 RK TF ORF HR EK (nucleotide substitution rates)51 反 录 假 基 因 (retropseudogenes) 113 人 科 (hominidae)72-73 人 类 的 系统 发 育 (human phylogeny)72-76 YS Fa BH (lysozyme) 87 中 的 正 选 择 (positive selection in)48 肉 足 类 (原生 动物 )(Csarcodina)C 值 125 ¥L + (cows) ,中 的 溶菌 酶 48-49 乳 清 蛋白 (lactalbumin787 乳酸 脱氧 酶 (lactate dehydrogenase)103 同 功 酶 (isozymes)88-89 乳酸 脱 氢 酶 A 基因 (lactate dehydrogenase A gene)43-44, 50 乳酸 脱 氢 酶 B 基 因 98-99 软体 动物 (mollusks),C 值 125-126 弱 键 (weak bond)6 - 16s 萨 塔 斯 和 特 韦 尔 斯 基 法 (Sattath and Tversky’s method ) 见 近邻 关系 法 三 色 性 (trichromotism)89-90 三 体 (trisomies)129-130 散在 重复 序列 (dispersed repeated sequence)127-129 色 敏 感 色素 蛋白 (color-sensitive pigment proteins)89 色素 蛋白 (pigment protein) ), 色 人 敏 威 的 89 ¥% (sharks) ,C 值 125-126 上 游 方向 (Cupstream direction) ,DNA 序列 1 YE 4, Ys HE E (dusky seaside sparrow)80-81 生命 的 起 源 (origin of life)5 生长 激素 基因 (growth hormone gene)43-44,50 生长 激素 释放 抑制 因子 -28 基因 (somatostatin-28 gene)43 生长 因子 组 件 (growth-factor module)94 生殖 (reproduction), 有 差别 的 , 见 自然 选择 识别 顺序 (recognition sequences) 37 ,39 世代 时 间 效 应 (generation-time effect)51-52 适合 度 (fitness)17-19,127-128 另 见 自然 选择 绝对 (absolute)17 相对 (relative)17 嗜 热 细菌 (thermophilic bacteria)131,137 We BA AK Mu(bacteriophage Mu)105,107-108 WE PA AK Dx174 96 噬菌体 , 转 座 107-108 收缩 系统 蛋白 基因 (contractile system protein gene)43 受 体 部 位 (acceptor site)8, 116 双 翅 目 (diptera)81-82 W# DNA (double -stranded DNA) 反问 平行 结构 (antiparallel structure) 6-7 DNA-DNA 杂交 与 CDNA-DNA hybridization and)40 后 随 链 (lagging strand)55 前 导 链 (leading strand)55 热 稳 定性 (thermal stability)40 双子 叶 植 物 (dicotyledons)53 水 平 基 因 转 移 (horizontal gene transfer)119,119-122 水 平 进化 (horizontal evolution ) 另 见 协同 进化 顺 向 重复 (direct repeats)105 顺序 -线性 排比 距离 法 (sequence-alignment ) , ,顺序 线性 排 比 中 的 35-37 点 阵 法 (dot matrix method)35-36 顺序 -距离 法 (sequence-distance method) 顺序 线性 排比 中 的 35-37 “ 死 基 因 ”(“dead genes”) 见 假 基 因 四 重 简 并 核 苷 酸 位 点 (fourfold degenerate nucleotide sites) 34-35 ,44-45 点 条 件 four-point codition) 66-67 4- Bit. FR MB WE AK $F (4-thiouridine) 56-57 松 驰 肽 基因 (relaxin gene) 43 速率 恒定 假定 (rate-constancy assumption)48-49,91 ° 168 » 随机 交配 (random mating) 17 随机 模型 (Sltochastic models) 16 中 性 学 说 与 Cneutral theory and)26 随机 遗传 漂 变 (random genetic drift)16-17,18-21,48-49 梭 状 芽孢 杆菌 (clostridia)132 T 糖 蛋白 激素 « WE (glycoprotein hormone a subunit)51 唐 氏 综合 性 (Down's syndrome) 129 特征 状态 法 (character-state methods)69 体 细 胞 突变 (somatic mutations)11 替换 (Csubstitution ) 见 基因 替换 , 核 苷 酸 蔡 换 条 件 固 定时 间 (conditional fixation time)23-24 调节 基因 (regulatory gene)7,9-10,125-126 铁 氧 还 蛋白 (ferredoxin) ,内 部 域 重 复 85-87 同 功 酶 (isozymes)88-89 同 义 密码 子 (Synonymous codons)10 非 随机 应 用 (Cnonrandom usage)55-59 同 义 替 换 (synonymous substitutions)11-13,55-59, 91, 97 另 见 核 苷 酸 蔡 换 与 非 同 义 替 换 对 应 (nonsynonymous substitutions versus)45-46 速率 (rates)42-45,52-54 两 为 蛋白 质 编 码 序 列 间 的 (between two protein-coding sequences ) 33-34 基因 间 的 变异 (variations among genes) 47 fr) SZ fiz A (synonymous sites)46-47 另 见 四 重 简 并 位 点 同 源 双 链 DNA Chomoduplex DNA)40 同 源 序列 (homologous sequences) ,分 岐 42 同 质 段 (isochores)47,134 中 的 基因 位 置 (gene location within)134,136 起 源 (origin)136-138 突变 (mutation(s)11-14,16,20-21 另 见 核 苷 酸 替 换 有 利 的 (advantageous) 见 有 利 突 变 定义 (defined)11 fit (deletions) 12-14 HE 48 & Bh (frameshift) 14 细菌 中 的 GC 含量 与 (GC content in bacteria and)132- 133 热点 (hotspot)14 插入 (insertions)12-14 中 性 的 Cneutral) 见 中 性 突变 点 (point)11,53-54 体 细胞 的 (somatic)11 空间 分 布 (Sspatial distribution )14 自发 的 (Spontaneous)53-55 同 义 的 (synonymous) , 见 同 义 密 码 子 , 同 义 替 换 类 型 (types)11 突变 的 热点 (hotspots of mutation) 14 突变 率 (rate of mutation) 23-25,45,46-48 突变 论 者 的 假说 (mutationist hypothesis) 137-138 突变 模式 (mutation pattern)53-55 推论 的 系统 树 (inferred phylogenetic trees)62-63 另 见 系 统 树 脱氧 核糖 (deoxyribose) 6 脱氧 核糖 核酸 (deoxyribonucleic acid), 见 DNA 拓扑 图 (学 )(topology), 见 系统 树 WV 外 膜 蛋白 工 基因 (outer memberane protein I gene,omp A)56 db Sit F (exon (s)8,25,83,93-94,97 AB Xt #K A (asymmetrical) 95,103 2 HW (classes) 95 dX 5 (domains and) 83-85 25 |B] 4} 7G (spatial distribution ) 8-9 Xt HF AY (symmetrical) 95,103 外 显 子 插入 (exon insertion) 92-93 ,95 外 显 子 重复 (exon duplication)84-86,92-94, 另 见 DNA 重 WER 外 显 子 混 匀 (exon shuffling) 83,92-96 8 tk HA J 45 (mosaic proteins and) 93-94 相位 限制 (phase limitations) 93-96 外 源 性 基因 (exogenous genes)106-107 外 转录 间隔 (external transcribed spacers)99 完全 变态 昆虫 (hemimetabola)81 为 蛋白 质 编码 的 基因 (protein-coding genes)7-9,102,123- 124 另 见 结构 基因 叶绿体 中 的 (in chloroplasts)52 真 细 菌 中 的 (in eubacteria)8-9 哺乳 动物 线粒体 中 的 (in mammalian mitochondria)52 FF RE HR (nucleotide substitution)11-14,32,34 植物 线粒体 中 的 (in plant mitochondria) 52 替换 速率 (substitution rates)42-45 在 真 核 生 物 中 的 转录 (transcription in eukaryotes)8 在 原核 生物 中 的 转录 (transcription in prokaryotes)8-9 卫星 DNA (satellite DNA)127,129-130,131 稳定 化 选择 (stabilizing selection)18-19 无 根系 统 树 Cunrooted phylogenetic trees)61-62,69 寻根 (rooting) ,70-71 Fe i f4 FE (agnathes) 91-92 C {BH (c values) 125 FE % #3 F (nonsense codon) ) 见 终止 密码 子 Zi & % 4 (nonsense mutations) 11-13 物种 分 岐 时 间 (species-divergence times) 估计 (estimation)70-71 X. 54g Chuman and ape)72-76 1) FH AY (species trees) 62-63 物种 形成 (speciation ) , #% AE 4118-119 TR SL 38 AE (missense mutations) 11-13 xX KGAA (phylogeny)5,49,60-81 特征 状态 法 (character-state methods) 69 支 序 (clades)69-70 保护 生物 学 与 (conservation biology and)80-81 距离 法 (distance approaches)69 在 基因 重复 事件 的 年 代 测 定 中 (in gene-duplication event dating)90-92 A. 538 Chumans and apes)72-76 分 子 数据 的 影响 (impact of molecular data) 60 线粒体 与 叶绿体 (mitochondria and chloroplast)77 分 子 古 生物 学 (molecular paleontology )77,80 物种 分 岐 时 间 估 计 (species-divergence time estimation) 71 ¥% 4M (phylogenetic tree(s) )60-72 tn tE AY (additive) 61-62 两 分 叉 节 点 (bifurcating nodes) 61-62 分 枝 (branches)61 分 枝 模 式 (branching pattern)61, 另 见 拓扑 图 枝 长 (branch length)61,69-70 定义 (Cdefined)61 外 部 节点 (external nodes)61 基因 (gene)63 水 平 基因 转移 与 (horizontal gene transfer and)121 推论 的 (Cinferred)62-63 ,69 内 部 节点 (internal nodes)61 最 节省 (maximum parsimony)67 多 分 叉 节点 Cmnultifurcating nodes)62 节点 (Cnodes)61 fj YE (reconstruction methods)64-68 , 另 见 系统 树 构 建 用 于 相对 速率 测验 的 (for relative-rate test)49-50 有 根 的 (rooted)61-62 寻找 无 根 树 的 根 (rooting unrooted trees)70-71 有 尺度 的 分 枝 (scaled branches)61 物种 (Species)63 拓扑 图 (topology)61-66 另 见 系 统 树 构建 无 根 的 (unrooted)61-62,67-68,70,76-77 无 尺度 的 分 枝 (unscaled branches)61 细胞 角 和 蛋白 内 A 基因 (cytokeratin endo A gene)113 细胞 器 DNA (organelle DNA) ,中 的 替换 速率 ,52-54, 另 见 线粒体 . 叶绿体 细胞 色素 CCcytochrome C)48-49 细胞 色素 C 基因 (cytochrome C gene)48-49,113 细胞 型 (cytotype)117 细菌 (bacteria ) *" 169% GC 含量 (GC content)131-134 中 的 基因 组 大 小 的 进化 (genome size evolution in)123- 124 细菌 转 座 子 (bacteria transposons)107-108,115-116 下 游 方向 (downstream direction) ,DNA 序列 6 纤毛 虫 (Cciliophora) ,C 值 125 纤毛 虫 类 (ciliates)77-78 纤维 糖 素 (fibronectin)93-94 胃 限制 片段 模式 (restriction-fragment patterns) 37, 38-40, 79-81 限制 图 谱 (restriction map)37-39,38-40,41 限制 位 点 (restriction sites)37,99-101 限制 性 内 切 核酸 酶 (restriction endonucleases)37-40 Bam 1 38-39 Bbv 1 37-39 Bgl 1101 EcoR | 37,39,100 Hae 1 37-39 Hind 1 37,100 Hind I 38-39 Hinf | 37-39 H pa 1 99-100 Nei | 37-39 Not 1 37-39 Pvu 1101 识别 顺序 (recognition sequences) 37-39 拼接 位 点 (Csplicing site)37 粘性 未 端 Csticky ends)37 线粒体 DNA (mitochondrial DNA)79-81 线粒体 基因 组 (mitochondrial genomes) 10, 95-96 的 内 共生 起 源 (endosymbiotic origin of )77 哺乳 动物 的 (mammalian)52-53 植物 (plant)52-53 线粒体 遗传 密码 (mitochondria genetic code) ,哺乳 动物 的 10-11 线性 排比 (Calignment)34-37 点 阵 法 (dot matrix method)35-36 顺序 -距离 法 (sequence-distance method)35-37 Wie GR (adenine) 6-7 相对 适合 度 (relative fitness) 17 相对 速率 测验 (relative-rate test) 49-50 人 对 猴 的 (for humans versus monkeys) 50-51 小 鼠 对 大 鼠 的 (for mice versus rates)50 ii Py FE XT 52 4 AE AY Cfor rodents versus primates)51-52 aE tte FE Sit (mosaic proteins) 93-94 /\\ BE A (parvalbumin) ) ,内 部 域 重 复 86-87 小 分 子 细 胞 核 RNA(small nuclear RNA), AL snRNA 基因 小 分 子 细胞 质 RNA (small cytoplasmic RNA) , 见 sRNA 基因 ° 170° /\y BA (mice ) , 核 苷 酸 蔡 换 速 率 50 协同 进化 (concerted evolution)92-93 ,98-103 进化 论 含意 (evolutionary implications)101-103 机 制 (mechanisms)100-102 心房 钠 泵 因子 (atrial natriuretic factor)50 新 达尔 文学 说 (neo-Darwinian theory)26-27 信使 RNA (messenger RNA) , 见 mRNA 信息 位 点 (informative sites)67-68,75-76,81 猩猩 科 (pongidae)73 猩猩 亚 科 (ponginae)73 性 别 决 定 (sex determination) ) ,变通 的 拼接 与 ,97-98 性 致死 基因 (sexlethal(szz)gene)97-98 胸腺 喀 啶 (thymine)6-7 选择 (selection), 见 自然 选择 选择 论 者 的 假说 (selectionist hypothesis)136-137 选择 强度 (selection intensity) , 核 苷 酸 蔡 换 速率 与 ,47 选择 优势 (selective advantage) 见 有 利 突 变 定 概率 与 (fixation probability and)22-24 定时 间 与 (fixation time and)23-24 选择 中 性 (selective neutrality)55 另 见 中 性 突变 下 的 核 苷 酸 替 换 模式 (pattern of nucleotide substitution under)53-54 i #F = MX (selectionism) 26 与 中 性 主义 对 应 (neutralism versus) 27 血红 和 蛋白 (hemoglobin)48-49 恒 春 (Constant Spring)85 | Tearia85 血红 蛋白 基因 (hemoglobin genes)92, 另 见 珠 蛋 白 基因 中 的 核 苷 酸 蔡 换 速 率 (rate of nucleotide substitutions in)43 血清 白 蛋白 (serum albumin) 43, 85-86 内 部 域 重 复 (internal domain duplication)85-86 i A & A Cfibrin) 93 血 纤 蛋白 溶解 作用 (fibrinolysis)92 i 4 & A YH Bi JR (plasminogen) 93-94 内 部 域 重复 (internal domain duplication) 85-86 血 纤 蛋白 原 (fibrinogen794 r 基 因 (r gene)43 血液 凝固 (blood coagulation)93-95 Y 鸦片 黑 素 皮质 激素 原 基 因 (proopiomelanocortin gene) 50, 113 WW 2& FA 4 HH AY DNA (subgenomic circular DNA)52 W. ## (subspecies ) 80 KEE BE HZ AR OE WS — 4% $F MB (nicotinamide adenine dinucleotide (NAD* )89 AR 4 38 Ceuglenozoa), C {#125 (AR) da 4 3 & (crystallins) ,基因 分 享 97-99 摇摆 Cwobbling)56-57 野生 型 等 位 基因 (wild-type allele), 突变 型 等 位 基因 替代 22-25 叶 猴 (Clangurs) ,的 溶菌 酶 48-49 叶绿体 基因 组 (chloroplast genomes)10 的 内 共生 起 源 Cendosymbiotic origin of)77-78 替换 速率 (substitution rates)52-54 4K i DNA 的 RNA & 3 fi (DNA-dependent RNA poly- merase), KL RNA 4 RB 依赖 S- 腺 苷 甲 硫 氢 酸 的 甲 基 化 酶 (s-adenosylmethiomine- dependent methylase)107 依赖 Vk 的 钙 结合 组 件 (CvitaminK-dependent calcium-bind- ing module)93-94 胰 蛋 白 酶 (trypsin)85,87,93-94 胰岛 素 基 因 (insulin gene) ,中 的 核 苷 酸 蔡 换 速 率 43-44 A 和 B 链 (A and B chains)46-47 C- 肽 基因 (C-peptide gene)46-47 胰岛 素 样 生 长 因子 工 基因 (insulin-like growth factor I gene)43,50 胰岛 素 原 基因 (proinsulin gene), 替换 的 速率 46-47 遗传 重 排 (genetic resetting)119 遗传 多 态 性 (genetic polymorphism) I & A HE 遗传 密码 (genetic code)9-11 的 简 并 (degeneracy of)10,55 哺乳 动物 线粒体 的 (mammalian mitochondrial) 10-11, 34-35 普 适 的 (universal)10,34-35 乙肝 病毒 (hepatitis B virus)109-110 乙酰 胆 碱 受 体 r 亚 基 基因 (acetylcholine receptor r subunit gene)43 蜡染 色 质 (heterochromatin)129-130 异型 酶 Callozymes)88 ,89 异 源 双 链 DNA(heteroduplex DNAJ)40 易 位 (translocation)116 Fl --IX 基因 (factor-IX gene)93-94 外 显 子 定位 (exon localization ) 8-9 应 答 者 基 JE 位 (Responder locus), HA CD. melanogaster) 127-128 用 于 系统 树 构 建 的 近邻 关系 法 Cneighbor relation methods for tree reconstruction ) 66-67 ,68,81 A. 45 3g 5 (for humans and apes)75 有 差别 的 生殖 (differential reproduction) ), 见 自然 选择 #4828 (marsupials), 4>- 4 +A W480 有 根 的 系统 树 (rooted phylogenetic tree )61-62 有 功能 基因 (functional gene) ,与 加 工 后 假 基 因 对 应 112- ES AI & ®R 7K (deleterious mutation ) 定 概 率 (fixation probability ) 23 固定 时 间 (fixation time) 17,23-24,45-46,87 Aj Fil 3 4E (advantageous mutation (s) 16-18, 26-27, 45-46, 48-49 另 见 正 选 择 的 固定 概率 (fixation probability of)22-23 的 固定 时 间 (fixation time of)23-24 基因 替换 的 速率 (rate of gene substitution )24 有 利 选 择 (advantageous selection)17,45-46 另 见 正 选 择 有 丝 分 裂 (mitosis)9-10,100-101,125-126,131 有 效 群体 大 小 (effective population size)20-23 ,27 长 期 (long-term)22 有 意义 密码 子 (sense codons)10,85 中 的 核 苷 酸 蔡 换 (Cnucleotide substitution in)11-13 诱 变 剂 (mutagens)52-53,131 鱼 类 (fishes) ,C 值 125 Sa (domain(s) xe XL (defined )83 Sb fit F 45 (exons and)83-85 另 见 外 显 子 中 的 条 目 功能 的 (functional)46,83 结构 的 (structural)46,83, 另 见 组 件 域 重 复 (domain duplication )84-87 卵 类 粘 蛋 白 基 因 与 (ovomucoid gene and)85-87 的 普遍 性 (prevalence of )85-87 原核 生物 (prokaryotes) 内 共生 学 说 与 (endosymbiotic theory and)77-78 中 的 结构 基因 (structural genes in)8-9 原 肌 球 蛋白 (tropomyosin) , 非 肌 的 113 原 肌 球 蛋白 a 链 (tropomyosin a chain) 内 部 域 重 复 85-87 原生 生物 (protists)77-78 猿 类 (apes), 的 系统 发 育 72-76 阅读 框架 (reading frame)9-10 Z 42 & fF (heterozygotes) tt ff + 5 (codominance and) 18-19 超 显 性 与 Coverdominance and)18-19 配子 的 随机 取样 与 (random sampling of gametes and)19 杂种 DNA (hybrid DNAJ) 见 异 源 双 链 DNA 杂种 劣势 (hybrid dysgenesis)116-118 物种 形成 与 (speciation and)118-119 载 脂 蛋 白 基 因 (apolipoprotein genes)43-44,46-47 载 脂 蛋白 A- I 43,50-51 载 脂 蛋白 A- N 43-44 # 9G EG E 43-44,50 MK (algae) .C 14.125 沼泽 地 人 (bog people) 80 真 骨 鱼 (bony fishes) ,C 值 125 真 核 生 物 (eukaryotes) 内 共生 学 说 与 (endosymbiotic theory and)77-78 基因 结构 (gene structure)6 ,84-85 ° 171° 基因 组 重复 (genome duplication )129 基因 组 大 小 (genome size)124-127 为 蛋白 质 编 码 基 因 的 结构 (protein-coding gene struc- ture)7-9 重复 基因 组 结构 (repetitive genome structure)125-129 真菌 (fungi)77-78 真实 系统 树 (true phylogenetic trees)62-63, 另 见 系 统 树 构 建 真 细 菌 (eubacteria)77-78 C 值 (C values)123-124 中 的 GC 含量 (GC content in)131-133 中 的 为 蛋白 质 编码 基因 (protein-coding gene in)8-9 正 选 择 (positive selection)17,45-46, 另 见 有 利 突变 乳牛 和 叶 猴 的 溶菌 酶 中 的 (in lysozymes of cow and jan- gurs)48-49 支原体 (mycoplasmas)123-124,132 rRNA 基因 (rRNA.genes)88 枝 长 估计 (branch length estimations)69-70 直 翅 目 (orthoptera)81-82 指 状 组 件 (finger module)93-94 植物 基因 组 (plant genomes) ,替换 速率 52-54 植物 线粒体 基因 组 (plant mitochondrial genome)52-54,77 替换 速率 (substitution rates)52-53 质粒 (plasmids)107-108 A) DNA 起 源 (DNAoriginating 记 )123-124 质 体 (plastids), 见 叶绿体 中 度 重 复 DNA (middle-repetitive DNA)125-127 中 性 突变 Cneutral mutation)17,45-46, 另 见 选 择 中 性 的 固定 概率 (fixation probability of)22-23 的 固定 时 间 (fixation time of)23-24 基因 替换 的 速率 (rate of gene substitution)24-25 ,45-46 终止 密码 子 (stop codons, termination codons)8,9-11,85, 89-90 ,97-98 框架 移动 突变 与 (frameshift mutation and)14 肿瘤 抗原 P53 基 因 (tumor antigen P53 gene)113 种 系 细胞 (germ-line cells), 中 的 突变 , 见 突变 朱 克 斯 和 坎 托 的 一 参数 模型 (Jukes and Cantor's one-pa- rameter model) 28-31 ,32-34,41 朱 克 斯 和 坎 托 公 式 (Jukes and Cantor's formula) 34 — 珠 蛋 白 基 因 (globin gene) 另 见 某 些 具体 类 型 , 如 肌 红 和 蛋 白 染色 体位 置 (chromosomal location)92 进化 史 (evolutionary history)92-93 家 族 (families)88 ,92-93 GC 含量 (GC content)134-137 进化 中 的 内 含 子 丧失 (intron loss during evolution )84- 85 超 家 族 (superfamily)88 , 92-93 1 珠 蛋 白 假 基因 (globin pseudogenes) ,缺陷 89-91 主 组 织 相 容 复合 体 基 因 (major histocompatibility complex genes)102-103 中 的 非 同 义 对 同 义 蔡 换 (nonsynonymous versus api mous substitution in)45-46 转化 基因 (transformer (tra) gene)97-98 转换 (transition)11-12,30-32,34-35 转录 (transcription)7-8,77,111,129 转录 起 始 部 位 (transcription initiation site)7-8,102 转录 终止 部 位 (transcription termination site)7-8 转移 RNA (transfer RNA) 见 tRNA 转 座 (transposition)101-102,105-122,129-130 保守 (型 ) (conservative)105-107 定义 (defined)105 重复 型 ty 105-107 对 宿主 基因 组 的 效应 (effects on host genome)115-116 水 平 基 因 转 移 (horizontal gene transfer)119-122 杂种 劣势 与 (hybrid dysgenesis and)117-118 复制 型 (replicative)105-107,128 反 录 序列 与 (retrosequences and)110-116 物种 形成 与 (speciation and)118-119 可 转 座 因子 拷贝 数 与 (transposable-element copy num- ber and)119-120 可 转 座 因子 与 (transposable elements and) 106-110 类 型 (types)105 转 座 酶 (transposase)106-107 PE WE IME BA (AK (transposing bacteriophages)107-108 & i F (transposons) 106-108 58 & (complex) 107 & i& (composite ) 107 对 宿主 基因 组 的 效应 (effects on host genome) 115-116 TOY Tn9 107 Tnl10 105,116 Tn21 107-108 Tn554 107-108 Tn107-108 “tee me Ff 4” (“transposon yeast”), Ty 因子 着 丝 粒 紫 ( 色 ) 细 菌 (purple bacteria) ,a 分 枝 77-78 自发 突变 (Spontaneous mutation ) ,模式 53-55 自然 选择 Cnatural selection)16-19,131 有 利 的 (advantageous) 17 共 显 性 的 (codominant)18-19 定义 (defined)17 固定 概率 与 (fixation probability and)22-23 固定 时 间 与 (fixation time and)23-24 负 的 (negative) 17 新 达尔 文 主义 (neo-Darwinism and) 26-27 超 显 性 的 (overdominant)17,18-19 as 一- 正 的 (positive)17, 在 寻找 无 根 树 的 根 中 的 (in rooting unrooted trees)70- 纯洁 化 (purifying)17 71,74-75 自身 折 回 DNA ColdbackDNA ) 125-127 变形 距离 法 中 的 (in transformed distance method) 66 “8 #, DNA” (“selfish DNA”)115-116,131 组 织 血 红 和 蛋白 溶 酶 原 激 活 剂 (tissue plasminogen activa- BA 3 4 (repressor )8 tor, TPA)93-94 组 成 同化 (compositional assimilation) , {fi 3 A 45 115-116 最 大 简约 法 (maximum parsimony methods), 64, 67-69, 组 蛋白 基因 (histone genes)8-9,87 79,82 中 的 核 苷 酸 蔡 换 速 率 (rate of nucleotide substitutions) 用 于 人 与 猿 的 (for humans and apes)75-76 42-44,46-47 FA + A 4824 & Cor marsupials) 80 48 44 (module(s) 83,75 It Sh 组 外 单位 Coutgroup), 另 见 系 统 树 “和 光环 缩写 词 和 种 名 索引 AATAA 块 (AATAA box),, 见 多 聚 腺 苷 酸化 信号 Acheta comzesticxs( 蝗 虫 )82 Achole plasma laidlawii (Fé fib {§ JRE) 132 Ach yrthosi phon magnoliae 4F #8 )82 ACTH 基因 (ACTH gene) 44 Actinobacteria iit & FA) »132 Adh, 3 8? Whi A i Aedes (fF 8% J& 137-138 Aegilops bicornis (VA ffi Li = FE ) 38-39 Aegilops sharonensis (Vb & 1 FE ) 38-39 AIDS (XG FH )58,108 Allium cepa( 洋 葱 ),C 18126 Alu F¥ i) CAlu sequences), 低 密度 脂 蛋 白 受 体 基 因 中 的 (in low-density-lipoprotein receptor gene)116 Ammodramus maritimus (¥¢ WE € ) 80-81 Amoeba dubia( Ket & I 8), C 18125 Amoeba proteus(K 4 #), C 18125 Am phiuma means ($48), C 18125 Anthrobacter luteus 132 : Artemia salina(— # A #5 Bh 81-82 BIR (B1 family)114, 5 W Alu 序列 Bacillus brevis i ¥F Bi) 132 B-# £4 {& (B-chromosomes) 129 Bacillus subtilis i Ft FF 132 Boa constrictor (#€) »C {4125 Bombyx mori( RR # ) 82,128 Bowman-Birk 型 蛋白 酶 抑制 因子 (Bowman-Birk type pro- tease inhibitor) ,内 部 域 重 复 86-87 CAAT (CAAT box)7-8 Carcarias obscurus &_) ,C {#125 cDNA (4. #} DNA)60,105,107-109,111 CDRs( 决 定 互补 性 的 区 域 )45-46 Clostridium innocuum AK F 44 FF RZ —)132 Clostridium pasteurianum (EF # 7a RA), A af dt me 85-87 Clostridium per fringens J" &\ 3 AB ) 132 Coscinodiscus asterom phalus ( 5 Ht (Al Si BE . HEME) «C 18125 cox | 3£ A (cox I gene) 97-98 Cu/Zn 超 氧 化 物 岐 化 酶 基因 (Cu/Zn superoxide dismutase gene)112-113 C 型 病毒 基因 (type-C virogene) ,水 平 转移 120-122 C 值 (CC value(s)123, 另 见 基 因 组 大 小 细菌 (bacteria)123 ° 174° HOKE W (eukaryotes) 124-127 C {A t¥ i (C-value paradox )124-127,131 Cyprinus car pio (##) 134-135 C {8 (C values)125 Dasyurus maculatus (FE FE 4S Wh) 80 Dictyostelium discoideum (网 柱 菌 属 之 一 )137-138 反 录 转 座 子 (retrotransposons)108-110 Dipodomys ordii il fi —#P)125-127 DNA 另 见 核 苷 酸 中 的 条 目 互补 Ccomplementary), 见 cDNA 双 链 的 (double-stranded)6-7,40 自身 折 回 (foldback)125-127 高 度 重 复 (highly repetitive)125-127 废物 (junk)131 中 度 重 复 (middle-repetitive)125-127,129-130 线粒体 (mitochondrial)79-81 非 基因 (Cnongenic)126-127,131 核 类 型 的 (nucleotypic)131 细胞 器 (organelle)52-54 在 质粒 中 的 起 源 (originating in plasmids)123-124 重复 (repetitive)126-129 Ti # (satellite)127,129-130,131 “8 #.” (“selfish”) 115-116,131 *% #% Ml (single-copy) 126-129 FA — (unique) 126-129 DNA -DNA 4¢2€ (DNA-DNA hybridization) 37 , 39-40 KX. 5548 Al (humans and apes and)40,76 DNA & (DNA duplication) 114,116,127-128, 5 Wb & 子 DNA & & fi (DNA polymerase)14,131 DNA #° 4% (DNA amplification) 79,130-131 DNA 复制 (CDNA replication) 9-10,129 DNA 修复 (CDNA repair)51-53,106-107,111 DNA 序列 (CDNA sequence) 6 KK FF RF M (nucleotide substitution ) 28-35 PCR 扩 增 (PCR amplification )77-80 4 AS HE RE (polymorphism measurement) 25-26 限制 位 点 (restriction site) 37-39 DNA 顺序 资料 CDNA sequence data) ,对 分 子 系统 发 育 的 影响 60 DNA 中 介 的 转 座 CDNA-mediated transposition) ) , 见 转 座 Drosophila( R: #8) 129-130,137-138,15,101,113-114,128 尸 因 子 在 物种 间 的 水 平 转移 (horizontal transfer of P el- ements between Species)121-122 杂种 劣势 (hybrid dysgenesis) 116-118 反 录 转 座 子 (retrotransposons)109-110 Drosophila mauritania( F # — FH) 121-122 Drosophila melanogaster (FR HB) 82, 106-107, 116-119, 121- 122 醇 脱 氢 酶 核 苷 酸 多 样 度 (Calcohol dehydrogenase nu- cleotide diversity)25-26 变通 的 拼接 与 (alternative splicing and)97-98 C 值 Cc value)125 同 义 密码 子 的 非 随 机 应 用 Cnonrandom usage of synony- mous codons)56-57 rRNA 基因 (rRNA genes)88 Rsp 基因 座位 (Rsp locus)127-128 可 转 座 因子 (transposable elements)105,107-108,119- 120 tRNA 基因 (tRNA genes)88 Drosophila nasutoides ( 5 #8 JR — FP), i RE HS DNA127- 128 Drosophila saltans (5% #8 JR — FP) 121-122 Drosophila sechellia (FR #8 J — FF) 121-122 Drosophila simulans (5% #8 J — FP) 118-119,121-122 Drosophila willistoni (5 #8 J — FP) 121-122 Drosophila yakuba (FR #) 121-122 Echymipera 80 EGF (epidermal growth factor ,表皮 生长 因子 )93-94 Erysiphe cichoracearum(— ## A) .C 18125 Escherichia coli (XK Mi ¥¥ )37-39,59,76-77,123-124,132- 133 插 人 序列 (insertion sequences) 106-107 同 义 密码 子 的 非 随 机 应 用 Cnonrandom usage of synony- mous codons)55-57 rRNA 基因 (rRNA genes)88 可 转 座 因子 (transposable elements)105-107,116 Euplotes aedzczlatxs( 小 腔 游 仆 虫 属 )137-138 GT-AG 规则 (GT-AG rule)8,90 GC 含量 (GC content)57-58 细菌 中 的 (in bacteria)131-134 同 质 段 与 (isochores and)134-137 GC 块 (GC box)7-8 GC 突变 的 压力 (GC mutational pressure)132-133 Gallus domzestiziczs( 鸡 ),C 值 125 Gal ycine maz( 大 豆 )84-85 Gorilla gortla( 大 猩猩 )72-76 Haemophilus aegyptixs( 哮 血 杆 菌 属 之 一 )37-39 Haemophilus zxuenzae( 流 感 嗜 血 杆 菌 )37-39 Lactobacillus viridescens (F1, 1 FF A JZ — ) 132 Lac Z 4 (A (Lac Z gene) 105-106 Lam preta planeri(-E {§ #8), C {#125 LDH, 见 乳酸 脱氧 酶 Lilium formosanum (台湾 百合 ),C 值 125 LINEs (long interspersed elements 的 首 字 母 缩 略 , 长 散在 因子 )128-129 Micrococcus Lutexs( 小 球菌 属 之 一 )132-133 mRNA 变通 的 拼接 与 (alternative splicing and)97 编码 区 (coding regions)7-8 M ycobacterium tuberculosis (4 %K FF fA ) 132-133 M ycoplasma(#X J J 132 M ycoplasma ca pricolum (fX Jip VE JR Z— 132-133 M yxococcus xanthus fi ER A RZ) » IR EF 110 Na, K-ATP fi B 3£ fA (Na, K-ATPase B gene) 44 Navicula pelliculosa( ft Fe & J&Z — Ct $C 18125 Neisseria cinerea ( Ae 3 KK FA RZ — 37-39 Nicotiana tabacum (Kl # ) 叶绿体 基因 组 (chloroplast genome) 52 C 值 (C values)125-126 Nocardia otitidis-caviarum i F K AJR Z — ) 37-39 Ophioglossum petiolatum(— # RE) »C {4125 ORFs, WH i€ te OTUs, 见 操 作 中 的 分 类 单位 Oxytricha xzov&( 尖 毛虫 属 之 一 )137-138 Pan paniscus 3& 38 FH 40 Pan troglod ytes (3 92 )72-76 Papio anubis U5 Bi Bb) 57-58 Papio cynoce phalus Pe Bi Z — FP) 121-122 Papio hamadr yas GR & Be Be) 121-122 Papio papio Hp # ) 121-122 Paramecium aurelia( 3K & i Bh) .C (4124-126 Paramecium caudatum (Fe & J 4), C {4124-126 Parascaris equorum (4 #3|) »C {2125-126 PCR , 见 多 聚 酶 链 式 反应 PGK 多 家 族 ( 磷 酸 甘 油 酸 激酶 多 家 族 )111,112 Phalanger 80 Phaseolus vulgaris (3% FZ )84-85 Philander opossum andersoni RK #k fi FR.) 80 Philosamia cynthia ricini(— #P #R) 82 Physarum polycephalum (9X 38 FA J&Z —)137-138 Pinus resinosa(¥ ) ,C {8125 P-M 系统 (P-M system), 116-118 Pongo pygmaeus ( 4 BE) Proteus vulgaris ¥% ii 48 ¥F A) 132-133 Protopterus aethiopicus (iii £4) »C 18125 Pseudomonas fluorescens Fe He {BF fd FA) 125 P AF (P elements) 105-106, 107-108,116-119, 5 WL a #% 座 因子 果 蝇 种 间 的 水 平 转移 (horizontal transfer between “ee Drosophila specles)121-122 RNA 信使 (messenger) , 见 mRNA 转录 后 的 修饰 (modification following transcription ) 9- 10,111 前 信使 (pre-messenger) , 见 前 -mRNA 核糖 体 的 (ribosomal) , 见 rRNA 小 核 的 (small nuclear) , 见 snRNA 转录 的 (transcribed ) ,7-8 转移 (transfer), WL tRNA RNA & & fi (RNA polymerase) ,7-8 RNA & & Bf 1 ,7 协同 进化 与 (concerted evolution and)102 RNA 序列 CRNA sequences)6-7 RNA & & fi I 7-8 RNA #74) & 4 B (RNA-mediated transposition), 5 转 座 RNA 转录 本 (RNA transcript) 变通 的 拼接 (alternative splicing)97 反 录 序列 与 Cretrosequences and)109-110 RNA-DNA 杂交 (RNA-DNA hybridization) rRNA 基因 (rRNA genes)81-82,87-88,101-102,123,130 叶绿体 中 的 (in chloroplasts)52 协同 进化 与 (concerted evolution and)98-99 内 共生 学 说 与 (endosymbiotic theory and)77-78 外 部 可 转录 间隔 (external transcribed spacer)99-100 内 部 可 转录 间隔 (internal transcribed spacer)99-100 哺乳 动物 线粒体 中 的 (in mammalian mitochondria)52 不 转录 间隔 (Cnontranscribed spacer)99-100 植物 线粒体 中 的 (in plant mitochondria)52 转录 (transcription)7,99 不 等 价 交 换 (Cunequal crossing-over)100-101 Rs 基因 座位 CRsza locus), 见 应 答 者 基因 座位 Rattus norvegicus (#4 HR FR) .C 值 125 Saccharomyces cerevisiae (BB 15 W & 124-125 同 义 密 码 子 的 非 随 机 应 用 Cnonrandom usage of synony- mous codons)55-57 rRNA 基因 (rRNA genes)88 可 转 座 因子 (transposable elements)116 Salmonella typhimurium ( fi (5 % VW 1) FR A) 119-120 Sarcophilus harrisii (48 3€ )80 Schistocerca gregaria( 44% #1) ,.C (#125 scRNA 基因 (scRNA genes) ,转录 7 Shigella dysenteria( Hil Fe EH EK BA ) » 8 A FR 106-107 SINEs (short interspersed elements 的 首 字 母 缩 略 , 短 散 在 因子 )128-129 snRNA 基因 (snRNA gene) ,转录 7-8 Staphylococcus atrexs( 金 黄色 酿 浓 葡萄 球菌 )107,132 Streptococcus faecals( 粪 链球 菌 )132 ° 176° Streptomyces griseus $# 3% A J&Z — )132 Strong ylocentrotus (ER ¥8 AA J&R ) 137-138 TACTAAC & (TACTAAC box) 9-10 TATA (TATA box)7-8,90 Tetrahymena (VU fi 8 J) 10 Theropithecus gelada( it Fe 9 — FP) 121-122 Thy-1tit AC(Thy-1 antigen) 50 Thylacinus cynoce phalus (48 Ft ) 80 Trichosurus (a FE 4 58 JB) 80 tRNA 9-10 丰 度 与 同 义 密码 子 的 非 随 机 应 用 (Cabundance and non- random usage of synonymous codons)55-57 来 自 一 的 加 工 后 假 基因 (processed pseudogenes derived from)112-113 tRNA 基因 (tRNA genes) ,9-10,87-88,95-96,123-124 叶绿体 中 的 (in chloroplasts)52 哺乳 动物 线粒体 中 的 (in mammalian mitochondria)52 植物 线粒体 中 的 (in plant mitochondria)52 转录 (transcription )7 Trypanosoma brucei (Ap FR #é PE 128 Ty AF (Ty elements)116 U6 A (U6 gene) ,转录 7-8 Vicia faba( # @)84-85 Xenopus (J 8 114 协同 进化 (concerted evolution) 98-99 Xenopus borealis M ¥8 Z — ) 98-99 Xenopus laevis NW Z — )98-99, 134-135 C {fi (c values) 125 rRNA 基因 (rRNA genes) 88 Xenopus mulleri MM 8 Z— )98-99 Zea mays( XK )77-78 a-ff 4 A 4E A (a-fetoprotein gene) 48a 微 管 蛋白 (Ca tubulin) 44 a- fii BF Bit (a-enolase) MVE -磷酸 丙酮 酸 水 合 酶 ,98-99 ao- 珠 蛋 白 基 因 (a-globin gene)84-85,88,91,103,113,134- 137 al 92-93 a2 92-93 密码 子 应 用 模式 (codon-usage patterns) 57-59 家 族 (family ) 92-93 中 的 核 苷 酸 蔡 换 速率 (rates of nucleotide substitution in)43,44,49 al- 抗 胰 和 蛋白 酶 (al-antitrypsin)50-51 BY — de FP Pe HK i. CHE ) (8* 一 thalassemia)97-98 B- kt fF 3 A EA (B-tubulin gene) 113 B- 珠 蛋白 基因 (B-globin gene) 84-85, 88, 91-93, 102-103, 134,136-137 密码 子 应 用 模式 (codon-usage patterns)57-59 家 族 (family)92-93 中 的 核 苷 酸 蔡 换 速率 (rates of nucleotide substitution 5- 珠 蛋白 基因 (5-globin gene)92-93 in)43,44-45,47,49,50-51 b1- 珠 蛋白 基因 (61-globin gene)58-59, 92-93 7- 珠 蛋白 基因 (7-globin gene)44-45,92-93,100 6- 珠 蛋 白 基 因 (6-globin gene)50-51,92-93,102-103 《陈建华 译 , 张 亚 平 、 吴 春花 和 李 海 觅 校 ) 人 Molecular Variation and Ecological Problems AFRADTESS las JR (E:T. Burke, W. Reiney 和 T. J. White . 技术 与 术语 pp (182) .4DNA 指纹 分 析 po (189) 7 系统 学 ee (188) OCS NS JE SS OES 分 子 变 异 与 生态 学 问题 1 4 a 分 子 遗传 学 的 新 进展 为 生态 学 提供 了 许多 新 的 并 且 具 有 很 高 价值 的 技术 。 就 象 这 些 技 术 似 乎 是 解决 生态 遗传 学 和 进化 生态 学 问题 的 基础 一 样 , 它 们 也 开始 为 其 他 生态 学 领域 提供 了 有 用 的 研究 工 具 。 现 在 有 一 种 倾向 , 批评 许多 生态 学 家 喜好 和 应 用 这 些 新 技术 是 一 种 潮流 ,或 可 能 是 生态 学 中 的 最 it “AY fe” (Abrahamson 等 1989) ,但 我 们 认为 这 是 生态 学 家 们 的 积极 响应 ,因为 这 种 新 的 可 能 性 实际 上 会 引发 一 次 关键 性 的 技术 飞 跃 。 这 些 技术 直接 的 重要 作用 是 有 效 地 检测 生物 个 体 间 的 差别 DNA. 组 成 所 有 DNA 分 子 的 四 种 核 苷 酸 的 显然 很 简单 的 线性 排列 与 表现 在 以 下 几 个 方面 巨大 而 复杂 的 异 质 性 是 很 不 相符 合 的 ,这 些 方 面包 括 进化 速率 、 差 异 很 大 的 序列 结构 、 突 变速 率 ` 固 定 速率 以 及 选择 压力 等 (图 1).。 许 多 生物 体 的 一 快 慢 蛋白 质 编码 DNA es 第 三 位 置 Be AM 第 二 位 置 ” 蛋白 质 次 级 BER 核 昔 酸 序列 wr /四 级 结构 不 转录 区 内 转录 区 KE 卜 亚 基 pe ] JW 四 级 结构 其 他 不 编码 DNA 小 卫星 微 卫 星 卫星 序列 图 1 DNA 序列 进化 的 相对 速率 些 基 因 组 具有 不 同 的 遗传 方式 和 序列 进化 率 ( 见 图 2) ,对 于 它们 的 比较 可 以 得 到 有 价值 的 认识 。 另 . 外 ,可 用 的 各 种 分 子 技 术 本 身 提 供 了 不 同 的 敏感 程度 。 这 样 就 使 从 近 缘 的 各 种 个 体 到 在 古代 就 已 趋 异 的 物种 之 间 的 每 一 种 亲缘 关系 程度 , 最近 已 可 能 在 目标 DNA 分 级 与 适合 作 定量 遗传 差异 (或 相 似 ) 的 分 子 方法 间 选 择 到 一 种 结合 。 了 isi 线粒体 Re. Michie. 质 体 L Tel aba es | eat REAR ee 植物 真菌 oY 原生 生物 原生 生物 图 2 不 同类 群 中 可 用 作 分 析 的 基因 组 长 期 以 来 ,对 表 型 变异 与 保持 感 兴趣 的 生态 学 家 们 ,通过 分 离 等 位 变异 涉及 表 型 的 基因 ,能 够 直 接 分 离 和 研究 其 遗传 构成 。 这 将 与 在 商业 上 具 重 要 价值 的 动 . 植 物 物种 早已 开展 分 子 遗 传 研究 一 样 , 是 一 种 自然 的 进步。 在 这 个 综述 中 ,我 们 主要 集中 于 DNA 变异 的 分 析 , 而 不 是 特异 序列 功能 或 特定 位 点 选择 过 程 的 研究 。 我 们 通过 有 关 生 态 学 问题 的 实例 来 曾 明 其 应 用 的 范围 。 附 表 中 ,我们 总 结 了 迄今 为 止 运用 各 种 分 子 方法 解决 的 生态 学 问题 。 我 们 顺序 介绍 其 应 用 领域 ,并 努力 强调 在 每 个 领域 中 ,现在 看 来 最 合适 - 181° 的 方法 。 由 于 大 多 数 的 技术 可 用 于 处 理 种 种 问题 ,为 避免 重复 ,首先 我 们 来 简单 描述 一 下 主要 的 新 技 术 。 2 技术 与 术语 这 一 节 论 述 了 所 用 到 的 不 同 技术 的 一 个 概貌 。 与 生态 学 家 的 需要 特别 有 关 的 两 本 手册 分 别 是 由 Heolzel(1992) 和 Hillis 与 Moritz(1990) 编 著 的 。 本 章 所 描述 的 已 建立 的 主要 方法 在 上 述 两 本 书 上 有 详 AM BGR AEE; 其 它 的 文献 在 需要 的 地 方 给 出 。 2.1 材料 来 源 实际 上 ,任何 细胞 组 织 都 是 合适 的 DNA 来 源 。 在 肴 椎 动物 研究 中 ,因为 血液 的 获得 是 非 破 坏 性 的 ,所 以 是 最 常用 的 材料 。DNA 所 需 的 量 依 所 用 的 技术 的 不 同 而 不 同 。 例 如 ,对 于 以 DNA 一 DNA 杂 交 为 基础 的 方法 ,如 多 位 点 DNA 指纹 ,每 次 样品 操作 需要 5ugDNA( 一 般 这 个 量 足 够 以 进行 若干 次 操作 ) 。 材 料 从 鸟 类 的 血液 ( 它 的 红细胞 是 具 核 的 ) 中 获得 只 需 1 一 2ul, 对 于 哺乳 动物 来 讲 , 只 有 白细胞 具 核 , 则 需要 lml 血液 .对 于 应 用 扩 增 技术 的 方法 来 讲 , 如 聚合 酶 链 式 反应 (PCR) ,虽然 由 于 存在 潜在 的 污染 问题 ,通常 都 避免 这 么 小 的 取样 ,但 是 在 理想 条 件 下 ,开始 于 一 单 倍 体 基 因 组 (haploid genome) 的 分 析 是 可 行 的 。 尽管 多 数 实 验 室 一 直 都 是 采用 冷冻 的 方法 保存 用 于 提取 DNA 的 组 织 , 但 已 经 证 明 各 种 化 学 混 合剂 (包括 促 溶 剂 , 丈 合 剂 ,乙醇 和 浓 盐 溶液 ) 能 够 在 环境 温度 下 保存 适用 于 大 多 数 分 析 方 法 的 相对 较 长 的 DNA 分 子 至 少 几 周 或 几 月 ( 见 Bruford 等 ,1992)。 例 如 ,从 酒精 中 保存 6 年 之 久 的 动物 组 织 中 提取 出 大 量 可 被 限制 性 核酸 内 切 酶 切断 的 DNA(Smith 等 1987) 。 但 是 另外 的 研究 则 报道 了 低 的 产 量 和 快速 降解 (Seutin 等 ,1990) 。 不 同 之 处 可 能 是 由 于 商业 酒精 的 污染 (lto,1992) 。 2.2 DNA—DNA 杂交 ASE Ti 1K BEF GO Fe BS 7 A EE dT) A A HE BK Gi) Ek EB» PAR. 的 简单 方法 是 点 印迹 (dot blot), 即 在 与 标记 了 的 探 针 杂交 前 ,将 等 分 试 样 的 DNA( 甚 至 血液 ) 点 到 滤 膜 上 并 固定 。 探 针 最 常用 的 是 放射 性 标记 了 的 ,但 是 非 放射 性 标记 的 方法 逐渐 发 展 并 普遍 起 来 。 通 过 各 种 合适 的 对 照 来 比较 其 杂交 强度 可 以 测定 目标 样品 中 探 针 序列 的 存在 。 杂 交 的 检测 可 以 通过 和 射 线 放射 自 显影 或 直接 在 膜 上 探 针 的 化 学 染色 。 当 研究 一 特异 性 序列 时 , 探 针 可 以 是 一 克隆 了 的 DNA 片段 或 一 非常 短 的 ,典型 的 是 20 一 30 个 碱 基 对 ,人 工 合成 的 守 核 苷 酸 序列 。 一旦 一 个 克隆 被 测序 后 , 就 可 以 设计 寡 核 苷 酸 探 针 , 并 且 原 则 上 人 允许 相对 快速 而 方便 地 对 序列 变异 数据 的 收集 (如 Gardes 等 1991). 2.3 限制 性 片段 分 析 用 点 印迹 法 简单 地 检测 相似 序列 经 常 是 不 够 的 , 我 们 需要 更 详细 的 有 关 杂 交 的 目标 DNA 的 信 息 。 直 到 最 近 , 估 测 DNA 序列 变异 的 最 简单 方法 是 应 用 限制 性 片段 (或 限制 性 片段 长 度 多 态 性 , RFLP) 来 分 析 。 首 先 ,样品 DNA 被 许多 合用 的 限制 性 内 切 酶 之 一 种 切 成 一 定 的 片段 , 然 后 依 它们 的 长 度 将 这 些 片段 通过 电泳 分 离 。 限 制 性 片段 可 以 通过 电泳 凝 胶片 的 染色 观察 或 如 上 所 述 , 按 South- ern 印迹 法 永久 地 转移 到 一 个 滤 膜 上 经 过 杂交 检测 。( 现在 有 些 方法 为 了 避免 印迹 这 一 步 , 而 是 把 片 段 在 凝 胶 上 于 燥 后 直接 杂交 凝 胶 , 如 Schafer 等 1988)。DNA 片段 的 存在 与 否 暗示 着 应 用 特定 限制 性 内 切 酶 来 识别 的 特异 性 目标 序列 的 变异 。 2.4 DNA 指纹 分 析 有 两 种 不 同 级 别 的 DNA 指纹 分 析 一 二 多 位 点 和 单位 点 指纹 。 对 于 后 者 ,通过 与 一 克隆 的 小 卫星 探 针 的 Southern 印迹 杂交 ,可 以 检测 在 一 个 单位 点 上 等 位 DNA 限制 性 片段 的 不 同 大 小 (Wong 等 * 182° 1987) 。 一 个 典型 的 小 卫星 DNA 序列 的 长 度 大 于 20,000 个 碱 基 对 , 它 包 括 一 个 短 的 10 一 60 碱 基 对 的 非 编 码 序 列 的 重复 拷贝 。 重 复 的 次 数 有 显著 的 差异 ,可 以 产生 易于 检测 的 不 同 长 度 的 限制 性 片段 , 从 而 在 一 些小 卫星 位 点 得 到 了 很 高 水 平 的 多 态 性 ( 杂 合 率 达 100%%)。 小 卫星 位 点 是 “可 变数 量 的 串联 重复 (VNTR) ”位 点 的 例子 。 在 多 位 点 DNA 指纹 法 中 ,用 到 了 一 个 “多 核心 (poly-core)” 探 针 , 它 可 与 部 分 重复 单位 ( 即 “ 核 >”) BARS, 这 种 重复 单位 在 微 卫 星 的 很 多 分 离 的 位 点 上 是 很 普通 的 (Jeffrey 等 ,1985a,b)。 可 以 用 不 同 的 核心 探 针 来 检测 非 依赖 性 小 卫星 带 谱 (Kindependent minisatellite profiles) 。 多 位 点 指纹 法 的 一 个 主要 优点 是 核心 探 针 可 用 在 广泛 的 生物 体 中 (如 Burke 和 Bruford 1987, Dallas 1988,Taggart 和 Ferguson 1990,Carvalho 等 1991; 见 Burke 等 1991a 综述 )。 有 关 多 位 点 和 单位 点 小 卫星 DNA 指纹 法 的 详细 实验 室 操作 程序 见 Bruford 等 (1992) 的 文章 。 多 位 点 指纹 法 的 一 个 缺点 是 指纹 谱 复 杂 ,难以 比较 ,特别 是 在 不 同 的 凝 胶 上 得 到 的 谱 。 组 成 的 DNA 片段 也 不 能 归 因 于 特异 性 位 点 。 单 位 点 指纹 法 通过 允许 基因 型 归 因 于 常常 是 高 度 变 异 的 位 点 避 免 了 这 些 问 题 , 但 它 也 有 缺点 ,就 是 在 所 研究 的 每 一 个 物种 中 或 至 少 在 一 个 近 缘 种 中 都 得 找 出 一 种 标记 系统 (Hanotte 等 ,199la,b,1992)。 然 而 , 现 在 可 以 使 用 一 种 相对 有 效 的 分 离 这 种 位 点 的 方法 (Armour 等 1990,Hanotte 等 199la,b;Bruford 等 (1992) 的 操作 程序 ) 。 另外 一 种 级 别 的 VNTR 位 点 包括 了 简单 的 序列 ,或 微 卫 星 多 态 性 (Tautz1989) 。 微 卫星 (micro- satellite) 包 含 不 同 数量 简单 而 短 的 串联 重复 ,如 (GT)n 或 (CAC)n。 小 卫星 和 微 卫 星 的 区 别 是 随意 的 , 但 实际 的 区 别 是 微 卫 星 总 的 长 度 小 到 允许 应 用 PCR 技术 分 析 。 所 以 微 卫 星 的 变异 分 析 比 小 卫星 容易 得 多 ( 见 Rassmann 等 1991,Schiotterer 等 (1991) 的 方法 )。 特 异 位 点 微 卫星 系统 常 在 宽 范 围 的 近 缘 种 中 适用 (Schlotterer 等 ,1991), 在 一 定 程 度 上 比 小 卫星 探 针 更 有 用 。 由 于 这 里 数据 太 少 而 不 能 在 两 个 级 别 的 两 个 位 点 进行 典型 变异 的 细致 比较 。 高 水 平 的 多 态 性 很 可 能 在 小 卫星 位 点 上 得 到 , 但 微 卫 星 的 变异 似乎 适合 作 大 量 的 应 用 。 2.5 DNA 放大 * 一 个 相对 较 新 的 方法 应 用 于 大 多 数 DNA 样品 中 一 一 包括 相当 粗 提 的 总 DNA 一 一 这 个 方法 是 聚合 酶 链 式 反 应 (PCR) (Mullis 和 Faloona, Saiki 等 1988)。 这 种 技术 可 以 产生 足 量 的 确定 长 度 的 DNA ,适合 各 种 方法 的 进一步 分 析 , 如 RFLP 测序 和 与 特异 探 针 的 杂交 。 在 聚合 酶 链 式 反 应 中 ,应 用 二 耐 高 温 的 DNA 聚合 酶 循环 复制 相反 的 两 条 DNA 链 上 两 个 引物 部 位 之 间 的 序列 , 这 个 反应 需要 ATARHEBARIIDHEES DNA 上 的 这 些 部 位 互补 ,每 循环 一 次 ,产量 成 倍增 加 。 这 个 过 程 的 灵敏 度 使 得 它 可 以 对 极 少量 DNA 进行 分 析 , 例 如 这 些 DNA 可 来 自 单个 精子 细胞 (Amheim 等 1990) , 单 根 头 发 (Higuchi 等 ,1988) ,单个 羽毛 (Taberlet 和 Bouvet, 1991), Hh {0 HY & AK CHagelber, 1989) 或 博物 馆 中 的 标本 (Thomas 等 ,1989,1990) 。 由 于 所 研究 的 序列 只 需要 很 少 的 完整 拷贝 , 甚 至 固定 的 或 包 埋 了 的 组 织 都 适合 来 提取 DNA 作 PCR(Greer 等 1991) ,所 以 ,很 简单 的 野外 样品 保存 和 实验 室 提 取 的 操作 程序 都 会 令 人 满意 。 因为 扩 增 的 PCR 产品 有 足够 的 量 可 供 直接 在 电泳 凝 胶片 上 检测 ,所 以 PCR 为 杂交 方法 提供 了 另 一 个 很 好 的 选择 。 例 如 可 以 检测 引物 部 位 间 的 序列 长 度 变异 或 检测 在 一 个 引物 部 位 本 身 的 变异 。 PCR 产物 可 以 用 作 点 印迹 DNA 一 DNA 杂交 时 的 靶 材 料 , 也 可 用 作 限 制 性 分 析 。 它 们 和 其 它 技术 (下 文 ) 可 以 不 需要 广泛 地 测序 就 可 以 相对 方便 地 收集 有 用 的 基于 序列 的 标记 数据 。 2.6 DNA 测序 直到 最 近 ,得 到 一 个 序列 之 前 , 必须 先 从 所 研究 的 生物 体 中 克隆 一 个 序列 。 比 如 对 整个 基因 的 DNA 多 态 性 的 研究 , 需 要 分 别 地 从 每 个 个 体 克 隆基 因 〈 如 Kreitman 1983)。 一 且 一 特定 位 点 至 少 在 一 个 亲缘 生物 体 中 得 到 克隆 并 测 得 序列 (由 此 可 设计 出 寡 核 苷 酸 引物 ),PCR 的 优点 是 通常 可 以 绕 过 克隆 这 一 步 。 对 一 些 位 点 来 说 ,可 以 鉴定 两 侧 的 序列 段 (stretches of flanking sequence) ,它们 在 一 广 阔 范 围 的 类 群 中 是 高 度 保守 的 ,人 允许 设计 “通用 ”的 引物 (Kocher 等 1989,Hillis 和 Dixon 1991 ,Tabeer- 。183。 let 等 1991) 。 现 在 已 经 有 了 直接 对 PCR 产物 测序 的 很 好 的 操作 程序 (如 Winship 1989 ,Innis 1990, Lee 1991) 。 一 些 工作 者 喜欢 在 测序 前 亚 克 隆 PCR 产物 ,但 是 这 就 意味 着 ,特别 是 当 多 序列 需要 排除 人 工 核 苷 酸 替 换 的 可 能 时 ,可 能 造成 相当 大 的 额外 工作 量 。 2.7 变性 梯度 凝 胶 电 泳 既 便 通 过 PCR 和 直接 测序 可 以 相对 比较 容易 地 获得 序列 数据 , 但 是 要 积累 起 适合 作 核 基因 等 位 基因 或 线粒体 单 膜 类 型 (haplotypes) 比 较 的 种 群 频率 数据 ,是 一 个 令 人 胆 尾 的 任务 。 虽 然 除 医学 遗 传 学 外 ,变性 梯度 凝 胶 电 泳 (DGGE) 尚未 被 广泛 应 用 ,DGGE 及 其 相近 的 方法 (如 温度 梯度 凝 胶 电 泳 (TGGE) (Riesner 等 1989) 和 PCR 一 单 链 构象 多 态 性 (SSCP) 分 析 (Hayashi 1991)) 能 够 提供 用 来 测序 数 十 个 样品 的 较 低 劳动 强度 的 方法 。Lessa(1992) 和 Myers 等 (1989) 提 供 了 DGGE 方法 详细 的 指导 , 但 是 ,简单 地 说 ,这 种 方法 需要 为 所 研究 的 具有 长 G-C 尾 的 区 域 准 备 一 个 引物 .这 种 具有 抗 变性 的 G- C 键 的 扩 增 产物 可 在 含有 脲 的 梯度 凝 胶 上 电泳 .不 同 序列 的 产物 在 不 同 的 腺 浓度 上 部 分 地 变性 ,对 长 度 小 于 500bp 的 产物 ,小 到 只 有 1 个 碱 基 对 替换 的 变化 能 够 通过 移动 距 离 的 不 同 而 分 辨 出 来 .频率 数 据 ( 包 括 杂 合子 的 辨别 ) 可 直接 由 凝 胶 上 得 到 .如果 有 要 求 的 话 ,代表 已 检测 了 迁移 等 级 的 谱 带 上 的 样 品 可 以 被 再 放大 并 测序 。 在 这 种 应 用 中 , DGGE 对 研究 DNA 片段 在 种 群 内 或 其 它 研究 单位 内 的 中 等 变异 是 最 有 用 的 (就 是 说 ,不 是 所 有 的 个 体 都 是 独特 的 ) 。 然 而 ,这 对 从 种 群 遗 传 或 系统 发 育 角 度 作 初 步 探索 可 能 有 同等 的 价值 , 即 在 被 选择 的 各 种 个 体 的 DNA 片段 测序 前 ,在 种 群 或 分 类 群 内 或 之 间 去 评估 最 初 放 大 的 DNA 片段 是 否 有 一 定 程 度 的 变异 。 2.8 随机 放大 多 态 性 DNA 人 们 现在 广泛 地 探索 随机 放大 多 态 性 DNA(CRAPD), 部 分 是 由 于 它 显 著 的 简单 性 。 它 依赖 由 被 研究 的 生物 体 中 提取 的 DNA( 有 时 来 自分 离 的 细胞 器 中 ), 应 用 几 组 短 的 单 链 随 机 序列 引物 来 测定 变异 (Williams 等 1990; Hardrys 等 1992) 。 经 过 琼脂 糖 电 泳 和 省 化 乙 锭 染色 后 ,比较 放大 产物 时 ,一 些 引物 将 产生 少许 分 离 的 带 , 它 们 的 一 部 分 在 种 群 内 或 种 群 间 是 多 态 的 。 当 检测 时 , 这 些 标记 通常 呈 现 显 著 的 孟 德 尔 遗 传 特性 (Williams 等 1990,Arnold 等 1991) 。 在 动 植物 中 ,这 些 标记 可 用 来 制作 基 因 连 锁 图 (Williams 等 1990) 。 假设 不 了 解 被 放大 的 区 域 ,并 且 有 关 的 书面 出 版 物 很 少 , 对 于 每 一 种 新 的 生物 必须 检验 从 不 同 个 体 中 多 次 分 别提 取 和 放大 ( 若 有 可 能 也 包括 遗传 力 ) 的 产物 模式 的 重复 能 力 。 应 用 得 好 ,这 种 方法 仅 需 要 DNA 分 离 、 放 大 和 琼脂 糖 凝 胶 电泳 过 程 , 就 可 提供 丰富 的 多 态 性 标记 数据 。 避 免 了 限制 性 酶 和 放射 性 标记 的 高 消耗 和 复杂 性 。 在 这 一 部 分 ,我 们 讨论 生态 学 家 感 兴趣 的 领域 .所 研究 不 同 范畴 的 问题 及 用 到 的 方法 的 实例 列 在 附 表 中 。 我 们 试 着 尽 可 能 地 选择 与 生态 学 家 有 关系 的 实例 并 尽 可 能 包括 有 代表 性 的 分 类 群 。 在 很 多 情况 下 ,虽然 一 个 新 而 有 前 途 的 技术 建立 了 ,但 仍 没 有 正式 发 表 的 应 用 实例 ,反映 了 这 一 领域 中 技术 发 展 的 步伐 还 不 快 。 阅 读 附 表 时 ,应 注意 这 种 可 能 性 。 就 象 在 附 表 中 所 列 的 一 样 ,读者 必须 明白 所 选 的 一 些 实例 并 不 代表 最 有 效 的 方法 。 3.1 性 别 鉴 定 Fisher(1930) 预 言 , 在 有 性 的 物种 中 ,一 种 亲本 应 该 在 它 的 每 一 性 别 的 后 代 中 有 均等 的 总 投入 。 Trivers 和 Willard (1973) 争辩 说 , 当 亲 本 的 投入 影响 到 一 个 后 代 以 后 的 生殖 成 功 (reproductive success) 并 且 在 生殖 成 功 中 某 一 性 别 的 变异 较 大 时 ,那么 一 种 亲本 应 该 在 这 种 性 别 有 较 大 的 投入 。 对 于 许多 通常 的 生物 体 研 究 对 象 来 说 ,由 于 难于 在 幼年 期 作 性 别 鉴 定 (sexing juveniles), Aix Mae 的 试验 、 相 关 的 假设 以 及 一 般 性 的 生活 史 的 研究 受到 了 障碍 。 有 一 个 在 形态 上 可 区 别 性 别 的 例子 , 东 。184。 部 蓝 色 鸣 鸟 (Szalia szalzs) 的 雄性 亲本 在 它们 的 肉 性 后 代 中 有 较 多 的 投入 (Gowaty 和 Drage 1991)。 有 人 认为 ,这 个 物种 从 出 生 到 繁殖 扩散 之 所 以 很 低 是 因为 嗜 杀 父 (Phiopatric) 的 雄性 乌 可 以 为 了 雌性 而 要 与 它 的 亲生 父亲 竞争 ,所 以 肉 性 后 代 将 占 雄 性 适合 度 较 大 的 比例 。 性 别 是 由 遗传 决定 的 关键 是 至 少 在 一 种 性 别 的 本 身 具 某 些 特 异性 DNA。 原 则 上 这 种 情况 只 需 一 个 位 点 的 等 位 基因 的 差异 ,而 实际 上 差异 一 般 广 泛 得 多 ,常常 包括 了 具 性 别 特异 的 染色 体 。 在 这 些 情 况 下 细胞 学 的 性 别 鉴定 是 可 行 的 ,但 通常 要 求 作 大 样品 是 不 切实 际 的 ( 见 Parker 等 1991)。 用 分 子 标 记 去 鉴别 特殊 的 性 染色 体 的 序列 特征 ,已 有 了 一 些 实例 。 例如 ,Griffiths 和 Holland(1990) 使 用 一 种 减 法 克隆 (subtraction cloning) 技术 分 离 了 食 鲁 鱼 鸥 (Larzs argentatus) 1) W 染色 体 ( 肉 性 特异 的 ) 的 特 异性 探 针 。 遗 憾 的 是 ,就 象 其 它 类 似 的 探 针 一 样 ,这 个 探 针 只 对 很 少 一 些 近 缘 种 有 应 用 价值 。 也 偶尔 地 发 现 了 对 其 它 一些 物 种 的 伴 性 探 针 (如 Quinn 等 1990,Rabenold 等 ,1991) 。 长 期 以 来 ,鉴定 和 分 析 性 别 决定 基因 本 身 似乎 避免 了 这 个 问题 .最 近 分 离 了 在 了 一 染色 体 上 的 性 别 决 定 区 (CSRY) 的 基因 ,并 认为 它 对 人 类 来 说 是 性 别 决定 位 点 (Sinclair 等 1990, Gubbay 1990). 它 能 够 作为 一 个 探 针 用 印迹 分 析 来 确定 一 系列 哺乳 动物 的 性 别 (Sinclair 等 1990). BRIER E FF HE BH 物 分 类 群 中 , 它 好 象 可 能 具有 一 个 相同 功能 的 同 源 物 , 但 首次 在 鸟 类 寻找 这 样 一 个 同 源 基 因 并 不 成 功 (CGriffiths 1991) 。 一 有 旦 得 到 了 合适 的 序列 数据 , 至 少 就 可 以 设计 和 合成 在 大 范围 的 哺乳 动物 物种 中 有 用 的 寡 核 背 酸 探 针 ,或 至 少 可 以 设计 窒 核 苷 酸 引物 应 用 于 PCR 。 3.2 交配 制度 进化 生态 学 家 对 交配 制度 特别 感 兴趣 ,他 们 希望 能 够 度量 个 体 在 自然 条 件 下 的 生殖 成 功 情况 。 或 者 ,也 需要 测量 互助 个 体 间 的 亲缘 关系 。 在 实践 中 , 父 本 和 母 本 的 检验 是 测量 亲缘 关系 的 一 种 特殊 情 况 ( 如 Birkhead 等 1990) 。 为 这 个 目的 ,应 用 分 子 方法 一 一 特别 是 多 位 点 DNA 指纹 和 随机 RFLP 分 析 一 一 进行 研究 ,可见 Burke 1989 WR. RI ,单位 点 指纹 分 析 发 展 迅 速 , 现在 已 成 为 可 选用 的 方 法 (Burke 等 1991b) 。 多 位 点 分 析 已 应 用 于 一 些 完 全 在 野外 进行 的 繁殖 系统 研究 上 ,现在 几乎 已 经 成 为 常规 方法 。 迄 今 多 数 的 研究 集中 在 鸟 类 上 , 反映 了 鸟 类 作为 行为 生态 学 研究 对 象 的 普遍 性 , 并且 涉及 到 基本 上 是 单 配 制度 中 确定 是 父 性 或 是 母性 ( 见 Burke 等 1991b ,Birkhead 和 Moller 1992) 或 者 关注 互助 繁殖 群 成 员 之 间 的 血统 分 布 以 及 亲缘 关系 的 程度 ( Burke 等 1989,Rabenold 等 1990 ,Jones 等 1991, Pacher 等 1991,Davies 等 1992) 。 第 一 类 研究 范畴 是 关于 交 苦 交配 对 策 (alternative mating strategies) 的 发 生 , 例 如 ,用 排除 分 析 (exclusion analyses) 发 现 子 代 基 因 型 与 它们 的 推断 亲本 不 一 致 ,以 此 来 检测 额外 配对 (extra- pair) 交 配 或 种 内 繁殖 寄生 现象 (brood parasitism ) 。 例 如 , FE A fal FEI MT HEAL NG & (Taeniopygia guttata) 的 交 配 行为 的 研究 导致 期 望 额外 配对 的 父 本 可 以 在 自然 种 群 中 出 现 . 在 对 一 野外 种 群 指纹 的 推断 研究 中 , 由 行为 指定 (behaviourally-assigned) 的 双亲 本 是 完全 的 ,并 且 经 过 排除 分 析 , 确 认 额 外 配对 的 父 本 以 较 低 的 频率 发 生 (82 个 后 代 中 有 2 个 ) , 而 种 内 繁殖 寄生 现象 则 意外 地 较 显 著 〈 80 个 后 代 中 有 9 4+) (Birkhead 等 1990) 。 例如 , E—-P ADEA RKRAW HRP. KA MAB (Prunella modularis) — RH ZB tt Si 繁殖 ,2 个 或 更 多 的 雄性 共同 拥有 一 个 峻 性 。 这 些 雄 性 一 般 互 相 没 有 亲缘 关系 ,但 有 一 种 显 性 的 关系 , 可 能 其 中 一 个 或 两 个 雄性 一 起 去 帮助 雌性 喂养 雏 鸟 .虽然 这 些 雄 性 对 它们 的 后 代 没 有 明显 的 偏爱 ,但 应 用 多 位 点 指纹 的 分 析 表 明 如 果 它 们 存在 某 些 家 系 关系 ,它们 就 会 倾向 于 喂养 同 窝 的 雏 鸟 (Burke 等 1987) 。 如 果 观 察 到 一 只 雄 鸟 在 雌 鸟 已 受精 还 未 产 卵 前 一 段 时 期 内 排外 性 地 去 接近 肉 性 ,那么 它 就 更 倾向 于 帮助 喂养 , 而且 由 雄性 喂养 的 程度 与 排外 性 地 接近 肉 乌 的 程度 显著 相关 。 指 纹 分 析 的 数据 表 明 ,用 观察 接近 的 途径 是 一 个 好 的 家 系 指 示 , 所 以 这 就 意味 着 雄性 岩 岗 就 是 用 它们 接近 肉 鸟 的 程度 来 决定 是 否 喂 养 雏 鸟 .随后 在 一 系列 的 去 除 (removal) 实 验 中 , 通过 人 工 操作 使 雄性 个 体 交 配 成 功 ( 通 过 DNA 指纹 来 确认 ), 以 上 观点 被 实验 所 证 实 (Davis 等 1992)。 就 象 在 岩 岗 的 研究 中 的 情况 一 样 ,在 只 有 少数 的 雄性 候选 者 的 情况 下 , 应 用 多 位 点 指纹 分 析 能 。185。 有 效 地 指示 家 系 , 但 是 这 经 常 需 要 对 许多 潜在 的 双亲 作 检 验 。 在 这 种 情况 下 ,应 用 一 个 单位 点 指纹 分 析 的 系统 是 更 有 效 的 , 它 能 在 一 系列 高 度 多 态 位 点 上 指示 个 体 的 基因 型 Gibbs 等 (1990) 将 多 位 点 和 单位 点 指纹 分 析 结 合 起 来 ,鉴别 了 28%% 第 3 代 红 翅 乌 和 鹊 幼 鸟 的 几乎 所 有 父 本 ,这 些 幼 鸟 不 是 由 拥有 它们 出 生地 的 雄性 所 生 的 。 这 就 说 明了 在 一 个 雄性 的 领地 上 产生 的 后 代数 和 它 的 实际 生殖 成 功 之 间 没有 显著 的 相关 ,而 且 在 它们 自己 领地 上 生育 较 大 比例 后 代 的 这 些 雄 性 也 进行 了 较 多 的 额外 交配 的 受精 。Gibbs 及 其 合作 者 所 用 的 单位 点 探 针 是 一 个 鼠 的 组 织 相 容 性 (histocompatibility) 位 点 cDNA , 它 的 用 途 是 通过 与 一 包含 限制 性 片段 的 小 卫星 的 偶然 杂交 而 发 现 的 ;但 是 没有 发 现 它 普遍 能 用 于 其 它 的 鸟 类 (Gibbs, 私 人 通信 )。 分 别 获 得 高 多 态 性 的 小 卫星 或 微 卫 星 位 点 的 特异 性 探 针 或 引物 的 一 般 性 的 方法 都 是 可 行 的 ( 见 前 文 ) ,而且 这 样 一 些 位 点 结合 使 得 多 位 点 指纹 法 变 得 过 时 (Wong 等 1987, Hanotte 等 1991a) 。 其 它 的 分 子 方法 偶而 也 用 到 .。 Quinn 及 其 合作 者 们 发 现 由 雪 雁 中 随机 克隆 的 一 系 列 RFLP 有 可 观 的 变异 ,并 且 可 用 来 进行 这 个 种 的 家 系 分 析 (Quinn 和 White,1987,Quinn 等 1987) 。 Williams 和 Strobeck(1986) 确 认 了 果 蝇 了 染色 体 的 核糖 体 基 因 的 特异 性 RFLPs, 由 此 我 们 能 够 揭示 在 野外 种 群 中 雌性 果 蝇 发 生 过 多 次 交配 .本 领域 更 详细 的 论述 已 超出 本 文 的 范围 ,读者 可 参考 一 些 已 发 表 的 综述 (Burke 1989,Burke 等 1991b 和 Burke 等 1991a 中 的 其 它 论文 )。 3.3 种 群 结构 种 群 结构 是 广义 的 话题 ,包括 从 社 群 (social groups) 内 到 种 群 间 在 各 种 水 平 上 研究 亲缘 关系 与 遗 传 分 化 。 在 前 面 一 节 内 ,我 们 单独 讨论 了 近 缘 家 族 关 系 的 分 析 。 除 等 位 酶 不 属于 本 评述 的 范围 外 ,线粒体 DNACmtDNA) 是 用 于 许多 种 群 分 化 研究 的 大 分 子 (Avise 等 综述 1987)。 例 如 ,84 只 座 头 鲸 (humpback whale) 的 mtDNA( 由 皮肤 活体 解放 得到) 的 RFLP 分 析 证 明 ,在 亚 种 群 之 间 , 以 及 来 自 北 大 西洋 和 北 太 平 洋 的 种 群 之 间 有 明显 的 单 模 标本 (haplo- types) 的 分 离 (Baker 等 1990) 。 单 模 标本 的 地 理 分 布 与 先前 报道 的 夏季 取 食 地 与 冬季 繁殖 地 之 间 的 迁 移 模 式 有 惊人 的 一 致 。 研 究 者 认为 ,这 种 遗传 分 离 反 映 了 迁移 目的 的 母系 习性 (materal traditions in migratory destination)”, 揭示 了 要 考虑 到 行为 模式 在 种 群 结 构 分 析 中 的 重要 性 。 在 植物 中 ,质粒 DNA 也 提供 了 很 多 类 似 mtDNA 同样 的 进展 ,并 已 在 少数 的 种 群 结构 研究 中 得 到 应 用 (如 Goff 和 Coleman 1988). 从 总 基因 组 文库 中 分 离 的 随机 克隆 已 在 种 群 水 平 上 用 于 RFLP 的 研究 。Mecdonald 和 Martinez (1990) 研究 了 从 一 块 麦 地 得 到 的 一 种 真菌 病原 体 Mycosphaerella graminicola 的 种 群 结 构 。 他 们 发 现 了 高 程度 的 遗传 变异 ,包括 一 片 叶 子 上 不 同 的 侵蚀 斑 (lesions) 之 间 。 他 们 的 研究 强调 了 在 确认 从 不 同 地 理 位 置 取得 的 少量 样品 是 否 代表 种 群 水 平 的 变异 之 前 ,评估 空间 尺度 变异 的 重要 性 。 也 偶尔 使 用 另外 一 些 DNA 标记 类 型 ,如 核糖 体 DNA( 如 Learn 和 Schaal 1987)。 尽 管 一 般 记 为 小 卫星 进化 太 快 而 不 能 用 于 种 群 水 平 的 分 析 ,Gilbert 等 ( 1990) 发 现在 讨论 南 加 利 福 尼 亚 的 海峡 岛 (channel islands) | &/}\ MI (dwarf foxes) 小 的 分 离 种 群 的 系统 发 育 , 以 及 分 离 种 群 间 遗 传 变异 的 相关 水 平时 , 指 纹 模 式 能 提供 有 益 的 信息 。 在 大 部 分 分 离 的 岛 上 ,他 们 发 现在 取样 的 狐 之 间 没 有 指纹 变 异 , 一 个 指纹 模式 甚至 在 自 交 的 实验 室 小 鼠 群 中 也 未 发 现 过 。 多 位 点 指纹 在 鉴别 自然 种 群 内 无 性 系 成 员 方 面 也 可 有 重要 价值 CNybom 和 Schaal 1990,Turner 等 1990,Carvalho 等 1991 ,Brookfield 1992) 。 PCR 使 得 在 种 群 研究 中 收集 实际 的 DNA 序列 是 可 行 的 ,而 且 它 也 允许 用 收藏 在 博物 馆 中 的 标 本 作 实 验 。Thomas 等 (1990) 利 用 这 种 有 利 条 件 ,发 现 78 年 间 3 40K Ckangaroo rat) 种 群 的 种 群 结 构 没有 明显 的 变化 。 3.4 迁移 和 基因 流 当然 ,迁移 是 种 群 结构 的 一 个 重要 成 分 ,所 以 ,同样 的 方法 学 上 的 各 种 途径 是 有 用 的 。 在 这 个 前 提 下 ,我们 列举 了 一 些 实例 来 着 重 强调 应 用 分 子 的 方法 有 时 可 以 推断 迁移 模式 。 例如 ,在 现代 人 的 地 理 起 源 这 个 有 争议 的 问题 上 , 通过 从 多 类 人 种 和 黑猩猩 取样 的 mtDNA 替 位 环 区 (displacement loop region) 的 序列 比较 , 确 认 了 人 类 mtDNA 进化 树 的 非洲 起 源 ( Vigilant 等 。 186。 1991; 例外 见 Templeton 1992) 。 Hagelberg 等 (1989) 在 研究 人 类 的 人 口 迁 移 时 ,扩展 了 PCR MAR. 证 明了 扩 增 5450 年 以 上 的 人 骨 的 mtDNA 的 可 行 性 。 在 一 系列 研究 上 ,无 疑 地 ,对 在 形态 学 上 无 症状 的 骨头 片段 作 了 鉴定 。 将 RFLP 分 析 与 等 位 酶 相 结 合 ,mtDNA 也 被 用 在 遗传 学 上 研究 和 确认 蝶 晨 两 个 种 之 间 的 历史 上 描绘 的 杂种 地 带 (hybrid zone) 的 变迁 〈 Arntzen 和 Wallis 1991). 40 SA ESC BER CT riturus marmoratus ) FH # HY A ef A BY RMR CT. crzstatxs) 种 群 的 特征 是 存在 一 种 低 的 但 可 辨认 的 渐 渗 的 mar- moratus 等 位 基因 频率 。 Culex pipiens 蚊 通 过 非特 异性 过 量 的 产生 多 种 酯 酶 来 抗 有 机 磷酸 酯 杀 虫 剂 。 这 些 酯 酶 中 有 一 个 在 B 位 点 上 用 电泳 可 察觉 到 的 扩 增 了 的 BB, 等 位 基因 。 来 自 非 洲 、 亚 洲 和 北美 洲 样品 的 B, 酯 酶 结构 基 因 序 列 的 限制 位 点 分 析 显 示 其 高 度 的 同 源 性 。 这 就 指出 了 OB, 等 位 基因 是 由 单 突 变 发 展 而 来 ,并 通过 对 杀 虫 剂 诱导 选择 的 有 利 性 ,在 世界 范围 种 群 之 间 快 速 扩散 。 3.5 渐 渗 现 象 与 杂交 地 带 适用 于 种 群 结构 分 析 的 技术 也 适 于 特殊 情况 的 杂交 地 带 。 分 析 沿 着 杂交 地 带 的 基因 渐 渗 ,mtD- NA 特别 有 价值 CHarrison 1989 SiR). BRA DNA 也 应 用 于 某 种 程度 的 研究 中 (如 Baker 等 1989) 。 Arnold 等 (1991) 用 一 种 选择 叶绿体 基因 的 PCR 和 RAPD 来 研究 路 易 斯 安 那 营 尾 杂 交 种 的 形 成 。 物 种 专 有 的 RAPD 标记 的 地 理 分 布 支持 这 样 一 个 假设 :7Tzrzs fulva Al I. hexagona 通过 基因 流 导 致 了 定位 的 和 扩散 的 渐 渗 .一 个 扩 增 的 叶绿体 基因 片段 (携带 在 峻 性 细胞 质 中 ) 的 RFLP 分 析 , 说 明 是 由 于 传粉 而 不 是 种 子 散布 导致 了 基因 流 。 这 个 领域 提供 了 某 些 成 功 应 用 DGGE 的 首 例 。Lessa(1992) 应 用 DGGE 研究 了 一 种 地 鼠 的 杂交 地 带 。 为 了 了 解 在 形态 上 还 识别 不 了 有 杂种 存在 的 地 区 ,在 有 杂交 潜 势 的 白 标 物种 间 基 因 交 换 的 程度 , Whittemore 和 Schaal(1991) 观 察 了 用 来 自 狼 牵 牛 叶绿体 和 大 豆 细胞 核 核糖 体重 复 (ribosomal repeat ) 的 克隆 探 针 消化 的 基因 组 DNA 限制 片段 印迹 。 他 们 发 现 , 虽 然 叶 绿 体 基因 型 有 某 些 大 尺度 的 地 理 变 异 , 在 同一 地 点 一 起 生长 的 物种 (包括 常 绿 的 和 落叶 的 ) 却 经 常 地 具有 相同 的 叶绿体 基因 型 。 一 个 种 在 不 同 的 地 点 具有 不 同 的 叶绿体 基因 型 ,而 细胞 核 核 糖 体 的 标记 则 显示 了 一 种 分 布 格局 与 所 期 望 的 物种 界线 (boundaries) 是 一 致 的 。 他 们 在 叶绿体 核 DNA 中 观察 到 的 地 理 变 异 和 明显 的 基因 流 的 极 明 显 的 悬殊 差别 的 格局 , 强调 了 在 依据 由 细胞 器 得 来 的 数据 解释 种 群 或 类 群 界 线 时 要 特别 谨慎 ( Pami- lo #l Nei, 1988). 3.6 物种 的 鉴定 总 DNA 的 提取 物 间 杂交 的 程度 已 被 广泛 地 作为 一 种 方法 用 来 估 测 物种 间 的 亲缘 关系 。 特 别 是 在 原核 生物 之 间 , 当 一 些 生 物 具 90% 或 以 上 的 杂交 值 时 ,这 种 方法 就 用 来 把 它们 粗 粗 定 为 物种 (Woese 1987)。 然 而 ,这 种 方法 的 分 辨 率 和 分 类 学 范围 经 常 是 低 的 ,需要 作 比 较 就 要 求 有 大 量 的 DNA, 物种 特异 性 探 针 在 研究 宿主 一 媒介 (vector) 一 寄生 物 系统 中 特别 有 用 。Kukla 等 (1987) 使 用 包含 有 重复 序列 的 放射 活性 标记 的 限制 片段 克隆 , 鉴定 了 采 采 蝇 组 织 中 锥 虫 的 种 和 亚 种 。 他 们 发 展 了 一 种 应 用 于 野外 的 方法 ,将 分 离 的 蝇 腹 部 整个 地 放 在 尼龙 膜 上 与 标记 的 探 针 杂交 ,就 能 确认 和 鉴定 肠 锥 虫 . 通 过 筛选 _ 个 基因 文库 ,Harnett 等 (1989) 发 现 并 测定 了 一 朝 核 背 酸 探 针 的 序列 , 它 能 区 别 引起 人 类 河 盲 症 (river blindness) 的 一 种 线虫 Onchocerca volvulus 和 形态 上 相似 但 不 是 病原 体 的 另外 一 个 Onchocerca Ff , E, {1148 # ZE [Fl FE AY HA Cblackfly ) #E dP _E 。 Persing 等 (1990) 应 用 包 柔 氏 螺 旋 体 (Boela) 特 异性 引物 和 PCR & DEF TED Te BE tr ASE HP AY 症状 DNA 片段 ,表明 Lyme 疾病 的 临床 发 现 至 少 30 年 前 就 已 经 在 美国 存在 了 。.Lyme 病原 体 Borrelia burgdorferi 另外 一 随机 克隆 的 序列 分 析 , 能 够 帮助 设计 PCR 引物 ,以 此 把 北美 类 型 与 欧洲 和 亚洲 隔 。187。 离 类 型 分 辩 开 (Rosa 等 1991 ) 。 Goff 等 (1988) 应 用 探 针 研 究 Anaplasma marginde 表面 蛋白 基因 ,检测 了 峰 与 牛 被 传染 的 频率 。 由 此 可 监测 宿主 携带 状态 、 疾 病 传 染 方式 和 地 方 性 兽 病 区 蝗 传 染 的 流行 。Rowan 和 Powers(1991) 测 定 了 由 22 个 海洋 动物 宿主 类 群 上 取得 的 131 个 个 体 隔 离 群 的 单 细 胞 藻类 共生 体 的 rDNA A) WBE 段 序 列 。 系 统 发 育 上 远 缘 的 宿主 上 发 现 了 近 缘 的 藻类 。 这 种 折 囊 的 和 如 此 广 的 分 布 区 对 营 类 共生 体 来 说 ,是 一 种 结合 的 群 聚 模式 , 这 种 模式 与 某 些 动物 寄生 物 的 分 化 历史 有 时 同 宿主 一 致 的 情况 是 十 分 不 一 样 的 (Page 1990). DNA 分 析 可 以 进行 血液 寄生 节肢 动物 的 寄主 的 分 类 。 为 更 好 地 说 明 这 种 方法 的 潜力 ,Coulson 等 《1990) 应 用 单位 点 小 卫星 指纹 分 析 蚊 子 的 肠子 内 含 物 ,得 到 了 被 这 种 蚊 叮 过 的 人 的 基因 型 。 7 和 区 地 生态 学 家 之 所 以 对 系统 学 感 兴趣 ,是 考虑 到 去 识别 特殊 的 物种 以 及 对 物种 间 进 化 关系 的 理解 。 分 子 技术 可 广泛 地 应 用 于 系统 学 的 研究 ,这 个 领域 已 广泛 地 评述 过 了 (Hillis 和 Moritz 1990,Hewitt 等 1991; 表 中 的 实例 )。 实 际 上 , 任何 客观 的 .基于 遗传 的 特性 都 具有 可 为 分 类 学 提供 资料 的 意义 ,不 同 方法 的 价值 将 按 所 研究 的 群体 内 遗传 多 样 性 的 大 小 而 不 同 。 尽 管 由 DNA 一 DNA 杂交 提供 的 表 型 性 的 方法 成 功 地 应 用 着 (特别 是 在 鸟 类 中 ;Sibley 和 Ahlquist 1990);DNA 序列 的 系统 发 育 分 析 被 看 好 , 而 且 现 在 由 于 PCR 的 发 明 而 使 之 变 得 更 加 可 行 。 在 这 之 前 ,只 有 核糖 体 RNA 基因 能 测序 到 值得 注 意 的 程度 (Woese 1987 ,Hillis 和 Dixon 1991). 应 用 PCR 的 首次 研究 为 测定 mtDNA 序列 而 研究 了 通用 引物 的 特性 (Kocher 等 1989)。 例 如 , Richman 和 Price(1992) 应 用 这 样 的 引物 ,从 8 个 Phylloscopus 鸣 禽 同 地 种 ,得 到 了 具有 910 个 碱 基于 的 线粒体 细胞 色素 b 序列 , 建立 了 这 些 群 体 的 系统 发 育 。 支 持 这 些 物种 的 形态 学 、 取 食 行为 和 生态 学 适应 解释 的 一 个 比较 分 析 中 ,系统 发 育 被 用 来 核实 共同 祖先 的 影响 。 物种 的 分 类 与 保护 特别 有 关系 ,这 一 点 已 被 一 系列 mtDNA 变异 的 研究 结果 所 强调 过 ,在 设想 是 分 离 的 小 地 鼠 (Learn 等 1982) 和 海滨 麻雀 (Avise 和 Nelson 1989) 的 物种 或 亚 种 间 , 在 可 能 是 杂种 起 源 的 红 狼 (Wayne 和 Jenks 1991) 以 及 被 外 源 基 因 渐 渗 的 濒危 的 美洲 独 和 灰 狼 种 群 ( 见 O'Brien 和 Mayr 1991) 中 ,都 见 不 到 有 mtDNA 明显 的 分 化 。 通 过 使 用 PCR 对 红 狼 标本 的 分 析 ,排除 了 杂交 是 最 近 发 生 的 可 能 性 .分 子 系统 学 也 用 来 揭示 这 样 的 事例 一 一 不 同 的 分 类 群 可 被 归并 为 一 个 种 ,特别 是 在 形态 上 保守 的 谱系 中 (Daugherty 等 1990) 。 3.8 群落 多 样 性 多 个 rDNA 小 亚 基 序 列 的 同时 扩 增 提供 了 一 个 检测 微生物 自然 多 样 性 的 有 用 方法 。Giovannoni 等 (1990) 把 从 浮游 细菌 的 自然 种 群 得 到 的 16s rRNA 基因 扩 增 部 分 的 克隆 测 了 序 。 经 过 培养 ,增加 了 可 检测 的 多 样 性 ,一 些 以 前 未 知 的 分 类 群 既 在 系统 发 育 上 是 分 离 的 ,又 是 微生物 群落 中 在 数量 上 重 要 的 成 员 。 Ward 等 (1990) 简 单 地 检测 了 一 陆地 温泉 中 蓝藻 细菌 从 中 微生物 物种 的 组 成 。 用 一 保守 的 寡 核 苷 酸 引 物 ,他 们 通过 从 环境 样品 中 取得 的 16s rRNA 合成 了 DNA。 经 过 克隆 和 测序 ,并 与 来 自 相 似 生 境 培养 的 有 机 体 的 16s rRNA 序列 相 比较 后 发 现 ,所 检测 的 8 个 序列 类 型 没有 一 个 同 这 一 地 点 以 前 CAN 14 种 生物 相 一 致 。 这 清楚 地 表明 ,分 子 工 具 可 以 揭示 出 微生物 群落 中 从 前 未 检测 出 的 多 样 性 , 而 且 新 生物 体 的 检测 并 不 限于 稀有 类 和 群 。 DNA 水 平 变 异 的 程度 和 类 型 ,特别 是 在 物种 内 ,只 是 最 近 才 为 人 所 知 。 新 技术 特别 是 PCR 的 发 明 ,使 得 检测 这 类 变异 变 得 容易 起 来 。 一 般 来 讲 , 以 PCR 为 基础 的 方法 已 经 成 为 并 且 将 来 仍 是 我 们 所 选择 的 研究 方法 。 - 188 ° 出 于 对 一 些 有 利 因素 的 考虑 ,mtDNA 已 经 成 为 在 DNA( 限 制 片段 ) 水 平 上 研究 不 同 种 群 的 通用 信息 源 ( 见 Hillis 和 Moritz 1990) 。 这 延伸 了 由 了 PCR 获得 序列 数据 的 情况 ,原因 可 能 是 由 于 mtDNA 分 子 具 有 比 核 DNA FIBA HN BER BR; Mt mtDNA 一 些 区 域 的 了 解 和 高 度 不 同 的 进化 速率 ; “通用 ?引物 的 可 用 性 (Kocher 等 1989) 以 及 线粒体 基因 组 的 单 倍 性 。 最 后 一 点 避免 了 在 双 倍 体 核 基因 组 中 潜在 的 问题 ,也 避免 了 测定 单 模 标本 的 序列 (Kreitman 1991)。 通 常 核 标记 也 是 可 行 的 (Pamilo 和 Nei 1988) ,虽然 在 这 里 经 常用 到 “等 位 酶 ,而 DNA 标记 在 确定 变异 程度 时 能 提供 更 大 的 灵活 性 。 由 于 物种 内 典型 的 核 苷 酸 多 态 性 水 平 是 1% 或 更 小 (Kreitman 1991) ,对 生态 学 家 来 说 ,样品 的 大 量 序列 分 析 一 般 不 是 最 适合 的 方法 .于 是 ,我 们 转向 更 简捷 的 方法 ,例如 ,应 用 DGGE , 寡 核 苷 酸 探 针 ,限制 性 酶 切片 段 ,或 者 对 已 测序 的 多 态 区 中 的 PCR 产物 的 简单 的 大 小 测度 。 虽然 这 些 技 术 变 的 易于 掌握 ,但 它们 的 成 功 应 用 仍 需要 很 多 的 脑力 劳动 , 而 且 生 态 学 家 要 注意 , 不 要 陷 人 只 把 实验 室 工 作 看 作 简单 技术 活动 的 错误 之 中 。 最 后 ,分 子 方 法 在 生态 学 过 程 研究 中 的 应 用 ,将 是 由 不 辞 辛劳 ,互相 了 解 对 方 优 缺 点 的 科学 家 们 将 野外 和 实验 室 工作 巧妙 结合 的 结果 。 参考 文献 Abrahamson, W.G. ,Whitham, T.G. & Price, P. W. ( 1989) . Fads inccology. BioScience, 39,321—325. Armour, J. A. L. ,Povey,S. ,Jeremiah, S. & Jeffreys, A. J. (1990). Systematic cloning of human minisatellites from ordered array charo- mid libraries. Genomics, 8, 501—502. Arnheim,N. , Li ,H. & Cui, X. (1990). PCR analysis of DNA sequences in single cells ; single sperm gene mapping and genetic disease di- agnosis. Genomics, 8, 415—419. Arnold, M. L. , Buckner, C. M. & Robinson, J. J. ( 1991) . Pollen mediated introgression and hybrid speciation in Louisiana irises. Pro- ceedings of the National Academy of Sciences, USA, 88, 1398—1402 Arntzen, J. W. &. Wallis, G. P. (1991). Restricted gene flow in a moving hybrid zone of the newts Triturus cristatus and T. marmoratus in western France. Evolution, 45 ,805— 826. Avise,J. C & Nelson, W. S(1989). Molecular relationships of the extinct dusky scaside sparrow. Science , 243 ,646—648. Avise, J.C. ,Arnold, R. M. ,Ball,E. , Bermingham, T. , Lamb, G.E. , Neigel, C. A. , Reeb, C. A. & Saunders, N. C. (1987). In- traspecific phylogeography: the mitochondrial bridge betwwen population genetics and systematics. Annual Review of Ecology and Sys- tematics, 18, 489—522 Baker, C. S. , Palumbi, S. R, , Lambertsen, R. H. , Weinrich, M. T. , Calambokidis, J. & O’Brien, S. J. (1990) . Influence of seasonal migration on geographical distribution of mitochondrial DNA haplotypes in humpback whales. Nature, 344, 238—240. Baker, R. J. , Davis , S. K. , Bradley, R.D,. Hamilton, M. J. & Van Den Bussche, R. A. (1989) . Ribosomal-DNA, mitochondrial- DNA, chromosomal, and allozymic studies on a contact zone in the pocket gopher, Geomys. Evolution, 43, 63—75. Balazs, I. , Neuweiler, J. , Gunn, P. , Kidd, K. K. , Kuhl, J. & Mingjun, L. (1992). Human population genetic studies using hypervari- able loci. Genetics, 131, 191—198. Birkhead, T. R. & Moller, A. P. ( 1992) . Sperm Competition in Birds. Academic Press, London, UK. Birkhead, T.R. , Burke , T. , Zann, R. , Hunter, F.M. & Krupa, A. P. (1990). Extra-pair paternity and intraspecific brood parasitism in wild zebra finches, Taeniopygia guttata, revealed by DNA fingerprinting. Behavioural Ecology and Sociobiology, 27, 315—324. Brookfield, J. F. Y. ( 1992) . DNA fingerprinting in clonal organisms. Molecular Ecology, 1,21—26. Bruford , M. W. , Hanotte, O. , Brookfield, J. F. Y. & Burke, T. (1992) . Single locus and multilocus DNA fingerprinting. Molecular Genetic Analysis of Populations: A Practical Approach (Ed. by A. R. Hocelzel), pp. 225—269. IRL Press, Oxford, UK. Bruns, T.D. , White, T. J. & Taylor, J. W. (1991). Fungal molecular systematics. Annual Review of Ecology and Systematics, 22, 525—564 Burke, T. (1989). DNA fingerprinting and other methods for the study of mating success. Trends in Ecology and Evolution, 4, 139— 144, Burke, T. & Bruford, M. W. (1987). DNA fingerprinting in birds. Nature, 327, 149—152. Burke, T. . Davies, N. B. , Bruford, M. W. & Hatchwell, B. J. (1989) . Parental care and mating behaviour of polyandrous dunnocks Prunella modularis related to paternity by DNA fingerprinting. Nature, 338, 249—251. Burke, T. , Dolf, G. , Jeffreys, A.J. & Wolff, R. ( Eds) ( 199la) . DNA Fingerprinting: Approaches and Applications. Birkhauser, Basel, Switzerland. Burke, T. , Hanotte, O. , Bruford, M. W. & Cairns, E. ( 1991b) . Multilocus and single locus minisatellite analysis in population bio- logical studies. DNA Fingerprinting: Approaches and Applications (Ed. by T. Burke,G. Dolf, A. J. Jeffreys & R. Wolff), pp. 154— 。 189 « 168. Birkhauser, Basel, Switzerland. Carvalho, G. R. , Maclean, N. , Wratton, S.D., Carter, R. E. & Thurston, J. P. (1991). Differentiation of aphid clones using DNA fingerprinting from individual aphids. Proceedings of the Royal Society of London, B. 243, 109—114. Coulson , R.M. R., Curtis, C.F. , Ready, P. D., Hill, N. & Smith, D. (1990). Amplification and analysis of human DNA present in mosquito bloodmeals. Medical and Veterinary Entomology, 4, 357—366. Dallas, J. F. (1988). Detection of DNA fingerprints of cultivated rice by hybridization with a human minisatellite probe. Proceedings of the National Academy of Sciences, USA, 85, 6831—6835. Daugherty, C.H. , Cree, A. , Hay, J. M. & Thompson, A. M. B. (1990) . Neglected taxonomy and continuing extinctions of tuatara (Sphenodon). Nature, 347,177—179. Davies ,N B. , Hatachwell, B. J. , Robson, T. & Burke, T. (1992). Paternity and parental effort in dunnocks Prunella modularis: how good are male chick-feeding rules? Animal Behaviour, 43, 729—745. Fisher, R. A. (1930). The Genetical Theory of Natural Selection. Clarendon Press, Oxford, UK. Gardes, M. , White, T. J. , Fortin, J. A. Bruns, T. D.& Taylor, J. W. (1991).. Identification of indigenous and introduced symbiotic fungi in ectomycorrhizae by amplification of nuclear and mitochondrial ribosomal DNA. Canadian Journal of Botany, 69, 180—190. Gibbs, H. L. , Weatherhead, P. J. , Boag, P. T. , White, B. N. , Tabak, L.M. & Hoysak, D. J. ( 1990) . Realized RS success of polygynous red-winged blackbirds revealed by DNA markers. Science,250, 1394—1397. Gilbert, D. A. , Lehman, N., O'Brien, S.J. & Wayne, R. K. (1990). Genetic fingerprinting reflects population differeneiias in the California Channel Island fox. Nature ,344,764—767. _ RS J. ,Britschgi, T. B. ,Moyer,C. L. & Field, K. G. (1990). Genetic diversity in Sargasso Sea bacterioplankton. Nature, 345, 60—63. 证。 Goff, L. J. & Coleman, A. W. (1988). The use of plastid DNA restriction endonuclease patterns in delineating red algal species and pop- ulations. Journal of Phycology, 24,357—368. a Goff, W. , Barbet, A., Stiller, D., Palmer, G. , Knowles, D. , Kocan, K., Gorham,J. & Meguire, T. ( 1988) . Detection of , Anaplasma marginale-infected tick vectors by using a cloned DNA probe. Proceedings of the National Academy of Sciences, USA, 85, 919923. ' Gowaty , P. A. & Droge, D. L. (1991). Sex ratio confiliet and the evolution of sex-biased provisioning in birds. Acta XX Congressus In- ternationalis Ornithologici, I1,932—945. Greer, C. E., Lund, J. K. & Manos, M. M. (1991). PCR amplification of paraffinembedded tissues: recommendations on fixatives for long term storage and prospective studies. PCR Methods and Applications, I, 46—50. ' Griffiths, R. ( 1991) . The isolation of conserved DNA sequences related to the human sexdetermining region Y gene from the lesser black-backed gull( Larus fuscus) . Proceedings of the Royal Society of London, B, 244,123—128. - Griffiths, R. & Holland, P. (1990). A novel avian W chromosome DNA repeat sequenee in the lesser black-backed gull(Larus fuscus). Chromosoma, 99, 243—250. Gubbay, J. , Collignon, J. , Koopman, P. , Capel, B. , Economou, A. , Munsterberg, A. , Vivian, N. , Goodfellow, P. & Lovell- Badge, R> (1990). A gene mapping to the sexdetermining regions of the mouse Y chromosome is a member of a novel family of em- bryonically expressed genes. Nature, 346, 245—250. Hadrys, H. , Ballick, M. & Schierwater, B. ( 1992). Applications of random amplified polymorphic DNA in molecular ecology. Molecu- lar Ecology , I, 55—63. Hagelberg, E. , Sykes, B. & Hedges, R. (1989). Ancient bone Dna amplified. Nature, 342—485. Hanotte,O. ,Burke,T. ,Armour,J. A. L. & Jeffreys, A. J. (1991b). 外 and evolution of Indian peafowl Pavo crista- tus minisatellite loci. DNA Fingerprinting: Approaches and Applications (Ed. by T. Burke,G. Dolf,A. J. Jeffreys & R. Wolff) ,pp. 193— 216. Birkhauser , Basel , Switzerland. Hanotte, O., Burke, T., Armour, J. A. L. & Jeffreys, A. J. (1991a). Hypervariable minisatellite DNA sequences in the Indian peafowl Pavo cristatus. Genomics, 9, 587—597. Hanotte, O. , Cairns, E., Robson, T., Double, M. & Burke, T. (1992) . Cross-species hybridization of a single locus minisatellite probe in passerine birds. Molecular Ecology, I, 127—130. Harnett, W., Chambers, A. E., Renz, A. & Parkhouse, R. M. E. (1989). An oligonucleotide specific for Onchocerca volvulus. Molecular and Biochemical Parasitology, 28, 77—84. Harrison, R. G. (1989). Animal mitochondrial DNA as a genetic marker in population and evolutionary biology. Trends in Ecology and Evolution, 4, 6—11. Hayashi, K. (1991) . PCR-SSCP: A simple and sensitive method for detection of mutations in the genomic DNA. PCR Methods and Ap- plications, 1, 34—38. Helm-Bychowski, K. M. & Wilson, A. C. ( 1986) . Rates of nuclear DNA evolution in pheasant-like birds; evidence from restriction e150 maps. Proceedings of the National Academy of Sciences, USA,83, 688—692. Hewitt, G. M., Johnston, A. W. B. & Young, J. P. W. ( Eds) ( 1991) . Molecular Techniques in Taxonomy. Springer Verlag, Berlin, Germany. Higuchi, R. , von Beroldingen, C. H. , Sensabaugh, G. F. & Erlich, H. A. (1988). DNA typing from single hairs. Nature, 332, 543 — 546. Hillis, D. M. & Dixon, M. T. (1991) . Ribosomal DNA; molecular evolution and phylogenetic inference. Quarterly Review of Biolo- gy, 66, 411—453. Hillis , D. M. & Moritz, C. (Eds)( 1990) . Molecular Systematics. Sinauer, Sunderland, MA, USA. Hoelzel, A. R. (Ed. ) (1992) . Molecular Genetic Analysis of Populations; A Practical Approach. IRL Press, Oxford, UK. Innis, M. A. , Gelfand, D. H. , Sninsky, J. J. & White, T. J. (Eds) ( 1990) . PCR Protocols: A Guide to Methods and Applications. A- cademic Press, New York, NY, USA. Ito K. (1992). Nearly complete loss of nucleic acids by commercially available highly purified ethanol. Biotechniques 12, 69—70. Jeffreys, A.J. , Wilson, V. & Thein, S.L. ( 1985a) . Hypervariable 'minisatellite’ regions in human DNA. Nature, 314, 67—73. Jeffreys, A.J. ,Wilson, V. & Thein, S. L. (1985b). Individual-specific ‘fingerprints’ of human DNA. Nature, 316, 76—79. Jones, C.S. , Lessells, C.M. & Krebs, J. R. (1991). Helpers-at-the-nest in European beecaters (Merops apiaster) a genefic analysis, DNA Fingerprinting; Approaches and Applications ( Ed. by T. Burke, G. Dolf, A.J. Jeffreys & R. Wolff),pp. 169—192. Birkha “user, Basel, Switzerland. Kocher, T. D. , Thomas, W. K. , Meyer, A. , Edwards, S. V. , Paabo,S. , Villablanca, F. X. & Wilson, A. C. (1989) . Dynamics of mitochondrial evolution in animals; amplification and sequencing with conserved primers. Proceedings of the National Academy of Sci- ences, USA, 86, 6196—6200. Kreitman, M. ( 1983) . Nucleotide polymorphism at the alcohol dehydrogenase locus of Drosophila melanogaster. Nature, 304, 412— 417. \ Kreitman, M. (1991). Variation at the DNA level: something for everyone. Molecular Techniques in Taxonomy (Ed. by G. M. Hewitt, A. W. B. Johnston & J. P. W. Young) , pp. 15—32. Springer Verlag, Berlin, Germany. Kukla, B. A. , Majiwa, P. A. O. , Young,J.R. ,Moloo, S. K. & ole-Moiyoi, O. (1987). Uses of species-specific DNA probes for de- tection and identification of trypanosome infection in tsetse flies. Parasitology, 95, 1—16. Laerm, J., Avise, J. C., Patton, J. C. & Lansman, R. A. (1982). Genetic determination of the status of an endangered specics of pocket gopher in Georgia. Journal of Wildlife Management, 46, 513—518. Learn, Jr. G. H. & Schaal, B. A. ( 1987) . Population subdivision for ribosomal repeat variants in Clematis fremontii, Evolution, 41, 433—438. Lee, J. S. (1991). Alternative dideoxy sequencing of double-stranded DNA by cyclic reactions using Taq polymerase. DNA and Cell Biolo- gy, 10, 67—73. Lessa, E. P. ( 1992). 有 of DNA sequence variation at the population level by PCR and denaturing gradient gel electrophoresis. Methods in Enzymology (in press). Lucchini, G. M. & Altwegg, M. (1992). Ribosomal-RNA gene restriction patterns as taxonomic tools for the genus Aeromonas. Inter- national Journal of Systematic Bacteriology, 42, 384—389. McDonald,B. A. & Martinez,J. P. (1990). DNA restriction fragment leugth polymorphisms among Mycosphaerella graminicola isolates col- lected from a single wheat field. Phytopathology ,80,1368— 1373. Moritz, C. , Dowling, T. E. & Brown, W. M. (1987). Evolution of animal mitochondrial DNA; relevance for population biology and , " systematics. Annual Review of Ecology and Systematics,18, 269—292. Mullis, K. B. &. Faloona, F. A. (1987). Specific synthesis of DNA in vitro via a polymerase catalysed chain reaction. Methods in Enzy- mology, 55, 335—350. Myers, R. M., Sheffield, V. C. & Cox, D. R. (1989). Mutation detection by PCR, GC-clamps and denaturing gradient gel elec- trophoresis. PCR Technology: Principles and Applications for DNA Amplification(Ed. by H. A. Erlich), pp. 71—88. Stockton Press, New York, NY, USA. Nybom, H. & Schaal, B. A. (1990). DNA'fingerprints’ reveal genotypic distributions in natural populations of blackberries and raspber- ries(Rubus, Rosaceae) American Jouranl of Botany, 77, 883—888. O’Brien, S.J. & Mayr, E. ( 1991) . Bureaucratic mischief: recognizing endangered species and subspecies. Science, 251, 1187—1188. Olson, R. R. , Runstadler, J. A. & Kocher, T. D. ( 1991) . Whose larvae? Nature, 351. Packer, C. , Gilbert, D. A. , Pusey, A. E. & O’Brien, S. J. (1991). A molecular genetic analysis of kinship and cooperation in African lions. Nature, 352, 562—565. Page, R. D. M. (1990). Temporal congruence and cladistic analysis of biogeography and cospeciation. Systematic Zoology, 39, 205— 226. * For Palmer, J. D. (1987). Chloroplast DNA evolution and biosystematic uses of chloroplast DNA variation. American Naturalist, 140, S6— S29. Pamilo, P. & Nei, M. (1988). Relationships between gene trees and species trees. Molecular Biology and Evolution, 5, 568—583. . Parker, J. S., Birkhead, T. R. , Joshua, S.K., Taylor, S. & Clark,M. S. (1991). Sex ratio in a population of guillemots Uria aalge de- termined by chromosome analysis. Ibis,133,423—424. Persing, D. H. , Telford, I S.R. ,Rys,P. N. ,Dodge,D. E. ,White, T. J. , Malawista, S. E. & Spielman, A. (1990). Detection of Borre- lia burgdorferi DNA in museum specimens of Ixodes dammini ticks. Science, 249, 1420—1423. Quinn, T. W. & White, B. N. (1987). Identification of restriction-fragment length polymorphisms in genomic DNA of the lesser snow goose( Anser caerulescens) . Molecular Biology and Evolution, 4, 126—143. Quinn, T. W. , Cooke, F. & White, B. N. (1990). Molecular sexing of geese using a cloned Z chromosomal sequence with homology to the W chromosome. Auk, 107, 199—202 Quinn, T. W. , Quinn ,J.S. , Cooke, F. & White, B. N. (1987) . DNAmarker analysis detects multiple maternity and paternity in sin- gle broods of the lesser snow goose(Anser caerulescens). Nature, 326, 392—394. Rabenold, P. P. , Piper , W.H., Decker, M. D. & Minchella, D. J. ( 1991) . Polymorphic minisatellite amplified on avian W chromo- some. Genome, 34, 489—493. Rabenold, P. P. , Rabenold, K. N. , Piper, W. H. , Haydock, J. & Zack, S. W. (1990). Shared paternity revealed by genetic analysis in cooperatively breeding tropical wrens. Nature, 348, 538—540. Rassmann, K. , Schlutterer , C. & Tautz, D. (1991). Isolation of simple sequence loci for use in polymerase chain reaction-based DNA fingerprinting. Electrophoresis, 12, 113—118. , Raymond, M., Callaghan, A., Fort, P. & Pasteur, N. ( 1991) . Worldwide migration of amplified insecticide resistance genes in mosquitoes. Nature, 350, 151—153. ; Richman, A.D. & Price, T. ( 1992) . Evolution of ecological differences in the Old World leaf warblers ; roles of history and adaptation. Nature, 355, 817—821. Riesner, D. , Steger, R. , Zimmat, R. , Owens, R. A. , Wagenhofer, M. , Hillen, W. , Vollbach, S. & Henco, K. ( 1989). Tem- perature- gradient gel electrophoresis of nucleic acids; Analysis of conformational transitions, sequence variations and protein-nucleic acid interactions. Electrophoresis, IO, 377—389. Rogstad, S. H. Surveying plant genomes for VNTR loci. Molecular Evolution; Producing the Biochemical Data( Ed. by E. A. Zimmer, T.J. White, R.L. Cann, & A. C. Wilson). Academic Press, San Diego, CA, USA (in press). Rosa, P. A. , Hogan, D. & Schwan, T. G. (1991). Polymerase chain reaction analyses identify two distinct classes of Borrelia burgdor- feri. Journal of Clinical Microbiology, 29, 524—532. Rowan, R. & Powers, D. ( 1991) . A molecular genetic classification of zooxanthellae and the evolution of animal algal symbioses. Sci- ence, 251, 1348—1351. Saiki, R. K. , Gelfand, D. H. , Stoffel, S., Scharf, S. J. Higuchi, R., Horn, G. T., Mullis, K. B. & Erlich, H. A. (1988). Primer-directed enzymatic amplification of DNA with a thermostable DNA polymerase. Science, 239, 487—491. Schafer, R. , Zischler, H. , Birsner, U. , Becker, A. & Epplen, J. T. (1988). Optimized oligonucleotide probes for DNA fingerprinting. Electrophoresis, 9, 369—374. ' Schlotterer, C. , Amos, B. & Tautz, D. (1991) . Conservation of polymorphic simple sequcnce date in ceacean species. Nature, 354, 63 —65- Seutin, G. , White, B. N. & Boag, P. T. (1990) . Preservation of avian blood and tissues for DNA analyses. Canadian Journal of Zoolo- gy. 69, 82—90. Sibley, C. J. & Ahlquist, J. E. (1990) . Phylogeny and Classification of Birds; A study in Molecular Evolution. Yale University Press, New Haven, CT, USA. Sinclair, A. H., Berta, P. , Palmer , M. S., Hawkins, J. R., Griffiths, B. , Smith, M.J., Foster, J. W. ,Frischauf, A. M., Lovell-Badge, R. , Goodfellow, P. N. (1990). A gene from the human sex-determining regions encodes a protein with homology to a conserved DNA-binding motif. Nature, 346, 240—244. Smith, L. J. , Braylan, R.C. , Nutkis, J. E. , Edmundsen, K. B. , Downing, J. R. & Wakeland , E. K. (1987). Extraction of cellu- lar DNA from human cells and tissues fixed in ethanol. Analytical Biochemistry, 160, 135—138. Soltis, P. S., Soltis, D: E. & Doyle, J. J. ( 1992) . Plant Molecular Systematics. Chapman &. Hall, London, UK. Taberlet, P. & Bouvet, J. (1991). A single plucked feather as a source of DNA for bird genctic studies. Auk, 108, 959—960. Taberlet, P. , Gielly, L. , Pautou, G. & Bouvet, J. (1991) . Universal primers for amplification of three non-coding regions of chloro- plast DNA. Plant Molecular Biology, 17, 1105—1109. Taggart, J. B. & Ferguson, A. (1990). Minisatellite DNA fingerprints of salmonid fishes . Animal Genetics, 21, 377—389. Tautz, D. (1989). Hypervariability of simple sequences as a general source for polymorphic DNA markers. Nucleic Acids Research, 17, « T9Z'* 6463 一 6471. Templeton, A. R. (1992) . Human origins and analysis of mitochondrial DNA sequences. Science, 255,737. Thomas, R. H. & Hunt, J. A. (1991). The molecular evolution of the alcohol dehydrogenase locus and the phylogeny of Hawaiian Drosophila. Molecular Biology and Evolution, 8, 687—702. Thomas, R. H. , Schaffner, W. , Wilson, A. C. & paabo, S. V. (1989). DNA phylogeny of the extinct marsupial wolf. Nature, 340, 465— 467. Thomas, W. K. , Paabo, S. , Villablanca, F. X. & Wilson, A. C. (1990). Spatial and temporal continuity of kangaroo rat populations shown by sequencing mitochondrial DNA from museum specimens. Journal of Molecular Evolution, 31,101—112. Trivers,R. L. & Willard,D. E. (1973). Natural selection of parental ability to vary the sex ratio of offspring. Science, 179,90—92. Turner, B. J. ,Elder,J. F. Jr, Laughlin, T. F. & Davis, W. P. (1990) Genetic variation in clonal vertebrates detected by simple-sequence DNAfingerprinting. Proceedings of the National Academy of Sciences. USA, 87, 5653—5657. Vigilant, L. , Stoneking, M. , Harpending, H. , Hawkes, K. & Wilson, A. C. (1991) . African populations and the evolution of hu- man mitochondrial DNA. Science, 253, 1503—1507. Ward, D. M., Weller, R. & Bateson, M. M. (1990). 16S rRNA sequences reveal numerous uncultured mieroorganism in a natural community. Nature, 345, 63—65. Wayne, R. k. & Jenks, S. M. (1991). Mitochondrial DNA analysis implying extensive hybridization of the endangered red wolf Canis rufus. Nature,351, 565—568. Welsh, J. , Pretzman, C. , Postic, D. , Saint Girons, I. , Baranton, G. & McClelland, M. (1992). Genomic fingerprinting by arbitrar- ily primed polymerase chain reaction resolves Borrelia burgdorferi into three distinet phylogenetic groups. International Journal of Sys- tematic Bacteriology, 42, 370—377. Whittemore, A. T. & Schaal, B. A. (1991). Interspecific gene flow in sympatric oaks. Proceedings of the National Academy of Sci- ences, USA, 88, 2540—2544. Williams, J. G. K. , Kubelik, A. R. , Livak, K. J. , Rafalski , J. A. & Tingey, S. V. (1990). DNA polymorphisms amplified by arbi- trary primers are useful as genetic markers. Nucleic Acids Research, 18, 6531—6535. Williams, S. M. & Strobeck, C. (1986). Measuring the multiple insemination frequency of Drosophila in nature: use of a Y-linked molec- ular marker. Evolution, 40, 440—442. Winship, P.R. ( 1989) . An improved method for directly sequencing PCR amplified material using dimethyl sulphoxide. Nucleic Acids Research, 17, 1266. Woese, C. (1987). Bacterial evolution. Microbiological Reviews, 51, 221—271. Wong, Z. , Wilson, V., Patel, I. , Povey, S. , Jeffreys, A. J. ( 1987) . Characterization of highly variable minisatellites cloned from human DNA. Annals of Human 人 51,269 一 288. ( 魏 伟 译 自 工 .Burke,W. E. Reiney and T. J. White, 1992, Molecular Variation and Ecological Problems, in R. J. Berry, T. J. Crawford & G. M. IIewitt (eds. ) (Genes in Ecology) 229—254, Oxford: Blackwell Scientific Publications 钱 迎 倩 校 ) * 193 = * <) To 77 a f Ad , Loe egy v if 7 5 joula mar e a ‘(be ‘wa wre “ive 'W bhi 1 ii a f 4,47 " ‘ * wy 4 a. ‘ iJ 4 | YI rym pMSTOR? 9 , 7 . “ ni ABT 4's o 4 sw 是 wey 4 7 vi 7 Capa “sa 是 Et ald 4 ro Stet aikis ‘ ‘ ? ¥ q le iw - istics " th 2 aw 】 厅 是 WW AVAL anata os } ’ J i ‘ =? ) 本 人 dor a , Dj ) ~~ unl . * “1 出 7 ‘ | 4 \ ep 2000 年 系统 学 议程 :制订 生物 圈 计 划 一 全 世界 物种 的 发 现 、 描 述 和 分 类 的 全 球 计划 技术 报告 美国 植物 分 类 学 家 学 会 .系统 生物 学 家 学 会 .Willi Hennig 学 会 和 系统 学 标本 馆 联 侣 会 组 成 的 联合 体 Systematics Agenda 2000 :Charting the Biosphere A Global Initiative to Discovery ,Describe and Classify the World’ s Species the American Society of Plant Taxonomists,the Society of Systematic Biologists and the Willi Hennig Society in cooperation with the Association of Systematics Collections, 1994 人 类 健康 … 物种 经 济 学 … 林业 ……… 渔业 … sees oe ee cee cee cen cee cen ces cence cesses ces ceesesseses 了 解 和 保护 地 球 的 生命 支持 系统 … 提高 日 常生 活 的 质量 … 加 强 科学 研究 … 2000 年 系统 学 议程 的 任务 … has nds kklaenoeeaiecce eee 第 一 项 任务 :全 球 物种 多 样 性 的 发 现 ,描述 和 编目 … 第 二 项 任务 :分 析 这 个 全 球 发 现 计 划 获 得 的 信息 ,并 将 其 融合 于 一 个 能 反映 生命 史 的 预测 性 分 类 系统 … 第 三 项 任务 :把 这 个 全 球 计划 获得 的 信息 整理 成 为 一 种 有 效 的 .可 查询 的 形式 , 以 最 大 限度 地 满足 科学 和 社会 的 需求 … 迎接 挑战 :基础 设施 与 人 才 资 源 - 建立 和 加 强 系 统 学 研究 中 心 及 标本 收藏 站 pp 教育 .培训 及 人 才 资 源 开 发 .pe 216》 oo ee soossesssseosssosoosssoosssoossosoooooovosoossoooeossossoesoosoooeoesossosoosoos sse sse C2185 * (220) 生物 多 样 性 项 目 … gue 机 a ce beet so icamiatatiddian iil 参考 文献 词汇 … - £197) - (198) eee eee eee Pere Cree ere ere eter errerr err eter errr rte ree etre rer rere err ers (199) 2000 年 系统 学 议程 :制订 生物 圈 计 划 pp 系统 学 知识 及 生物 多 样 性 的 价值 .ee 《II0]) (201) (201) 药物 .pe oo 农业 农业 和 遗传 资源 :ee 8 。 (205) > (205) > (206) > (207) … (208) ” (208) ** (208) (202) (203) (204) = (09) - (Zire) “+ (293) ~ (214) (216) (217) 2000 年 系统 学 议程 :制订 生物 圈 计 划 一 一 全 世界 物种 的 发 现 、 描 述 和 分 类 的 全 球 计划 技术 报告 前 言 .遐想 你 被 置身 于 一 个 陌生 但 又 美丽 的 星球 .四 周 景色 宜人 .漫步 沙滩 ,翻滚 的 波浪 拍打 着 海岸 , 岸上 绿 草 悠悠 ,溪流 涛 涯 ,茂密 的 森林 衬托 着 远 处 白 拒 拒 的 雪山 .你 只 消 一 警 便 能 领悟 到 这 是 个 充满 生命 的 世界 一 一 种 类 如 此 之 多 令 人 感到 茫然 , 乍 看 约 或 令 人 发 闸 。 试想 会 有 多 少 东西 能 从 这 个 新 的 星球 了 解 到 ,而 这 些 知识 会 有 多 人 么 的 重要 。 有 些 植物 可 能 会 变 成 新 的 食物 ,哺育 饥饿 的 生灵 ,或许 化 作 新 的 药物 ,解除 疾病 的 痛苦 ;有 些 动物 也 许 能 有 效 坎 制 作物 害虫 的 危害 ;微生物 或 就 能 够 分 解 污染 物 ,或 就 能 够 维持 住 一 个 拥挤 世界 的 大 气 。 再 想 一 想 , 你 这 一 辈子 能 在 这 个 迷人 的 新 世界 里 的 寿命 是 如 此 之 短 , 因 此 你 只 能 在 这 短暂 的 时 窗 内 把 所 有 的 一 切 都 发 现 出 来 。 事实 上 你 无 需 穷 尽 你 的 想象 力 , 因 为 这 个 渺茫 的 星球 就 是 我 们 的 地 球 。 我 们 星球 上 的 生命 丰富 得 让 人 吃惊 , 它 造 福 人 类 的 潜能 同 我 们 约 想 到 的 任何 一 个 星球 一 样 可 观 , 更 不 用 说 我 们 今后 还 要 继续 求 索 。 短 暂 的 时 窗 也 同样 是 事实 。 我 们 地 球 的 表面 ,不 论 是 陆地 还 是 水 域 , 都 由 于 人 口 膨 胀 带 来 对 住房 、 食物 和 燃料 的 需求 而 面临 着 急骤 的 退化 。 今 后 一 代 或 两 代 人 口 的 迅猛 增长 加 之 资源 消耗 ,将 在 我 们 尚 有 机 会 发 现 更 不 用 说 仔细 研究 我 们 正在 失去 什么 之 前 ,大 量 生命 的 多 样 性 将 被 毁坏 。 当 得 知 地 球 上 数 百 万 计 的 物种 尚未 发 现 或 描述 后 ,许多 人 都 感到 惊奇 .实际 上 ,地 球 上 的 生命 是 如 此 之 丰富 ,对 某 些 生物 类 群 的 研究 是 如 此 之 肤浅 ,我 们 仍 不 清楚 地 球 上 到 底 生 活 有 多 少 物种 。 假 如 地 球 上 有 一 千 万 或 五 千 万 个 物种 ,几乎 任何 一 个 生物 学 家 都 不 会 感到 吃惊 。 然而 ,我 们 确实 知道 生命 多 样 性 过 去 对 我 们 有 多 人 么 重要 ,将 来 对 我 们 会 有 多 人 么 重要 。 我 们 也 知道 , 研究 这 种 多 样 性 可 以 告诉 我 们 这 个 星球 的 生命 史 是 什么 ,这些 研 究 怎样 来 帮助 我 们 解决 进入 二 十 一 世纪 后 世界 面临 的 最 紧迫 的 难题 。 我 们 目前 正面 对 一 个 前 所 未 有 的 机 遇 ,一 个 在 我 们 失败 后 子孙 后 代 不 再 会 有 的 机 遇 。 系统 学 是 生物 学 的 一 个 分 支 科 学 , 它 的 任务 是 掌握 生命 的 多 样 性 .系统 学 家 把 掌握 的 知识 划分 到 分 类 系统 ,以 此 表示 我 们 对 现存 物种 或 过 去 年 代 物 种 的 了 解 ,进而 准确 推测 尚未 了 解 的 物种 .世界 系 统 生 物 学 家 被 迫切 地 要 求 加 紧 对 地 球 生 命 的 探索 ,以 便 为 全 社会 提供 必 不 可 少 的 背景 知识 ,发 现 和 利 用 新 的 生物 资源 ,并 制定 保护 地 球 生 物 多 样 性 的 有 效 决 策 。 美国 植物 分 类 学 家 学 会 .系统 生物 学 家 学 会 .Wili Hennig 学 会 及 系统 学 标本 馆 联合 会 组 成 的 联 合体 1994 年 人 内 容 提 要 地 球 上 的 物种 ,包括 人 ,共同 构成 了 一 块 精美 的 纺织 品 。 这 块 纺 织品 塑造 了 对 维持 生命 至 关 重 要 的 大 气 气候、 土壤 .水 及 地 球 的 其 他 生态 学 特性 。 构 成 纺织 品 的 一 百 多 万 根 丝线 (物种 ) 为 系统 生物 学 家 , 即 探索 地 球 生物 多 样 性 的 科学 家 所 发 现 和 描述 . 反 过 来 ,物种 描述 又 为 其 他 各 项 研究 的 开展 打下 基础 ,例如 物种 间 关 系 的 研究 以 及 告诉 我 们 生命 多 样 性 组 成 及 其 历史 的 分 类 研究 .物种 的 分 类 犹如 强 大 的 理论 工具 ,能 帮助 我 们 了 解 、 维 持 并 合理 利用 我 们 继承 下 来 的 丰富 的 生物 财富 。 系统 生物 学 研究 在 过 去 两 百 多 年 中 取得 了 重大 的 成 就 ,尽管 如 此 ,我 们 对 生命 的 了 解 还 远 远 不 够 , 数 千 万 计 的 物种 仍 有 待 我 们 去 探索 ,去 认识 .这 些 物 种 中 可 能 有 维持 复杂 的 生态 平衡 的 物种 ,可 能 有 增加 和 扩大 农业 生产 的 物种 ,也 可 能 有 会 成 为 消灭 人 类 健康 之 敌 的 新 药 和 特效 药 的 物种 。 令 人 欣慰 的 是 ,近期 系统 学 的 发 展 适 时 提出 了 制订 生物 圈 计 划 的 艰巨 任务 ,其 目的 就 是 在 于 掌握 物种 多 样 性 的 巨大 的 范围 。 对 人 类 今后 的 生存 和 幸福 来 说 ,当前 迎接 这 一 挑战 比 以 往 任 何 时 候 都 要 重要 。 当 今世 界 逐 步 面临 多 样 性 减少 和 栖息 地 消失 的 境况 ,人 类 对 珍贵 生物 资源 的 需求 也 在 不 断 提 高 .为 此 ,物种 多 样 性 的 基 础 系统 学 研究 势 在 必 行 .世界 上 的 自然 资源 管理 者 ,药物 开发 者 .保护 生 物 学 家 、 生 态 学 家 及 其 他 有 关 人 十 只 有 共同 努力 ,才能 付 之 于 实现 。 对 地 球 生物 多 样 性 了 解 得 越 多 ,人 类 保护 陆地 和 海洋 自然 生境 的 能 力 就 越 强 。 如 果 想 让 子孙 后 代 享有 我 们 所 依赖 的 地 球 生 命 的 多 样 性 ,我们 就 必须 求 得 这 些 知 识 。 国际 系统 生物 学 界 倡议 的 2000 年 系统 学 议程 旨 在 实现 世界 各 国 所 追求 的 一 个 科学 目标 , 即 发 现 、 描述 和 分 类 地 球 上 的 物种 。 实 现 这 个 目标 要 求 国际 社会 努力 完成 三 个 彼此 关联 的 科学 任务 。 第 一 项 任务 :全 球 物种 多 样 性 的 发 现 、 描 述 和 编目 ; 第 二 项 任务 :分 析 这 个 全 球 发 现 计 划 获 得 的 信息 ,并 将 其 融合 于 一 个 能 体现 生命 史 的 预测 性 分 类 系统 ; 第 三 项 任务 :把 这 个 全 球 计 划 获 得 的 信息 整理 成 为 一 种 有 效 的 、 可 查询 的 形式 ,以 最 大 限度 地 满 足 科 学 和 社会 的 需求 。 它 对 科学 和 社会 的 作用 巨大 ,具体 表现 在 : 1. 新 发 现 的 物种 将 扩充 社会 有 用 资源 的 编目 ; 2. 新 的 系统 学 数据 将 会 用 维持 和 利用 各 国 物 种 多 样 性 所 必需 的 知识 把 保护 学 家 政策 制定 者 及 生物 资源 管理 者 武装 起 来 。 3. 物种 多 样 性 知识 将 有 助 于 新 产品 的 发 现 , 并 将 指导 农作物 和 药物 的 新 品种 和 改良 品种 的 选择 。 4. 基底 数据 将 随 之 产生 ,并 用 于 监测 全 球 气候 及 生态 系统 的 变化 ,其 中 包括 物种 灭绝 速度 .生态 系统 退化 以 及 外 来 的 .引起 病害 和 虫害 生物 体 的 传播 等 。 ol 各 Ill “ 浪费、 破坏 我 们 的 自然 资源 ,....….. ,将 会 损害 子孙 后 代 真 正 的 繁荣 昌盛 ,按理 说 我 们 应 把 繁荣 昌盛 传 给 他 们 并 发 扬 光 大 ” 一 西 奥 多 .罗斯 福 1907 年 12 月 3 日 提交 国会 的 咨文 我 们 与 其 他 数 百 万 物种 共同 占有 地 球 .这些 物 种 形态 多 样 ,关系 奥秘 ,是 三 十 多 亿 年 进化 的 结果 。 地 球 上 的 物种 ,包括 我 们 本 身 , 被 汇 织 在 一 个 精美 的 生态 结构 中 。 这 个 结构 塑造 了 大 气 、 气 侯 及 地 球 的 地 理 特 性 ,并 奠定 了 生命 本 身 的 基础 。 人 类 依赖 于 难以 数 计 的 其 他 物种 .换言之 ,人 类 生活 的 好 坏 与 全 球 生态 网 络 的 状况 有 着 直接 的 关 系 。 成 千 上 万 的 物种 被 人 类 用 于 食物 、 住 房 , 衣 物 药品、 商业 或 其 他 目的 .对 其 他 生命 型 的 利用 推动 了 世界 经 济 的 发 展 ,使 我 们 每 个 人 的 生活 更 富裕 、 更 美好 。 人 类 能 有 效 利用 其 他 物种 的 本 领 来 自 对 这 些 物种 知识 的 了 解 . 这 种 知识 从 认识 它们 是 什么 种 类 、 它们 在 哪儿 、 它 们 会 有 什么 特征 、 它 们 与 别 的 物种 有 什么 关系 开始 地 球 上 的 生命 形式 极其 丰富 多 样 。 迄今 为 止 ,已 描述 的 物种 大 概 不 足 150 万 种 ,但 据 专 家 估计 与 我 们 一 道 栖 居 地 球 的 物种 很 可 能 有 几 千 万 。 记 录 和 了 解 物 种 多 样 性 对 人 类 今后 的 发 展 至 关 重要 .了解 这 些 基 本 知识 是 系统 学 这 门 科学 的 主要 任务 。 系统 生物 学 家 致力 于 地 球 物 种 的 发 现 \ 描 述 和 了 解 .他 们 根据 获得 的 信息 对 物种 进行 分 类 ,在 此 基础 上 再 整理 有 关 这 些 物 种 的 所 有 生物 学 知识 ,并 制订 出 一 个 框架 ,预测 已 知 的 或 未 知 的 生活 型 的 特 征 . 尽 管 我 们 掌握 地 球 物 种 的 知识 还 不 够 全 面 , 但 新 的 系统 分 析 方法 .生物 遗传 物质 CDNA) 的 直接 利 用 、 尖 端的 信息 处 理 技术 .自然 历史 标本 收藏 的 增加 及 其 数据 库 的 建立 等 手段 ,都 为 了 解 全 球 生物 多 样 性 铺 平 了 道路 。 未 加 控制 的 人 类 活动 使 我 们 目前 正 处 于 一 个 重大 的 生物 灭绝 时 期 ,因此 目前 认识 生物 多 样 性 比 以 往 任何 时 期 更 具有 迫切 性 据 美国 国家 研究 理事 会 的 一 份 报告 称 , 到 2100 年 很 可 能 一 半 以 上 的 现 有 物种 都 将 灭绝 CNRC 1980) .但 就 目前 生态 系统 的 退化 速度 来 看 ,这 项 推测 可 能 还 有 些 保守 ;按照 哈佛 大 学 著名 的 生物 学 家 下 . O. Wilson 博士 的 谨慎 估计 ,地 球 上 每 年 导致 绝 灭 的 物种 有 将 近 2 万 7 千 种 (Wilson 1992). 人 口 的 膨胀 .贫穷 的 增长 全 球 的 冲突 及 自然 资源 的 过 度 利用 造成 了 环境 质量 严重 的 下 降 和 物种 多 样 性 不 可 挽回 的 损失 。 多 样 性 的 减少 伴随 着 生物 学 知识 的 损失 降低 了 各 国人 民 改 善 经 济 状况 和 提高 生活 水 平 的 能 力 。 物种 灭绝 的 悲剧 向 国际 社会 发 出 了 严峻 的 挑战 一 一 在 人 类 生物 遗产 永久 地 失去 之 前 发现、 保存 和 认 识 其 多 样 性 生物圈 的 未 来 尚 有 赖 于 各 国政 府 在 今后 几 十 年 内 的 共同 努力 .近期 在 里 约 热 内 卢 召 开 的 联合 国 环境 与 发 展 大 会 (UNCED) 已 经 认识 到 这 一 点 .大 会 上 国际 社会 认识 到 ,在 保持 经 济 持续 发 展 的 同时 有 必要 维持 生物 圈 的 完整 性 .各 国 通过 全 球 行动 计划 “二 十 一 世纪 议程 也 呼吁 要 加 强 对 地 球 生物 多 样 性 的 了 解 程度 。 | 在 发 展 经 济 的 同时 兼顾 持续 利用 取决 于 综合 的 政治 决策 和 经 济 决策 .成 功 的 决策 必须 以 各 种 准 确 的 地 球 物种 科学 库 的 信息 为 依据 。 为 迎接 掌握 生命 多 样 性 重任 的 挑战 ,国际 系统 学 界 提出 了 一 项 控 索 和 研究 计划 一 一 2000 年 系统 学 议程 :绘制 生物 圈 图 谱 。 有 了 全 社会 的 共同 决心 和 一 致 支持 ,全 世界 的 系统 学 家 们 提出 了 一 项 加 速 研 究 的 计划 ,以 期 在 今后 25 年 中 解答 下 列 问题 : . 地球 上 的 物种 是 什么 ? 2. 它们 分 布 在 什么 地 方 ? 3. 它们 具有 什么 样 的 特性 ? .它们 之 间 的 关系 如 何 ? 本 项 研究 获得 的 知识 将 被 整理 成 为 预测 性 的 分 类 系统 和 数据 库 ,使 其 成 为 认识 、 维 持 和 永 续 利 用 人 入 — ~ -一 人 类 继承 的 巨大 的 生物 财富 的 有 效 工 具 。 系统 学 是 建立 在 以 下 工作 之 上 的 科学 : DEF: 发 现 、 描 述 和 划分 物种 或 物种 类 群 ( 合 称 分 类 单元 ) 的 科学 系统 发 育 分 析 : 发 现 生 物种 类 群 间 的 进化 关系 RE: 按照 进化 关系 将 物种 最 终归 为 不 同 的 类 群 * 200 2000 年 系统 学 议程 :制订 生物 圈 计 划 世界 系统 学 界 通过 2000 年 系统 学 议程 果断 地 提出 了 一 项 迎合 社会 需求 ,有 明确 科学 目标 的 计划 : 发 现 、 描 述 和 划分 全 世界 的 物种 。 迎接 生物 多 样 性 危机 的 挑战 和 成 功 地 完成 这 项 议程 要 求 国际 上 的 广泛 参与 。 议 程 确 定 了 三 项 彼 此 关联 的 研究 任务 : 1. 全 球 物 种 多 样 性 的 发 现 、 描 述 和 编目 ; 2. 分 析 这 个 全 球 发 现 计 划 获 得 的 信息 ,并 将 其 融合 于 一 个 能 体现 生命 史 的 预测 性 分 类 系统 ; 3. 把 这 个 全 球 计 划 获 得 的 信息 整理 成 为 一 种 有 效 的 、 可 查询 的 形式 ,以 最 大 限度 地 满足 科学 和 社 会 的 需求 。 系统 学 知识 及 生物 多 样 性 的 价值 “每 一 个 国家 都 有 三 种 财富 , 即 物 质 财富 、 文 化 财富 和 生物 财富 .前 两 者 我 们 基本 了 解 ,因为 它们 是 目 常 生活 的 组 成 部 分 .生物 多 样 性 问题 的 实质 是 没有 给 予 生物 财富 以 足够 的 重视 。 这 是 一 个 重大 的 战略 性 失误 . 随 着 时 间 的 推移 ,这 次 失误 越 来 越 会 让 人 们 感到 居 异 ” —E.O. Wilson,1992 年 , 第 311 页 尽管 人 们 依赖 数 以 万 计 的 物种 获取 食物 、 住 房 、 药 品 及 其 他 必 不 可 少 的 物质 ,但 据 科 学 预示 生物 畔 的 未 知 部 分 还 蕴藏 着 更 大 的 潜力 。 在 全 球 环境 面临 各 种 不 利 改变 的 当今 ,掌握 更 多 的 物种 多 样 性 知 识 尤为 重要 。 这 些 知识 大 部 分 来 自 系 统 学 基础 研究 , 即 发 现 和 描述 新 物种 ,确定 物种 的 特征 及 与 其 他 物种 的 关系 ,按照 这 些 数据 进行 分 类 并 建立 预测 性 的 信息 查询 系统 。 由 此 可 见 , 对 于 试图 了 解 生命 多 样 性 .为 子孙 后 代 保 护 和 管理 生命 多 样 性 的 基础 科学 和 应 用 科学 研究 人 员 来 说 ,系统 学 知识 万 基础 之 基础 。 人 类 健康 世界 上 有 几 亿 人 在 蒙受 生物 引发 的 疾病 带 来 的 痛苦 .为 了 解除 这 些 疾 病 对 人 类 的 折磨 ,全 世界 每 年 投入 的 经 费 高 达 几 十 亿美 元 。 纵 观 世 界 上 所 有 的 疾病 ,目前 最 让 人 深恶痛绝 的 有 三 类 寄生 虫 ,它们 是 导致 痉 疾 的 原生 动物 .引发 日 本 血吸虫 病 的 血液 时 虫 及 造成 爱滋病 的 HIV 病毒 .此 外 ,世界 上 25%5 的 人 在 肠 内 寄生 有 影响 儿童 身体 和 智力 发 育 的 帼 虫 。 自 1979 年 以 来 ,细菌 中 有 270 个 新 属 和 大 约 1100 个 新 种 被 相继 描述 。 现 已 认识 的 病原 或 兼 性 病原 属 、 种 的 数量 在 不 断 增 加 。 没有 系统 学 这 门 科学 ,就 不 可 能 取得 对 付 这 些 疾病 的 进展 .系统 学 家 能 够 认识 .区 分 并 说 明 影响 人 类 健康 的 非 病 原 体 及 病原 体 的 特征 .这 些 生物 有 数 十 万 个 种 和 上 百 万 个 品系 ,其 中 包括 细菌 、 病 毒 、 真菌 .酵母 菌 、 原 生动 物 、 线 虫 .由 虫 . 扁 虫 . 丝 虫 .昆虫 . 昌 、 螨 、 蜂 蛛 、 蝎 .蜗牛 等 .仅仅 了 解 可 能 引发 疾 病 的 生物 这 还 不 够 ,我 们 还 要 把 一 个 类 群 中 的 所 有 已 知 物种 区 别 开 来 ,以 便 加 强 对 新 发 现 物种 的 了 解 ,确定 某 个 已 知 的 品系 或 物种 本 为 非 病 原 体 是 否 已 转变 成 病原 体 ( 见 专栏 1)。 掌握 致 病 生 物 的 进化 关系 对 提高 人 类 健康 水 平 同样 起 着 关键 的 作用 .通过 研究 疾病 载体 及 相关 的 非 疾病 载体 的 相似 性 , 便 能 预测 致 病 生 物 的 变化 趋势 和 发 现 新 的 病原 型 。 由 于 爱滋病 导致 的 免疫 率 乱 患者 人 数 不 断 增加 ,而 人 类 又 能 够 移植 器 官 、 医 治 重度 烧伤 和 延长 老人 及 瘤 症 患者 的 生命 ,因而 , 即 使 是 最 无 毒 的 细菌 和 病毒 也 有 可 能 危及 生命 的 安全 .尽管 人 们 有 抗生素 疫苗、 良好 的 卫生 条 件 和 安 全 的 食品 ,但 是 许多 传统 的 疾病 正在 复活 ,一 些 前 所 未 有 的 疾病 正在 出 现 。 大 量 曾 一 度 被 认为 是 非 病 原 体 的 物种 ,目前 已 经 从 人 类 病例 中 被 分 离 出 来 .事实 证 明 , 掌 握 全 部 生物 类 和 群 的 进化 关系 及 地 理 分 布 知识 ,对 于 了 解 病原 体 由 动物 转 至 人 类 的 过 程 和 发 现 某 些 病原 种 比 其 他 种 毒性 更 强 的 原因 起 着 关 键 的 作用 。 *。201。 “如 果 认 为 我 们 必须 在 服侍 人 类 和 服侍 环境 之 间作 出 选择 的 话 , 那 我 们 就 犯 了 一 个 危险 的 错误 。 两 个 目标 的 统一 必须 当 作 一 个 首要 问题 来 对 待 , 二 者 不 能 也 绝对 不 能 分 离开 来 。” —Orville Freeman, 美国 前 农业 部 长 ,1989 年 物种 的 利用 给 全 球 经 济 带 来 了 价值 数 万 亿美 元 的 效益 。 随 着 越 来 越 多 的 国家 编目 、 研 究 并 提出 对 本 国境 内 多 样 性 的 权利 时 ,关于 物种 的 利用 和 管理 的 国际 协议 和 条 约 逐 渐 在 受到 重视 。 发 现 和 描述 的 . 物种 越 多 ,对 其 分 布 及 与 别 的 物种 间 的 关系 了 解 得 越 详尽 ,那么 这 些 物 种 对 一 个 国家 的 经 济 能 作出 的 贡献 就 越 大 ,这 些 物 种 能 给 后 代 保 存 下 来 的 就 越 多 .2000 年 系统 学 议程 所 确定 的 研究 任务 已 经 为 获得 这 些 重要 的 知识 制订 了 计划 。 历史 表明 ,新 种 的 发 现 以 及 随后 的 特性 研究 ,往往 会 带 来 重大 的 经 济 效益 .系统 学 分 析 ,包括 物种 间 已 研究 认识 的 特性 的 比较 ,从 而 能 够 推测 新 种 的 特性 : 反 过 来 ,这 些 推测 又 能 更 有 效 、 更 可 靠 地 评定 这 些 新 种 的 潜在 经 济 价值 。 By 物 据 世 界 卫生 组 织 统计 ,人 类 为 药 用 目的 而 利用 的 植物 有 两 万 多 种 .事实 上 ,发 展 中 国家 有 80%% 的 人 仍然 依靠 传统 药物 作为 主要 的 疾病 治疗 (手段 ) 这些 药物 大 部 分 来 自 野 外 采集 的 植物 ,给 这 些 物 种 的 很 多 野生 种 群 带 来 了 很 大 的 压力 。 专栏 1 疙 疾 与 系统 学 : 既 救 命 又 省 钱 没有 遵循 寄生 虫 及 其 传播 媒介 的 准确 的 系统 学 知识 而 制定 的 疾病 控制 措施 ,只 会 造成 时 间 和 人 金 钱 的 浪费 。 闪 疾 就 是 一 例 。 JE PR HE Plasmodium 属 的 寄生 原生 动物 引起 的 。 在 该 属 四 个 会 侵 染 人 体 的 物种 中 ,PlLaszzodzzzz falciparum 造成 死亡 或 病态 的 危害 最 大 , 它 通过 蚊子 叮咬 而 传染 给 兰 椎 动物 。 能 携带 寄生 虫 的 蚊子 | 的 种 类 很 多 ,但 它们 的 分 布 和 传播 能 力 各 不 相同 。 据 世界 卫生 组 织 估计 ,全 世界 并 疾 患者 每 年 有 2 一 3 亿 例 ,大 约 一 百 万 例 患 者 因 病 死亡 ,其 中 多 数 为 儿童 。 六 十 年 代 , 许 多 科学 家 都 在 从 事 Anopheles gambiae 这 种 分 布 于 非洲 的 主要 传播 媒介 的 杀 虫 剂 抗 性 研究 . 几 十 个 品系 被 送 到 伦敦 进行 杀 虫 剂 和 杂交 试验 ,以 确定 其 抗 性 遗传 模式 。 大 量 的 杂交 种 不 能 再 生育 .在 研究 过 程 中 ,系统 学 家 发 现 一 个 被 认为 是 4. gambiae 的 种 实际 上 是 六 个 不 同 的 种 ,其 生物 学 特性 和 闪 疾 传播 能 力 显 然 各 不 相同 。 类 似 情 况 在 蚊子 中 还 重复 出 现 过 。 美 国 的 Anopheles quadrimaculatus, E\ FEW A. culicifacies 和 泰国 的 A. dirus 均 被 证 明 是 种 的 复合 体 ( 即 不 仅仅 是 一 个 物种 ) ,它们 传播 洗 疾 的 能 力 各 不 相同 。 “美国 药店 开 出 的 所 有 药方 中 ,四 分 之 一 是 从 植物 中 提取 的 物质 ,13% 来 自 微生物 ,另外 3 儿 强 来 自动 物 .也 就 是 说 ,40 儿 以 上 的 药 来 源 于 生物 .然而 ,这 些 药物 只 不 过 占 众 多 可 利用 中 的 极 小 部 分 。 —E. O. Wilson, ,1992 年 ,第 283 一 285 页 实践 证 明 ,在 筛选 有 药 效 的 成 分 时 ,如 果 选 用 传统 药物 所 利用 的 物种 ,其 成 功 机 遇 比 选用 同一 地 区 中 植物 随机 抽样 要 大 得 多 。 人 类 利用 动物 和 植物 的 能 力 , 是 各 地 人 民 与 自然 界 密切 相处 ,在 长 期 的 实践 .失败 过 程 中 经 过 不 断 总 结 形成 的 。 专 长 于 民族 生物 学 , 即 研究 人 们 利用 土生 土 长 动 植 物 的 系统 学 家 对 这 些 重 要 经 济 物种 的 描述 和 研究 起 着 主要 作用 .开展 人 类 利用 的 动物 .植物 和 微生物 的 民族 生 物 学 综合 调查 迫在眉睫 .记载 传统 人 类 社会 与 为 其 所 用 的 动 植 物 间 的 关系 ,包括 种 质保 护 , 是 系统 民 族 生 物 学 的 一 个 重要 研究 领域 。 分 类 系统 的 创造 是 系统 民族 生物 学 的 一 个 最 重要 的 贡献 .系统 民族 生物 学 的 民族 生物 区 系 遗 传 “OZ ,有 多 样 性 的 大 部 分 科研 工作 ,如 保存 .保护 .育种 .有 用 基因 的 探索 .生物 技术 等 ,都 随 着 近 缘 关系 的 决定 而 定 的 。 研 究 成 果 多 以 分 类 、 分 类 学 专著 或 系统 发 育 分 析 的 形式 在 科学 界 交流 。 这 些 研 究 可 提供 基础 的 生物 学 信息 ,如 物种 分 布 、 结 构 变 异 等 , 它们 对 驯化 种 和 野生 近 缘 种 的 研究 有 者 关键 的 作用 。 许多 发 现 新 药 的 例子 也 可 以 说 明 系 统 民族 生物 学 的 重要 性 ( 见 专栏 2)。 世界 上 用 有 花 植物 制造 的 药物 产值 达 数 十 亿美 元 。 然 而 这 项 财富 大 多 数 仅 来 自 一 小 部 分 物种 .与 25 万 种 有 花 植物 相 比 ,微生物 具有 更 大 的 多 样 性 ,它们 很 可 能 是 药物 和 其 他 生物 技术 产品 的 重要 来 源 (Bull 等 ,1992) 。 微 生物 药 中 最 著名 的 例子 是 由 Penazczllizzxz notatum 生产 的 盘 尼 西林 , 它 给 治疗 传染 病 的 药物 带 来 了 一 场 革命 。 寻找 微生物 来 源 新 药 的 工作 才刚 开展 。 微 生物 的 系统 发 育 和 分 类 能 促进 对 它们 相互 间 关 系 的 认 识 , 这 为 筛选 自然 界 的 大 量 物种 提供 了 可 预测 的 线路 图 .因此 ,系统 学 知识 对 微生物 新 药 的 发 现 具有 不 可 估量 的 作用 .遗憾 的 是 ,人 们 对 微生物 尤其 是 病毒 .细菌 和 真菌 的 系统 学 了 解 甚 少 , 上 百 万 的 物种 仍 有 待 发现 和 描述 ,多 数 类 群 间 的 关系 仍 有 竺 分析. 此 外 ,研究 许多 微生物 类 群 的 系统 学 家 也 不 断 减 少 。 这 种 状况 如 不 改变 ,人 类 便 会 失去 发 展 经 济 和 技术 的 许多 良机 (Hawksworth 和 Ritchie 1993), RE 系统 民族 生物 学 与 新 药 的 发 现 :马达 加 斯 加 的 几 个 例子 马达 加 斯 加 这 个 陆地 岛屿 上 有 1 万 3 千 多 种 植物 . 令 人 人 惊奇 的 是 ,这 个 岛屿 上 80%% 的 植物 都 是 特 有 种 。 通 过 研究 这 些 特 有 种 及 其 在 当地 医疗 体系 中 的 作用 而 开发 的 新 药 不 胜 枚 举 。 K # 4€ (Catharanthus rosexs) 是 其 中 最 著名 的 一 个 例子 .不 久 以 前 , 它 还 仅仅 是 人 们 花园 中 的 一 种 观赏 植物 .当地 不 少 人 把 它 当 作 一 种 民间 草药 来 治疗 糖尿 病 , 于 是 人 们 对 它 进一步 研究 ,以 期 从 中 找到 口服 胰岛 素 的 代用 品 。 虽 然 玫 瑰 红 草 长 春花 在 治疗 糖尿 病 方面 的 效用 尚未 得 到 证 实 , 但 它 的 提 取 物 却 发 现 具有 大 幅度 减少 实验 动物 白血球 计数 和 抑制 骨髓 活动 的 功效 。 根 据 上 述 观 察 结 果 , 类 们 终于 分 离 出 两 种 化 学 成 份 , 即 能 够 有 效 治 疗 白血病 的 长 春 碱 和 长 春 新 碱 . 自 从 这 种 药物 首次 进入 市 场 以 来 ,儿童 白血病 的 治愈 率 由 过 去 的 10%% 提 高 到 现在 的 95% 。 3e 7K JB (Rauwol fia) PA Bi FP, BY RE HB AR CR. serpentina) Al R. zoomzztorza ,它们 的 根 是 提取 几 种 生物 碱 或 制作 根 粉 的 原材料 .这 些 产 品 的 药物 制剂 可 用 来 治疗 高 血压 ,也 可 用 作 治疗 精神 紊乱 的 镇 静 剂 。 cio 问题 是 灭绝 的 速度 上 升 得 如 此 之 快 ,以 至 于 如 果 人 们 找到 一 种 具有 特殊 生物 活性 的 植物 , 很 可 能 当 你 去 时 已 发 现 其 生境 全 然 无 存 。 这 是 一 场 时 间 战 争 .” Michael Balick 纽约 植物 园 经 济 植物 研 究 所 所 长 农 业 ”世界 农业 的 发 展 有 赖 于 农业 研究 带 来 的 技术 进步 。 从 世界 范围 看 ,发 达 的 农业 体系 正 朝 着 减少 杀 虫 剂 、 化 肥 和 除草 剂 的 施用 量 ,加 强生 物 防 治 、 害 虫 综合 管 理 和 持续 性 农业 的 方向 发 展 *。 以 上 技术 强烈 依赖 于 有 关 害 虫 类 群 、 害 虫 的 植物 寄主 及 害虫 天 敌 的 系统 学 知识 .系统 学 信息 是 农业 管理 的 语言 和 预 测 基础 ,由 于 系统 学 信息 的 不 足 而 造成 搁浅 或 失败 的 项 目 多 不 胜 数 ( 见 专栏 3)。 随 着 对 非 杀 虫 剂 防 治 策略 的 作用 的 不 断 重 视 , 需 要 了 解 在 农业 生态 系统 中 起 重要 作用 的 各 种 各 样 的 生物 越 来 越 成 为 关键 问题 。 据 估计 ,有 用 的 生物 防治 因子 可 能 有 数 千 种 ,但 它们 均 未 被 科学 所 揭 示 。 因 此 ,要 发 挥 它们 的 经 济 作用 ,就 必须 首先 发 现 和 描述 这 些 生物 ,并 把 它们 纳入 分 类 系统 和 信息 系 统 。 如 果 有 一 些 生 物 , 它 们 在 农业 生态 系统 中 既 能 使 产量 提高 并 又 有 一 个 健康 的 环境 ,但 人 们 却 对 它 们 尚未 认识 ,或 与 别 的 生物 混淆 不 清 , 或 与 其 他 物种 的 关系 不 明 ,农业 发 展 势 必 会 受到 极 大 的 阻碍 。 es。 203 。 系统 学 研究 节省 数 十 亿美 元 : 几 个 生物 防治 事例 FE + Au tht 26 AR BA. HB Wt (cottony-cushion scale) 严 重 影响 了 加 利 福 尼 亚 的 柑 桔 产业 。 根 据 一 位 系 统 学 家 提供 的 信息 ,在 澳大利亚 进行 国外 考察 ,结果 发 现 并 引进 了 一 种 以 吹 棉 晶 为 食 的 球 虫 ,从 而 控 制 了 这 种 蛤 虫 的 危害 ,拯救 了 加 利 福 尼 亚 的 柑 桔 业 。 许多 年 来 ,生物 防治 专家 一 直 没 有 找到 对 加 利 福 尼 亚 红 介壳 虫 有 效 的 天 敌 。 一 位 介壳 虫 专家 应 邀 研究 这 种 昆虫 ,结果 发 现 它 实 际 上 是 三 个 不 同 的 相似 种 , 即 加 利 福 尼 亚 红 介壳 虫 、. 黄 蛤 和 紫 杉 明 。 其 后 ,研究 寄生 蜂 的 系统 学 家 发 现 , 正 是 因为 鉴定 失误 才 难 以 找到 红 介 壳 虫 的 天 敌 。 不 久 , 各 种 成 功 的 生物 防治 因子 相继 被 引入 。 了 解 有 害 种 的 原 产地 往往 会 给 寻找 有 效 生 物 防 治 因 子 提 供 很 大 的 帮助 。 甜 菜 叶 蝉 CCzrculzyer tenellus) 早先 被 认为 是 Eutettix 属 的 一 个 种 , 原 产 南美 洲 。 遗 憾 的 是 ,人 们 在 南美 洲 不 仅 没 有 发 现 防 治 因 子 ,还 浪费 了 大 量 的 时 间 和 精力 。 最 后 系统 学 家 发 现 该 种 其 实 属于 东 半 球 的 Circulifer 属 , 于 是 便 在 地 中 海地 区 找到 了 几 种 有 效 的 天 敌 , 并 引入 加 利 福 尼 亚 。 1974 年 , 扎 伊 尔 发 现 了 一 种 引进 的 粉 明 科 介壳 虫 。 这 种 害虫 每 年 给 西非 的 木薯 种 植 业 造成 近 14 亿美 元 的 损失 。 这 种 介壳 虫 被 描述 为 物种 Phenacoccus maazhoi ,于 是 人 们 开始 在 南美 北部 寻找 它 的 生物 防治 因子 。 在 没有 找到 任何 有 效 的 寄生 虫 后 ,一 位 粉 内 科 系统 学 家 又 重新 研究 ,结果 找到 了 一 个 与 上 述 种 非常 相近 的 种 Pherrexz ,主要 见于 南美 北部 ,而 P. manihoti 实际 上 分 布 在 较 南 部 .有 了 这 一 发 现 ,有 效 的 寄生 虫 便 很 快 被 找到 并 引入 非 洲 灾区 。 外 来 害虫 的 侵入 对 世界 农业 生产 最 具 破坏 力 。 不 幸 的 是 ,国际 贸易 量 的 增长 和 交通 网 络 的 飞速 发 展 增加 了 引入 新 害虫 的 可 能 性 大 多 数 国家 都 要 查验 人 境 的 商品 ,搜查 任何 外 来 的 传染 物 , 并 制定 相 应 的 入 境 管理 规定 .这些 措施 基本 上 依赖 于 系统 学 家 提供 的 信息 ,因为 任何 一 个 国家 都 不 可 能 有 完整 的 所 有 物种 的 编目 ,也 不 可 能 完全 了 解 某 种 被 查获 的 生物 是 否 分 布 于 本 国 。 再 者 ,多 数 重要 的 农业 类 群 大 都 确 乏 详尽 的 鉴定 材料 .缺乏 某 一 害虫 类 群 的 系统 学 信息 有 时 还 会 产生 一 些 特殊 问题 ,例如 , 烟 草 菠 蠕 虫 (budworm) 往 往 见于 来 自 中 美和 南美 的 查获 商品 。 芽 蠕虫 一 直 被 认为 只 有 三 个 种 ,但 近期 专 项 研究 表明 ,其 复合 体 由 十 二 个 不 同 的 型 组 成 。 各 个 国家 也 必须 制定 若干 规定 ,以 限制 从 某 些 国家 进口 某 些 特殊 的 农业 产品 .这 些 规定 都 必须 以 系统 学 知识 为 依据 ,同时 也 要 依靠 本 国 对 原 产 国 商品 中 出 现 的 所 有 植 食性 生物 .它们 是 否 有 害虫 的 潜 势 以 及 世界 分 布 的 了 解 程度 ( 见 专栏 4) 。 由 于 缺乏 足够 的 系统 学 知识 ,尤其 是 关于 有 害 物种 的 系统 学 知识 ,制定 这 些 重要 规定 的 科学 依据 往往 不 足 。 系统 学 信息 与 农产品 贸易 从 某 种 情况 上 讲 ,掌握 有 潜在 危害 的 生物 的 系统 学 知识 可 为 增加 商品 的 出 口 量 和 避免 严重 国际 贸易 事件 发 生 铺 平 道 路 .举例 说 明 ,加 拿 大 从 美国 进口 的 小 麦 中 带 有 一 种 黑 粉 菌 , 这 种 菌 最 初 被 鉴定 为 Neovossia indica , 一 种 极其 危险 的 外 来 病原 体 。 为 此 ,加 拿 大 作出 禁止 从 美国 进 口 小 麦 的 禁令 。 经 二 位 系统 学 家 研究 这 种 病菌 ,最 终 认 定 是 一 种 常见 于 大 米 的 物种 Tilleiia parclayaxa, 并 且 早 在 小 麦 运 到 同一 仓库 之 前 就 已 存在 , 正 是 由 于 这 项 极 小 的 系统 学 发 现 ,一 场 可 能 造成 重大 经 济 损失 的 国际 事件 才 得 以 平息 。 在 过 去 ,农业 项 目 提 倡 使 用 杀 虫 剂 和 化 肥 ,常常 给 环境 带 来 不 利 影响 .而 在 当今 , 随 着 害虫 管理 和 生物 防治 等 低 环 境 影响 策略 的 出 台 , 作 物种 质 需要 重新 发 掘 。 这 项 工作 要 求 详 细 地 了 解 世 界 珍贵 的 农 “204。 4 ee My A Oy BK FR 5 BBE UN th PRE ESE HAS $8 hill SG RE KO A RS UB PS TE AE SF fp AE 物 的 基因 移植 到 另 一 种 生物 ,因此 ,保持 物种 多 样 性 变 得 尤其 重要 ,因为 任何 生物 的 遗传 材料 都 可 能 有 益 于 农业 体系 。 系 统 学 知识 则 能 使 科学 家 更 好 地 了 解 作 物 的 抗 病情 况 ,从 而 在 特定 情况 下 选用 最 佳 的 遗传 原 种 ( 见 专栏 5)。 专栏 5 系统 学 发 现 与 作物 改良 :两 个 事例 玉米 1977 年 ,一 位 叫 Rafael Guzman 的 墨西哥 植物 系统 学 家 重新 发 现 了 (在 两 块 玉米 大 田间 的 水 渠 HAG AM Zea perexzzs ,一 种 珍贵 的 多 年 生 玉 米 草 , 即 野 玉 米 。Zea perennis 是 人 类 三 种 最 主要 农 作物 (其 他 两 种 为 水 稻 和 小 麦 ) 之 一 的 玉米 (Zea mays) 的 一 个 近 缘 种 .不 久 以 后 ,Guzman 又 在 附近 山 区 的 云雾 林 中 发 现 了 这 种 多 年 生 玉 米 草 的 另外 一 个 种 ,并 把 种 籽 送 给 玉米 系统 学 家 Hugh lltis 和 John Doebley 研究 .这 些 种 籽 所 产生 的 植物 结果 是 一 个 鲜 为 人 知 的 种 Z. diploperennis, 5 Z. peren- nis 不 同 的 是 ,这 种 玉米 的 染色 体 数目 与 家 种 玉米 恰好 相同 ,很 容易 与 家 种 玉米 杂交 。 更 令 人 感到 惊 奇 的 是 ,Z._ diploperennis 可 以 抵抗 家 种 玉米 (Z. mays) 常 见 的 七 种 病毒 病 , 同 时 某 些 对 病毒 的 抗 性 目前 可 以 移植 到 家 种 玉米 .迄今 为 止 , 已 经 有 四 个 抗 病毒 玉米 品种 进行 了 商业 性 种 植 . 世 界 玉米 的 年 产值 近 600 亿 美元 ,这 项 发 现 的 潜在 经 济 价值 可 见 一 斑 。 上 述 事例 的 另 一 方面 也 值得 引起 人 们 的 重视 。 这 个 新 种 发 现 于 生物 多 样 性 丰富 的 墨西哥 西南 部 地 区 ,但 是 森林 砍伐 、 牧 业 和 农业 正在 迅速 破坏 着 这 个 地 区 的 森林 。 如 果 不 是 Sierra de Manantlan #% 个 山区 被 确定 为 生物 圈 保 护 区 ,这 种 珍贵 植物 所 剩 的 几 个 种 群 现在 可 能 已 经 绝 灭 .还 有 ,新 种 的 发 现 者 如 果 不 是 一 位 杰出 的 草本 植物 系统 学 家 ,或 者 他 没有 把 种 籽 送 给 分 类 困难 的 Zea 属 方面 的 专家 , 这 一 珍稀 物种 或 许 就 会 为 人 们 所 忽略 .以 上 事实 进一步 说 明了 培养 一 大 批 优 秀 的 系统 学 家 ,增强 探 索 、 记 录 和 保存 世界 上 现存 生物 区 系 多 样 性 力量 的 重要 作用 。 著 匣 1962 年 ,Hugh Iltis 和 Don Ugent 在 安第斯 山 探险 时 采集 到 一 千 多 号 植物 标本 ,包括 一 个 野生 番 茄 新 种 的 种 籽 。 新 种 与 家 种 番茄 杂交 后 ,可 增加 杂种 果实 的 可 溶性 固体 含量 .这 项 成 果 每 年 可 为 番茄 种 植 业 创造 800 万 美元 的 效益 。 林 业 美国 的 林地 面积 有 230 万 英亩 。 虽 然 木 材 产品 的 产值 高 达 1360 亿 美元 ,与 其 相 比 , 林 副 产品 及 娱 乐 ` 水 资源 等 非 商品 利用 所 创造 的 价值 则 要 更 大 些 。 随 着 人 们 对 森林 价值 认识 的 转变 ,森林 管理 出 现 了 重大 的 变革 。 新 型 的 管理 哲学 促使 人 们 去 保护 老龄 林 , 并 寄 更 大 希望 于 非 木 材 物 种 。 与 传统 的 森林 管理 方式 相 比 ,森林 的 长 期 管理 面临 着 一 连 串 的 问题 .尽管 大 多 数 森林 管理 者 能 够 测定 森林 物理 和 化 学 性 状 ,监测 动 植物 区 系 变化 ,但 他 们 仍然 缺乏 衡量 森林 系统 生物 多 样 性 的 专门 知识 .有 限 的 无 脊椎 动物 及 微生物 系统 学 知识 使 森林 濒临 险 境 ,在 控制 引进 的 有 害 节肢 动物 和 病原 体 方面 尤其 如 此 。 例 如 ,1992 年 不 列 颠 哥伦比亚 发 现 了 一 种 奇异 的 昆虫 。 由 于 没有 这 方面 的 专家 ,等 鉴定 出 这 种 可 怕 的 外 来 甲虫 Bu ptestis hemmoradialis 时 已 经 过 了 一 年 的 时 间 。 在 此 期 间 , 这 种 昆虫 已 经 过 了 两 个 生长 季节 。 这 么 一 来 ,本 来 可 以 在 小 范围 内 采取 的 灭 杀 措施 ,只 好 扩展 到 大 范围 内 进行 。 像 这 样 的 时 间 耽 搁 不 仅 降低 了 灭 虫 效果 ,而且 还 增加 了 灭 虫 的 经 费 开 支 。 渔 业 渔业 产品 是 世界 上 和 蛋白质 的 主要 来 源 (Norse 1993) .因此 ,区 分 普通 鱼 类 和 具 商 业 价 值 的 海味 对 自然 资源 管理 和 为 水 产 养 殖 物 种 的 选择 有 着 重要 的 作用 ( 见 专栏 6)。 此 外 系统 学 信息 在 国内 法 及 国际 法 规 , 条 约 和 公约 的 执行 等 政策 问题 上 也 同等 重要 。 “OO 非 本 地 种 的 引进 极 有 可 能 给 水 生生 境 带 来 严重 的 危害 .人们 往往 认为 一 些 外 来 种 有 益 而 故意 将 其 引入 ,不 料 后 果 最 为 严重 。 不 少 水 生物 种 通过 栖 居 船体 或 水 舱 而 无 意 被 引入 .这些 引进 的 物种 大 部 分 会 在 经 济 上 给 土生 种 带 来 严重 的 损失 .再 则 ,引进 种 还 会 携带 许多 寄生 虫 和 病原 体系 统 学 的 研究 对 准确 鉴定 引进 种 及 其 寄生 虫 和 病原 体 有 着 不 可 磨灭 的 贡献 ,是 制定 有 效 管理 策略 的 理论 基础 。 系统 学 研究 提高 渔业 产量 :两 个 事例 正确 鉴定 目标 物种 把 系统 学 与 渔业 也 联系 到 了 一 起 .太平 洋 东 北部 的 狭 鳃 (T7Heragra chnalcosgrazz7z4) 捕 捞 业 是 世界 上 最 大 、 创 造 经 济 价值 最 高 的 捕捞 对 象 之 一 .至 二 十 世纪 八 十 年 代 , 狭 鳃 已 经 成 为 世界 渔业 中 捕捞 量 最 大 的 鱼 种 .然而 , 狭 鳃 只 不 过 是 东北 太平 洋 地 区 几 种 近 缘 鱼 类 中 的 一 种 ,不 和 久 前 其 早期 生活 史 还 鲜 为 人 知 ,部 分 原因 在 于 其 幼体 的 野外 样品 难 与 其 他 鱼 类 难以 辨别 。 在 过 去 的 十 年 中 ,系统 学 的 研究 结果 突破 了 这 一 难关 ,能 够 准确 地 分 辨 出 不 同 的 幼体 ,使 得 通过 增加 幼 体 数量 提高 可 捕捞 鱼 类 产量 之 计划 得 以 实施 .系统 学 家 还 通过 随 船 服务 和 举办 管理 人 员 分 类 培训 班 ,为 这 项 捕 拓 业 提供 后 续 服 务 。 要 维持 和 扩大 鱼 类 可 捕捞 种 群 的 规模 ,准确 无 误 的 系统 学 信息 必 不 可 少 。 例 如 ,有 关 西 班 牙 铺 的 数据 都 以 巴西 种 群 为 根据 ,渔业 人 员 最 初 打算 利用 这 一 信息 来 管理 墨西哥 湾 和 美国 东海 岸 的 种 群 。 然而 系统 学 研究 证 明 , 巴 西 种 群 为 本 brasiliensis ,与 北美 种 群 ,Scoxzperomzozrzs maculatus 截 然 不 同 。 由 于 两 个 种 的 生物 学 特性 各 异 , 像 南方 种 那样 进行 管理 很 可 能 会 导致 失败 。 了 解 和 保护 地 球 的 生命 支持 系统 地 球 表面 的 环境 与 有 生命 的 生物 间 的 关系 十 分 密切 ,并 随时 间 的 推移 而 改变 。 地 球 上 数 百 万 的 物 种 不 仅 相互 关联 ,与 周围 的 环境 也 息息相关 ,最 终 形成 了 一 个 维持 生命 存在 的 错综复杂 的 生态 网 络 。 这 种 关系 的 产物 免费 为 我 们 提供 了 清洁 的 空气 .水 .肥沃 的 土壤 及 调节 地 球 的 地 球 化 学 循环 (基本 上 通过 微生物 作用 完成 ) 。 绿 色 植 物 能 吸收 太阳 的 能 量 , 并 把 能 量 转化 给 别 的 生物 .世界 上 的 植被 特别 是 热带 雨林 再 把 水 循环 到 大 气 , 从 而 控制 着 气候 的 变化 。 随 着 人 口 的 暴涨 及 全 球 变化 的 加 快 ,地 球 的 生命 支持 系统 日 益 受 到 威胁 .人 类 从 世界 自然 资源 获 取 食 物 、 住 房 \ 衣 物 和 燃料 的 同时 ,也 给 环境 带 来 了 严重 的 影响 , 像 森林 大 面积 砍伐 .空气 污染 \ 水 污 染 、 全 球 变 暖 等 。 系统 学 的 知识 在 监测 这 种 全 球 变化 方面 起 到 最 基本 的 作用 .收藏 的 标本 是 生物 群落 和 生态 系统 变更 的 见证 ,记载 着 长 时 间 内 环境 对 所 受 压 力 的 反应 。 同 样 是 这 些 标本 ,由 于 包含 不 同 的 物种 存在 和 鉴定 的 基本 科学 证 据 , 因 此 也 是 物种 灭绝 的 最 可 靠 记 载 . 对 下 个 世纪 物种 灭绝 的 推测 ,主要 依靠 森林 砍伐 和 生境 破坏 方面 的 综合 信息 .没有 物种 存在 和 分 布 的 有 完整 记录 的 科学 知识 ,就 没有 生态 变化 和 物种 灭绝 的 准确 评估 .只 有 系统 学 才能 可 靠 地 衡量 生物 多 样 性 的 危机 程度 。 另 一 方面 ,正确 鉴定 物种 对 监测 全 球 变化 也 十 分 重要 .所 有 的 生物 群落 都 包含 一 些 对 环境 变化 特 别 敏感 的 物种 。 比 如 , 某 些 蛙 类 对 空气 质量 的 变化 异常 敏感 ;在 水 生 群 落 中 , 某 些 鱼 类 对 水 纯度 变化 十 分 敏感 .为 此 ,科学 家 已 越 来 越 多 地 利用 这 些 指示 种 来 考察 全 球 变化 对 自然 群落 的 影响 ,从 而 实现 监 测 全 球 变化 的 目的 。 只 有 准确 鉴定 和 描述 这 些 物种 ,掌握 其 分 布 及 近 缘 种 的 知识 ,才能 够 开展 这 些 监 测 活动 。 世界 上 许多 生境 和 生态 系统 都 生活 着 成 千 上 万 的 有 着 极其 复杂 作用 关系 的 物种 .生态 学 家 和 资 源 管 理 人 员 进 行 这 些 相互 关系 的 动态 研究 时 ,由 于 对 即使 是 最 普通 物种 的 鉴定 和 分 布 的 认识 都 还 存 在 着 缺陷 ,这 些 生境 和 生态 系统 的 基本 描述 当然 不 可 能 全 面 。 这 就 要 求 开 展 深 入 的 系统 学 研究 ,描述 和 鉴定 地 球 众 多 生态 群落 中 生存 的 物种 .这些 信 息 对 提供 评定 环境 压力 所 依据 的 基 低 数据 至 关 重 要 。 系统 学 对 自然 资源 的 管理 和 保护 同样 有 重要 作用 。 保 护 区 生物 多 样 性 的 保护 管理 人 员 需 要 对 物 种 作 鉴 定 并 了 解 其 地 理 分 布 , 为 有 效 管 理 策略 的 制定 和 实施 提供 依据 .系统 学 则 为 物种 的 鉴定 多样 性 的 评价 以 及 需要 特别 保护 的 物种 的 确定 提供 了 理论 基础 .此 外 ,系统 学 信息 与 保护 区 和 开发 区 的 选 。206。 arta sede tinny sm 址 和 规划 .它们 与 地 方 和 国家 法 规 的 关系 的 评估 ,都 有 着 紧密 的 联系 。 有 效 管理 动 植物 国际 贸易 也 同 样 需要 精确 的 系统 学 资料 这些 资料 还 直接 有 利于 一 些 像 濒危 野生 动 植物 种 国际 贸易 公约 (CITES) 的 国际 性 条 约 和 公约 的 执行 和 实施 。 提高 日 常生 活 的 质量 生物 的 多 样 性 有 助 于 我 们 去 理解 人 类 意识 和 智力 的 某 些 方面 。 对 自然 环境 的 宁静 和 舒适 的 追求 是 人 类 的 共性 ,这 就 是 许多 宗教 道德 文化 为 什么 具有 保护 和 尊敬 自然 环境 信仰 的 原因 .人 类 能 够 使 其 他 物种 灭绝 ,而 在 伦理 道德 上 ,人 们 普遍 认为 应 肩负 起 阻止 这 种 悲剧 发 生 的 责任 。 这 正 像 Ehrlich 和 Ehrlich (1992 ,第 220 页 ) 指 出 的 那样 , 我 们 认为 ,如 果 大 多 数 人 没有 保护 生物 多 样 性 的 观念 ,那么 这 个 问题 就 不 可 能 得 到 解决 。 纵 观 人 类 历史 ,人 对 其 他 物种 显示 出 极度 的 好 奇 心 , 并 为 其 美学 价值 所 倾倒 。. 人 类 与 自然 的 这 种 联系 在 所 有 民族 中 普遍 存在 ,并 体现 于 对 其 他 物种 的 态度 ,尤其 是 园艺 业 、 宠 物 饲 养 .野生 动物 和 鸟 的 观赏 等 活动 之 中 。 对 其 它 物种 的 美学 和 情感 依托 的 同时 ,还 为 许多 人 创造 了 巨大 的 经 济 效益 ,尤其 在 自然 旅游 和 标本 贸易 这 两 个 方面 。 旅游 业 每 年 创造 的 价值 达 2500 亿 美元 。 如 果 把 观赏 其 他 物种 连带 的 旅行 活动 计 和 人 在 内 ,上 述 收益 中 有 将 近 20%% 来 源 于 生态 或 自然 旅游 .不 少 国家 国民 生产 总 值 的 大 部 分 或 部 分 来 自生 态 旅游 ,其 中 单 是 某 些 物种 就 创造 了 巨额 收入 .例如 在 东非 ,肯尼亚 Amboseli 公园 的 一 头 狮子 十 五 年 内 可 创汇 50 万 美元 ,所 有 的 非洲 象 每 年 创汇 60 万 美元 。 如 果 计 人 此 类 自然 区 域 各 项 配套 产业 的 盘 利 ,这 项 收入 在 全 世界 可 达 几 百 亿美 元 ( 见 专栏 7) 。 专栏 7 系统 学 与 生态 旅游 系统 学 研究 对 生态 旅游 业 的 贡献 重大 .系统 学 方面 的 出 版 物 ,例如 修订 版 .图解 专著 、 纺 目 、 标 本 等 ,为 野外 向 导 、 旅 行 向 导 、 电 影 、 录 像 、 录 音 及 其 他 宣传 手段 提供 了 科学 的 背景 材料 。 上 千年 来 ,人 类 不 论 生 存在 哪里 ,都 始终 和 其 他 物种 的 驯化 种 植 打 着 交道 .当今 驯养 和 栽培 的 动 植 物 已 有 几 万 种 ,其 繁殖 和 贸易 的 商业 价值 有 几 十 亿美 元 (CGroombridge 1992) 。 举 例 说 明 , 仅 英 国 就 栽培 有 3000 多 种 用 作 装 饰 的 植物 ;全 世界 有 贸易 记录 的 兰花 种 类 超过 5000 种 .从 国际 商业 范 栈 来 讲 , 像 鸟 类 、 疏 行 动物 、 蛙 类 、 热 带鱼 类 、 蝴 蝶 、 最 蛛 等 动物 的 出 口 每 年 可 创造 几 亿美 元 的 效益 。 系 统 学 对 监测 和 管理 世界 自然 资源 的 重大 作用 表现 在 它 提 供 了 准确 的 识别 材料 图解 以 及 物种 分 布 信息 。 世界 上 大 量 的 动 植物 贸易 对 其 自然 种 群 产 生 了 极 大 的 压力 ,尤其 是 从 野外 直接 猎取 。 由 于 许多 物种 形态 的 相似 ,因此 ,有 效 地 监测 物种 和 执行 法 律 必须 依靠 物种 的 准确 鉴别 。 加 强 科学 研究 系统 学 构 画 了 一 个 总 体 框架 ,使 生物 学 的 研究 成 果 在 这 个 框架 内 得 以 整理 和 交流 。 比 较 两 个 或 两 个 以 上 物种 的 生物 学 研究 ,或 针对 某 一 物种 但 其 研究 成 果 最 终 会 被 对 其 它 种 有 兴趣 的 生物 学 家 考虑 的 生物 学 研究 ,都 或 多 或 少 地 借鉴 系统 学 的 研究 结果 .系统 学 研究 的 结果 对 选择 研究 系统 和 评价 一 些 有 意义 的 生物 学 现象 的 普遍 性 也 有 重要 的 作用 。 通过 分 析 物 种 关系 而 产生 的 系统 发 育 树 包 含 着 对 血统 (共同 祖先 )、 长 期 的 特征 变化 及 地 理 分 布 (历史 生物 地 理学 ) 变 化 的 假设 .理论 上 讲 ,在 演化 世代 期 所 发 生 的 所 有 生物 学 变化 都 能 在 系统 发 育 树 中 体现 出 来 .近年 来 ,由 系统 学 家 提出 来 的 以 系统 发 育 假设 为 依据 的 严 廊 的 比较 研究 法 得 到 了 发 展 , 用 来 研究 和 解释 一 系列 生物 学 现象 ,例如 寄生 物 及 寄主 的 生物 地 理学 和 协同 进化 ,生态 学 和 行为 学 的 历史 变迁 等 (Brooks 和 McClennan 1991) .与 此 同时 ,系统 发 育 假设 也 成 为 研究 适应 、 物 种 形成 、 灭 绝 等 基本 进化 过 程 的 理论 基础 。 2000 年 系统 学 议程 的 任务 2000 年 系统 学 议程 制订 生物 圈 计 划 系统 学 知识 的 基本 用 户 : 1. 物种 的 发 现 和 编目 =a . 医疗 和 保健 预测 性 分 类 和 数据 库 2 比较 物种 并 推测 LUTE SSA . 生物 技术 系统 发 育 史 ye . 农业 和 渔业 3. 利用 系统 发 育 及 由 . 林产 工业 此 产生 的 分 类 来 结 学 知识 | Le . 保护 及 资源 管理 者 合 基础 和 应 用 生物 学 . 生态 旅游 4. 提供 可 持续 利用 生物 . 基础 生物 科学 多 样 性 的 基本 数据 第 一 项 任务 :全球 物 种 多 样 性 的 发 现 . 描 述 和 编目 生物 圈 物 种 的 发 现 . 摘 述 和 编目 是 人 类 用 智慧 管理 生物 圈 的 一 个 重要 贡献 .由 于 许多 物种 过 于 微 小 ,其 研究 十 分 困难 ,造成 世界 各 地 生物 多 样 性 的 了 解 甚 少 。 璧 如 说 ,世界 上 任何 一 处 普通 庭院 都 生存 有 许多 物种 ,将 这 些 物 种 逐一 列 出 几乎 不 大 可 能 ,更 何况 比 它 复杂 得 多 的 生态 系统 。 迄今 为 止 , 系 统 学 家 大 约 已 经 描述 了 140 万 种 生物 ,其 中 大 部 分 是 昆虫 。 据 推测 ,尚未 发 现 和 描述 的 物种 仍 有 1 千 万 到 一 亿 种 ( 见 专栏 8)。 , 有 待 了 解 的 物种 的 数量 多 得 如 此 令 人 吃惊 ,这 似乎 又 与 我 们 在 日 常生 活 中 所 接触 到 的 少数 树木 、 哺乳 动物 、 鸟 类 、 蝴 蝶 及 其 他 常见 物种 大 有 出 人。 那么 就 去 想象 一 下 大 片 的 雨林 ,那里 仅 在 一 棵 树 上 就 能 发 现 几 百 种 昆虫 ,在 一 小 块 森 林 就 生存 有 几 百 个 不 同 的 树种 , 仅 在 几 立 方 英尺 的 土壤 和 地 表 腐 叶 中 就 会 生活 着 上 千 种 微小 的 螨 、 线 虫 \ 真 菌 和 微生物 。 。208。 物种 数量 知 多 少 ? 几 个 事例 已 描述 物种 的 数量 《有 竺 发 现 物种 的 估量 ST 约 50 万 a 40— 30077 7A 100—150 Jr 4 万 10— 70% 4 万 20781 = TF post 30— 5077 sp] 50—1004 204 1573 75—10037 8004 —14Z 5| A Groombridge(1992) 人 类 对 全 球 环境 造成 的 压力 ,迫切 要 求 尽快 掌握 世界 生物 多 样 性 的 知识 。 这 项 工作 要 求 我 们 加 大 探索 地 球 的 力度 ,汇集 这 些 物 种 的 样本 ,仔细 分 析 发 现 的 标本 ,以 准确 判断 它们 与 已 知 物 种 的 区 别 。 要 实现 此 项 目的 ,就 必须 支持 对 地 球 生境 开展 综合 性 的 考察 和 编目 以 及 对 收藏 标本 的 研究 工作 。 今 后 的 几 十 年 中 ,地 球 五 分 之 一 之 多 的 物种 行将 灭绝 ;但 目前 对 全 球 生物 资源 的 编目 远 远 不 够 ,难以 提供 物 种 多 样 性 的 信息 .物种 多 样 性 充满 活力 ,可 推动 世界 走向 一 个 可 持续 发 展 的 未 来 。 本 项 任务 中 ,应 优先 考虑 以 下 几 个 方面 的 工作 : 1. 调查 海洋 、 陆 地 和 淡水 生态 系统 ,获得 全 球 物种 多 样 性 的 综合 性 知识 ; 2. 确定 这 些 物种 的 地 理 分 布 和 时 间 分 布 ; 3. 发 现 、 描 述 和 编目 受 威胁 及 濒危 生态 系统 中 生存 的 物种 ; 4. 把 了 解 最 少 的 生物 类 群 作 为 目标 ; 5. 对 能 够 维持 全 世界 各 种 生态 系统 的 功能 及 完整 性 .促进 人 类 健康 .改善 人 类 食物 来 源 的 关键 类 群 进行 编目 。 全 球 物种 编目 的 作用 1. 能 推动 物种 的 发 现 和 分 类 ,综合 有 关 物 种 的 信息 并 编 和 人 数据库 ,便于 快速 查询 。 2. 能 获得 世界 上 很 多 生态 系统 内 物种 多 样 性 、 分 布 、 特 性 方面 的 信息 。 3. 能 进行 本 底 评估 ,对 全 球 变化 进行 长 期 监测 和 分 析 。 4. 能 发 现 新 的 生物 资源 。 基于 科学 、 经 济 和 伦理 上 的 原因 ,我们 必须 阐述 和 了 解 物 种 多 样 性 的 重要 性 ,以 免 为 之 过 晚 .本 项 任务 的 效益 远 远大 于 迎接 生物 多 样 性 危机 之 挑战 所 需要 的 投资 数额 .我 们 没有 比 这 更 大 的 科学 举措 , 也 没有 比 这 更 好 的 机 会 。 第 二 项 任务 :分 析 这 个 全 球 发 现 计 划 获 得 的 信息 , 并 将 其 融合 于 一 个 能 反映 生命 史 的 预测 性 分 类 系统 2000 年 系统 学 议程 的 第 一 项 研究 任务 包含 着 一 个 生物 多 样 性 最 基本 的 问题 :哪些 物种 与 我 们 共 同 栖 上 县 地 球 ? 除 此 之 外 ,系统 学 家 还 有 另外 一 个 研究 目标 ,这 就 是 记录 物种 的 特性 ,综合 生物 学 其 他 领 ”209。 = 18° 14 10 a 13 11 各 种 生物 的 大 小 代表 其 主要 分 类 单元 已 描述 物种 的 数量 , 单位 尺寸 :Dj= 约 1 千 个 已 描述 的 种 分 类 单元 1 原核 生物 界 ( 细 菌 、 蓝 绿 淋 ) (水 母 .珊瑚 、 梢 子 母 ) 14 非 昆虫 节肢 动物 门 2A 8 FG hl ( me & ) (8 HOH .甲壳 动物 等 ) 3 RK 9 线形 动物 门 (线虫 ) 15 鱼 纲 ( 鱼 类 ) 4 植物 界 (多 细胞 植物 ) 10 环节 动物 门 ( 虹 旭 等 ) 16 两 栖 岗 (两 栖 动物 ) 5 原生 动物 门 11 软体 动物 门 ( 软 体 动物 ) 17 爬行 纲 ( 爬 行动 物 ) 6 多 和 孔 动 物 门 (海绵 ) 12 RR Ath (i ZF) 18 f (4 #) 7 腔 肠 动物 门 13 昆虫 纲 19 哺乳 类 (哺乳 动物 ) 插图 :Frances L. Faweett, 4 #:Q. D. Wheeler, 1990, 美国 昆虫 学 会 年 刊 83:1031- 1047. 物种 图 是 一 幅 想 象 的 景观 。 图 上 生物 的 大 小 与 其 代表 类 和 群 的 物种 数量 成 正比 。 这 些 数量 还 不 够 准确 ,许多 物种 尚未 被 发 现 或 描述 ,对 大 部 分 物种 的 系统 发 育 关 系 也 了 解 其 少 。 例 如 昆虫 (甲虫 ) 以 迄今 描述 的 95 万 种 为 准 ,但 据 昆 虫 学 家 估计 可 能 有 1 千 万 种 以 上 。 图 中 涉及 的 其 他 类 群 如 爬行 动物 和 许多 无 脊 椎 动物 的 分 类 单元 ,可 能 未 按 其 自然 类 群 组 合 , 也 就 是 说 它 门 可 能 不 具有 一 个 独特 的 共同 祖先 。 随 着 物种 的 描述 、 其 间 关系 的 穴 析 和 分 类 对 系统 发 育 的 反映 ,本 图 将 全 面 .形象 地 体现 生物 多 样 性 , 域 的 数据 ,并 为 解释 生物 学 信息 提出 一 个 理论 框架 .仅仅 具 备 一 份 物种 的 名 录 并 不 能 得 到 整理 所 掌握 知识 的 一 个 预测 性 框架 。 永 续 利 用 地 球 的 生物 多 样 性 ,预测 的 准确 性 十 分 重要 .事实 上 ,系统 学 家 已 经 掌握 了 一 套 整 理 生 物 多 样 性 知识 的 科学 依据 ,其 中 包括 通过 了 解 物种 间 血 缘 关 系 或 系统 发 育 关 系 而 产生 的 分 类 系统 ( 见 专栏 9) 。 现 生 物种 是 进化 多 样 化 慢 长 历史 的 最 终 产 物 . 进 化 史上 共同 祖先 和 相关 性 之 独特 模式 是 建立 物 种 系统 发 育 的 基础 .按照 这 种 系统 发 育 遗 产 进行 的 分 类 称 为 自然 分 类 。 物种 的 知识 是 按照 生物 系统 发 育 分 类 进行 整理 的 。 获 得 这 些 知识 能 使 科学 家 们 推断 有 特殊 科学 价值 或 社会 价值 的 物种 及 其 特性 ,并 有 利于 创造 保存 这 些 知识 的 有 效 的 信息 系统 ( 见 专栏 10)。 这 些 知 识 还 将 推动 新 的 多 学 科研 究 .按照 自然 分 类 的 理论 框架 储存 和 查询 信息 ,能 够 更 有 效 更 经 济 地 利用 物 种 及 其 生境 的 知识 ( 见 专栏 11)。 专栏 9 系统 发 育 知识 使 基础 生物 学 与 应 用 生物 学 相 结 合 分 析 系 统 发 育 关系 是 一 项 综合 性 的 工作 ,可 把 它 比 作 是 汇集 各 研究 领域 数据 的 一 个 总 成 .这 些 研究 领域 包括 大 解剖 和 显 微 解剖 学 、 发 生生 物 学 、 遗 传 学 .分子 生 物 学 .比较 生理 学 .地质 学 .古生物 学 .生态 学 行为 学 以 及 生物 地 理学 .一 项 研究 中 最 后 采用 的 数据 取决 于 所 研究 生物 的 种 类 、 与 这 些 生物 有 关 的 知识 的 多 少 以 及 不 同类 型 的 数据 对 确定 种 间 关 系 所 起 作用 的 大 小 。 系统 学 家 把 各 种 生物 特征 的 相似 性 归结 到 等 级 模式 之 中 ,以 反映 生物 的 系统 发 育 史 。 这 样 , 猫 类 物种 具有 的 相似 性 在 能 类 物种 中 则 没有 ; 像 猫 类 和 能 类 的 食肉 动物 所 具备 的 相似 性 ,其 他 哺乳 动物 中 也 不 存在 。 更 广泛 一 些 , 所 有 哺乳 动物 具有 的 特征 ,如 毛皮 和 乳腺 等 ,其 他 肴 椎 动物 都 没有 , 依 此 类 推 , 直 到 包括 所 有 生命 类 群 .由 此 ,掌握 这 种 历史 等 级 使 系统 学 家 能 够 准确 地 预测 没有 仔细 研究 过 的 物种 的 特征 。 这 种 推测 有 着 重大 的 经 济 意 义 。 从 鲜 为 人 知 的 物种 中 寻找 新 的 活性 药物 化 合 物 就 是 其 中 一 例 ( 见 专栏 11)。 自然 分 类 如 何 进行 预测 正 像 物 种 特征 比较 研究 可 以 揭示 种 阅 进 化 关系 那样 ,进化 关系 也 可 用 所 谓 的 自然 分 类 清楚 地 表 示 出 来 .物种 间 的 关系 划 有 等 级 ,其 分 类 也 是 如 此 。 这 种 关系 按照 十 八 世纪 瑞典 分 类 学 家 卡尔 * 林 奈 的 姓名 命名 , 称 为 林 奈 等 级 ,包括 种 、 属 .科目 、 纲 . 门 和 界 . 照 此 分 类 ,所 有 哺乳 动物 都 属于 哺乳 纲 , 其 中 包括 食肉 目 。 食 肉 目 又 包括 能 类 和 猫 类 ,分 别 属于 驴 科 和 猫 科 。 猫 类 被 划分 在 猫 科 猫 属 Panthera ( 注 : 仅 一 部 分 猫 类 划分 在 这 个 属 ) ,这 一 属 内 还 包括 虎 , 它 的 学 名 (拉丁 名 ) 为 Panthera tigris . 3X #£ Th 特 的 名 称 好 比 一 种 科学 的 语言 ,不 仅 便于 交流 ,而且 也 便于 储存 任何 生物 类 群 的 信息 。 由 此 可 想 而 知 ,按照 这 种 等 级 列 出 的 物种 名 单 比 按照 字母 顺序 列 出 的 名 单 更 能 预测 物种 的 特 征 . 因 此 ,一 种 了 解 甚 少 的 猫 科 动 物 可 以 预测 它 具 备 其 他 猫 科 动物 的 许多 特征 、 食 肉 动 物 的 一 些 特 征 和 所 有 哺乳 动物 的 部 分 特征 .按照 字母 顺序 列 出 的 名 单 ,或 没有 准确 反映 种 间 关 系 的 等 级 分 类 名 单 , 则 不 具备 这 种 推测 功能 。 上 述 简单 事例 在 人 类 应 用 物种 知识 方面 具有 深远 的 意义 .假如 为 增强 对 物种 生物 学 特性 的 预测 能 力 , 把 这 种 知识 聚集 在 数据 库 内 ,从 此 便 能 更 有 效 、 更 经 济 地 利用 这 些 特性 的 话 ,我 们 就 会 在 自然 分 类 的 理论 框架 内 储存 和 查询 这 些 知 识 。 这 进一步 突出 了 发 现 所 有 物种 系统 发 育 关系 的 重要 性 。 分 类 的 预测 价值 :紫杉醇 与 癌症 天 然 产 品 紫杉醇 产 自 短 叶 紫 杉 (Tazrus brevifolia) 的 皮 , 经 证 实 是 一 种 治疗 卵巢 癌 和 乳腺 瘤 的 强 效 药 剂 .遗憾 的 是 ,从 三 棵 树 的 皮 中 提取 的 紫杉醇 才能 治疗 一 位 瘤 症 患者 ,而 且 事后 树 便 死 亡 。 漫 无 目的 地 去 寻找 含有 同样 产品 的 植物 可 能 会 花费 很 多 年 的 时 间 。 由 于 了 解 短 叶 紫 杉 的 进化 关系 ,人 们 便 着 手 审查 它 的 近 缘 种 .研究 发 现 ,少量 浆果 紫 杉 (Tazrzus baccata) 的 叶 也 能 够 提取 紫杉醇 ,而 且 既 经 济 又 不 会 给 紫 杉 树 带 来 危害 。 更 有 趣 的 是 ,发 现 一 种 生活 在 短 叶 紫 杉 皮 中 的 真菌 新 种 Tazomyces azdzreanae: 它 也 能 产生 紫 杉 | 醇 。 这 样 便 开 辟 了 生产 廉价 有 效 抗 瘤 药 的 可 能 性 。 过 去 的 二 十 年 极 大 地 推动 了 系统 学 理论 和 实践 的 快速 发 展 ,使 揭示 地 球 生命 的 多 样 性 和 系统 发 育成 为 一 个 可 以 实现 拘 目 标 。 电 子 显微镜 术 、 基 因 序列 分 析 等 新 的 数据 收集 方法 进一步 拓宽 了 信息 来 源 , 反 过 来 ,信息 又 协助 人 类 把 物种 划 入 等 级 分 类 ,使 信息 本 身 成 为 所 有 比较 生物 学 领域 内 整理 物种 多 样 性 知识 不 可 缺少 的 框架 。 新 型 计算 机 技术 能 够 进行 大 型 数据 库 的 处 理 , 和 否则 至 少 上 一 代 系 统 学 家 会 被 埋没 在 大 量 的 数据 之 中 。 本 项 任务 中 ,应 优先 考虑 以 下 几 个 方面 的 工作 : 1. 确定 主要 生物 类 群 的 系统 发 育 关 系 ,为 基础 生物 学 和 应 用 生物 学 提出 一 个 总 体 理 论 框架 ; 2. 发 现 对 应 用 生物 学 至 关 重 要 的 物种 类 群 的 系统 发 育 关 系 ,重点 放 在 对 人 类 健康 ,粮食 生产 、 全 世界 各 种 生态 系统 保护 等 有 重要 作用 的 物种 上 3. 发 现 对 基础 生物 科学 至 关 重 要 的 物种 类 群 的 系统 发 育 关 系 , 比 如 与 实验 科学 有 广泛 联系 的 学 科 ,或 者 对 维持 生态 系统 功能 及 完整 性 必 不 可 少 的 学 科 ; 4. 继续 探索 对 分 析 系 统 学 数据 更 有 效 的 技术 和 方法 。 生命 系统 发 育 分 类 的 作用 有 : 1. 建立 一 套 测 定 灭绝 速率 和 全 球 变化 模式 的 框架 ; 2. 为 寻找 基因 、 生 物产 品 \. 生 物 防 治 因子 和 潜在 作物 物种 提供 指导 ; 3. 为 生物 学 知识 的 管理 提供 一 套 预 测 性 框架 ,为 社会 和 科学 的 沟通 芮 定 基础 ; 4. 协助 保护 者 .资源 管理 者 和 政策 制定 者 确定 优先 项 目 ; 5 6 . 为 连结 所 有 生物 学 科 的 比较 研究 .连结 所 有 生物 类 群 的 多 学 科研 究 创造 基础 ; .为 了 解 形成 当今 生命 多 样 性 的 物种 形成 .灭绝 .适应 等 过 程 提供 科学 基础 。 第 三 项 任务 :把 这 个 全 球 计 划 获 得 的 信息 整理 成 为 一 种 有 效 的 、. 可 查询 的 形式 , 以 最 大 限度 地 满足 科学 和 社会 的 需求 掌握 世界 数 百 万 物种 的 大 量 知识 ,就 需要 新 型 的 配套 系统 的 支持 ,这 样 才 能 有 效 地 利用 和 查询 这 些 知 识 . 这 种 信息 系统 包括 系统 学 ` 地 质 学 和 生态 学 方面 的 数据 ,其 来 源 途 径 主 要 是 现 有 自然 历史 标 本 收藏 图 书馆 、 档 案 馆 以 及 不 断 发 展 着 的 调查 和 编目 。 随 着 新 种 的 发 现 . 系 统 发 育 关系 的 阐述 以 及 其 他 信息 的 积累 ,有 关 物 种 的 知识 也 需要 不 断 更 新 .电子 知识 在 全 世界 的 普及 使 所 有 国家 都 受益 菲 浅 。 数据 库 例如 分 子 遗传 学 数据 库 ,必须 通过 标准 的 物种 名 称 和 系统 发 育 分 类 与 其 他 生物 技术 数据 库 相 连接 。 系统 学 的 发 展 依靠 物种 信息 的 积累 和 交流 。 在 过 去 ,信息 是 通过 植物 志 、 动 物 志 、 专 著 ` 民 族 生物 学 研究 等 文字 印刷 方式 进行 积累 和 传播 的 。 除 此 之 外 ,还 有 几 亿 个 标本 和 与 标本 有 关 的 数据 散 存 在 世 界 各 地 的 系统 学 标本 存储 机 构 。 这 些 信息 必须 按照 科学 名 称 进 行 整理 ,同时 科学 名 称 要 遵循 以 种 间 关 系 为 依据 的 等 级 分 类 。 高 速 的 信息 处 理 技术 、 硬 件 以 及 建立 有 亲缘 关系 的 数据 库 等 现代 化 信息 手段 的 出 现 , 使 人 们 能 够 为 任何 意图 .以 任意 组 合 方式 提取 物种 信息 。 在 综合 其 他 数据 库 内 的 信息 后 ,将 为 提出 地 球 生 命 组 合 和 2 多 新 的 见解 提供 依据 。 另 一 方面 ,以 上 的 数据 库 还 能 避免 研究 和 管理 的 重复 ,节省 数 百 万 美元 的 经 费 。 然 而 ,由 于 各 种 来 源 的 欠缺 ,彻底 改革 系统 学 在 实际 应 用 上 的 作用 以 及 大 大 地 扩展 其 对 科学 和 社会 的 价 值 的 理想 还 没有 实现 。 要 发 挥 散 落 在 世界 各 地 的 物种 信息 的 优势 ,就 应 当 开 展 这 项 工作 。 事 实 上 ,保护 生物 学 家 、 资 源 管 理 者 及 其 他 自然 资源 利用 者 曾 多 次 要 求 获 得 这 些 信 息 。 本 项 任务 中 ,应 优先 考虑 以 下 几 个 方面 的 工作 : 1. 以 世界 自然 历史 标本 存储 机 构 收藏 的 标本 为 基础 ,建立 物种 信息 的 系统 学 \ 生 物 地 理学 和 生态 学 数据 库 。 2. 综合 系统 学 标本 存储 机 构 的 数据 和 地 理 信息 系统 (GIS) 数 据 库 的 信息 ,为 监测 过 去 和 现在 全 球 变化 对 物种 的 分 布 和 灭绝 造成 的 影响 提供 条 件 。 3. 建立 各 数据 库 间 的 联系 ,使 各 种 分 类 单元 及 其 分 布 区 所 有 有 用 的 信息 可 有 效 地 被 查询 。 4. 建立 和 采用 一 套 信息 系统 ,便于 国际 用 户 的 使 用 。 5. 编撰 所 有 系统 学 数据 库 必需 的 \ 包 括 分 类 名 称 ` 地 理 分 布 及 其 他 信息 内 容 的 数据 字典 。 6. 出 版 手册 、 图 解 、. 电 子 动 植物 志 、 专 著 等 数据 产品 。 7. 通过 持续 提供 软件 和 硬件 的 支持 ,以 建立 维持 和 更 新 数据 库 及 信息 网 络 的 机 制 。 有 效 的 系统 学 信息 系统 的 作用 有 : ” 工 .使 政策 制定 者 作出 更 全 面 的 资源 永 续 利用 决策 。 2. 更 详细 地 记载 物种 的 灭绝 及 其 分 布 的 变化 。 3. 系统 学 及 相关 信息 的 数据 库 使 用 效率 越 高 ,就 越 能 更 经 济 地 管理 生物 资源 。 4. 方 便 系 统 学 知识 的 获得 ,便于 解决 问题 。 5. 在 生物 学 及 其 他 领域 特别 是 生物 技术 的 数据 之 间 建 立新 的 比较 和 联系 的 方法 。 6. 加 强国 际 交 流 与 合作 ,减少 科研 工作 的 重复 。 迎接 挑战 :基础 设施 与 人 才 资源 被 里 约 热 内 卢 召 开 的 联合 国 环境 与 发 展 大 会 以 及 生物 多 样 性 公约 采纳 的 全 球 行动 计划 (21 世 纪 议程 ) 呼 吁 各 参 会 国 制定 国家 策略 ,去 编目 和 了 解 本 国 的 生物 多 样 性 ,并 制定 今后 的 保护 计划 。 在 编目 和 了 解 世界 生物 多 样 性 的 过 程 中 ,国际 社会 将 面临 两 个 重大 的 挑战 .第 一 ,需要 极力 扩大 和 改善 系统 学 研究 的 基础 设施 建设 ,特别 是 修 盖 生物 标本 收藏 馆 ; 第 二 ,强化 专业 系统 学 人 员 的 培训 和 录用 ,改变 “分 类 学 障碍 ”的 说 法 。 系统 学 为 生物 多 样 性 研究 商定 了 基础 “许多 建议 (加 强 基 础 和 应 用 保护 研究 ) 认 为 , 现 有 分 类 学 知识 能 够 承担 这 些 工 作 。 然 而 ,完成 这 项 工作 所 需要 的 训练 有 素 的 分 类 学 队伍 并 不 存在 .生物 多 样 性 的 描述 .编目 分 类 ,监察 和 管理 知识 必须 经 过 培训 .有 了 以 上 这 些 基础 才能 去 研究 和 保护 生物 多 样 性 。” 国家 研究 委员 会 ,保护 生物 多 样 性 ,1992, 第 71 页 系统 学 界 通过 2000 年 系统 学 议程 ?提出 系统 学 行动 计划 的 建议 .上 面 提 到 的 三 项 任务 的 成 功 , 对 履行 这 个 行动 计划 是 必要 的 。 这 项 计划 有 以 下 几 个 主要 点 : 1. 所 有 的 国家 为 了 解 、 保 存 和 利用 他 们 的 生物 多 样 性 就 要 建立 和 加 强 具 标本 收藏 馆 的 系统 学 研 究 中 心 ; 2. 对 系统 学 家 和 其 支撑 系统 工作 人 员 进 行 教育 和 培训 的 有 关 单 位 进行 资助 ; 3. 在 基础 和 应 用 系统 学 范围 内 要 扩大 研究 工作 的 队伍 ; A. 全 世界 系统 学 研究 单位 之 间 在 研究 和 教育 方面 开展 国际 合作 和 交流 ; 5. 在 上 述 这 些 单 位 之 间 ,并 扩大 到 社会 上 建立 起 电子 交流 的 联系 ; 6. 支持 基于 分 类 单元 和 全 世界 范围 的 比较 系统 学 研究 。 se 建立 和 加 强 系 统 学 研究 中 心 及 标本 收藏 在 一 些 国家 中 没有 合适 的 基础 设施 来 存放 世界 上 大 多 数 国家 的 生物 多 样 性 标本 ,是 得 不 到 生物 多 样 性 综合 知识 的 一 个 原因 。 同 时 ,发 达 国 家 的 系统 学 研究 中 心 也 不 是 以 支持 它们 为 执行 上 述 研 究 任 务 所 承担 的 应 负 的 责任 。 物 种 丰富 国家 未 来 的 繁荣 将 有 赖 于 发 展 管理 他 们 自己 的 生物 资源 的 能 力 ,其 中 包括 要 具备 为 提供 对 有 效 地 作出 决策 所 需 知 识 的 科学 基础 设施 .世界 各 国 为 克服 科学 能 力 的 不 足 , 就 必须 通过 建造 新 的 或 加 强 现 有 标本 收藏 馆 的 基础 设施 ,例如 博物 馆 、 标 本 馆 和 为 微生物 和 遗传 资源 保存 所 需要 的 贮藏 所 。 全 世界 自然 历史 标本 收藏 馆 拥 有 20 亿 号 标本 (Duckworth 等 ,1993) 。 我 们 虽然 已 掌握 有 如 此 巨大 的 生物 学 遗产 ,但 是 通过 已 保存 的 标本 ,只 鉴定 了 地 球 物 种 多 样 性 的 一 小 部 分 .植物 、 动物 和 其 它 生 物 的 系统 学 标本 收藏 馆 仅仅 是 我 们 生物 区 系 的 永久 性 记录 。 起 源 于 这 些 标 本 收藏 馆 的 特殊 的 库 和 数据 库 是 我 们 对 地 球 自然 历史 的 书面 的 记录 ( 见 专栏 12)。 已 保存 标本 的 系统 学 收藏 馆 可 在 自然 历史 博物 馆 、 标 本 馆 和 大 学 的 标本 馆 和 农业 部 .自然 资源 或 生物 考察 等 政府 有 关 部 门 的 标本 馆 内 见 到 。 这 些 标 本 收藏 馆 也 可 以 活 生 物 的 形式 保存 在 动物 园 、. 水 族 馆 .昆虫 馆 、 乌 类 馆 、 植 物 园 内 ,或 者 如 种 质 、 冷 冻 的 组 织 和 微生物 的 模式 标本 保存 在 特殊 的 贮藏 器 内 。 有 保存 标本 的 标本 收藏 ( 馆 ) 的 系统 学 研究 中 心 馆 是 各 国 乃 至 全 世界 有 关 生 物 多 样 性 知识 的 贮藏 场所 .尽管 各 国标 本 收藏 的 基础 设施 不 同 , 但 它们 基本 上 具有 两 种 主要 功能 。 第 一 种 是 国家 研究 中 心 , 通过 标本 馆 、 图 书馆 和 数据 库 , 记 载 本 国 的 生物 多 样 性 。 第 二 种 设施 也 很 有 存在 的 必要 ,这 类 中 心 的 功 能 是 支持 重点 放 在 分 类 单元 , 且 有 国际 意义 的 系统 学 研究 或 标本 收藏 .有 些 中 心 只 有 上 述 一 种 功能 , 而 另外 一 些 中心 则 具有 足够 的 基础 设施 和 科研 力量 ,两 种 功能 兼备 .许多 中 心 可 以 在 现 有 机 构 和 标本 收藏 馆 的 基础 上 建立 ,而 有 些 则 必须 重新 建立 。 不 论 是 那 种 情况 ,科学 设施 的 核心 都 应 当 包 括 有 分 类 单元 知识 的 专业 系统 学 家 。 系统 学 标本 收藏 馆 的 重要 性 “科学 标本 收藏 馆 是 社会 在 了 解 自然 界 过 程 中 的 一 项 持续 性 投资 .… ……'. 随 着 生境 的 消失 、 物 种 的 灭绝 和 有 重要 地 质 学 及 古生物 学 价值 的 遗址 的 破坏 ,这 些 标本 收藏 迄 中 的 标本 已 成 为 一 种 不 可 再 EUR.” 一 保存 自然 科学 标本 收藏 馆 :环境 遗产 记事 ,第 6 页 1. 标本 收藏 馆 是 人 类 自然 遗产 的 永久 性 记录 , 它 包 含 着 许多 科学 领域 的 研究 所 不 可 缺少 的 材 料 ,例如 保存 生物 多 样 性 和 监测 全 球 变化 的 研究 ; 2. 标本 收藏 馆 能 满足 应 用 生物 学 的 需求 ,例如 卫生 科学 (寄生 虫 学 .流行 病 学 .诊断 学 ) PL 源 管理 ` 生 物 技 术 等 ; 3. 标本 收藏 馆 积 极 支 持 公 共 教 育 和 正规 教育 计划 ; 4. 通 过 标本 收藏 馆 的 展览 提高 自然 保护 及 生物 多 样 性 保护 的 公众 意识 。 国家 系统 学 研究 中 心 。 国 家 研究 中 心 应 当 建 有 收藏 各 地 方 或 各 地 区 动 植物 区 系 的 标本 收藏 馆 ,使 国内 生物 多 样 性 研究 和 管理 能 够 采用 准确 .最 新 的 系统 学 数据 。 世 界 各 地 的 标本 收藏 馆 要 求 配 有 专业 人 员 ,以 便 提 供 当 地 生物 区 系 鉴 定 准 确 的 标本 ;这 些 标本 许多 都 是 当地 的 特有 种 .此 外 ,全 国生 物 学 调 查 所 得 数据 的 核实 也 要 依靠 这 些 系 统 学 标本 收藏 馆 中 的 佐证 标本 。 只 有 研究 这 些 标本 ,研究 人 员 才 能 断定 同一 物种 在 不 同 地 区 被 发 现 。 国家 生物 资源 研究 中 心 的 迅速 发 展 以 及 世界 各 国 制 定 的 各 种 计划 ,如 墨西哥 的 全 国生 物 多 样 性 交流 委员 会 (CONABIO)、 哥斯达黎加 的 国家 生物 多 样 性 研究 所 (INBio) .美国 的 全 国生 物 多 样 性 调查 等 ,都 为 此 类 项 目 在 国内 的 顺利 开展 商定 了 基础 .这些 计划 作用 重大 ,是 研究 .管理 和 保护 各 国生 物 多 样 性 的 基础 ,也 是 争取 国内 支持 这 些 行 动 的 依据 。 国际 系统 学 研究 中 心 .2000 年 系统 学 议程 行动 计划 的 内 容 之 一 就 是 建立 新 的 或 完善 现 有 的 系统 。 214 学 研究 中 心 ,为 实现 记录 世界 生物 多 样 性 这 个 目标 作出 贡献 .各 个 国家 研究 中 心 重 复 各 种 生物 类 和 群 的 标本 收藏 馆 或 分 类 研究 既 不 现实 ,也 没有 必要 。 相 反 , 了解 世界 上 某 一 分 类 单元 情况 的 系统 学 家 则 必 须 得 到 收藏 各 国标 本 的 研究 中 心 的 资助 ,以便 在 世界 各 地 开展 研究 工作 ,因为 物种 往往 经 常 是 跨国 境 分 布 的 .系统 学 研究 最 终 以 分 类 单元 来 定向 的 ,所 以 就 必须 全 面 地 在 世界 范围 内 收藏 各 种 生物 类 群 的 标本 。 由 于 地 区 性 标本 收藏 一 般 不 够 全 面 , 很 难 广泛 地 满足 比较 系统 学 研究 的 要 求 , 各 国 研 究 机 构 有 必要 充分 地 参与 。 由 此 ,国际 研究 机 构 间 的 合作 和 数据 库 联网 不 可 缺少 。 物 种 丰富 国家 研究 机 构 间 的 伙伴 关系 也 应 当 建 立 起 来 ,以 便 保 持 系统 学 标本 收藏 馆 的 稳定 和 发 展 , 建 立 起 交流 标本 .生物 多 样 性 信息 、 培 训 水 平和 科学 知识 的 网 络 。 任 何 一 个 标本 收藏 馆 都 不 可 能 有 研究 各 种 生物 类 群 的 系统 学 家 , 可 见 各 类 群 世 界 级 专家 的 人 员 交 流 也 势 在 必 行 .系统 学 界 如 果 想 多 快 好 省 地 编目 和 划分 世界 的 物种 多 样 性 ,建立 起 这 种 联系 妃 关键 所 在 。 在 各 有 关 国 家 建立 系统 学 研究 中 心 , 就 要 求 开展 一 些 重大 的 国际 合作 项 目 。 除 个 别 情况 外 ,世界 上 物种 丰富 国家 基本 上 没有 标本 收藏 馆 , 即 使 有 也 得 不 到 足够 的 支持 .这 些 标本 收藏 馆 大 部 分 都 缺乏 专业 系统 学 家 和 受过 培训 的 辅助 人 员 ,可 用 于 调查 和 编目 的 经 费 也 普遍 不 足 , 更 不 用 说 资助 系统 学 家 到 世界 各 地 的 标本 收藏 馆 去 进行 必要 的 比较 研究 .物种 丰富 的 国家 如 果 要 建立 一 套 系统 学 知识 体系 , 为 生物 多 样 性 的 保护 和 永 续 利 用 提供 服务 ,就 必须 解决 这 些 问题 ( 见 专栏 13) 。 在 发 达 国 家 ,系统 学 标本 收藏 馆 的 数量 和 侧重 各 不 相同 。 以 美国 为 例 , 主 要 的 系统 学 研究 中 心目 前 有 50 多 个 ,收藏 从 细菌 到 鲸 几 症 包括 所 有 生命 类 型 的 标本 .大 型 标本 收藏 中 心 都 是 一 些 重要 的 自然 历史 博物 馆 及 植物 园 ,州立 机 构 、 联 邦 机 构 . 许 多 大 学 也 有 .此 外 , 侧重 收藏 地 区 标本 的 研究 机 构 也 很 多 ,这 些 标 本 收藏 馆 具有 重要 的 历史 和 科学 价值 。 与 系统 学 标本 收藏 馆 有 关 的 数据 中 心 `. 图 书馆 和 档案 馆 同样 是 系统 生物 学 研究 的 重要 场所 。 专 业 图 书馆 并 不 仅 限 于 收藏 书刊 ,也 同样 收集 卡片 索引 、 目 录 、 原 稿 、 插 图 .照片 缩微 胶片 记录 、 制 图 法 资 料 、 文 献 档案 及 不 同类 型 的 电子 媒介 物 等 。. 近 几 年 来 ,科学 信息 的 大 量 产生 也 相应 使 大 多 数 研 究 机 构 的 收集 能 力 有 所 提高 。 如 果 生 物 多 样 性 的 全 球 调查 和 编目 工作 获得 成 功 , 即 使 是 最 大 的 研究 中 心 , 其 贮存 和 管理 信息 的 能 力也 会 逐渐 显得 不 足 。 只 有 加 强 基 础 设施 建设 ,提高 系统 学 数据 库 的 储存 、 查 询 和 利用 的 水 平 , 才 能 使 世界 科学 家 共享 信息 ,避免 研究 重复 和 面向 社会 。 利用 收藏 标本 解决 问题 1. 当 公 共 健 康 官员 担心 鱼 类 体内 的 水 银 含量 时 , aL HR ee EE th TE TS 模式 。 2. GFE RYE 2 FE RAF 2 9 A A 研究 人 员 联 想到 由 于 环境 中 存在 有 DDT. 3. 导致 爱滋病 及 其 他 疾病 的 病毒 突变 频繁 , 知 与 前 曾 描述 过 的 .贮藏 在 模式 菌 种 或 冷冻 标本 中 的 菌株 进行 比较 , 便 可 帮助 公共 健康 官员 了 解 疾 病 的 传播 途径 。 改善 系统 学 基础 设施 的 建议 : 1. 建立 和 完善 世界 各 国 的 国家 系统 学 研究 中 心 。 这 些 中 心 应 当 盖 有 收藏 记录 国内 生物 财富 的 地 方 及 地 区 参考 标本 收藏 馆 , 具 有 供 研究 和 储存 信息 之 用 的 设施 ,并 具备 培训 和 教育 能 力 ; 2. 建立 或 完善 国际 系统 学 研究 中 心 ,以 利于 获得 系统 学 知识 和 建设 有 分 类 单元 研究 重点 的 世界 性 标本 收藏 馆 ; 3. 通过 建立 国际 网 络 ,改善 世界 上 标本 的 照管 和 保藏 ,实现 知识 、 信息 及 资源 的 共享 。 4. 加 强 和 扩大 现 有 系统 学 研究 中 心 的 储存 能 力 及 研究 力量 ,包括 制定 相应 计划 ,将 所 有 已 登记 的 生物 多 样 性 录 和 人 数据库。 5. 加强 和 扩大 系统 学 研究 中 心间 国际 合作 项 目 进行 。 ° 215° 教育 .培训 及 人 才 资源 开发 在 占 世 界 80 色 的 陆 生 生物 多 样 性 的 国家 中 ,其 科学 家 数量 仅 占 6%% ,这 是 获得 科学 知识 了解 和 有 效 利用 生物 多 样 性 的 一 个 严重 制约 。 除 此 之 外 , 另 一 个 制约 因素 是 全 世界 缺少 许多 生物 类 群 的 分 类 专 家 ,包括 一 些 最 富有 多 样 性 和 最 有 经 济 价值 的 类 群 . 由 此 看 来 ,实现 2000 年 系统 学 议程 提出 的 三 项 研 究 任 务 所 面临 的 最 大 挑战 ,或 许 就 是 在 全 世界 招募 、 教 育 、 培 训 和 聘用 足够 的 系统 学 家 和 技术 人 员 。 美 国 国家 科学 理事 会 的 全 球 生 物 多 样 性 特别 工作 组 (1989)、 英 国 上 议院 的 科学 和 技术 选择 委员 会 〈《1991) 等 众多 组 织 和 特别 工作 组 的 结论 认为 ,缺少 生物 的 鉴定 .记录 和 分 类 方面 的 系统 生物 学 家 , 严 重 妨 碍 了 全 球 生 物 多 样 性 减少 之 问题 的 有 效 解决 。 训练 有 素 的 系统 学 家 数量 减少 的 原因 很 多 。 美 国 国家 科学 基金 会 近期 指导 进行 的 一 项 大 学 调查 发 现 , 在 调查 的 有 博士 学 位 授予 权 的 院 校 中 ,系统 生物 学 家 仅 有 940 名 ,25%% 的 所 有 调查 院 校 只 设置 了 副手 职位 (Higher Education Survey,1990) 。 更 可 悲 的 是 , 收 到 的 回复 中 只 有 18%% 的 院 校 表明 如 果 今 后 有 新 的 教员 职位 ,它们 才 会 聘用 系统 学 家 。 在 美国 和 英国 ,系统 学 家 的 研究 工作 和 (或 ) 教 学 职位 由 于 受到 其 他 生物 学 领域 的 竞争 ,在 几 十 年 前 已 紧缩 .因此 ,大 部 分 研究 机 构 在 调查 时 提出 它们 愿 扩大 的 是 分 子 生 物 学 而 不 是 系统 学 项 目 , 因 为 前 者 "具有 更 大 的 资助 机 会 ”。 出 于 上 述 原因 ,新 培养 的 系统 学 家 的 数量 比 二 十 年 前 减少 了 很 多 。 许 多 生物 类 群 的 分 类 专家 越 来 越 少 , 如 藻类 、 细 菌 、 真菌、 低 等 无 脊 椎 动物 `. 昆虫 及 其 近 缘 种 等 .一 些 对 经 济 和 生态 系统 最 为 重要 的 生 物 类 群 更 需要 专业 培训 的 专家 去 作 研 究 .以 线虫 为 例 , 美 国有 15 个 机 构 所 属 的 标本 馆 和 12 名 专职 线虫 系统 学 家 ,但 带 学 生 的 线虫 系统 学 家 只 有 两 位 。 由 于 线虫 对 农业 有 举足轻重 的 作用 ,缺乏 受过 培训 的 专家 必 将 会 带 来 严重 的 经 济 后 果 。 改变 “分 类 学 障碍 ”的 说 法 过 去 几 年 中 下 降 最 严重 的 是 分 类 学 和 系统 学 领域 .受过 培训 的 分 类 学 家 急 缺 ,热带 国家 | . 几乎 没有 .许多 重要 生物 类 群 方面 的 专家 也 显 不 足 , 发 达 国 家 甚至 也 是 如 此 。 另 外 ,可 参考 的 标本 收 藏 馆 也 不 够 ,而 且 地 区 分 布 不 平衡 ,大 都 远离 被 研究 生物 的 原 产 地 。 目 前 分 类 学 的 效率 低下 ,重复 研 究 较 多 .有 鉴于 此 ,在 开展 任何 生物 多 样 性 研究 之 前 ,必须 首先 强调 改变 “分 类 学 障碍 ”的 说 法 。 —DIVERSITAS: IUBS-IUMS-SCOPE-UNESCO 生物 多 样 性 项 目 尽管 人 们 对 许多 类 群 的 系统 学 知识 不 足 或 严重 不 足 有 一 致 的 看 法 ,但 尚 从 缺 能 说 明 该 学 科 有 这 种 趋势 的 证 据 。 统 计 世 界 现 有 的 各 生物 类 和 群 的 系统 学 专业 人 才 十 分 必要 ,只 有 这 样 ,才能 更 准确 .更 有 效 地 重点 实施 培训 和 吸收 人 才 计划 。 系统 生物 学 人 才 资 源 的 匮乏 在 发 展 中 国家 更 为 突出 。 受 过 培训 的 科学 家 的 人 数 、 研 究 经 费 、 标 本 馆 职位 .部门 支持 等 方面 的 不 足 , 都 意味 着 很 少 有 系统 科学 家 投身 这 一 学 科 行 列 。 要 扭转 这 种 局 势 , 迫 切 需要 强化 发 展 中 国家 地 方 自然 历史 研究 机 构 的 作用 ,建立 与 发 达 国 家 研究 机 构 间 的 联系 (National Research Council) 。 由 于 在 很 多 发 展 中 国家 环境 恶化 和 生物 多 样 性 丧失 的 趋势 不 断 加 快 ,培训 “ 准 分 类 学 家 ”, 让 他 们 与 专业 系统 学 家 一 道 工作 也 不 失 为 解决 人 才 资 源 问题 的 一 种 办 法 ,但 这 并 不 意 谓 着 可 以 取代 建立 有 效 的 科学 基础 设施 和 强大 的 科学 家 队伍 的 计划 。 在 发 达 国 家 ,不 少 像 博物 馆 和 植物 园 之 类 的 研究 机 构 开 展 了 与 附近 大 学 联合 培养 系统 生物 学 本 科 生 和 研究 生 的 项 目 。 这 些 项 目 一 般 说 来 都 有 很 大 的 国际 性 成 分 .尽管 取得 的 成 绩 不 少 ,但 就 物种 多 样 性 的 危机 程度 和 描述 世界 生物 资源 在 科学 和 经 济 上 的 紧迫 性 来 看 ,系统 学 还 必须 得 到 更 多 的 经 费 支持 ,争取 在 研究 生 和 大 学 生 中 培养 出 更 多 的 科学 家 。 部 分 证 据 表 明 ,大 学 生 对 物种 多 样 性 很 感 兴趣 , 他 们 为 现代 系统 学 研究 的 重要 性 和 在 智力 上 富有 的 挑战 性 所 吸引 .但 由 于 研究 生 经 费 不 足 和 博士 生 毕业 后 就 业 前 景 渺茫 ,他们 只 好 打消 投身 系统 学 研究 的 念头 。 加 强人 才 资 源 的 利用 的 建议 : 1. 从 事 发 展 中 国家 持续 发 展 和 环境 保护 推动 项 目的 国际 机 构 应 当 为 基础 系统 学 研究 以 及 专业 、 准 专业 系统 学 家 的 培训 和 聘任 提供 经 费 支 持 ; 2. 各 国 应 当 建立 全 国生 物 多 样 性 监测 机 构 、 系 统 学 研究 中 心 及 标本 收藏 馆 及 国家 生物 普查 机 构 ,并 为 上 述 活动 的 开展 配置 专业 的 系统 学 家 ; 3. 各 大 学 和 研究 所 凡 设 有 生物 多 样 性 培训 和 教育 项 目 者 ,应 当 配备 专业 系统 学 教师 4. 发 达 国 家 的 政府 机 构 和 自然 历史 研究 机 构 应 当 向 物种 丰富 国家 的 学 生 及 其 他 科研 人 员 的 培 训 提供 更 大 的 援助 ; 5. 资 源 管理 机 构 ( 如 林业 、 渔 业 、 野 生动 物 等 ) 的 工作 人 员 中 应 当 包括 专业 系统 学 家 。 2000 年 系统 学 议程 完善 了 其 他 生物 多 样 性 计划 国际 社会 中 许多 机 构 和 组 织 已 经 认识 到 描述 和 了 解 地 球 物 种 多 样 性 的 紧迫 性 .这 些 机 构 和 组 织 包括 : “联合 国 环境 与 发 展 大 会 (UNCED) 及 其 二 十 一 世纪 议程 “联合 国 环境 规划 署 CUNEP) SKA BAS (UNDP) “Diversitas ,一 个 包括 以 下 机 构 和 组 织 的 联合 体 : 国际 生物 科学 联盟 (CIUBS) 环境 问题 科学 委员 会 (SCOPE) 联合 国教 科 文 组 织 C(UNESCO) 国际 微生物 学 联盟 (IUMS) “二 十 一 世纪 的 微生物 多 样 性 ,国际 生物 科学 联盟 (CIUBS) 和 国际 微生物 学 联盟 (IUMS) 的 一 项 行 动 计 划 非 政府 组 织 也 发 出 同样 的 呼吁 ,特别 是 : “世界 资源 研究 所 (WRI) “世界 自然 基金 会 (WWFE) “国际 自然 保护 联盟 /国际 自然 与 自然 资源 保护 联盟 (IUCN) “大 自然 保护 协会 CTNC) 2000 年 系统 学 议程 从 分 类 单元 着 手提 出 了 全 球 生 物 多 样 性 的 一 个 前 景 展望 ,给 保护 和 管理 这 项 必 不 可 少 资源 的 科学 框架 增添 了 新 的 内 容 。. 对 所 有 旨 在 了 解 、 保 护 和 利用 生物 多 样 性 的 计划 ,如 生态 学 界 提出 的 持续 性 生物 圈 计 划 来 说 ,2000 年 系统 学 议程 起 到 了 锦上添花 的 作用 。 , 对 2000 年 系统 学 议程 的 投资 2000 年 系统 学 议程 之 计划 设想 宏伟 ,需要 众多 方面 的 大 力 支持 才能 得 以 实现 .任何 政 府 或 任何 国 际 机 构 都 不 可 能 去 单独 资助 这 项 计划 的 运作 , 它 需 要 世界 上 众多 组 织 和 政府 的 共同 支持 。2000 年 系统 学 议程 的 任务 通过 一 项 长 远 的 25 年 计划 实现 ,每 年 大 约 需要 投入 经 费 30 亿 美元 。 经 费 预 算 系 根据 各 项 工作 的 开支 制订 ,其 中 包括 人 才 开 发 .建立 计算 机 网 络 、 支 持 标本 收藏 建设 (包括 模式 菌 种 及 种 质 贮藏 所 )、 研 究 项 目 、 宣 传 研究 成 果 等 方面 的 开支 .按照 目前 的 资助 水 平 , 完 成 2000 年 系统 学 议程 的 任务 至 少 需要 150 年 .鉴于 生物 多 样 性 丧失 的 紧迫 性 ,目前 每 年 的 研究 和 基础 建 设 资助 (大 约 5 亿 美元 ) 必 须 增 加 将 近 六 倍 才能 在 25 年 内 完成 这 些 任 务 。 从 生物 多 样 性 显示 出 的 科学 、 经 济 和 美学 价值 中 不 难看 出 这 项 投资 的 产 出 。 发 现 、 描 述 . 了 解 和 利 用 其 他 物种 取得 的 持续 进展 已 经 使 人 类 受益 上 罪 浅 。 人 类 今天 的 进一步 努力 会 带 来 明天 的 更 大 效益 , 同 时 也 将 有 助 于 今后 世 世 代 代 生命 多 样 性 的 保存 。 ee 参考 文献 Brooks,D. R. and B. McClennan. 1991. Phylogeny, ecology, and behavior; a research program in comparative biology. U. of Chicago Press, Chicago, Illinois. P | Bull, A. T. » M. Goodfellow, J. H. Slater. 1992. Biodiversity as a sourcé of innovation in biotechnology. Annual Review of Microbiolo- gy. 46: 219—252. ‘ : . di Castri, F. , J. R. Vernhes, and T. Younes. 1992. Inventorying an monitoring biodiversity. Biology International , Special issue. 27, = 3} ; Duckworth, W. D. , H. H. Genoways, and C. L. Rose, 1993. Preserving natural science collections; chronicle of our environmental her- itage. National Institute for the Conservation of Cultural Property, Washington, D. C. Ehrlich, P. R. and A. H. Ehrlich. 1992. The value of biodiversity. Ambio. 21: 219—226. Ehrlich, P. R. and E.©. Wilson. 1991. Biodiversity studies; science and policy. Science. 253: 758—762. Gaston, K.G. and R.M. May. 1992. Taxonomy of taxonomists. Nature. 365: 281—282. Gore, A. 1992. Earth in the balance. Hisapien Mifflin, New York. Groombridge, B. (ed. ). 1992. Global biodiversity: status of the Earth's living resources. World Conservation Monitoring Centre. Chap- man and Hall, London. Hawksworth, D. L. and J. M. Ritchie. 1993. Biodiversity and biosystematic priorities; microorganisms and invertebrates. International Mycological Institute, CAB International, Wallingford, United Kingdom. Higher Education Surveys. 1990. Systematic biology training and personnel. Survey No. 10. , Washington, D. C. Holden, C. 1989. Entomologists wane as insects wax. Science. 246:754—756. Iltis, H. H. 1989. Serendipity in the exploration of biodiversity; what good are Reedy tomatoes? In Biodiversity (E.O. Wilson, ed. ), National Academy Press, Washington, D. C. , 98—105. International Union for the Conservation of Nature (IUCN), World Resource Institute (WRI), Conservation International (CI), World Wildlife/U.S (WWF/US), and World Bank. 1990. Conserving the world’s biological diversity. Lubchenco, J. , A.M. Olson, L. B. Brubaker, S.R. Carpenter, M.M. Holland, S. P. Hubbell, S. A. Levin, J. A. MacMahon, P. A. Matson, J. M. Melillo, H. A. Mooney, C.H. Peterson, H.R. Pulliam, L. A. Real, P. Regal, and P.G. Risser. 1991. The sustain- able biosphere initiative: an ecological research agenda. Ecology. 72: 371—412. May, R.M. 1992. How many species inhabit the Earth? Scientific American. 267(4); 42—48. Miller, E.H. (ed). 1985. Museum collections; their role and future in biological research. Vancouver, B.C. : Brit. Columbia Prov. Mu- seum Occas. Papers Series, No. 25. Myers, N. 1988. Threatened biotas; “Hot spots” in tropical forests. Environmentalist. 8; 187—208. Myers, N. 1990. The biodiversity challenge: Expanded hotspot analysis. Environmentalist. 10; 243—256. Myers, N. 1991. Tropical forests: present status and future outlook. Climate Change. 19: 3 一 32. Nash, S. 1989. The plight of systematists: are they an endangered species? Scientist Oct. 16; 7. National Research Council. 1992. Conserving biodiversity: a research agenda for development agencies. National Academy Press, Wash- ington, D. C. National Research Council. 1993. A biological survey for the nation. National Academy Press, Washington, D. C. National Science Board. 1989. Loss of biological diversity: a global crisis requiring international solutions. National Science Foundation, Washington, D. C. Norse, E. A. (ed. ). 1993. Global marine biological diversity. Island Press, Washington, D. C. Office of Technology Assessment (OTA). 1987. Technologies to maintain biological diversity. Washington, D. C. Peters, R. L. , and T. E. Lovejoy (eds. ). 1992. Global warming and biological diversity. Yale University Presa, New Haven, Conneti- cut. Rasoanaivo, P. 1990. Rain forests of Madagascar: sources of industrial and medicinal plants. Ambio. 19: 421—424. Raven, P.H. 1993. A plea to the citizens of the world: live as if Earth matters. Diversity. 9(3) : 49—51. Raven, P.H. and E.O, Wilson. 1992. A fifty-year plan for biodiversity studies. Science. 258: 1099—1100. Reid, W. V., and K. R. Miller. 1989. Keeping options alive; the scientific basis for conserving biodiversity. World Resources Institute, Washington, D. C. Resolutions from the International Symposium and First World Congress on the Preservation and Conservation of Natural History Collec- tions. 1992. Madrid, Spain, 1—57; EBCOMP, S.A. , Bergantin, 1— 28042. Madrid. Endorsed by United Nations Education, Scien- tific and Cultural Organization. we Yo ee ae am So Sitarz, D. (ed. ). 1993. AGENDA 21: the Earth Summit strategy to save our planet. Earthpress, Boulder, Colorado. Stierle, A. , G. Strobel, and D. Stierle. 1993. Taxol and taxane production by taxomyces andreanae, an endophytic fungus of Pacific Yew. Science. 260: 214—216. Task Force on Global Biodiversity. 1989. Loss of biological diversity; a global crisis requiring international solutions. NSF—89—171, Washington, D. C. U. K. House of Lords. 1991. Systematic Biology Research. Select Committee on Science and Technology, 1st Report. London; HMSO, HL Paper 22—I. U.K. Natural Environment Research Council. 1992. Evolution and biodiversity -the new taxonomy. London. United Nations Conference on Environment and Development (UNCED). 1992. United Nations Convention on Biological Diversity. Wheeler, Q. D. 1990. Insect diversity and cladistic constraints. Annals of the Entomological Society of America. 83; 1031—1047. Wilson, E.O. 1985. The biological diversity crisis: a challenge to science. Issues Sci. Technol. (Fall); 20—29. Wilson, E.O. (ed. ). 1988. Biodiversity. National Academy Press, Washington, D. C. Wilson, E. O. 1992. The diversity of life. Harvard University Press, Cambridge, Ma. Wilson, E. O. 1992. Biodiversity; challenge, science, opportunity. American Zoologist. 32; 1—7. World Resources Institute. 1993. Biodiversity prospecting: using genetic resources for sustainable development. World Resources Insti- tute, Washington, D. C. World Resources Institute (WRI) , International Union for the conservation of Nature (IUCN), and United Nations Environment Program (UNEP). 1992. Global Biodiversity Strategy. Guidelines for action to save, study, and use the earth's biotic wealth sustainably and equitably. WRI, Washington, D. C. | * 219° 大 i 词 汇 所 图 LU mi 0 生物 多 样 性 (Biodiversity) :生物 的 多 样 性 和 变异 性 ,包括 物种 的 数量 .独特 分 支 Cdistinct clades) 的 数 量 、 种 内 遗传 性 变异 及 “功能 的 2 多样 性 (生物 的 功能 .生物 与 其 他 生物 及 其 环境 间 相 互 作 用 的 多 得 不 计 其 数 的 方式 )。 生物 地 理学 (Biogeography) :对 植物 .动物 和 微生物 地 理 分 布 的 研究 。 生物 资源 (Biological Resource,Bioresources) :对 人 类 有 实在 或 潜在 价值 的 某 种 生物 ,或 者 源 于 某 种 生 物 的 产品 。 | 4 4 Fl (Biosphere) :有 生命 存在 的 地 球 部 分 。- 生物 技术 (Biotechnology) :利用 生物 或 源 于 生物 的 物质 ,去 制造 或 改变 某 种 产品 ,改良 植物 或 动物 ,或 者 为 特定 目的 去 开发 微生物 的 任何 技术 。 分 支 (Clade) : 某 一 分 类 单元 ,系统 发 育 中 的 一 个 分 枝 或 一 个 谱系 。 分 类 (Classification)# 正 式 地 、 科 学 地 把 物种 排列 到 某 种 等 级 系统 ,并 给 物种 或 物种 类 群 制订 科学 名 称 。 比较 生物 学 (Comparative biology) :一 个 以 上 物种 之 间 的 比较 研究 。 特有 (Endemic) : 某 种 生境 或 地 理 区 域 特 有 的 某 一 物种 。 44% (Extinction) : 某 一 物种 最 后 一 个 个 体 的 死亡 。 编目 (Inventory) :把 某 一 指定 区 域 的 所 有 植物 .动物 及 微生物 种 的 名 称 或 描述 编列 成 表 。 & ZB (Monograph) :汇集 世界 上 关于 某 一 分 类 单元 的 所 有 已 知 资料 ,包括 新 的 及 过 去 已 知 的 物种 , 按 照 已 知 的 系统 发 育 组 织 编写 的 一 本 全 面 的 论著 。 系统 发 育 多 样 性 (Phylogenetic diversity) : 某 一 类 群 所 代表 的 独特 的 谱系 的 数量 或 分 支 的 数量 。 系统 发 育 (Phylogeny) :物种 间 进 化 中 的 模式 及 物种 间 的 共同 祖先 。 物种 (Species) :生物 的 种 类 ;分 类 学 和 系统 发 育 分 析 的 基本 单位 。 物种 多 样 性 (Species diversity) : 原 义 是 指 即 地 球 上 物种 的 数量 和 种 类 ;广义 上 亦 包括 物种 的 数量 及 其 相互 关系 (如 系统 发 育 多 样 性 ) 。 调查 (Survey) :按照 一 定 的 方法 考察 某 一 选 定 地 区 ,以 便 发 现 大 型 或 微型 的 动 植 物 区 系 内 的 所 有 物 种 。 系统 学 (Systematics) :现在 生活 的 和 化 石生 物 ( 物 种 ) 种 类 的 比较 研究 ,包括 它们 的 描述 、 分 布 及 其 共 存 的 系统 发 育 关 系 。 分 类 单元 (Taxon) :一 个 物种 或 一 组 相关 的 物种 。 分 类 学 (Taxonomy) :把 物种 科学 地 划分 到 一 种 等 级 系统 ,以 此 反映 对 其 系统 发 育 的 了 解 情况 。 〈《 郭 寅 峰 译 。” 钱 迎 倩 和 周 红 章 校 ) «220° 9 ISBN 7-03-005669-8 sul 787030"056696 > | ISBN 7-03-005669-8 定价 :41.00 元