生物 & HE
中 国 科 学 院 生 物 多 样 性 委员 会
Br
wr
whe.
ED oS PEM MC = )
中 国 科学 院 生物 多 样 性 委员 会
ae kB
wu ML
-一
。 中 国 科学 院 生物 多 样 性 委员 会
上
ARR TURAL IE Bi 16 号
i 4 100717
兵器 工业 出 版 社 印 刷 厂 印刷
京 发 行 所 发 行 ”各 地 新 华 书 店 经 售
人
人 OA
ioo7 18 A FFA : 787 X 1092 1/16
1997 年 12 月 第 一 次 印刷 ”印张 :14. 25
印 数 :1 一 1000 字数 :410 FF
ISBN 7-03-005669-8/Q。616
”定价 :41. 00
= F
随 着 时 间 的 推移 ,生物 多 样 性 的 重要 性 越 来 越 为 社会 各 界 所 理解 和 重视 。 众 所 周
知 , 生 物 多 样 性 中 最 为 重要 的 有 物种 多 样 性 .生态 系统 多 样 性 和 遗传 多 样 性 三 个 层次 。
遗传 多 样 性 是 这 三 个 层次 中 研究 相对 较为 薄弱 的 ,在 我 国 尤其 如 此 。
遗传 多 样 性 研究 具有 十 分 重要 的 意义 。 其 研究 结果 可 为 物种 濒危 机 制 的 探讨 、 种 质
资源 的 保存 与 利用 、 生 物 分 类 与 演化 的 研究 .生态 适应 机 制 的 探讨 等 提供 重要 证 据 或 依
据 。 我 国 的 遗传 多 样 性 研究 取得 了 重要 进展 ,特别 关于 大 熊猫 濒 危机 制 的 研究 受到 国外
同行 的 关注 。 但 是 , 除 中 国 科 学 院 生物 多 样 性 委员 会 生物 多 样 性 研究 丛书 ”之 一 《中 国
。 动 植物 遗传 多 样 性 兴 胡 志 昌 和 张 亚 平 主 编 ) 以 外 ,国内 还 没有 遗传 多 样 性 方面 的 专著 出
版 。 有 鉴于 此 ,我 们 组 织 翻译 了“ 分子 进 化 基础 "中科院 昆明 动物 研究 所 细胞 与 分 子 进
化 开放 研究 实验 室 陈 建华 译 , 张 亚 平 、 吴 春花 和 李 海 鹏 校 , 其 中 序 和 前 言 由 赵 丽 惠 译 , 马
克 平 校 ) 和 分子 变异 与 生态 学 问题 (中 科 院 植物 研究 所 魏 伟 译 , 钱 迎 倩 校 ) 以 补充 国内
这 方面 资料 的 不 足 。 为 了 促进 生物 多 样 性 研究 的 重要 支撑 学 科 之 一 ,生物 系统 学 的 发
展 , 我 们 将 “生物 系统 学 议程 2000 年 "中科院 动物 研究 所 郭 寅 峰 译 , 中 科 院 植物 研究 所
钱 迎 倩 和 动物 所 周 红 章 校 ) 同 时 编 入 此 书 , 作 为 《生物 多 样 性 译 丛 》 之 三 正式 出 版 。 其 它
三 集 分 别 是 :生物 多 样 性 译 丛 一 兴 包 括 《 保 护 世 界 的 生物 多 样 性 》 和 《生物 多 样 性 一 有
关 的 科学 问题 与 合作 研究 建议 》 两 部 分 )《 全 球 生物 多 样 性 策略 》( 作 为 《 译 丛 》 之 二 ) 和
《生物 多 样 性 公约 指南 兴 作 为 《 译 丛 》 之 四 )。 我 们 将 继续 选择 国外 本 领域 好 的 资料 翻译
出 版 ,及 时 把 国外 新 的 理论 、 方 法 和 动态 介绍 到 国内 ,以 推动 中 国 的 生物 多 样 性 保护 和
朋党 工作 。
北京 教育 学 院 刘 玉 明 先生 和 中 科 院 植物 所 赵 丽 惠 同 志 认 真 校订 译 稿 ,北京 海岸 文
化 服务 中 心 刘 万 海 先生 大 力 支持 。 在 此 ,向 他 们 表示 衷心 的 感谢 。
马克 平
1997 7 A 25 8
=
《分 子 进化 基础 》
Savayecensnavovsueesesnansaucsusavieveces soscussesccesensesscessocesssvcsscscenscaseceassesnceess (5)
| 基因 结 析 与 突变 - … (6)
(16)
- (16)
前 言 …………
2 群体 中 基因 的 动力 学 …
2.1 等 位 基因 频率 方面 的 改变 ee
2-9 ones. PTTTTT ELINOR ETE TIP ee erie Ti errerrerr err err errr
2. A ATRL BEIK KI) pp
Ze
2.
Ze
5 基因 替换 -
6 遗传 多 态 性 -
7 新 达尔 文学 说 与 中 性 突变 假说 -
3 ” 核 背 酸 序列 中 的 进化 变化 …
3.2 两 DNA 序列 间 的 核 苷 酸 蔡 换 数
4
4 和 28 若 换 速率 变异 的 原因 eev eee eee cee ee
4.
4. 4 APF BP ceecee ccc ceeceeeeecee Sic
4.5 细胞 器 DNA 中 的 替换 速率
4.
4.
5 分 子 系统 发 育 …
和
5.
5. WME ode TOWEL ccs cob Mee ccelecalecececcccccvccecevaneuentne'se
办
BE a ees eee SO ee Sa
用 前 稿 宦 本 二 直属
5. © PPR TCHR YH cnc ccc ccc ccc cccccessenececen cesses cee ceccce scenes cee see see seuss asec ces ces cescesecs
9
a
5. 7 物种 分 岐 时 间 的 估计 …………………:
BB 二
9 人 和 猿 的 系统 发 育
os 分 子 古 生物 学 …
录
(3)
(6)
(7)
“@)
ead)
(16)
(199
«C219
* (22)
- (24)
= (26)
(28)
二 (3])
a ll FT IE FE ll FT SE EE: [| Sob ons sen cocieow cue dewccwens cos con cus cnn cocens sovece conser ees
和
0
.1 PERF PREPAY RE en
ee rte cedhapeents akedec ese terectesteey (HGS
3 —AS TE VE FE Ps FL AE FAH FR BM one nee ne nee cee cen ccc cee cence cee cen ens cce cence sescee cee ces
see - (48)
(28)
(34)
(37)
(42)
(42)
(47)
二
6 ABR E 因 市 的 芒 考 酸 若 和 换 寞 式 二 0
多 同 义 密码 子 的 非 随机 应 用 oo csecee cesses cesses see cen aes
本 。(60)
(53)
(55)
(60)
(64)
- (68)
(69)
(70)
- (70)
如 条
5. 10 线粒体 和 叶绿体 的 内 共 牛 起 源 .pe
ee °° - X7es
(76)
5. 12 深 色 海 滩涂 :物种 保护 生物 学 中 的 一 次 教训 PR
6 由 基因 重复 和 外 显 子 混 匀 造成 的 进化 …………- naginul neninsanen sos cacecbsusvos cos ves ete
6.1 DNA 重复 的 类 型 …
G. 2 IRAIDR GB cnc evncceessccccnncce ene ccenccessccesesceenns cesses concer cesses ccs see ces cee ssacee ens seeaen acs
6. 3 域 重 复 和 基因 的 延长 .ee
6.4 基因 家 族 的 形成 与 新 功能 的 获得 pe
6. 5 重复 基因 的 无 功能 化 ee
6.7 珠 蛋 白 基 因 超 家 族 revere ee ee
G. 产 下 新 商 能 的 恋 通 和 途 物 .oo
G. 10 Bo Be SCTE BU IRIEL, .0
TURE ERE HEAL, woe -nn om ene nen coc ceneee coc eencen enn sesces ses cce coe ose ens ese een eos coe ess cen caskennay nama
DD BE Bie Fie EI woe ane con san con ons coc ces coe eee nce ese sab sscnas cos cesnanascaunapetes sescees
2 可 转 座 因子 …
3 反 录 序列 …
4 转 座 对 宿主 基因 组 的 影响 .. 的 向 全 寺 人
7
Hi
全
‘-
7.5 杂种 劣势 …
7.6 转 座 与 物种 形成 …
is
人
7 可 转 座 因 子 拷贝 数 的 进化 动力 学 ……………:
8 水 平 基因 转移 …
8 基因 组 的 组 织 化 和 进化
.JIC 值 … sees
.7 细菌 的 GC 含量 …
go 90 90 90 90 90 go gp
ames
词汇 表 …
主题 索引 Eeessssseseseeaseeoeooeeeeoooooeceeoooecoeooooooooceoaooacoaos 二
.2 细菌 的 基因 组 大 小 的 进化 … ou eue cos ose ade oan ou won sein sansa uly euiaet wine ene
ee a EOIN FA C—A HED 000 ono nee ccscee one cseuesuse ene consontss oneies tan
A FRG HE Wy FE BAY Be BEY oon eee ccc ccc ccc ccc recccecencccccsccccesccecce cov ces cesses cesses ces cee ce
Se Ti BO IN HG BIL, Fel] =2~ 22-002 one cee cee ces ces concen ace cee con ead ses eseors dus ena ase sane enna
I MT EEG ann vox oes uns cee coe essen oss ons vesisnn ces tue ccs eua¥enasnienne
5B ee PAE 2d ee dd _E BY Y, 20e one vee ee
Wes He) FO FR BE] cee cee cee cee cee cee cee cence cen ceeeee ccs seeneeceeceneescseees
引言
hy Rh
De
《分 子 变异 与 生态 学
1 材料 来 源 seessessessooesoooosoossssessssssssssssooosooo oo 。
2 DNA—DNA 杂交 soe ne cee cee cee cee cee eee eee eee eee ses wee canes
3 限制 性 片段 分 析 和 pp
A DNA 指纹 分 析 cee cee reece cee cee cence ces eee ees cee cence cen ces
5 DNA 放大 ooesosoossssessssssssoeosoosososssssesssssssossssossoosoo oo 。
问题 》
i) 性 别 鉴定 Sesoasceseaeeeseeeseseeeseseseessesseeeesseseeesoesoesesees
ww ww ww wr
(2000 年 系统 学 议程 :制订 生物 圈 计 划 》
- (198)
- (199)
esos cecccganasenereces sce scccsccecccccssccscsseceess (2()])
系统 学 知识 及 生物 多 样 性 的 价值 … ee
内 容 提要 …
导言 … seeeo ee ooooooooooooooooooooooooooooo。
2000 年 系统 学 议程 :制订 生物 圈 计 划 …
人 类 健康 …
物种 经 济 学 …
林业 .… cee cee cee cee ceee
加 强 科 学 研究 …
2000 $6 GEE RAYE ccc cee ce eee cesce ees
第 一 项 任务 : ERD BS PEE ZBL HE A Se +
第 二 项 任务 :分 析 这 个 全 球 发 现 计划 获得 的 信息 ,并 将 其 融合 于
一 个 能 反映 生命 史 的 预测 性 分 类 系统 …
第 三 项 任务 :把 这 个 全 球 计 划 获 得 的 信息 整理 成 为 一 种 有 效 的 .可 查询 的 形式 ,
以 最 大 限度 地 满足 科学 和 社会 的 需求 …
—* 基础 设施 Poser ¢
. vila of SSS oo eee
2000 年 系统 学 议程 完善 了 其 他 生物 多 样 性 计划 pp
对 2000 年 系统 学 议程 的 投资 . 人 ee
参考 文献 …
词汇 …
区 变性 梯度 凝 胶 电 泳 sosooooeooooooooovoovooooooooooooooooooooooooooooooooooovoooooooooooooooooooooosoooooo oo
生态 学 应 用 aeeeeeeseeessesoeeesseeoeeoeeseeeoeoeoseeoesoeososooesoosooososeososoossoessesssessssessososesseooossoseeoosseooosooe
- (184)
5 渐 渗 现象 与 杂交 地 带 ssesasaesesaeessceoeseeeoesoseessesecssoesosseeseeeesesessseoeooseseoessesessesoeeesooasesesa5sseeas
6 物种 的 鉴定 于
(184)
(184)
(184)
(185)
(186)
(187)
(187)
(188)
(188)
(188)
(197)
(201)
基因
7
HE AW. FEE AE YE hh --e ee
es
TB FAA BF HBR AE hr SFE Gh nnn one ene ere cnn ces cnn enecesace cee con ces cesses casas cesses sescescesceeces
本
- (208)
> (208)
> (208)
(202)
(203)
(204)
(205)
(206)
(207)
- (209)
* (212)
- (216)
© (217)
(214)
(216)
(217)
(218)
- (2208
chs
se
|
7 ae 二
‘ 二 >
“
ve ¢ -
oe te
:
有
¢
das beeamebadeetess =:
ae * oS ye RE a vu. x
ae see rn yee
i y iw
eae eeeree
四
ove
4 ie a a
ieee;
GOT e x
—
ewer pees, +s *
‘me .
eh 0 Ee
分 子 进 化 基础
原作 : 李 文 雄 〈 美 国 得 克 萨 斯 大 学 )
D. 蕊 劳 尔 〈 以 色 列 特拉维夫 大 学 )
翻译 : 陈建华
Fundamentals of Molecular Evolution
Wen-Hsiung Li (The University of Texas, Houston)
Dan Graur (Tel Aviv University )
Sinauer Associates, Inc. , Publishers
Sunderland, Massachusetts, 1991
Ties
序
1869 年 ,Johann Friedrich Miescher 发 现 了 DNA。 他 曾经 “大 胆 ” 地 认为 ,DNA 可 能 和 遗传 有
关 。 但 过 了 一 段 时 间 ,, 他 还 是 放弃 了 这 种 “ 荒 订 ” 的 观点 ,并 花费 30 多 年 的 时 间 去 研究 鱼 精 蛋 白 一
精子 细胞 中 非常 基本 的 蛋白 质 组 分 。 按 照 Miescher 的 观点 , 这 种 蛋白 质 是 遗传 的 关键 所 在 。 后 来 发
Bh, DNA 分 子 不 仅仅 是 遗传 的 关键 ,正如 一 位 分 子 进 化 学 先驱 Emile Zuckerkandl 所 说 的 那样 , 它们
还 是 “进化 史 的 文献 资料 ”。 实 际 上 , 每 一 种 活 组 织 的 DNA 都 是 历史 过 程 的 积累 。 然 而 , 包 容 在 这
些 过 程 里 的 信息 处 在 一 种 杂乱 无 章 的 无 序 状 态 中 , 是 分 散 的 或 片段 的 。 有 一 些 信息 是 隐藏 的 或 是
“伪装 ”的 ,很 难 辩 认 出 来 ; 有 一 些 已 丢失 , 毫 无 踪迹 可 寻 。 分 子 进 化 的 目的 就 是 要 澄清 这 些 历 史 过
程 , 整 理 信息 使 之 有 序 , 读 出 并 解 译 信息 。
由 于 进化 过 程 难以 用 基因 材料 研究 清楚 , 用 分 子 资料 不 仅 可 以 重建 进化 年 代 , 而 且 也 可 以 弄 清
进化 过 程 的 驱动 力 。 分 子 生 物 学 的 重大 突破 , 如 基因 克隆 技术 、DNA 序列 分 析 、 限制 性 核酸 内 切 栈
片段 分 析 等 , 在 某 种 意义 上 , 已 使 科学 家 们 处 于 一 种 新 的 十 分 有 利 的 位 置 。 我 们 能 够 洞察 一 个 从 未
见 过 的 世界 ,在 这 里 , 基 因 是 通过 复制 、DNA 混 匀 、 核 苷 酸 蔡 代 、 转 移 及 基因 转化 进化 的 。 在 这 个
世界 里 , 基 因 组 或 静止 , 或 流动 , 有 时 在 过 了 很 长 时 间 后 会 有 微小 的 变化 , 有 时 又 会 在 媳 眼 间 发 生
戏剧 性 的 地 质 学 斥 度 的 变化 。
通过 研究 遗传 材料 , 我 们 也 能 试 着 将 生物 界 按 系 统 发 育 事实 来 划分 , 并 建立 分 类 系统 。 与 传统
的 研究 进化 方法 相反 , 例 如 比较 解剖 学 、 形 态 学 和 古生物 学 , 都 毫 无 必要 地 将 自己 限制 在 极端 相似
组 织 的 进化 关系 研究 中 。 我 们 现在 已 经 能 够 建立 巨大 的 家 系 树 , 它 连接 兰 椎 动物 、 昆 贝 、 植 物 、 真
菌 和 细菌 , 并 能 够 追溯 它们 的 共同 祖先 , 一 直到 无 法 追溯 的 时 代 。
本 书 的 宗旨 是 从 分 子 水 平 上 描述 进化 的 原动力 , 进 化 过 程 的 驱动 力 及 其 基因 组 , 基 因 和 它们 的
产物 长 期 进化 的 各 种 分 子 机 制 所 产生 的 结果 。 另 外 , 本 书 从 进化 观点 为 分 子 材 料 的 比较 和 系统 发 育
分 析 提 供 了 基本 的 方法 论 。 尽 管 个 体 受 自然 选择 和 其 它 过 程 所 影响 , 我们 依然 强调 : 是 群体 和 基因
随 着 进化 时 间 而 变 。 为 了 在 这 些 看 起 来 完全 不 同 的 水 平 间 构造 联系 , 我 们 借用 了 群体 遗传 学 的 基本
。 我 们 着 手 为 分 子 进 化 “初学 者 ” 写 了 这 本 书 。 同 时 , 也 努力 保持 了 方法 的 科学 和 规范 , 并 包含
了 一 些 定 量 方法 。 因 此 , 可 以 用 数学 和 直觉 解释 , 从 分 子 水 平 上 描述 进化 现象 和 机 制 。 这 两 种 解释
都 不 会 削弱 彼此 的 说 服 力 , 还 会 相互 补充 , 以 帮助 读者 更 好 地 领会 观点 。 我 们 没有 试图 达到 泛泛 的
完满 性 , 而 是 提供 了 大 量 实例 , 以 支持 和 澄清 许多 理论 观点 和 有 争议 的 问题 。
许多 年 来 , 生 物化 学 家 和 分 子 生物 学 家 们 把 进化 研究 看 作 是 大 胆 推 测 , 无 根据 的 假设 和 无 学 科
方法 论 的 统一 体 , 而 这 种 评价 从 未 正确 过 。 分 子 方法 的 引进 不 容 置疑 地 将 进化 论 变 成 一 种 “ 硬 ” 科
学 。 在 这 里 , 能 够 从 经 验 数据 测度 、 计 数 或 用 计算 机 处 理 相关 的 参数 , 也 能 用 事实 去 检验 理论 的 正
确 性 。 在 今天 的 进化 研究 中 , 推 测 学 也 服务 于 同 物理 学 同样 的 目的 。 它 们 是 定量 性 假说 , 以 刺激 实
验 性 工作 。 由 此 , 理 论 能 够 得 以 校正 、 精 炼 或 被 驱 斥 。 本 书 的 主要 目的 之 一 是 通过 加 强 本 领域 的 事
实 基础 ,表明 进化 研究 已 经 达到 了 William Herschel 先生 于 1831 年 所 说 的 所 有 自然 科学 的 共同 目的 ,
即 可 以 这 样 陈 述 其 主张 :“ 不 是 模糊 和 泛泛 的 , 而 是 在 位 置 、 重 量 和 量度 上 尽 可 能 精确 ”。
我 们 感谢 许多 同事 、 学 生 和 朋友 , 是 他 们 帮助 我 们 编辑 了 本 书 。 他 们 的 评论 、 建 议 、 指 正和 讨
论 大 大 地 提高 了 本 书 的 质量 , 也 避免 了 许多 。 我 们 荣幸 地 感谢 Sara Barton, Adina Breiman, David
Cutler, David Hewett-Emmett, Winston Hide, Austin Hughes, Li Jin, Margaret Kidwell, Amanda
Ko, Giddy Landan, William S. Lewis, Volker Loeschcke, Ora Manheim, David Mindell, Tatsuya ota,
Lori Sadler, Paul Sharp, Yuval Shuali, Jurgen Tomiuk, Danid Wool 和 Chung-1 Wu. #5!) +h jit ot . HR
们 感谢 C. William Birky Jr. 和 Bruce walsh, 他 们 两 位 从 头 到 尾 地 校 阅 了 文稿 并 提出 了 很 多 有 益 的 建
3 .
lei 博士 表达 感激 之 情 , 他 对 我 们 的 调查 研究 工作 给 予 了 极 大 的 鼓
一 以 色 列 两 国 科学 基金 会 的 支持 也 是 本 项 合作 成 果 得 以 面世 的
rr
ae yes Ae 9 eS
: mC Ts ES Heal Laas
tab oF hae hah wt H2
se 人
让 Ea He tua
a
wt Py vu
: ask :
ry 7 ‘ i
We 各 - ' ;
pony ene
om ce we Wee 的 六
eae Re. Re et .
15 CW A pee ee
区 机 了 同人 克 册 六 所 3
时
和
上
iz 7h ha EY TT
Bg. py ae +i Oe ee Poe)
"DIA Joxegrel Jral a i gH Mate
SOT oda IO . aioe
- og it a tutto Ton W i Lg alain
让 Mae Wea X@
前 言
什么 是 分 子 进 化
分 子 进化 包括 两 个 研究 领域 : (1) 大 分 子 进 化 ; (2) 基因 和 有 机 体 进 化 史 的 重建 。 关 于 “大 分
子 进化 ", 我 们 指 的 是 在 进化 年 代 中 , 出 现在 遗传 材料 〈 如 DNA 序列 ) 中 的 变化 速率 、 模 式 及 产物
CME AR) 以 及 与 此 变化 相关 的 机 制 , 也 被 称 做 分 子 种 系 发 生 史 。 时间 枚 总 覃 分 于 认 化 这
《正如 从 分 子 材料 所 推 知 的 那样 ) 。
这 两 个 研究 领域 似乎 由 不 相关 的 研究 项 目 组 成 , 因 为 第 一 个 研究 领域 的 目的 是 要 盏 明 分 子 进化
的 原因 和 结果 ; 而 第 二 个 研究 领域 是 仅仅 把 分 子 用 作 工 具 , 以 重建 有 机 体 及 其 遗传 组 分 的 演化 史 。 然
而 在 实践 中 , 这 两 个 方面 是 紧密 相关 的 , 一 个 领域 的 进步 也 会 促进 另 一 领域 的 发 展 , 例 如 : 种 系 发
” 生 知 识 对 决定 分 子 特 征 的 变化 顺序 是 很 必要 的 ; 相反 , 给 定 分 子 的 变化 模式 和 速率 知识 对 试图 重建
类 和 群 的 进化 史 是 很 重要 的 。
ESL, 第 三 个 研究 领域 , 前 生物 (Prebiotic) 进化 或 称 “ 生 命 起 源 ” 也 包含 在 分 子 进化 框架 中 。
然而 , 它 涉及 到 很 多 猜想 , 也 极 少 用 到 定量 方法 , 并 且 , 在 前 生物 系统 〈 即 缺乏 可 复制 基因 的 系
统 ) 信息 传递 过 程 的 规律 , 目 前 还 不 清楚 。 因 此 , 本 书 并 不 侧重 生命 起 源 , 有 兴趣 的 读者 可 以 参阅
Oparin (1957), Cairns-Smith (1982), Dyson (1985) 和 Loomis (1988) 的 著作 。
分 子 进化 研究 起 源 于 两 个 不 同 的 学 科 : 和 群体 遗传 学 和 分 子 生 物 学 。 群 体 遗 传 学 为 研究 进化 过 程
提供 了 理论 基础 , 而 分 子 生物 学 则 为 其 提供 了 经 验 数据 。 因 此 , 掌 握 群 体 遗 传 学 和 分 子 生 物 学 的 基
本 知识 对 理解 分 子 进化 是 很 有 神 益 的 。
Ket
1 基因 结构 与 突
本 章 提供 为 研究 DNA 水 平 上 的 进化 过 程 所 必需 的 .关于 分 子 生物 学 方面 的 基础 知识 。 最 为 基本
的 部 分 是 一 种 典型 的 真 核 生物 基因 的 基因 组 结构 和 各 种 突变 类 型 。 更 进一步 的 背景 知识 将 在 以 后 的
有 关 章 节 中 讲述 出 。 某 些 术语 请 参看 词汇 表 。
1.1 DNA 序列
除 某 些 病毒 外 ,所 有 生物 的 遗传 信息 都 由 脱氧 核糖 核酸 DNA (deoxyribonucleic acid) 分 子 所 扒
带 。DNA 通常 是 由 两 条 相互 缠绕 的 互补 链 所 组 成 ,形成 一 种 右手 螺旋 状 。 每 条 链 都 是 一 条 由 四 种 核 背
RAMA ARE RK HR. A PE (purines) : PR ERM A (adenine) fl & RM G(guanine) , Pi FP he
(pyrimidines) ; fg fit % GE T (thymine) Fil fd he CCcytosine) 。 两 条 链 靠 核 苷 酸 之 间 的 氢 键 联系 在 二 起 。
腺 味 叭 与 胸腺 喀 啶 通过 两 个 氢 键 ,又 称 弱 键 (weak bond) 配 对 ;而 鸟 味 叭 与 胞 旷 啶 通过 三 个 氢 键 ,又 称
强 键 Cstrong bond) 配 对 (图 1 一 1)。
* HR BR a Moe Hin IER AS
(a)
H
\
N—Heeeeese O i
\
YN Neesece me a
Fe Se
(P) (s) O 〇 eeeseee H—N
J
Af PH We SiR
(b)
图 1 一 1 Sahm He Boe Cy Bl A i oR) Be AT, Ca) A Ae AR HR Fo ARR SZ ie (25 BE) , fo Cb) AE LER Fo B
之 间 ( 强 键 )。P :磷酸 根 ;S : 糖 。
DNA 序列 中 的 每 一 个 核 苷 酸 都 包含 一 个 成 糖 ( 脱 氧 核糖 )、 一 个 磷酸 基 团 和 一 个 味 叭 或 喀 喧 碱
基 。DNA 分 子 的 主干 由 糖 和 磷酸 等 部 分 构成 ,它们 通过 不 对 称 的 5 一 3' 磷 酸 二 酯 键 共 价 连结 在 一 起 。
所 以 ;DNA 分 子 是 一 种 有 极 性 的 分 子 , 它 的 一 端 ,在 末端 核 苷 酸 的 5' 碳 原子 上 有 一 个 磷酸 根 ( 一 P),
另 一 端 ,其 末端 核 苷 酸 的 3 碳 原 子 上 有 一 个 游离 羟基 (一 OH) .磷酸 二 酯 键 的 方向 决定 着 分 子 的 特性 ;
。6。
例如 ,序列 5 一 G 一 C 一 A 一 A 一 工 一 3 与 序列 3' 一 G 一 C 一 A 一 A 一 工 一 5 是 两 种 不 同 的 序列 。 为 了 方
便 起 见 ;DNA 序列 按 其 转录 的 顺序 , 即 从 5' 端 到 3' 端 书写 ,它们 又 分 别 被 称 为 上 游 (upstream) 和 下 游
(downstream) 方 向 。DNA 的 双 螺 旋 形 式 有 两 条 链 , 按 反 辕 平行 方向 排列 着 (图 1 一 2)。
5’ P+dk-—P—dk—P—dR-~P die OM 3
bs rif ew etme
C T T G
3’ RA RS St ee ve
图 1 一 2 双 链 DNA 的 反 向 平行 结构 的 图 示
P, 磷 酸根;dR ,脱氧 核糖 ;CH, 凑 基 ;A, 腺 味 叭 ;G, 鸟 味 叭 ;C, 胞 喀 啶 ; 工 ,胸腺 喀 喧 ;一 , 共 价 键 ;.,,。, 弱 键 ;…, 强 键 。
核糖 核酸 RNA(ribonucleic acid) 既 有 双 链 分 子 又 有 单 链 分 子 。RNA 与 DNA 不 同 之 处 在 于 ,其 主
王 糖 的 部 分 是 核糖 而 不 是 脱氧 核糖 ,由 尿 喀 啶 核 苷 酸 代 替 了 胸腺 喀 啶 核 苷 酸 。 腺 味 叭 , 胞 喀 啶 , 鸟 嘲
叭 ,以 及 胸腺 喀 啶 / 尿 喀 啶 ,都 是 标准 核 苷 酸 。 某 些 功能 RNA 分 子 , 特 别 是 tRNA 分 子 , 常 含有 非 标 准
核 苷 酸 , 即 在 转录 之 后 导入 RNA 分 子 中 的 、 将 标准 核 苷 酸 加 以 化 学 修饰 的 核 苷 酸 。
1.2 基因 结构
过 去 ,基因 被 定义 成 为 一 个 多 肽 链 编码 或 确定 一 个 功能 RNA 分 子 的 一 个 DNA 片段 。 然 而 ,最 近
的 分 子 研 究 却 从 根本 上 改变 了 我 们 对 基因 的 认识 ,所 以 ,我 们 将 采用 一 个 更 有 点 生气 的 定义 , 即 基因
是 对 某 一 特殊 功能 至 关 重 要 的 基因 组 DNA 或 RNA 的 一 个 序列 。 执行 这 一 功能 可 能 并 不 需要 该 基因
被 翻译 出 来 ,甚至 无 需 被 转录 出 来 。
现在 ,已 有 三 类 基因 被 认识 :(1) 为 蛋白 质 编码 的 基因 (protein-coding genes) ,它们 在 被 转录 成
RNA 之 后 再 被 翻译 成 蛋白 质 ;(2)RNA 基因 (RNA-specifying genes) ,它们 仅 被 转录 ;(3) 调 节 基 因
(regulatory genes) 。 按 照 狭 义 的 定义 ,第 三 类 只 包括 那些 不 转录 的 序列 。 被 转录 的 调节 基因 本 质 上 属
于 前 两 类 之 一 。 和 蛋白 质 编码 基因 和 RNA 基因 又 被 看 成 是 结构 基因 (structural genes), 注意 , 某 些 作者
将 结构 基因 的 定义 ,限制 在 只 包括 蛋白 质 编码 基因 的 范围 。
在 细菌 中 ,结构 基因 的 转录 仅 由 一 种 依赖 DNA 的 RNA 多 聚 酶 执行 。 与 之 不 同 的 是 ,在 真 核 生 物
里 要 用 到 三 种 RNA 多 聚 酶 。 核 糖 体 RNACrRNA) 基 因由 RNA 多 聚 酶 工 转录 ,蛋白质 编码 基因 由
RNA 多 聚 酶 工 转录 ,小 分 子 细胞 质 RNA(CscRNA) 基 因 , 象 转 移 RNA(CtRNA) 的 基因 , 则 由 RNA 2B
酶 开 转 录 , 某 些小 分 子 细胞 核 RNA(snRNA) 基 因由 多 聚 酶 工 转 录 , 另 一 些 则 由 多 聚 酶 下 转录 。 一 种
snRNA 基因 Us ,可 能 既 被 多 聚 酶 工 又 被 多 聚 酶 下 转录 。
蛋 和 白质 编码 基因
真 核 生 物 的 一 个 标准 的 蛋白 质 编码 基因 由 转录 部 分 和 不 转录 部 分 构成 (图 1 一 3a)。 不 转录 部 分
根据 它们 相对 于 蛋白 质 编码 基因 的 位 置 ,被 命名 为 5 和 3' 侧 序列 (flanking sequences) , 5! fill FF A&A
LES RFA) ,它们 决定 转录 过 程 的 起 始 、 缓 急 和 终止 。 因 为 这 些 调节 序列 起 始 转录 过 程 , 所
以 ,它们 也 被 称 为 启动 子 (promoters) ,而 它们 所 处 的 部 位 则 叫 启动 子 区 (promoter region)。 启 动 子 区
由 以 下 信号 构成 :TATA 块 (TATA box) ,位 于 转录 起 始点 上 游 19 一 27 碱 基 对 (bp) 处 ,更 上 游 一 些 的
CAAT (CAAT box) ,以 及 一 个 或 多 个 GC 块 (GC box) 拷 贝 , 后 者 由 序列 GGGCGG 或 其 变异 体 组
成 ,位 于 CAAT 块 的 周围 (图 3a) 。 可 能 在 定向 方面 起 作用 的 CAAT 块 和 GC 块 , 控 制 RNA 多 聚 酶 的
起 始 联结 ,而 TATA 块 则 控制 转录 起 始点 的 选取 。 不 过 ,我 们 注意 到 ,以 上 信号 对 启动 子 的 功能 而 言
都 不 是 必 不 可 少 的 。 某 些 基 因 不 具有 TATA 块 ,所 以 没有 一 种 独一无二 的 转录 起 始点 . 另 一 些 基 因 婚
没有 CAAT 块 也 没有 GC 块 ,它们 的 转录 起 始 是 受 5' 侧 区 域 中 的 其 他 因素 所 控制 的 .3' 侧 序列 含有 关
于 转录 过 程 终止 的 信号 和 多 聚 腺 苷 酸 尾部 的 信和 号。 目前 ,还 不 能 精确 地 标明 三 个 基因 开始 和 终止 的 位
en?
点 。
真 核 生物 中 为 蛋白 质 编码 的 基因 的 转录 起 始 于 转录 起 始 部 位 (transcription-initiation site) (RNA
转录 物 中 的 帽子 部 位 (cap site)) ,结束 于 终止 部 位 (termination site), 后 者 与 成 熟 信 使 RNACmRNA)
分 子 的 多 聚 腺 苷 化 作用 (polyadenylation) 或 多 聚 腺 苷 酸 尾 部 位 (poly(A)-addition site) 可 能 等 同 , 也 可
能 不 等 同 。 换 言 之 ,转录 的 终止 可 能 发 生 在 比 多 聚 腺 苷 酸 尾部 更 下 游 的 地 方 。 转 录 而 成 的 RNA, 又 称
前 信使 RNA(pre-messenger RNA)(pre-mRNA) 包 含 5 和 3' 不 翻译 区 ,Cuntranslated regions) ,外 显 子
(exons) 和 内 含 子 (introns) 。 内 含 子 ,或 插 和 人 序列 ,是 一 些 虽 被 转录 但 在 前 mRNA 分 子 的 加 工 中 被 剪
除 的 序列 。 所 有 保留 在 经 拼接 而 达成 熟 的 mRNA 中 的 基因 组 序列 称 外 显 子 。 oe
外 显 子 的 某 些 部 分 称 为 蛋白 质 编码 的 外 显 子 或 编码 区 (coding regions) 。
有 几 种 类 型 的 内 含 子 , 按 它们 从 前 mRNA 中 剪除 的 特异 机 制 来 界定 其 性 质 ( 见 Lewin,1990)。 这
里 我 们 只 关心 那些 受 RNA 多 聚 酶 工 转 录 的 细胞 核 基因 中 的 内 含 子 。 这 些 内 含 子 在 分 子 成 熟 期 间 ,在
酶 促 作 用 下 从 前 mRNA 中 剪除 。 这 些 内 含 子 的 拼接 位 点 (splicing sites or junctions) 可 能 由 每 三 内 含
子 的 5 和 3' 端 上 的 核 苷 酸 来 决定 ,分 别称 给 体 (donor) 和 受 体 (acceptor) 部 位 。 例 如 ,所 有 真 核 生 物 的
细胞 核 内 含 子 都 以 GT 开始 ,以 AG 结束 (GT 一 AG 规则 (GT-AG rule)) ,而 已 表明 这 些 序列 对 于 正
确 的 剪 切 和 拼接 是 至 关 重 要 的 (图 1 一 3a)。 和 邻近 内 含 子 的 外 显 子 序列 可 能 对 拼接 部 位 的 决定 也 有 贡
献 。 此 外 ,每 一 内 含 子 都 含有 一 段 特别 的 序列 ,TACTAAC 框 (TACTAAC box) ,位 于 内 含 子 3/ 端 上 游
侧 序列 区 外 显 子 2 外 显 子 3 。 侧 序列 区
Aa
fs az Z SE
| | | | | |
起 始 密码 子 终止 密码 子 | 起 始 密码 子 起 始 密码 子 终止 密码 子
|
-35 转录 起 始
A 终止 密码 子
(b)
图 1 一 3 (《a) 典 型 真 核 生 物 的 蛋白 质 编码 基 因 的 图 示 结 构 。 注 意 , 按 照 习惯 5/ 端 放 在 左边 . (b) 受 诱导 的 原核 生物 的
操纵 子 的 图 示 结 构 。 基 因 A 和 也 是 为 蛋白 质 编码 的 基因 ,并 被 转录 形成 一 个 信使 RNA。 阻 遇 物 基因 为 二 个 阳台 县
白 编码 ,后 者 结合 在 操纵 基因 上 ,并 通过 过 制 RNA 多 聚 酶 的 移动 从 而 阻碍 结构 基因 的 转录 。 操 纵 基因 是 二 段 至 风
有 10 个 碱 基 长 的 DNA 区 域 , 它 可 能 与 操纵 子 中 基因 的 被 转录 区 域 重 重 。 经 与 一 种 诱导 物 (二 种 小 分 子 ) 结 大 后 ,天
坎 物 转化 成 一 种 不 能 与 操纵 基因 结合 的 形式 。 于 是 RNA 多 聚 酶 就 能 起 动 操纵 子 中 基因 A fo BMH RL Lewin
1990)。(a 和 (b) 两 图 中 的 各 区 都 不 是 按 其 尺度 来 画 的 .
约 30 个 碱 基 的 地 方 。 这 一 序列 在 酵母 细胞 核 基 因 中 是 相当 保守 的 ,而 它 在 更 高 等 的 真 核 生 物 的 基因
申 则 要 变化 得 多 样 一 些 。 拼接 过 程 包括 5 拼接 部 位 的 裂 开 ,以 及 内 含 子 5 端 的 G 和 TACTAAC 框 中
第 6 位 上 的 A 之 间 形 成 克 酸 二 酯 键 。 随 后 ,3' 拼 接 部 位 裂 开 , 而 两 个 外 显 子 则 被 连 在 二 起,
内 含 子 的 数目 因 基因 而 异 。 某 些 基因 具有 十 几 个 内 含 子 , 其 中 有 些 内 含 子 可 能 有 几 千 个 核 昔 酸
长 。 另 三 些 ( 例 如 ,大 多 数组 蛋白 基因 ) 则 完全 没有 内 含 子 。 外 显 子 在 整个 基因 中 并 不 是 均匀 分 布 的
。8 。
有 些 外 显 子 密 集 在 一 起 ,另外 一 些 则 位 于 与 邻近 外 显 子 相距 很 远 的 地 方 。 图 1 一 4 给 出 了 说 明 这 一 现
象 的 一 个 例子 。 注意 ,细胞 核 蛋 白质 编码 基因 的 绝 大 多 数 具 有 内 含 子 。 并 非 所 有 内 含 子 都 起 分 裂 编码
区 的 作用 。 有 些 内 含 子 出 现在 不 翻译 区 域 ,主要 在 转录 -起 始 位 点 和 起 始 密码 子 之 间 的 区 域 中 。
真 细菌 类 的 蛋白 质 编 码 基因 与 真 核 生 物 中 的 这 类 基因 有 几 方 面 不 同 , 最 重要 的 是 ,它们 不 含 内 含
F (图 1 一 3b)。 真 细菌 中 的 启动 子 含 有 一 个 一 10 序列 (一 10 sequence) 和 一 个 一 35 序列 (一 35 se-
quence) ,分 别 位 于 转录 起 始 位 点 上 游 10bp 和 35bp 的 地 方 . 前 者 也 称 普 里 伯劳 块 (Pribnow box) RA
序列 TATAAT 或 其 变异 形式 ,而 后 者 则 具有 序列 TTGACA 或 其 变异 形式 。 原 核 生 物 的 启动 子 在 离
一 35 序列 更 上 游 的 地 方 , 可 能 还 含有 其 他 一 些 特别 的 序列 。
原核 生物 中 几 个 结构 基因 可 能 呈 连 续 排 列 以 形成 一 个 基因 表达 单位 , 它 被 转录 成 一 个 mRNA 分
子 ,接着 再 翻译 成 不 同 的 蛋白 质 。 这 种 单位 通常 都 含有 控制 属于 该 单位 的 基因 协调 地 表达 的 遗传 因
素 。 这 一 由 基因 排列 成 的 整体 称 为 一 个 操纵 子 (operon) (图 1 一 3b) 。
RNA 基因
原核 生物 和 真 核 生 物 中 的 RNA 基因 ,其 结构 通常 是 相似 的 。 这些 基因 一 般 不 含 内 含 子 。 然 而 ,在
有 些 生 物 中 , 象 纤 毛虫 、 粘 菌 和 细菌 中 ,确定 RNA 的 基因 就 可 能 含有 在 RNA 变 成 有 功能 分 子 前 必须
被 剪除 的 内 含 子 。 涉 及 某 些 RNA 基因 的 转录 调节 的 序列 因素 ,有 时 被 包括 在 决定 功能 终 产物 的 序列
的 范畴 内 。 特 别 地 ,所 有 确定 tRNA 的 基因 都 含有 一 个 受 RNA 多 聚 酶 下 识别 的 内 部 转录 起 始点 。
许多 RNA 分 子 在 转录 之 后 都 受到 修饰 。 这 类 修饰 包括 标准 和 非 标准 核 苷 酸 的 挫 人 ,标准 核 苷 酸
转变 成 非 标准 核 苷 酸 的 修饰 ,向 5 或 3 末端 的 核糖 核 苷 酸 的 终端 序列 的 酶 促 添 加 等 。
图 1 一 4 人 的 区 因子 基因 中 8 个 外 显 子 的 位 置 .图 中 坚 线 代 表 8 个 外 显 子 .本 图 只 标 出 了 被 转录 的 区 域 , 外 显 子 和
内 含 子 均 按 其 尺度 绘 出 。 注 意 ,5' 不 翻译 区 比 3' 不 翻译 区 短 。 资 料 取 自 Yoshitake 等 (1985) 。
调节 基因
我 们 对 调节 基因 的 认识 比 对 其 他 类 型 基因 的 认识 要 晚 一 些 。 暂 时 只 有 几 种 这 类 基因 或 基因 家 族
被 鉴别 出 来 。 它 们 是 ;(1) 复 制 子 基因 (replicator genes) ,作为 DNA 复制 的 起 始 和 终止 的 特异 位 点 而
起 作用 ,(2) 重 组 子 基因 (recombinator genes) ,提供 受 与 重组 有 关 的 酶 识别 的 特异 位 点 ,(3) 分 离子 基
因 (segregator genes) ,在 有 丝 分 裂 和 减 数 分 裂 期 间 ,提供 将 染色 体 附 着 到 分 离 机 构 上 的 特异 位 点 ,以
及 (4) 附 着 位 点 (attachment sites) ,为 蛋白 质 、 激 素 , 或 其 他 分 子 所 附着 。 可 能 还 存在 更 多 的 调节 基因 ,
它们 中 有 些 可 能 在 功能 和 位 置 两 方面 都 是 独立 于 结构 基因 的 ,并 且 可 能 与 更 复杂 的 调节 功能 , 象 多 细
胞 生物 的 个 体 发 育 有 关 。
1.3 遗传 密码
蛋白 质 合 成 涉及 到 一 个 解码 过 程 , 厌 此 ,一 个 由 mRNA 分 子 携带 的 遗传 信息 通过 转移 RNA (tR-
NA) 介 体 的 使 用 ,而 被 翻译 成 氨基 酸 。20 种 基本 氮 基 酸 及 其 缩写 形式 列 于 表 1 一 1。 翻 译 从 翻译 起 始
位 点 开始 ,进行 到 一 个 终止 信号 时 为 止 。 翻 译 过 程 涉 及 相互 邻近 的 不 重 登 核 苷 酸 三 联 体 , 称 为 密码 子
《codons) 的 连续 识别 。 一 个 将 被 翻译 的 序列 的 相位 由 起 始 密码 子 决定 , 称 为 阅读 框架 (reading frame) 。
在 处 于 核糖 体 和 mRNA 分 子 间 的 中 间 相 位 的 翻译 机 构 中 ,每 一 个 密码 子 被 翻译 成 一 个 特异 氨基 酸 ,
它 被 连续 地 添加 到 正在 延长 的 多 肽 链 上 。 密 码 子 与 氨基 酸 之 间 的 对 应 由 一 组 称 为 遗传 密码 (genetic
2 Oe
code) 的 规则 来 决定 。 除 了 几 个 例外 情况 ( 见 后 面 ) ,与 细胞 核 为 蛋白 质 编码 基因 有 关 的 遗传 密码 是 “ 通
FAAS” Cuniversal) , 即 几 乎 所 有 真 核 生 物 的 细胞 核 基因 和 原核 生物 的 基因 的 翻译 ,都 是 由 同一 组 规则
所 决定 的 。
通用 密码 子 由 表 1 一 2 给 出 。 由 于 1 个 密码 子 由 3 个 核 童 酸 组 成 , 且 存在 四 种 不 同类 型 的 核 苷 酸 ,
所 以 ,应 有 4: 一 64 种 可 能 的 密码 子 。 其 中 61 个 为 特异 的 氨基 酸 编码 ,并 被 称 为 有 意义 密码 子 (sense
codons) ,其 余 3 个 则 为 无 意义 密码 子 或 终止 密码 子 (nonsense or stop codons) ,其 作用 是 充当 使 翻译 过
程 终止 的 信号 。 因 为 有 意义 密码 子 有 61 个 ,而 蛋白 质 中 的 氨基 酸 却 上 只 有 20 种 ,所 以 ,大 多 数 氨基 酸 由
1 个 以 上 的 密码 子 编码 。 这 样 一 类 密码 被 称 为 是 简 并 密码 (degenerate code) 。 编 码 同 一 氨基 酸 的 不 同
密码 子 称 同 义 密码 子 (synonymous codons), 。 相 互 之 间 仅 在 第 3 位 上 不 同 的 同 义 密码 子 被 指定 为 一 个
密码 子 族 (codon family) 。 例 如 ,为 顷 氮 酸 编码 的 4 个 密码 子 组 成 一 个 四 密码 子 族 。 与 之 对 比 ,为 丝 氢
酸 编码 的 6 个 密码 子 被 分 成 一 个 四 密码 子 族 和 一 个 二 密码 子 族 。
表 1 一 1 基本 和 氨基酸 及 其 三 字母 和 一 字母 缩写
名 = i ‘ 三 字母 缩写 一 字母 缩写
Alanine Ala A
”Arginine Arg R
Asparagine Asn N
Aspartic acid Asp D
Cysteine Cys C
Glutamic Acid Glu E
Glutamine Gln Q
Glycine Gly G
Histidine His H
Isoleucine Tle I
Leucine Leu Le
Lysine Lys K
Methionine Met M
Phenylalanine Phe F
Proline Pro P
Serine Ser S
- Threonine Thr ify
Tryptophan Trp WwW
Tyrosine Tyr Y
Valine Val V
表 1 一 2 通用 密码 子
密码 子 氨基 酸 mT 氨基 酸 RAT 氨基 酸 密码 子 氨基 酸
UUU Phe UCU Ser UAU Tyr UGU Cys
UUC Phe UCC Ser UAC Tyr UGC Cys
UUA Leu UCA Ser UAA Stop UGA Stop
UUG Leu UCG Ser UAG Stop UGG Trp
CUU Leu CCU Pro CAU His CGU Arg
CUC Leu CCC Pro CAC His CGC Arg
CUA Leu CCA Pro CAA Gln CGA Arg
CUG Leu CCG Pro CAG Gln CGG Arg
AUU Tle ACU Thr AAU Asn AGU Ser
AUC lle ACC Thr AAC Asn AGC Ser
AUA Ile ACA Thr AAA Lys AGA Arg
AUG Met ACG Thr AAG Lys AGG Arg
GUU Val GCU Ala GAU Asp GGU Gly
GUC Val GCC Ala GAC Asp GGC Gly
GUA Val GCA Ala GAA Glu GGA Gly
GUG Val GCG Ala GAG Glu GGG Gly
-10°
大 多 数 真 核 生 物 的 蛋白 质 中 第 1 个 氨基 酸 是 甲 硫 氨 酸 ,由 起 始 密码 子 (initiation codon) AUG 编
码 。 这 一 氨基 酸 在 成 熟 蛋白 质 中 通常 被 移 除 了 。 大 多 数 原 核 生 物 的 基因 也 用 AUG 密码 子 作 为 起 始 ,
起 始 翻译 过 程 的 氨基 酸 则 是 甲 硫 氨 酸 的 衍生 物 , 称 甲 酰 甲 硫 氮 酸 。
表 1 一 3 哺乳 动物 线粒体 的 密码 子 ”
密码 子 AER FAT 氨基 酸 密码 子 AER RBS 氨基 酸
UUU Phe UCU Ser UAU Tyr UGU Cys
UUC Phe UCC Ser UAC Tyr UGC Cys
UUA Leu UCA Ser UAA Stop UGA Trp
UUG Leu UCG Ser UAG Stop UGG Trp
CUU Leu coy Pro CAU His CGU Arg
CUC Leu CCC Pro CAC His CGC Arg
CUA Leu CCA Pro CAA Gln CGA Arg
CUG Leu CCG Pro CAG Gln CGG Arg
AUU . Tle ACU Thr AAU Asn AGU Ser
AUC Tle ACC Thr AAC Asn AGC Ser
AUA Met ACA Thr AAA Lys AGA Stop
AUG Met, ACG Thr AAG Lys AGG Stop
GUU Val GCU Ala GAU Asp GGU Gly
GUC Val GCC Ala GAC Asp GGC Gly
GUA Val GCA Ala GAA Glu GGA Gly
GUG Val GCG Ala GAG Glu GGG Gly
< 与 通用 密码 子 的 差别 用 黑体 字 表示 。
通用 密码 子 在 质 体 一 象 维 管 植物 的 叶绿体 一 基因 组 所 采用 的 独立 的 翻译 过 程 中 也 被 使 用 着 。 比
较 起 来 ,大 多 数 线粒体 基因 组 和 几 种 细胞 核 基因 组 (例如 , 枝 原 体 属 Mycozplasma 和 四 膜 虫 属 Terrahny-
men&) 则 使 用 与 通用 密码 子 不 同 的 密码 子 。 不 过 ,一 般 说 来 这 些 密码 子 与 通用 密码 子 之 间 只 有 较 小 的
差别 。 作 为 一 例 ,哺乳 动物 线粒体 的 密码 子 列 于 表 1 一 3。 注 意 , 通 用 遗传 密码 中 编码 丝氨酸 的 密码 子
有 两 个 被 用 作 终 止 密码 子 ,而 色 氮 酸 和 甲 硫 氨 酸 都 是 被 两 个 密码 子 编码 ,而 不 是 一 个 。
DNA 序列 在 染色 体 复制 过 程 中 ,正常 情况 下 被 精确 地 拷贝 。 然 而 , 极 偶然 地 也 会 出 现 错误 ,从 而
产生 新 的 序列 。 这 些 错误 称 之 为 突变 (mutations) 。 突 变 既 可 发 生 在 体 细胞 内 又 可 发 生 在 种 系 细胞 内 。
由 于 体 细胞 突变 是 不 遗传 的 ,所 以 ,在 只 讨论 进化 问题 时 我 们 将 不 考虑 它们 。 本 书 通 篇 提 及 的 “突变 ”
这 个 词 ,将 只 指 在 种 系 细胞 中 的 突变 。
突变 可 以 根据 受 突变 事件 影响 的 DNA 序列 的 长 短 来 分 类 。 例 如 ,突变 可 能 影响 到 一 个 核 苷 酸
〈 点 突变 (point mnutations) ) 或 几 个 相互 邻近 的 核 苷 酸 。 我 们 也 可 按 突变 事件 造成 的 变化 类 型 ,将 突变
分 成 :(1) 替 换 (substitutions), 即 一 个 核 苷 酸 被 另 一 个 所 取代 ,(2) 缺 失 (deletions), 即 从 DNA 中 移 去
一 个 或 多 个 核 苷 酸 ,(3) 插 入 (insertions) ,向 序列 中 添加 一 个 或 多 个 核 苷 酸 ,(4) 倒 位 (inversions) , 即 含
有 2 个 或 多 个 碱 基 对 的 双 链 DNA 片段 转动 180"( 图 1 一 5)。
核 背 酸 蔡 换
核 苷 酸 替 换 分 成 转换 (transition il Mi # (transversions) Wi *. HRA A M GCM) = jaja T AIC
CHE ME) Z NA) A ER. HR — SR SF — Ea A HH.
发 生 在 蛋白 质 编 码 区 的 核 苷 酸 蔡 换 也 可 通过 它们 对 翻译 产物 恒 白 质 的 影响 来 定性 。 如 果 替 换 不
引起 氨基 酸 改 变 ( 图 1 一 6a) , 则 被 称 为 是 同 义 的 (synonymous) 或 沉默 的 (silent) 。 非 同 义 的 或 引起 氢
基 酸 改变 的 突变 ,又 可 进一步 攻 划 分 成 总 又 的 (missensey 和 无 义 的 (nonsense) 突 变 。 谋 又 实 变 将 受到
国王
(a)
”bb)
图 1 一 5 突变 的 类 型
〈a) 原 序列 ;(b) 从 C 到 工 的 转换 ;(c) 从 G 到 C 的 颠 换 ;(d) 缺 失 序 列 ACCTA;(e) 插 人 序列 AAAGC; (5 -GCAAAC— 3! 倒
fi Re 5’ — CAAACG— 3’,
影响 的 密码 子 变 成 另 一 种 密码 子 , 后 者 确定 的 氨基 酸 与 前 者 编码 的 氨基 酸 互 不 相同 (图 1 — 6b). HM
突变 则 将 密码 子 变 成 一 个 终止 密码 子 ,这样 , 由 于 翻译 过 程 在 成 熟 前 就 结束 了 ,所 以 最 终结 果 是 产生
一 个 截 掉 尾巴 的 蛋白 质 ( 图 1 一 6C) 。
(b) He Cys
AAGGCAAACCTACTGGTCTTATGT
x
AAGGCAAATCTACTGGTCTTATGT
=
AAGGCAAACCTACTGCTCTTATGT
AAGGCAACTGGTCTTATGT
ACCTA
AAGGCAAACCTACTAAAGCGGTCTTATGT
AAGGTTTGCCTACTGGTCTTATGT
ATA
ATA
ATA
ATA
ATA
ATA
图 1 一 6 发 生 在 编码 区 中 的 替换 类 型
(a) 同 义 的 ,(b) 误 义 的 ,和 (c) 无 义 的 。
每 一 个 有 意义 密码 子 通过 一 次 核 苷 酸 替 换 可 以 突变 成 9 种 其 他 密码 子 , 例 如 ,CCU(pro) 可 以 经
历 6 种 非 同 义 的 替换 , 变 成 UCU (Ser), ACU (Thr),GCU (Ala),CUU (Leu) , CAU (His) # CGC
(Arg), WA 3 种 同 义 的 替换 , 变 成 CCC,CCA 或 CCG。 因 为 通用 遗传 密码 由 61 个 有 意义 密码 子 组
成 ,所 以 有 61X9=549 种 可 能 的 核 苷 酸 蔡 换 。 如 果 我 们 假定 核 苷 酸 替 换 随 机 地 进行 且 编 码 区 中 所 有
密码 子 具 相同 的 频率 ,那么 ,我 们 就 能 根据 遗传 密码 算出 不 同类 型 核 苷 酸 蔡 换 的 期 望 比 例 ., 这些 数 据
。12 。
Ala
GCA AAC GIC CIG
GCAAACGTCCTGTTAACA
Asn
Val
GTC
GTA
Val
Val
GTC
TGC
Phe
Val
Leu
Thr
ACA
ACA
Thr
Thr
ACA
ACA
Thr
Thr
ACA
列 于 表 1 一 4。 由 于 遗传 密码 的 结构 , 同 义 替 换 主要 发 生 在 密码 子 的 第 3 位 上 。 事 实 上 ,第 3 位 上 所 有
可 能 发 生 的 改变 中 ,大 约 70%% 是 同 义 的 。 相 比 之 下 ,密码 子 第 2 位 上 的 所 有 蔡 换 都 是 非 同 义 的 ,而 第 1
位 上 发 生 的 核 苷 酸 变化 , 绝 大 多 数 也 是 如 此 (96%% )。
表 1 一 4 随机 蛋白 质 编 码 序 列 中 不 同类 型 突变 替换 的 相对 频率
替换 数目 百分比
全 部 密码 子 总 数 549 100
同 义 的 134 25
非 同 义 的 415 75
误 义 392 71
KEM 23 4
第 一 位 总 数 183 100
同 义 的 8 4
非 同 义 的 175 96
误 义 166 91
无 意义 9 5
第 二 位 总 数 183 100
同 义 的 0 0
非 同 义 的 183 100
误 义 176 96
LBM 7 4
第 三 位 总 数 183 100
同 义 的 126 69
非 同 义 的 57 31
误 义 50 27
无 意义 7 4
缺失
一 一 一
4 一 一 = a5
a — eS
添加
图 1 一 7 不 等 价 交 换 , 结 果 是 子 链 之 一 中 某 一 DNA 序列 缺失 ,而 另 一 子 链 中 则 出 现 同一 序列 的 重复 。 图 中 先 形 表
示 某 一 特定 长 度 的 DNA。
缺失 和 插入
缺失 和 揪 和 人 可 能 由 几 种 机 制造 成 。 机制 之 一 是 不 等 价 交 换 (unequal crossing over)。 图 1 一 7 绘 出
了 _ 1 殴 单 模型 ERR EET FRR CAR LIE — DNA 片段 缺失 ,而
在 另 一 条 上 则 出 现 相 应 的 添加 。 另 一 个 机 制 是 复制 滑脱 (replication slippage) 或 滑脱 链 误 配 (slipped-
strand mispairing) 。 这 类 事件 发 生 在 含有 邻接 短 重复 序列 的 DNA 区 域 中 。 图 1 一 8a 表示 ,在 DNA 复
制 期 间 ,滑脱 可 因 邻 接 重复 间 的 误 配 而 引起 ,而 滑脱 又 可 造成 某 一 DNA HERA RES MR.
于 究竟 是 缺失 还 是 重复 , 则 要 看 滑脱 发 生 在 5"~3' 方 向 还 是 与 之 相反 的 方向 。 图 1 一 8b 表明 ,滑脱 误
配 也 可 能 发 生 在 非 复 制 DNA 中 。 造成 DNA 序列 插入 或 缺失 的 第 三 种 机 制 是 DNA 转 座 ,这 将 在 第 7
章 中 加 以 探讨 。
SRS AULA SEAS BEE (ges) 因为 当 一 个 带 有 缺失 或 插入 的 序列 与 原 序列 比较 时 ,两 序列 中 就 将
有 一 个 会 出 现 “ 裂 锋 ”( 第 3 章 )。 裂 颖 事件 中 涉及 的 核 苷 酸 数目 ,范围 从 一 个 或 几 个 到 包括 成 千 个 核 昔
1 138
(a) 在 DNA 复制 期 间 正常 配对 四 相互 作用 巢 色 体 DNA 的 正常 配对
5’—AATCCTAGTATATA 3’
nwt Ss siseeceace 5’—AATCCTAGTATATACACGAATT—3°
4'—TTAGGATCATATATGTGCTTAA—S’ - SP2SSTS See eeese caer
<~TTAGGATCATATATCTGCEE AE 地
滑脱 链 误 配 , 滑 脱 链 误 本 滑脱 链 误 配
AG AG
T
A rs
5 一 AATC TATA Le 5’ AATCCTAGTATATA 4 [
tit eens icp tes 5 AATE 人
3’—TTAGGATCATAT TATGTGCTTAA—S’ 3'—TTAG ATATGTGCTTAA 一 一 5 32322333
G 中 5 一 TTAccATcATAT , TTAA 一 -一 5
A A Cc
TE
GT
复制 继续 插入 TA 重复 单位 不 配对 的 TA 重复
单位 被 切除 后 继续 复制 - 切除 /修复
| MA TA 重复 单位
AG
Hy I AG
GonA. « «=e 加
5 oe TATATACACGAATT—3" 5 一 AATCCTAGTATACACGAATT —3 Crit | a ee
生生 下 这 证 下 下 让 人- 和 你 于 和 明生 吕 生 放 计 5 一 AATC 让
IE 3 TTAC ATATGTGCTTAA 一 一 5 2
Boe 3‘—TTAGGATCATATATGTGCTTAA—S’
Tc
图 1 一 8 BREMOSR PA (FHUARAR) MOAR AEH ER FRA, DRAFT DNA 合成 的 方向 ,
圆 点 表示 碱 基 配 对 。(a) 在 DNA 复制 期 间 TA 重复 中 发 生 的 两 碱 基 滑 脱 。3' 一 5' 方 向 中 的 滑脱 造成 一 个 TA 单位 播
入 的 结果 ( 左 半 图 )。 另 一 方向 中 的 滑脱 则 造成 一 个 重复 单位 缺失 的 结果 ( 右 半 图 )。 右 半 图 中 的 缺失 是 正在 生长 的
链 的 3' 端 上 ,未 配对 重复 单位 ( 标 有 星 号 ) 被 切除 而 造成 的 ,推测 系 赁 借 DNA 聚合 酶 的 3 一 5' 外 切 酶 活性 。(b) 在 非
复制 DNA PTA 重复 中 发 生 的 两 碱 基 滑 脱 。 误 配 区 形成 单 链 环 ,它们 可 能 是 切 离 和 误 配 修复 的 目标 。 结 果 ( 有 是 缺失
还 是 插入 ) 依 赖 于 倒 底 是 哪 条 链 被 切 离 和 被 修复 ,以 及 在 DNA 修复 过 程 中 究竟 是 哪 条 链 被 当 作 模 板 。 自 Levinson
和 Gutman (1987) 修 改 而 成 。
酸 的 连续 长 段 。 裂 颖 的 长 度 基 本 上 展示 出 双 峰 型 频率 分 布 , 短 裂 颖 (到 20 一 30 核 苷 酸 为 止 ) 常 常 是 由
DNA 复制 过 程 中 的 错误 所 造成 的 , 象 上 面 讨论 过 的 滑脱 链 误 配 , CaS
Bt 36 th BK DNA 转 座 所 造成 。
FE Fit SK, UN RS SE AE TO KE RAR FE 23) FC WU KS ea) BE HE SP
下 游 的 编码 序列 将 会 按 错误 的 相位 阅读 。 这 种 突变 称 框架 移动 (frameshift) 突 变 。 结 果 , 一 个 裂缝 不 仅
会 导入 许多 氮 基 酸 的 改变 ,而 且 还 可 能 使 终止 密码 子 被 抹 掉 或 者 在 相位 中 导 和 新 的 终止 密码 子 ,后 果
是 产生 长 度 异 常 的 蛋白 质 ( 图 1 一 9)
突变 的 空间 分 布
突变 不 是 在 整个 基因 组 中 随机 出 现 的 .有 些 区 域 比 另 一 些 区 域 更 容易 突变 ,它们 被 称 为 突变 的 热
四 Bre Ui pee ea Pe i A A ak Sa a SA
a em eR 5’ 一 TG 一 3' 。 志 核 苷 酸 5 一 TT 一 3' 在 原核 生物 中 是 一 个 突变 热点 ,但 在 真 核 生 物 中
通常 不 是 . 在 细菌 中 ,含有 短 加 〔 即 "两 条 互补 链 读 起 来 相同 的 序列 ,如 5 二 GCCG-
GC—3's-5'= GGCGCC— 3’ #1 5’/ -GGGCCC— 3’) HY DNA 内 的 区 域 ,被 发 现 比 其 他 区 域 更 易于 突
变 。 在 真 核 生物 的 基因 组 中 , 串 接 重复 常常 是 缺失 和 插 人 的 热点 ,或 许 这 是 滑脱 链 误 配 所 造成 的 结果 。
=
(palindromes
el4e
my pave Ala Lew Val ‘Lew Lew Thr le “ Cys “de> “Ter
AAG GCA CTG GTC CTG TTA ACA ATA TGT ATA TAA TACCATCGCAATAGGG
AAG GCA CTG TCC TGT TAA CAATATGTATATAATACCATCGCAATAGGG
bye Ala’ “Leu. Phe Cys Ter
iu oAla..Asn..Val. Leu. Leu. Thr... Ile... Cys. Ie Ter
AAG GCA AAC GTC CTG TTA ACA ATA TGT ATA TAA TACCATCGCAATAGGG
AAG-GCA AAC GGT CCT GTT AAC AAT ATG TAT ATA ATA.CCA TCG CAA TAG GG
Bye pvAla Asn Gly «Pro ~ Vab(iiAsn’\ Asn >) MetoyTyr: De) «Tle Prov Ser Gin ‘Ter
a
图 1 一 9 由 缺失 或 插入 造成 的 阅读 框架 发 生 框 架 移动 的 例子 。(a) 缺 失 一 个 G 造 成 成 熟 前 终止 。(b) 插 入 一 个 G,
结果 抹 掉 了 一 个 终止 密码 子 。 终 止 密码 子 下 划 有 横 线 。
习题
1. 从 某 种 哺乳 动物 中 找 出 两 个 完全 定 序 了 的 为 蛋白 质 编码 的 基因 (你 可 以 应 用 数据 库 或 一 本 杂
志 )。 确 定 它们 每 一 个 的 内 含 子 和 编码 外 显 子 间 的 长 度 比 。 用 取 自 果 蝇 的 两 个 为 蛋白 质 编码 的 基因 再
做 上 述 处理 。 哪 些 基因 的 内 含 子 与 外 显 子 长 度 比 更 大 ?
2. 从 某 种 哺乳 动物 中 找 出 一 个 完整 的 mRNA 序列 。 删 去 你 在 编码 区 中 最 先 碰 到 的 两 个 核 苷 酸
CI。 判 断 是 否 有 一 个 成 熟 前 终止 密码 子 进入 阅读 框架 ,或 者 是 否 翻译 会 超越 原 终止 密码 子 而 延长 。
3. 用 习题 2 中 的 序列 ,在 编码 区 中 第 6 个 C 后 插入 一 个 A。 插 和 人 将 会 怎样 影响 翻译 ?
4. 用 习题 2 中 的 序列 ,判断 有 多 少 密码 子 能 经 一 次 核 苷 酸 蔡 换 而 突变 成 终止 密码 子 。
5. 用 习题 2 中 的 序列 ,判断 密码 子 第 3 位 中 有 多 少 转换 是 同 义 的 ,而 又 有 多 少 颠 换 是 同 义 的 。
后 继 阅 读 文献
Darnell, J. E., H. F. Lodish and D. Baltimore. 1990. Molecular Cell Biology, 2nd Ed. Scientific
American Books. New York.
Lewin, B. 1990. Genes TV . Oxford Universtity Press, New York.
Stryer, L. 1988. Biochemistry, 3rd Ed. Freeman, New York.
Suzuki, D. T.. A. J. F. Griffiths. J. H. Miller and R. C. Lewontin. 1989. An Introducition to Ge-
netic Analysis, 4th Ed. Freeman, New York.
Watson, J. D, N. H. Hopkins, J. W. Roberts. J. A. Steitz and A. M. Weiner. 1987. Molecular Biolo-
gy of the Gene, 4th Ed. Benjamin/Cummings, Menlo Park, CA.
2 群体 中 基因 的 动力 学
群体 遗传 学 探讨 发 生 在 群体 内 的 遗传 变化 。 本 章 将 介绍 某 些 对 理解 分 子 进化 来 说 至 关 重 要 的 、 群
体 遗 传 学 的 基本 原理 。 群 体 遗 传 学 的 一 个 基本 问题 ,是 确定 一 个 突变 基因 的 频率 在 各 种 进化 力量 的 影
响 下 ,将 如 何 随时 间 而 变化 .此 外 ,从 长 期 的 观点 看 ,重要 的 是 决定 一 个 新 的 突变 变异 型 完全 替代 群体
中 的 老 变异 型 的 概率 ,以 及 估计 替代 过 程 将 会 进行 得 多 快 。 与 形态 上 的 改变 不 同 , 许 多 分 子 变化 好 象
对 生物 的 表 型 只 有 很 小 的 影响 ,所 以 ,分 子 变 异型 的 频率 受 机 遇 的 影响 强烈 。 因 此 ,在 处 理 分 子 进化
时 ,机 遇 因素 应 该 被 考虑 进去 。
2.1 等 位 基因 频率 方面 的 改变 。
一 个 基因 在 染色 体 或 基因 组 上 的 位 置 称 基因 座位 (locus) , 某 一 给 定 基 因 座 位 上 所 选取 的 基因 形
式 称 等 位 基因 (alleles) .在 一 个 群体 中 , 某 一 基因 座位 上 可 能 有 一 个 以 上 的 等 位 基因 存在 ,它们 的 相对
比例 称 等 位 基因 频率 (allele frequencies) 或 基因 频率 (gene frequencies)。 例 如 ,我 们 假定 。 一 个 大 小 为
N 的 单 倍 体 群 体 中 , 某 一 基因 座位 上 有 各 具 ni An, 个 拷贝 的 两 个 等 位 基因 。 那 么 ,它们 的 等 位 基因
频率 就 分 别 等 于 和 和 天。 注意 ,其 中 心 二 nm 一 N ,而 对 十 冰 一 1。
进化 是 在 群体 的 遗传 组 成 方面 发 生变 化 的 过 程 . 因 此 ,进化 过 程 中 最 基本 的 部 分 是 等 位 基因 频率
随时 间 的 变化 .事实 上 ,从 进化 的 观点 看 ,一 个 新 突变 要 变 得 有 意义 就 必须 增加 它 自 己 的 频率 FRA
在 群体 中 被 固定 (fixed)( 即 在 随后 的 世代 中 所 有 个 体 将 共有 同一 种 突变 型 等 位 基因 )。 如 果 不 增加 自
己 的 频率 ,那么 这 个 突变 将 对 该 物种 的 进化 史 几 乎 没有 影响 .对 于 一 个 要 增加 频率 的 突变 型 等 位 基因
来 说 ,必须 是 某 些 因子 而 不 是 突变 来 挫 和 作用。 这 些 因子 包括 自然 选择 ,随机 遗传 漂 变 ,重组 和 迁徙 。
为 了 认识 进化 的 过 程 ,我 们 必须 研究 以 上 因子 是 如 何 影 响 等 位 基因 频率 的 变化 的 。 本 书 里 ,我 们
只 讨论 自然 选择 和 随机 遗传 漂 变 。 在 涉及 形态 学 性 状 的 经 典 进化 研究 中 ,自然 选择 被 看 成 是 进化 的 主
要 驱动 力量 。 与 此 成 鲜明 对 比 的 是 ,在 分 子 水 平 上 随机 遗传 漂 变 被 认为 在 进化 中 起 重要 作用 。
研究 群体 中 的 遗传 变化 有 两 种 数学 途径 :决定 性 的 和 随机 性 的 .决定 性 模型 (deterministic model)
较 简 单 。 它 假定 ,群体 中 等 位 基因 频率 从 这 一 代 到 下 一 代 的 改变 是 以 唯一 的 方式 发 生 的 ,并 且 能 根据
关于 初始 条 件 的 知识 毫 不 含糊 地 预测 出 来 .严格 说 来 ,此 途径 仅 当 两 个 条 件 满 足 时 才能 应 用 :(1) 群 体
在 大 小 上 是 无 限 的 ,和 (2) 环 境 或 者 不 随时 间 而 变 或 者 按 决定 性 规则 而 变 。 这 些 条 件 在 自然 界 显 然 绝
不 会 得 到 满足 ,因此 , 纯 决 定性 途径 对 于 描述 群体 中 等 位 基因 频率 随时 间 的 变化 可 能 是 不 够 的 。 随 机
的 或 不 可 预料 的 等 位 基因 频率 方面 的 波动 也 必须 被 考虑 进去 。
处 理 随 机 波动 需要 一 种 不 同 的 数学 途径 。 随 机 性 模型 (stochastic models) 假 定 等 位 基因 频率 的 变
化 按 或 然 性 方式 发 生 , 即 ,从 这 一 世代 中 关于 条 件 的 知识 我 们 不 能 含糊 地 预料 下 一 世代 里 的 等 位 基因
频率 ,而 只 能 决定 可 能 出 现 的 某 些 等 位 基因 频率 的 出 现 概率 .显然 ,随机 性 模型 比 决定 性 模型 更 可 取 ,
因为 它们 建立 在 更 为 现实 的 假定 之 上 。 不 过 ,决定 性 模型 在 数学 处 理 上 要 容易 得 多 ,而 且 在 某 些 条 件
下 它们 也 能 得 出 足够 精确 的 近似 结果 。 以 下 ,我们 将 按 决 定性 方式 处 理 自然 选择 。
2.2 自然 选择
自然 选择 Cnatural selection ) 被 定义 成 :一 个 群体 内 遗传 上 不 同 的 个 体 或 基因 型 的 有 差别 的 增殖 。
. 16 .
有 差别 的 增殖 是 由 个 体 间 如 死亡 率 、 能 育 性 .生殖 力 、 交 配 成 功 和 后 代 生 活力 等 因子 方面 的 差异 所 造
成 的 。 自然 选择 是 个 体 间 在 与 增殖 有 关 的 性 状 方面 存在 遗传 变异 的 必然 结果 。 如 果 一 个 群体 由 在 这
类 性 状 方面 相互 无 差别 的 个 体 所 组 成 , 则 它 将 不 会 受到 自然 选择 。 选 择 导致 等 位 基因 频率 随时 间 而
变 。 然 而 ,仅仅 是 等 位 基因 频率 从 一 代 到 另 一 代 发 生变 化 ,并 不 一 定 表示 自然 选择 在 起 作用 。 别 的 过
程 , 例 如 随机 遗传 漂 变 ,也 能 导 至 等 位 基因 频率 随时 间 的 改变 ( 见 后 面 的 内 容 )。
eo eee eae
过 ,由 于 一 个 群体 的 大 小 通常 受 其 所 处 环境 的 容量 限制 ,所 以 , 某 三 个 体 的 进化 成 功 不 是 由 其 绝
对 适合 度 (absolute fitness) 而 是 由 其 与 群体 中 其 他 基因 型 相 比 的 相对 适合 度 (relative fitness) 所 决定
的 。 在 自然 界 ,不 能 预期 一 个 基因 型 的 适合 度 在 所 有 世代 和 所 有 环境 条 件 下 保持 不 变 。 然 而 ,对 每 种
基因 型 指定 一 个 恒定 的 适合 度 值 ,我 们 就 可 以 得 出 一 些 简单 的 理论 公式 ,它们 对 理解 由 自然 选择 导致
的 群体 遗传 结构 变化 的 动力 学 是 很 有 用 的 。 在 某 些 最 简单 的 模型 里 ,我们 假定 生物 的 适合 度 仅 由 其 遗
传 组 成 所 决定 。 我 们 还 假定 ,所 有 基因 座位 对 个 体 的 适合 度 的 贡献 相互 独立 ,所 以 每 一 基因 座位 都 能
被 隔离 开 来 处 理 。
群体 中 的 大 多 突变 型 都 会 降低 其 携带 i 。 这 类 突变 将 受到 淘汰 性 选择 并 且 最
终 将 会 被 从 群体 中 去 除 。 这 种 的 选择 称 负 选 择 或 纯洁 (GBA Cogaive oF poring section 偶
尔 ' 某 二 新 突变 可 能 与 群体 中 最 好 的 等 位 基因 一 样 合适 ,这 utral) , 且 其
命运 将 不 由 选择 所 决定 ?3 极 军 见地 , 可 能 会 产生 一 个 能 给 其 携带 者 以 选择 优势 的 突变 型 。 这 类 突变 将
人
RE AEF (nositiv or dares élection ) 。 NRA OLR A eee od I Des
下 面 我 们 将 考虑 一 个 有 两 个 等 位 基因 , eres | 的 基因 座位 的 例子。 每 等 位 基因 可 被 指定 __ +
内 在 适合 度 值 ; 它 可 能 是 优势 的 .劣势 的 ,或 中 性 的 。 然 而 ,这 种 指定 只 适用 于 单 倍 体 生 物 。 在 两 倍 体
生物 中 ,适合 度 最 后 由 该 基因 座位 上 的 两 个 等 位 基因 间 的 相互 作用 所 决定 。 两 个 等 位 基因 ,将 有 三 种
可 能 的 两 倍 体 基 因 型 :AIA ,AiA, 和 A:A: ,它们 的 适合 度 则 可 分 别 用 wi wie wok RA
给 定 某 一 群体 中 等 位 基因 A, 的 频率 为 p, 该 互补 等 位 基因 A, 的 频率 为 q 王 1 一 p, 我 们 可 以 证 明 ,
在 随机 交配 下 AJA ,AiA, 和 ALA, 的 频率 将 分 别 为 p ,2pq 和 号 。 一 个 维持 着 这 种 基因 型 比 的 群体 ,
被 认为 是 处 于 哈 迪 一 温 伯 格 平 衡 (Hardy-Weinberg equilibrium) 。 1M .p=p’ +> (2pq) UK a=>
(2pq) 十 qz。 ee eee)
在 一 般 情 况 下 ,三 种 基因 型 被 指定 为 以 下 适合 度 值 和 初始 频率
基因 型 AA, A,A, A.A,
适合 度 Wi Wiz W22
频率 P2 2pq q°
现在 让 我 们 考虑 一 下 等 位 基因 频率 随 选 择 而 改变 的 动力 学 。 假 定 三 种 基因 型 的 频率 及 其 适合 度
如 上 ,, 则 三 种 基因 型 AlAi ,AiA, A ALA, 对 下 一 世代 的 相对 贡献 ,将 分 别 为 pwii,2pqwiz 和 qzwz。 因
此 ,等 位 基因 A, 的 频率 在 下 一 世代 将 变 成
y 2 ee ed
pw, + 2pqwy, + 9 oz
每 世代 等 位 基因 A, 的 频率 改变 量 被 表示 成 Aq=q' 一 q。 我 们 可 以 证 明
Ar = pal pwr 一 Wy) + q (Way x ¥en)
p’wy, + 2pquy. + q° 2row,
下 面 ,我 们 假定 A, 是 该 群体 中 的 原 等 位 基因 或 “ 老 , 本 然后 ,我 们 来 考虑 一 个 新 突变 型
等 位 基因 A, 出 现 后 ,等 位 基因 频率 变化 的 动力 学 。 为 了 数学 上 的 便利 ,我 们 给 予 A,A, 基因 型 的 适合
度 值 为 1。 新 产生 的 基因 型 AiA, MAA, 的 适合 度 将 有 赖 于 A 和 As 间 相 互 作用 的 模式 .。 例如 ,如 果
A, 对 A, 是 完全 显 性 的 ,那么 wavwb 和 wz 可 分 别 写成 1,1 十 s, 和 1 十 s, 如 果 A, 完全 隐 性 , 则 适合
分 别 为 1,1,1 十 s。 这 里 s BHAA, 的 基因 型 与 A,Ai 间 的 适合 度 差异 。s 的 值 为 正 表 示 与 AlA, 比较
e 飞 7
(2. 1)
(2. 2)
适合 度 增 高 ,而 为 负 时 则 表示 适合 度 降 低 。
共 显 性
在 选择 的 共 显 性 模式 (codominant mode of selection) 或 基因 选择 (genic selection) 中 ,两 种 纯 合 子
有 着 不 同 的 适合 度 值 ,而 杂 合子 的 适合 度 则 为 两 种 纯 合 基因 型 的 适合 度 的 平均 值 。 三 种 基因 型 的 相对
适合 度 值 可 写成 :
基因 型 AA, AiA, A:A,
适合 度 1 1 十 s 1 十 2s
根据 等 式 2. 2, 在 共 显 性 下 我 们 得 等 位 基因 A. 的 每 世代 频率 改变 如 下 :
4 天 (2. 3)
~ 1+ 2spq + 2
图 2 一 1 BARA s=0.01 的 等 位 基因 A, WI In tO. BOT) AB, FE A te ES Ze ET El
等 位 基因 频率 的 前 提 下 增加 其 中 一 种 等 位 基因 的 频率 ,而 与 等 位 基因 在 群体 中 的 相对 频率 无 关 。 因
此 ,基因 选择 是 一 种 定向 选择 (directional selection)。 注 意 ,在 低频 率 下 对 一 个 共 显 性 等 位 基因 的 选择
*
1.0
0.8
0.6
it
&
0.4
0.2
四
0 200 400 600 800 1,000 1,200 1,400
世代
图 2 一 1 具 S=0.01 的 共 显 性 优势 等 位 基因 ,在 其 于 第 0 代 作 为 突变 的 结果 而 出 现 后 的 频率 。
不 是 十 分 有 效 ( 即 ,等 位 基因 频率 的 变化 缓 慢 )。 原 因 在 于 , 当 A: 频率 低 时 ,等 位 基因 A, 处 于 杂 人 合子
中 的 比例 较 大 。 例 如 , 当 A; 的 频率 为 0.5 50MM A, 等 位 基因 由 杂 合 子 携带 ,而 若 A, 的 频率 为 0.
01, 则 99%% 的 这 种 等 位 基因 都 处 于 杂 合 子 中 。 因 为 杂 合 子 带 有 两 种 等 位 基因 ,受到 的 选择 压力 比 纯 合
子 A;A; 的 弱 ( 即 s 和 2s 的 关系 ), 所 以 在 低 q 值 下 等 位 基因 频率 的 总 改变 量 就 小 。
超 显 性
在 选择 的 超 显 性 模式 (overdominant mode of selection ) , 杂 合 子 有 最 高 的 适合 度 。 于 是 :
SEA AA, AA, A2A2
适合 度 1 1 十 s” 1+t
这 里 s>O 目 s>t。 根据 ALA, 的 适合 度 是 高 于 、 等 于 或 低 于 AVA, 的 适合 度 ,t 可 相应 地 吉 正 值 、
零 、 或 负 值 。 等 位 基因 频率 的 变化 表示 成
On agen = (2. 4)
图 2 一 2 表示 一 个 受 超 显 性 选择 的 等 位 基因 的 频率 变化 .与 造成 一 个 等 位 基因 最 终 从 群体 申 消 失
的 著 显 性 选择 体制 不 同 , 在 超 显 性 选择 下 ,群体 迟早 将 达到 一 种 两 等 位 基因 共存 的 平衡 状态 。 平 衡 送
到 后 将 看 不 到 等 位 基因 频率 的 进一步 变化 ( 即 Aq=o)。 所 以 , 超 显 性 选择 属于 一 种 称 为 平衡 选择 或 稳
定 化 选择 (balancing or stabilizing selection) 的 选择 体制 。
4 18>
处 于 平衡 时 的 等 位 基因 AD 的 频率 可 通过 令 等 式 2.4 的 Aq 一 o 而 解 出 :
(2.'5)
s
了 一 2 从
当 t 王 0( 即 两 种 纯 合 子 有 相同 的 适合 度 值 ) 时 ,两 种 等 位 基因 的 平衡 频率 将 都 是 50% 。
1.0
0.8
0.6
0.4
0.2
世代
图 2 一 2 一 个 受 超 显 性 选择 的 等 位 基因 的 频率 变化 。 起 始 频率 从 上 到 下 各 为 ;0.99,0.75,0.25 Fo 0. 013s=0. 250
及 t=0.125。 因 为 s 和 t 的 值 都 特别 大 ,所 以 等 位 基因 频率 的 变化 迅速 。 注 意 , 在 q 一 0.667 处 有 一 个 稳定 平衡 。 自
Hartl 和 Clark(1989) 修 改 而 成 。
2.3 随机 遗传 漂 变
正如 上 面 提 到 的 ,自然 选择 不 是 引起 等 位 基因 改变 的 唯一 因子 。 等 位 基因 频率 变化 也 可 因 机 遇 而
产生 ,虽然 在 这 种 情况 下 变化 不 是 有 方向 性 的 而 是 随机 的 .产生 等 位 基因 频率 的 随机 波动 的 一 个 重要
因子 是 生殖 过 程 中 配子 的 随机 取样 (图 2 一 3)。 之 所 以 出 现 取样 问题 ,是 因为 在 自然 界 中 绝 大 多 样 情
况 下 , 任 一 个 世代 中 可 用 配子 的 数目 都 远大 于 下 一 世代 所 产生 的 成 年 个 体 数 。 换 句 话 说 ,只 有 一 小 部
分 配子 成 功 地 发 育 到 成 体 。 在 一 个 经 受 孟 德尔 式 分 离 的 两 倍 体 群体 中 ,即使 没有 配子 过 剩 , 即 每 一 个
_ 体 对 下 二 世代 正好 贡献 两 个 配子 ,取样 问题 也 会 发 生 。 原 因 是 , 杂 合 子 能 产生 两 种 配子 ,而 传 给 下 一 世
代 的 两 个 配子 由 于 机 遇 却 可 能 是 同一 类 型 的 。
为 了 看 取样 造成 的 后 果 , 让 我 们 考虑 一 个 群体 中 所 有 个 体 有 同样 的 适合 度 以 至 于 选择 不 起 作用
的 理想 情形 。 我 们 再 把 问题 进一步 简化 ,考虑 一 个 没有 重奏 世代 的 群体 ( 即 一 群 同时 繁殖 的 个 体 ) ,这
样 , 任 一 给 定 世代 都 能 与 前 一 世代 和 后 一 世代 毫 不 含糊 地 区 分 开 来 。 该 被 考虑 的 群体 为 两 倍 体 , 由 N
个 不 体 所 组 成 ,所 以 ,对 任 一 给 定 的 基因 座位 来 说 该 群体 含有 2N 个 基因 。 接 下 来 我 们 处 理 具 有 两 个
等 位 基因 A, 和 A,、 频 率 分 别 为 p 和 q=1 一 p 的 一 个 基因 座位 的 简单 例子 。 当 从 无 限 的 配子 库 中 抽取
ON 个 配子 时 ,样本 中 正好 含有 i 个 A, 型 基因 的 概率 p, 由 二 项 式 概率 函数 给 出 :
PS SF a
\ 1 ie i7TQQN — ai’?
对 于 两 种 等 位 基因 共存 ( 即 0
0 的 基因 选择 ,我们 得 ,
K = 4Nsu (2.18)
RES» YE BP LE PK Is CN) PE HA Es) .以 及 突变 率 Cu),
2.6 遗传 多 态 性
如 果 一 个 基因 座位 在 群体 中 有 两 个 或 更 多 的 等 位 基因 存在 , 则 它 就 被 说 成 是 多 态 性 的 (polymor
phic)。 然 而 ,如 果 其 中 一 个 等 位 基因 有 非常 高 的 频率 ,比如 说 99 斩 或 更 高 ,那么 ,其 他 等 位 基因 看 来 都
不 能 在 样本 中 被 观察 到 ,除非 样本 特别 大 。 所 以 ,从 实际 出 发 ,如 果 那 种 最 党 见 的 等 位 基因 的 频率 小 于
99% ,, 则 该 基因 座位 通常 被 定义 为 多 态 性 的 。 该 定义 显然 有 点 武断 ,而 且 在 文献 中 还 可 发 现 有 人 用 别
的 标准 。
中 24 °
测度 某 一 群体 的 多 态 性 程度 的 最 简单 方法 之 一 ,是 通过 将 多 态 性 基因 座位 数 用 所 取样 本 的 基因
座位 总 数 来 除 ,以 算出 多 态 性 基因 座位 的 平均 比例 。 然 而 ,该 测度 与 被 研究 的 个 体 数 有 关 。 群体 内 遗
传 变异 性 的 更 为 合适 的 斥 度 是 平均 期 望 杂 合 度 (expected heterozygosity) 或 基因 多 样 度 Cgene
diversity) 。 该 尺 舌 多 态 性 的 武断 描绘 ,可 以 从 有 关 基 因 频 率 的 知识 中 直接 算出 ,并 且 受 取样 作
用 的 影响 较 小 。 一 个 基因 座位 上 的 基因 多 样 度 定义 为 :
h=1— 之 (2.19)
这 里 x 是 等 位 基因 的 频率 而 mm 为 该 玄 基 因 座 位 上 等 位 基因 的 总 数 。 对 任 一 给 定 的 基因 座位 而 言 ,h 是
随机 地 从 该 群体 中 选取 的 两 个 等 位 基因 互 不 相同 的 概率 .所 有 被 研究 过 的 基因 座位 的 h 值 的 平均 值 ,
了 ,可 用 作 群 体内 遗传 变异 性 程度 的 一 种 估计 。
基因 多 样 度 太 度 h 和 五 , 曾 被 广泛 用 于 电泳 数据 和 限制 酶 数据 。 不 过 ,它们 可 能 不 适用 于 DNA
顺序 数据 ,因为 自然 界 中 DNA 水 平 上 的 遗传 变异 程度 是 相当 高 的 。 特别 地 , 当 所 考虑 的 序列 很 长 时 ,
样本 中 的 每 一 序列 看 来 都 与 别 的 序列 有 一 个 或 多 个 核 苷 酸 的 差别 , 在 大 多 数 情 况 下 h 和 H 都 将 接近
于 1。 所 以 ,这 些 基 因 -多 样 度 太 度 将 无 法 区 别 不 同 的 基因 座位 或 群体 , 也 不 再 是 多 态 性 的 信息 义 度 。
对 于 DNA 顺序 数据 , 关于 群体 中 多 态 性 的 更 合适 的 义 度 ,是 任意 两 个 随机 选取 的 序列 间 每 位 点
的 平均 核 苷 酸 差异 数 。 该 尺度 称 核 苷 酸 多 样 度 Cnucleotide diversity) (Nei 和 Li,1979) ,用 天 表示 :
区 一 0 。 [2 20)
这 里 和 Ml x; 25) A DNA 序列 的 第 1 种 和 第 j 种 类 型 的 频率 ,而 DNA 序列 的 第 i 种 和 第 j 种 类 型
间 不 同 核 苷 酸 的 比值 。
目前 ,关于 DNA 序列 水 平 上 的 核 苷 酸 多 样 度 , 仅 有 为 数 不 多 的 一 些 研 究 。 这 类 研究 之 一 涉及 果
ii D. melanogaster 的 乙醇 脱氧 酶 (Adh)? 基 因 座 位 。 路 越 Adh 区 域 的 11 个 序列 已 由 克 赖 特 曼 (Kreit-
man,1983) 定 序 。 这 些 线性 排列 的 序列 长 达 2379 SRR. 如 果 不 管 缺失 和 插 人 , 则 有 9 个 不 同 的 等
位 基因 ,其 中 一 个 由 3 个 序列 表示 ,而 其 余 的 则 各 由 一 个 序列 表示 (图 2 一 7)。 所 以 ,频率 xi 一 xs 各 为
1/11, 而 频率 x, 为 3/11。43 个 核 苷 酸 位 点 是 多 态 性 的 。 首先 我 们 计算 每 对 等 位 基因 的 不 同 核 苷 酸 所
点 的 比值 .例如 ,等 位 基因 1 一 S 和 2 一 S 在 2379 个 核 音 酸 中 相互 有 3 个 不 同 , 则 rs 一 0. 13%。 样 本 中
所 有 等 位 基因 对 的 if ee 2 一 1。 由 等 式 2. 20, 估 出 核 苷 酸 多 样 度 为 r* 一 0. 007。 被 研究 的 等 位 基
因 中 6 个 是 缓慢 移动 的 电泳 变异 型 (S),5 个 为 快速 移动 的 电泳 变异 型 (F)。S 和 开间 的 区 别 是 由 一 个
BAERS. 结果 赋 于 蛋白 质 以 不 同 的 电泳 运动 性 所 造成 的 。 对 这 些 电泳 类 型 的 每 一 种 ,也 曾 分 别 地
计算 了 它们 的 核 苷 酸 多 样 度 .我 们 得 到 :关于 S,x=0. 006; 关 于 F,r 王 0.003。 这 些 结果 指出 ,S 等 位 基
因 的 多 态 性 是 F 等 位 基因 的 两 倍 。
? 侧 序列 外 显 子 1 ASF 幼稚 前 导 外 显 子 2 ASF , 外 显 子 3 内 含 子 加 ”外 显 子 4 FABRE 3 侧 序列
Hl CcG CAATATGGG C GC T ac C ccc GGAATCTCCACTA GG A 5C AGC C 7
1S an ‘ & da ? . T T A GACT AAG ie. >> . ~
2s Ae ; aoa. * Je C2 T.A CA.TAAC.. ;
3S sun P lie - ~ A T A
Be Se a . eet “©. OF WS, abe ie ae Vee A TA ,
55 AG... -A. TC 5 A G GT a Sr C
6S etter koh ; G eh als SE. WM. . 24) Ba A ok 了 CGIA C T
7- Se ‘ G GTCTCC C
ar TGC AG A.TC G G GTCTCC 于
ao TGC AG a: tC G G GTCTCC C25 F
* 10-F TG CHAG.9. 2A .TC G od G GTCTCC c G
nt TGC AGGGGA... ’ rT G A G eterce C
图 2 一 7 3D. melanogaster 的 乙醇 脱 氢 酶 基因 ,其 11 个 序列 中 的 多 态 性 核 苷 酸 位 点 。 只 有 那些 与 共同 顺序 有
差异 的 地 方 被 显示 出 来 了 。 圆 点 表示 与 共同 顺序 相同 。 外 显 子 4 中 的 星 号 指示 赖 氨 酸 -对 - 苏 氨 酸 替 代 的 位 点 ,该 蔡
代 是 两 电泳 型 等 位 基因 间 出 现 快 / 慢 运动 性 的 原因 。 自 Hartl 和 Clark(1989) 修改 而 成 。
bo
wn
amas
表 2 一 1 RMD. melanogaster? 的 醇 脱 氢 酶 基因 座位 的 11 个 等 位 基因 中 >
成 对 地 比较 的 百分比 核 背 酸 差异
等 位 基因
等 位 基因
1S 25 3S 4S 5S 6S 7F 8F 9F 10F
1-S
ze 0.13
3-S 0.59 0.55
4-S 0.67 0.63 0.25
5-5 0.80 0.84 0.55 0.46
6-S 0.80 0.67 0.38 0.46 0.59
7-F 0.84 0.71 0.50 0.59 0.63 0.21
8-F 1.13 1.10 0-88 0.97 0.59 0.59 0.38
9-F 1-13 1.10 0.88 0.97 0.59 0.59 0.38 0:00
10-F 1.13 1-10 0.88 0.97 0.59 0.59 0.38 0.00 0.00
11-F 1.22 1.18 0.97 1.05 0.84 0.67 0.46 0.42 0.42 0.42
A Nei(1987). #48 Kreitman(1983). ‘
a. 加 以 比较 的 位 点 的 总 数 为 2379。S 和 下 分 别 表 示 缓 慢 和 快速 移动 的 电泳 型 等 位 基因
2.7 新 达尔 文学 说 与 中 性 突变 假说
达尔 文 提出 他 的 进化 学 说 根据 的 是 自然 选择 ,而 没有 关于 群体 中 变异 的 来 源 的 知识 。 备 德尔 定律
被 重新 发 现 以 及 遗传 变异 被 证 明 是 由 突变 产生 的 之 后 ,达尔 文 主义 和 备 德 尔 主 义 被 用 作 后 来 被 称 为
进化 的 综合 或 新 达尔 文 主义 Cneo 一 Darwinism ) 的 那 种 理论 的 框架 。 根 据 该 学
说 ,虽然 突变 被 看 成 是 遗传 变异 的 根本 源 ,但 目 然 永 择 短 在 决定 群体 的 租 人 七 移 志 , 并 在 基因 替换 的 过
程 中 、 着 FA.
一 时 ,新 达尔 文 主义 成 了 进化 生物 学 中 的 法 则 ,而 选择 终于 被 看 成 是 能 驱动 进化 过 程 的 唯一 力
量 。 其 他 因素 , 象 突变 和 随机 漂 变 , 被 认为 最 多 只 有 次 要 作用 。 新 达尔 文 主义 的 这 一 特殊 标记 称 为 选 _
择 主 义 (selectionism ) 。
很 据 选择 论 者 或 进化 过 程 的 新 达尔 文学 派 的 观点 ,基因 替换 是 以 选择 对 有 利 突变 作用 的 结果 而
出 现 的 。 另 一 方面 多 态 性 则 是 由 平衡 选择 来 维持 的 。 于 是 ,新 达尔 文 论 者 把 蔡 换 和 多 态 性 看 成 是 由 不
同 的 进化 惫 量 驱 动 的 \ 丙 种 孤立 的 观 尔 ” 适 困 蕉 换 是 正 的 适应 性 过 程 的 最 后 结果 ,如 果 上 且 只 有 当 二 个
新 的 等 位 基因 能 改善 该 生物 的 适合 度 时 , 它 才 会 经 此 过 程 而 占据 群体 的 以 后 世代 ;而 多 态 性 则 是 在 某 .
一 基因 座位 上 两 个 或 更 多 个 等 位 基因 共存 对 该 生物 或 该 群体 有 利 时 , 才 被 维持 的 .新 达尔 文学 派 的 理
论 主张 自然 界 中 大 多 数 遗 传 多 态 性 是 稳定 的 。
十 九 世 纪 七 十 年 代 后 期 群体 遗传 学 中 出 现 了 一 次 革命 。 蛋 白质 顺序 数据 的 应 用 打破 了 群体 遗体
学 研究 中 的 物种 界线 ,并 且 首 次 为 检验 与 基因 替换 的 过 程 有 关 的 学 说 提供 了 足够 的 经 验 数 据 ,1968
年 ,木村 提出 ,进化 中 大 多 数 的 分 子 变化 是 由 于 中 人 性 或 近 中 性 突变 i wt 9 (Kimura,
19 dL; King 和 Juges, 。 这 一 假说 ,现在 上 性 学 说 Cneutral theory of molecular
evolution ) 而 著称 ,极力 主张 :分 子 水 平 上 的 大 多 数 进化 变化 以 及 物种 内 的 大 多 数 变异 性 , 既 不 是 由 有
利 等 位 基因 的 正 选 择 也 不 是 由 平衡 选择 所 造成 的 ,而 是 由 选择 上 呈 中 性 或 近 中 性 的 突变 型 等 位 基因
意 币 只 是 说 ,这 他 等 位 基因 的 命运 很 大 程度 上 是 由 随机 遗传 漂 变 所 决定 的 。 换 句 话说 ,选择 可 能 会 起
E 用 ,但 它 的 强度 太 弱 以 至 于 不 能 抵消 机 遇 作用 的 影响 。 要 使 这 种 情况 成 为 事实 ,二 不 等 下
择优 势 度 或 劣势 度 的 绝对 值 必须 小 于 1/(2Ne) , e 为 有 效 群 体 大 小 。
照 中 性 学 说 的 说 法 ,等 位 基因 的 频率 纯粹 由 随机 规则 所 决定 ,而 且 我 们 在 任 一 给 定时 刻 得 到 的 画
面 都 只 是 一 种 瞬 态 , 它 代表 取 自 进行 着 的 动力 学 过 程 中 的 一 种 暂时 构造 。 因 此 ,多 态 性 基因 座位 是 由
或 者 在 走向 固定 的 途中 、 或 者 将 要 灭绝 的 那些 等 位 基因 所 组 成 。 从 这 一 场景 来 看 ,与 进化 过 程 有 关 的
所 有 分 子 的 表现 形式 ,都 应 被 看 成 是 突变 输入 和 与 之 相伴 的 等 位 基因 的 随机 灭绝 或 固定 的 某 一 连续
© IO20。
“过程 的 结果 。 故而 ,中 人 性 学 说 把 替换 和 多 态 性 看 成 是 同一 现象 的 两 个 侧面 。 替 换 是 一 个 长 期 而 渐进 的
过 程 , 藉 此 突变 通 等 位 基因 的 频率 随机 地 增加 或 减少 ,直到 这 些 等 位 基因 最 终 困 机 遇 而 固定 或 丢失 。
在 任何 给 定时 间 量 ; 某 亚 基因 座位 所 具有 的 等 位 基因 ,其 频率 将 既 不 是 0%% 也 不 是 100%%。 这 些 就 是 多
态 性 的 基因 原 位 。 审 往 学 说 认为 ,群体 让 的 大 多 数 遗 传 多 态 性 在 自然 界 中 都 是 朋 时 的 。
“下 入 论 者 和 选择 论 着 朵 季 证 酌 末 质 ,涉及 突变 型 等 位 基因 的 适合 度 值 的 分 布 问题 .两 种 学 说 都 认
为 ,大 多 数 新 突变 是 有 害 的 并 且 它们 很 快 被 从 群体 中 清除 ,所 以 ,它们 对 替换 速率 和 群体 内 的 多 态 性
的 量 都 没有 什么 贡献 。 不 同 的 是 ,关于 非 有 害 突变 中 中 性 突变 的 相对 比例 问题 。 选择 论 者 主张 很 少 的
Sopa * echnla onstabeisieti tes so 2
ICES: scingrnmmpornnembeens 点 得 到 普遍 承认 .第 二 ,分子 生物 学 和 玫
体 遗 传 学 间 综 合 ,通过 分 子 进 化 和 遗传 多 态 性 只 是 同一 现象 的 两 个 侧面 这 一 概念 的 导 和 人 ,而 大 大 加 强
(Kimurra 和 Ohta,1971)。 虽 然 争论 仍 在 继续 ,但 任何 令 人 满意 的 进化 学 说 必须 与 分 子 水 平 上 进化 过
程 的 这 两 个 方面 一 致 ,这 一 点 现在 已 得 到 承认 。
在 一 系列 研究 中 , 根 井 等 (Nei 等 ,1978) 曾 从 这 一 观点 检验 过 中 性 突变 假说 。 最 近 , 赫 德 森 等
(Hudson 等 ,1987) 曾 提出 过 一 种 方法 ,测试 由 种 间 DNA 顺序 比较 揭示 的 高 速 进化 着 的 DNA 区 域 ,
是 否 象 中 性 突变 假说 所 预测 的 那样 ,在 物种 内 也 表现 出 高 水 平 的 多 态 性 。
习题
1. ASR 2.2 FHS 2.3.
2. 如 果 A, MWA 是 完全 显 性 , 那么 等 位 基因 A. 的 每 世代 频率 改变 将 是 多 少 ?
3. 从 等 式 2.4 导出 等 式 2.5 中 的 平衡 频率 。
4. 给 定 一 个 由 5 个 两 倍 体 个 体 组 成 的 群体 ,其 中 Ai 的 频率 为 0.5, 且 A AA, 有 同样 的 适合 度 ,
ABA ,在 下 一 世代 A, 的 频率 为 (a)0.0,(b)0.5, 或 (c)1.0 的 概率 各 为 多 少 ?
5. 在 一 个 肉体 以 2 : 1 超过 雄性 的 群体 中 ,有 效 群 体 大 小 与 调查 统计 的 群体 大 小 的 比 是 多 少 ?
6. 一 个 经 历 过 瓶颈 的 群体 ,比如 在 连续 6 个 世代 中 其 群体 大 小 为 :10、10、10'、10.10' 和 10'。 其
长 期 群体 大 小 是 多 少 ?
7. 在 一 个 有 效 群 体 大 小 为 100, 且 Ne=N 的 群体 中 ,一 个 具 0. 01 的 选择 劣势 度 的 新 突变 ,其 固
定 概率 是 多 少 ?
8. 应 用 图 2 一 7 中 的 序列 ,计算 等 位 基因 (a)1 一 S、 2 一 S 或 3 一 S 间 ,(b)1 一 S 和 7-F 间 ,编码 区
〈 黑 长 方块 ) 中 的 核 背 酸 多 样 度 。 该 编码 区 长 771 个 核 苷 酸 。
后 继 阅 读 文献
Christiansen, F. B. and M. W. Feldman. 1986. Population Genetics. Blackwell Scientific Publica-
tions. Cambridge, MA
Crow. J.F.and M. Kimura. 1970. An Introduction to Population Genetics Theory. Harper & Row.
New York.
artl, D. L. and A. G. Clark. 1989. Principles of Population Genetics. 2nd Ed. Sinauer Associates.
Sunderland, MA.
Hedrick, P. W. 1983. Genetics of Populations. Science Books International. Portola Valley. CA.
Kimura. M. 1983. The Neutral Theory of Molecular Evolution. Cambridge University Press. Cam-
bridge.
Nei. M. and D. Graur. 1984. Extent of protein polymorphism and the neutral mutation theory.
Evol. Biol. 17: 73—118.
3 核 音 酸 顺 序 中 的 进化 变化
DNA 序列 进化 中 的 基本 形式 是 核 苷 酸 随时 间 的 改变 。 这 一 过 程 值得 详细 考虑 ,因为 核 苷 酸 顺 序
中 的 变化 在 分 子 进 化 研究 中 , 既 用 来 估计 进化 的 速率 又 用 于 重建 生物 进化 的 历史 。 然 而 , 核 苷 酸 鞭 换
的 过 程 通常 是 极其 缓慢 的 ,以 至 它 不 可 能 在 研究 者 所 生存 的 时 间 里 被 观察 到 。 因 此 ,为 了 检 出 DNA
序列 中 的 进化 变化 ,我 们 依靠 比较 法 , 即 让 某 一 给 定 顺序 与 另 一 个 与 它 在 进化 上 过 去 有 共同 祖先 的 顺
序 比较 。 这 种 比较 要 用 到 统计 学 方法 ,其 中 几 种 将 在 本 章 中 讨论 。
3.1 DNA 序列 中 的 核 音 酸 蔡 换
前 一 章 中 ,我 们 把 进化 过 程 描绘 成 一 系列 的 基因 替换 ,在 这 一 过 程 中 新 等 位 基因 以 单个 突变 的 形
式 产 生 ,继而 增加 其 频率 ,最 终 则 在 群体 中 固定 。 现 在 我 们 从 不 同 的 观点 来 看 这 一 过 程 。 我 们 注意 到 ,
要 被 固定 的 等 位 基因 其 顺序 不 同 于 它们 所 替代 的 等 位 基因 。 如 果 我 们 使 用 的 时 间 尺 度 中 一 个 时 间 单
位 比 固 定时 间 长 ,那么 ,任何 给 定 基 因 座 位 上 的 DNA 顺序 都 将 表现 出 连续 变化 。 为 此 ,研究 一 下 一 个
DNA 序列 中 的 核 苷 酸 如 何 随时 间 改 变 将 是 有 趣 的 。 象 以 后 我 们 要 解释 的 那样 ,这 一 研究 结果 可 被 用
来 建立 估计 两 序列 间 蔡 换 数 的 方法 。
为 了 研究 核 苷 酸 替 换 的 动力 学 ,我 们 必须 作出 几 项 关于 一 个 核 苷 酸 被 另 一 个 替换 的 概率 的 假定 。
文献 中 已 提出 了 许多 这 样 的 数学 方案 。 我 们 将 把 讨论 仅 限 制 在 那些 最 简单 且 最 常用 的 方法 上 : 朱 克 斯
Ail 4k 46 (Jukes 和 Cantor,1969) 的 一 参数 模型 (one-parameter model) 和 木村 (Kimura ,1980) 的 两 参数
异型 (two-parameter model) 。 关 于 更 一 般 的 模型 的 评论 ,读者 可 参考 李 等 (Li 等 ,1985a) 的 论述 。
朱 克 斯 和 坎 托 的 一 参数 模型
朱 克 斯 和 坎 托 模型 的 替换 方案 如 图 3 一 1 所 示 。 该 模型 假定 蔡 换 在 4 种 核 苷 酸 类 型 中 随机 地 发
生 。 换言之 ,在 变化 方向 上 没有 任何 倾斜。 例如 ,如 果 所 考虑 的 核 苷 酸 是 A, 则 它 将 以 相同 的 概率 改变
Purines A G
T
Pyrimidines i
a
A3—1 MMAR -KURM, AMA PHF 6H HAIR F ABA a,
MTC BG. 在 此 模型 中 , 对 每 种 核 苷 酸 来 说 , 蔡 换 速率 为 每 单位 时 间 Se, FL 3 种 可 能 的 变化 方向 中
每 种 的 蔡 换 速率 都 是 w。 因 为 该 模型 只 涉及 一 个 参数 ,所 以 它 又 叫 一 参数 模型
© 28 e
我 们 假定 一 个 DNA 序列 中 某 一 位 点 上 座 落 的 核 苷 酸 在 时 刻 0 时 为 A。 首先 ,我 们 要 问 : 该 位 点
在 时 刻 t 时 被 A 占据 的 概率 是 多 少 ? ”该 概率 用 Paw RA.
因为 我 们 从 A 开始 ,所 以 该 位 点 在 0 时 刻 被 A SNR Pam=l. ENA 1, 该 位 点 上 仍 为
A 的 概率 由
Pa 一】 一 3c (3.1)
给 出 , 它 反映 出 核 苷 酸 保持 不 变 的 概率 , 即 1 一 3a。
在 时 刻 2 仍 有 A 的 概率 为
Pag) = (1 — 3@)Paay + @L1 — Paay] (3. 2)
Fy TF te SK , HE ATT BP YE) J TE: CK PR RS ABE A 2) KF BO MTC 或 G 但 随后
又 回复 到 A( 图 3 一 2)。 在 时 刻 1 RBA A 的 概率 是 PAo ,而 在 时 刻 2 REA A 的 概率 是 1 一 3a。 这
两 个 独立 变量 的 乘积 给 出 了 第 一 种 局 面 的 概率 , 它 构成 等 式 3. 2 NH. EMA RRA A
的 概率 为 1 一 PAo ,而 在 时 刻 2 变 成 A 的 概率 为 w。 这 两 个 概率 的 乘积 给 出 了 第 艺 种 局 面 的 概率 , 它 即
等 式 3. 2 中 的 第 2 项 。 mE
局 面 工 Aw I
t=0 A A
不 替换 替换
fel A 4E A
不 替换 替换
t=2 A A
图 3 一 2 假定 在 时 刻 0 某 一 位 点 上 为 A, 而 在 时 刻 2 该 位 点 上 仍 有 A 的 两 种 可 能 的 局 面 。
用 以 上 公式 ,我们 可 以 证 明 , 以 下 递 推 式 可 用 于 任何 的 ti:
0 Sea)
HEAT AT Ae SAT A Paw WE et BE SH 3. 3 ,为 :
Paci — Paw Bre Sel se A a Bice) (3. 4a)
或
AP 4g) =— 3aPio + @01 — Paw) =— 40P aq + 4 (3. 46)
至 此 我 们 考虑 的 是 一 个 离散 的 时 间 过 程 。 不 过 ,我 们 可 以 用 连续 时 间 模 型 来 近似 这 一 过 程 , 把
APaA 看 成 是 时 刻 t 时 的 变化 率 。 以 这 一 近似 ,等 式 3. 4b 被 重 写 成
dP aa)
AO 一 一 4aPao +a (3.5)
这 是 一 个 一 阶 线性 微分 方程 ,其 解 由
Paw = < + aa He 7 (3. 6)
给 出 。 因 为 我 们 从 A 开始 , 所 以 Pao=1l. Ki
Pay => + Ge" (3.7)
事实 上 ,等 式 3. 6 REHAB FMR. HM. BK ARE RAE A, Py... 0. iit
在 时 刻 t 该 位 置 上 有 和 的 概率 为
Pa oe a hie G | (3. 8)
© 29 «
等 式 3.7 和 3. 8 对 描绘 替换 过 程 来 说 是 充分 的 。 从 等 式 3. 7, 我 们 可 以 看 到 ,如 果 起 始 核 背 酸 是
AIBA Paw Ht STH Rh A 1 降 到 1/4( 图 3 一 3)。 另 一 方面 ,从 等 式 3. 8 我 们 看 到 ,如 果 起 始 核 苷 酸 不
是 A, 那 么 Pa 将 从 0 单调 地 上 升 到 1/4。 所 以 ,不 管 起 始 条 件 如 何 ,PAw 最 终 都 将 达到 174( 图 3 一 3)。
这 对 工 C AG 而 言 也 是 正确 的 .因此 ,在 朱 克 斯 - 坎 托 模型 下 4 种 核 苷 酸 中 每 种 的 平衡 频率 都 是 1/4。
达到 平衡 后 ,在 概率 上 将 没有 进一步 的 变化 , 即 , 对 所 有 t 都 有 Paw =Pr =Pom =Pow=1/4. AM,
核 苷 酸 的 频率 仅 在 无 限 长 的 DNA 序列 中 保持 不 变 。 实 际 上 ,DNA 序列 的 长 度 是 有 限 的 ,所 以 核 苷 酸
频率 上 的 波动 看 来 是 会 发 生 的 。
1.0
0.8
0.2
0 40 80 120 160 200
时 间 ( 百 万 年 )
图 3 一 3 一 个 位 置 上 有 某 一 核 苷 酸 的 概率 随时 间 的 变化 :由 同样 的 核 音 酸 开 始 ( 上 线 ) 或 由 不 同 核 苷 酸 开始 (下
线 )。 虚 线 表示 平衡 频率 (0. 25)。a 一 5X10“" 核 音 酸 /位 点 /年 。
上 面 ,我 们 的 注意 力 集中 在 一 个 特定 的 核 苷 酸 位 点 上 ,而 把 Psw 处 理 为 一 种 概率 。 然 而 ,PE\v, 所 可
被 解释 成 某 一 DNA 序列 中 A 的 频率 。 例 如 ,如 果 我 们 从 一 个 仅 由 腺 味 聆 构成 的 序列 开始 , 那 委 PAw
=1, 而 PAw 则 是 在 时 刻 t 该 序列 中 A 的 期 望 频率 。
MKB A 且 时 刻 t HRPM A 这 一 事实 考虑 进去 ,我 们 可 以 把 等 式 3.7 以 更 明确
的 形式 重 写成
Paaw = > + (Se (3. 9)
如 果 起 始 核 苷 酸 是 G 而 不 是 A, 那 么 由 等 式 3. 8 我 们 得
caw = + a (ess (3. 16)
因为 在 朱 克 斯 - 坎 托 模型 下 所 有 核 苷 酸 都 是 等 价 的 ,所 以 Poa) =Poawy =Prawy. PLE RNTVEK
一 个 一 般 性 的 概率 ,Pioo, 这 是 某 一 核 苷 酸 在 给 定 起 始 核 苷 酸 为 i 的 条 件 下 在 时 刻 t 变 为 j 的 概率 。 应
用 这 个 一 般 化 了 的 概念 和 等 式 3. 9, 我 们 得
Pia = + = (Bye (S39)
且 由 等 式 3. 10;
on 4 a Se (3. 12)
ix iF}.
木村 的 两 参数 模型
象 朱 克 斯 和 坎 托 模型 那样 ,假定 所 有 核 苷 酸 蔡 换 随机 发 生 , 这 是 不 现实 的 。 例 如 ,转换 ( 即 A 和 G
之 间或 C 和 T 工 之 间 的 变化 ) 一 般 比 颠 换 ( 即 所 有 其 他 类 型 的 变化 ) 更 频繁 一 些 ( 第 4 章 )。 考 虑 到 这 一
事实 ,木村 (Kimura,1980) 曾 提出 一 个 两 参数 模型 ,如 图 3 一 4 所 示 。 在 此 方案 中 ,每 一 核 苷 酸 位 点 上
° 30 «
转换 型 替换 的 速率 为 每 单位 时 间 ,而 每 种 颠 换 型 蔡 换 类 型 的 速率 则 为 每 单位 时 间 B。
a
味 叭 A G
We ee C
a.
图 3 一 4 核 音 酸 蔡 换 的 两 参数 模型 。 在 此 模型 中 ,转换 的 速率 (a) 可 能 不 等 于 颠 换 的 速率 (B) 。
该 模型 比 朱 克 斯 - 坎 托 模型 复杂 ,而 我 们 将 只 给 出 最 后 结果 。 从 等 式 3. 11 我 们 看 到 ,在 朱 克 斯 - 坎
托 模型 中 , 某 一 位 点 上 在 时 刻 t 时 的 核 苷 酸 与 时 刻 0 时 的 相同 的 概率 ,对 4 种 核 苷 酸 来 说 是 相同 的 。
即 ,PAAo 王 Pecuw 王 Po 三 Prro 。 由 于 替换 方案 的 对 称 , 这 种 等 同性 对 木村 的 两 参数 模型 也 是 成 立 的 。
我 们 将 用 Xo 表 示 该 概率 。 可 以 证 明 :
X@) = 4+ (Dew + (Sener (3.13)
在 朱 克 斯 - 坎 托 模型 下 ,等 式 3. 12 不 管 从 核 苷 酸 1 到 核 苷 酸 j 的 变化 是 转换 还 是 颠 换 都 成 立 。 与 之 不
同 ,在 木村 的 两 参数 模型 下 ,我 们 必须 对 转换 和 颠 换 两 种 变化 加 以 区 别 。 我 们 用 Yu 表示 起 始 核 苷 酸
和 时 刻 t 时 的 核 苷 酸 经 转换 而 互 不 相同 的 概率 。 我 们 看 到 ,由 于 替换 方案 的 对 称 , 所 以 Yu 王 PAcou 二
PeAo 王 Prco 王 Per 可 以 证 明
Y() = + A (Fe Es (Ser (3. 14)
HA hMRPRSRGRERAK-HREKRPHRRMAAA AY BR.Z.H FRA:
Ape a “ (Pe (3. 15)
注意 ,每 种 核 苷 酸 只 有 一 种 转换 类 型 ,但 却 经 受 着 两 种 类 型 的 颠 换 。 例 如 , 若 起 始 核 苷 酸 是 A, 那
么 这 两 种 可 能 的 颠 换 变化 即 为 A~C 和 A-~TI。 因 此 ,起 始 核 背 酸 与 时 刻 t 时 的 核 苷 酸 经 两 种 颠 换 类
型 之 一 的 变化 而 互 不 相同 的 概率 ,将 是 由 等 式 3. 15 给 出 的 概率 的 两 倍 。 还 要 注意 ,Xo 十 Yeo 十 2Zo 三
ahs
3.2 两 DNA 序 列 间 的 核 苷 酸 蔡 换 数
一 个 群体 中 的 等 位 基因 替换 一 般 要 花 成 千 甚 至 上 百 万 年 来 完成 (第 二 章 ) 。 为 此 ,我 们 不 能 靠 直接
观察 来 处 理 核 苷 酸 蔡 换 的 过 程 , 核 苷 酸 替 换 常 常 是 从 那些 有 共同 起 源 的 DNA 分 子 的 成 对 比较 中 推
断 出 来 的 。
两 个 核 苷 酸 序 列 相互 分 岐 以 后 ,每 一 个 都 将 积累 核 苷 酸 替 换 。 所 以 , 自 两 序列 发 生 分 岐 以 来 所 出
。 现 的 核 苷 酸 蔡 换 数 , 就 是 分 子 进化 中 最 通常 用 到 的 变量 。
当 两 核 苷 酸 序列 间 的 分 岐 程度 较 小 时 ,在 任 一 位 点 上 发 生 一 次 以 上 替换 的 机 会 可 以 忽略 , 则 两 序
列 间 被 观察 到 的 差异 数 将 接近 实际 替换 数 。 另 一 方面 如 果 分 岐 程度 突出 ,那么 ,由 于 在 同一 位 点 上 的
多 重 替 换 (multiple substitution ) 或 多 次 “ 击 中 ”(Cmultiple“hits”) , 观察 差异 数 看 来 将 小 于 实际 替换 数 。
例如 ,如 果 某 一 位 点 上 的 核 苷 酸 ,在 一 个 序列 中 从 A 变 到 C 再 变 到 下 ,在 另 二 个 序列 中 则 从 A 变 到
T, 那 么 ,尽管 已 发 生 了 3 次 替换 ,但 两 序列 在 该 位 点 上 却 是 相同 的 (图 3 一 5) 。 文 献 中 已 有 几 种 修正 这
. 31 。
种 偏差 的 方法 被 提 了 出 来 。
x
- &
«x * K ef RR
x i H al
ge m XK i
it ® HR Bi 1
关 *
VU
*4
< < < be be
4 人 Peet t
=o) SIS NOP LOG MENS ok Oo RO
“ACT(Thr)e>ACGCThr)
& 1 : AAT(Asn)AAG(Lys)«*ACG (Thr)
途径 1 需要 一 次 同 义 变化 和 一 次 非 同 义 变化 ,而 途径 工 则 需要 二 次 非 同 义 变化 .已 知 同 义 蔡 换 远
比 非 同 义 替 换 发 生得 频繁 (第 四 章 ) ,所 以 我 们 可 以 假定 途径 I 比 途 径 1 ers
我 们 假定 途径 | 的 权重 为 0. 7 而 途径 工 的 权重 为 0. 3, 那 么 两 密码 子 间 呵 义 的 差异 数 估计 为 0.7X1
十 0.3X0 王 0.7, 而 非 同 义 的 差异 数 为 0.7X1 十 0.3X2=1.3。 这 里 所 用 的 权重 是 假设 的 。 对 所 有 可 能
的 密码 子 对 的 权重 作 经 验 性 的 估计 ,富田 和 安永 (Miyata 和 Yasunaga,1980) 曾 根据 蛋白 质 顺 序数 据
作出 , 李 等 (Li 等 ,1985b) 则 根据 DNA 顺序 数据 而 得 到 。 如 果 我 们 假定 两 种 途径 可 能 性 相同 ;那么 ,上
例 的 非 同 义 差异 数 为 (L 十 2)/2 一 1. 5, 而 同 义 差异 数 则 为 (1 十 0)/2=0.5。 可 见 , 加 权 法 和 非 加 权 法 可
能 会 给 出 有 点 不 同 的 结果 。 实 际 上 ,两 种 方法 的 估 值 间 的 差异 一 般 较 小 (Nei 和 Gojobori, 1986) ,但 对
于 那些 高 度 保守 的 蛋白 质 , 如 组 蛋白 和 肌 动 蛋白 ,对 编码 的 基因 而 言 它们 可 能 非常 重要 (Li 等 ,
1985b) 。 用 任何 一 种 方法 ,我 们 都 能 估 出 两 编码 序列 间 的 同 义 差 异 数 (Ms) 和 非 同 义 差异 数 (MA)。
从 以 上 结果 我 们 可 以 用 ps=MSs/Ns 算出 每 同 义 位 点 的 同 义 差 异 数 ,并 用 pp =Ma/Na 算出 每 非
同 义 位 点 的 非 同 义 差异 数 。 这 些 公式 显然 没有 把 同一 位 点 上 多 次 击 中 的 效应 考虑 进去 。 我 们 可 用 朱
克 斯 和 坎 托 的 公式 :
ees £. AMs
K,=— {1 3Ns} (3.23)
和
3 AM,
K,=— {ln i ox | (3. 24)
来 做 这 样 的 修正 。
一 种 可 采用 的 处 理 编码 区 的 方法 是 ,把 核 苷 酸 位 点 分 成 非 简 并 的 (nondegenerate), 两 重 简 并 的
(twofold degenerate) fll Pa & fai 3# 9 (fourfold degenerate) {ii A (Li 等 ,1985b) 。 如 果 一 个 位 点 上 所 有 可
能 的 变化 都 是 非 简 并 的 , 则 该 位 点 是 非 简 并 的 ;如 果 三 种 可 能 的 变化 中 一 种 是 同 义 的 , 则 该 位 点 是 两
重 简 并 的 ;如 果 所 有 可 能 的 变化 都 是 同 义 的 , 则 该 位 点 即 为 四 重 简 并 的 。 例 如 ,密码 子 TIT(Phe) 的 前
两 位 是 非 简 并 的 ,而 第 3 位 则 是 两 重 简 并 的 ( 见 第 一 章 中 的 表 1 一 1)。 相 比 之 下 ,密码 子 GTT(Val) 的
第 3 位 是 四 重 简 并 的 。3 个 异 亮 氨 酸 密 (lle) 码 子 中 的 第 3 位 被 简化 处 理 成 两 重 简 并 位 点 ,尽管 事实 上
该 位 置 上 的 简 并 是 三 重 的 。 在 哺乳 动物 的 线粒体 基因 中 , 异 亮 氨 酸 只 有 两 个 密码 子 , 所 以 其 第 3 位 事
实 上 就 是 两 重 简 并 位 点 ( 见 第 一 二 的 委 工 二 37
将 核 苷 酸 位 点 经 上 述 分 类 分 成 各 种 简 并 美 型 (degeneracy « classes) 之 后 ,我 们 即 可 对 这 3 类 位 点 分
别 计算 两 编码 序列 间 的 替换 数 。 注 意 ,根据 定义 所 有 非 简 并 位 点 上 的 替换 都 是 非 同 义 的 。 类 似 地 ,所
有 四 重 简 并 位 点 上 的 替换 都 是 同 义 的 。 在 两 重 简 并 位 点 上 ,转换 型 变化 (Ce>*T 和 Ac>*G) 是 同 义 的 ,而
所 有 其 他 变化 , 即 颠 换 型 变化 ,都 是 非 同 义 的 。 在 哺乳 动物 线粒体 的 遗传 密码 里 ,此 规则 一 无 例外 。 另
一 方面 ,在 通用 的 细胞 核 遗 传 密码 中 , 却 有 两 个 例外 : 精 氨 酸 密码 子 (CGA 和 AGA,CGG 和 AGG)
第 1 位 ,其 上 的 一 种 颠 换 型 变化 是 同 义 的 ,而 其 他 类 型 的 颠 换 和 所 有 转换 都 是 同 义 的 ;以 及 3 个 异 亮
氨 酸 密 子 (AUU AUC 和 AUA) 中 的 最 后 一 位 也 是 如 此 。
根据 两 种 方法 计算 替换 速率 的 计算 机 程序 可 由 作者 提供 , 若 需 要 ,请 寄 一 个 格式 化 了 的 TBM PCa
三 兼容 软磁盘 来 拷贝 。
3.3 , 核 背 酸 序列 和 氨基 酸 序列 的 线性 排比
两 不 同 源 序 列 的 比较 涉及 对 缺失 和 插入 位 置 的 鉴别 问题 ,因为 两 个 品系 从 其 共同 祖先 分 玻 演 化 时
. 34 *
eis sn eet itt steer digmnclit mA DNA
FF Ba Be A LE ARE RRA IE A he 7 RE — PET A
We» BF 8 FE BR
虽然 我 们 是 用 DNA 序列 来 说 明 线 性 排比 的 过 程 ,但 同样 的 原则 和 程序 也 可 用 于 氨基 酸 序列 的
排比 。 事 实 上 ,用 氨基 酸 顺序 与 用 DNA 顺序 比 起 来 ,前 者 通常 能 得 到 更 可 靠 的 线性 排比
线性 排比 由 一 系列 成 对 的 碱 基 组 成 ,其 中 每 一 个 碱 基 各 来 自 一 个 序列 .有 3 种 线 列 的 对 ,(1) 匹 本
的 大 基 对 ,(2) 匹 配 错误 的 碱 基 对 ,和 (3) 由 来 自 一 个 序列 的 碱 基 与 另 一 序列 的 空缺 碱 基 Cnull base) 组
成 的 对 子 。 空 缺 碱 基 用 表示。 一个 匹配 的 对 子 表示 一 个 自 两 序列 分 坡 以 来 没有 发 生变 化 的 位 点 ,_
个 匹配 错误 的 对 子 表示 一 次 替换 ,而 一 个 空缺 对 子 则 表示 ,在 这 两 个 序列 之 一 的 该 位 置 上 曾经 发 后 过
一 次 缺失 或 者 插入 。
考虑 两 DNA 序列 A 和 B, 其 长 度 分 别 为 m 和 nm 的 例子 。 如 果 我 们 用 x 表示 匹配 的 对 子 数 ,用 Y
表示 匹配 错误 的 对 子 数 ,而 用 z 表示 含有 一 个 空缺 碱 基 的 对 子 数 , 则 我 们 有 ,
1 十 Mi 一 2(z 十 y) 十 > (au Z)
点 阵 法
当 只 有 少数 裂缝 上 且 两 序列 在 其 他 任何 方面 差异 都 不 太 大 时 ,一 种 合理 的 线性 排比 可 以 由 视觉 观
察 得 到 ,或 者 也 可 用 被 称 为 点 阵 法 (dot matrix method) 的 方法 得 到 。 在 此 法 中 ,被 线 排 的 两 个 序列 作
为 一 个 和 矩阵 的 首 列 和 首 行 而 写 出 (图 3 一 6)。 在 两 序列 中 核 苷 酸 相同 的 矩阵 位 置 处 记 上 圆 点 。 如 果 两
序列 等 同 ,那么 该 矩阵 对 角 线 上 的 所 有 元 素 都 将 是 圆 点 (图 3 一 6a) 。 如 果 两 序列 有 差异 但 可 被 无 裂 颖
地 线 排 , 则 对 角 线 元 素 的 大 多 数 是 圆 点 (图 3 一 6b) 。 如 果 两 序列 之 一 中 出 现 一 个 裂 矣 , 则 线性 排比 的
对 角 线 将 垂直 或 水 平地 移动 (图 3 一 6c)。 如 果 两 序列 间 的 差异 既 有 裂缝 又 有 替换 (图 3 一 6d) , 则 找 出
裂 锋 的 位 置 并 从 犯 种 可 能 的 线性 排比 中 挑 出 一 种 可 能 是 很 困难 的 。 在 这 样 的 情况 下 ,视觉 观察 和 点 阵
法 就 不 可 靠 了 ,而 为 了 得 到 客观 的 线性 排比 已 有 几 种 计算 方法 被 提出 来 了
Met GCI ht s.tz aT, SC 6 Taco: Ph
_ SSR SRR
Bee
i li
~4 7 A OO a>
€ (d)
A 3—6 ThE OA Sem APE AYO 1) % sO A 212 7
HIM HEF AHA RARRLARMA. AMP ELH OSHARGRAPASH HIALEAH
组 成 。 途 径 2 含 有 8 个 对 角 线 步骤 ,其 中 2 个 是 空格 ,和 1 个 水 平 步 骤 。 途 径 1 MRAZ MHARED MY TAR
定 , 即 根据 哪 种 进化 序列 更 有 可 能 :一 次 两 核 昔 酸 缺 失 ( 途 径 1) 或 一 次 一 核 苷 酸 缺 失 和 两 次 替换 (途径 2) 来 决定 。
。35 。
顺序 一 距离 法
两 序列 间 最 为 可 能 的 线性 排比 是 ,根据 某 种 标准 使 线 列 中 匹配 错误 和 有 裂缝 的 数目 最 小 的 那 种 。 不
幸 地 是 ,降低 匹配 错误 数 结 果 常 会 导致 裂缝 数 增加 ,反之 亦 然 。
例如 ,考虑 以 下 两 个 序列 :
A:TCAGACGATTG (m=11)
B:TCGGAGCTG (n= 9)
我 们 可 按 如 下 排比 将 匹配 错误 数 降 到 和 零 ;
全 一 ACUTE
ORG 人 人 一 全 (人
在 这 种 情况 下 裂缝 数 为 6。 反之 , 裂 矣 数 可 降低 到 由 |m 一 n| 个 核 苷 酸 组 成 的 一 个 裂 颖 ,结果 匹配
错误 数 却 增加 了 :
(1) TCAGACGATTG
TCGGAGCTG— — crn
在 这 种 情况 下 ,我 们 只 有 一 个 位 于 末端 ,因而 也 是 不 可 避免 的 裂缝 ,但 匹配 错误 (用 星 号 标 出 ) 的 数目
却 为 5。
或 者 ,我 们 可 以 选 一 个 裂 颖 数 和 替换 数 都 不 是 最 小 的 线性 排比 。 例 如 ,
(1) TCAG—ACGATTG
TC—GGA—G CG
在 这 种 情况 下 匹配 错误 数 是 2, 裂 颖 数 为 4。
那么 ,这 3 种 线性 排比 中 哪 一 种 最 可 取 ? 显 然 , 将 蔡 换 与 裂缝 比较 就 好 象 将 芋 果 和 桔子 比较 一 样 。
所 以 ,我 们 必须 找到 一 个 共同 标准 , 藉 此 来 比较 裂 颖 和 替换 。 [ri] ty HE BK PK Ay Fe SE Ab Fi] (gap
penalty) 。
有 几 种 指定 裂 矣 处 罚 的 系统 .所 有 系统 都 是 在 相对 于 点 状 的 替换 .缺失 和 插 人 出 现 的 频繁 程度 如
何 , 这 类 问题 的 预先 理解 的 基础 上 建立 的 。 在 第 1 个 系统 中 , 裂 颖 的 总 长 度 (z) 用 恒定 的 裂 笑 处罚 Cw)
来 乘 。 该 系统 背后 的 假定 是 ,有 某 一 裂 妖 的 概率 反比 于 裂缝 的 大 小 。 举 例 说 来 ,有 一 个 由 两 核 苷 酸 组
成 的 裂 颖 的 概率 ,与 有 两 个 各 由 一 核 苷 酸 构成 的 裂 颖 的 概率 相同 .这 样 , 对 任何 线性 排比 ,我 们 都 能 用
D= y+ wz (3. 26)
来 计算 两 序列 间 的 距离 尺度 (D)。
在 第 2 种 处 罚 系统 中 ,我们 假定 长 的 缺失 和 插入 在 进化 中 与 短 的 比较 ,出 现 的 可 能 性 是 不 同 的 。
在 这 种 情况 下 ,对 不 同 长 度 裂 颖 的 处 罚 可 能 正比 于 裂 颖 长 度 也 可 能 并 非 如 此 。 根 据 这 一 系统 ,与 某 一
特定 线性 排比 有 关 的 距离 尺度 是
D=y+ Dj wer (3. 27)
其 中 ,zk ZEKE K Bt wk WE RA OK 的 裂 颖 的 处 罚 。
现在 让 我 们 用 有 w=2 的 第 1 个 系统 来 比较 线性 排比 1,I 和 HE。 得 到 的 距离 (D) ,对 线性 排比
1,0 AM AHA 0+ (2K 6)=12,54+ (2X2) =9,M 2 十 (2X4) 王 10。 我 们 将 选取 线 排 工 。 如 果 我 们
用 有 wi=2 Aw.-6 的 第 2 个 系统 , 则 了 的 值 结 果 对 工 工 和 开 分 别 为 12,11 和 10。 在 这 种 情况 下 ,
HK THE LAG HE MM
任何 线性 排比 算法 的 目的 ,都 是 从 所 有 可 能 的 线性 排比 中 ,选取 具有 最 小 D 值 的 那 种 线性 排比 。
在 最 和 常 应 用 的 方法 中 ,有 尼 德 尔 曼 与 文 施 (Neeldleman 和 Wunsch,1970) 法 ,和 塞 勒 斯 (Seller,1974)
法 . 在 前 一 种 方法 中 ,两 序列 间 的 类 似 性 (similarity) 用 类 似 指 数 (Csimilarity index) 来 测度 ,而 具 最 大
类 似 性 的 那 种 线性 排比 将 被 从 所 有 候选 者 中 选取 出 来 。 在 塞 勒 斯 法 中 ,两 序列 间 的 不 相似 性 (dissimi-
larity) 用 距离 指数 (distance index) 来 测度 , 具 最 小 距离 的 那 种 线性 排比 将 被 选 出 。 这 两 种 方法 曾 被 证
明 在 某 些 条 件 下 是 等 价 的 (Smith 等 ,1981) 。
在 必须 从 许多 线性 排比 中 选 出 一 种 时 ,寻找 最 佳 排比 的 任务 若 无 计 算 机 的 帮助 常常 难以 完成 。 在
。36。
尼 德 尔 曼 与 文 施 (Needleman 和 Wunsch,1970) 算 法 或 其 修订 法 的 基础 上 ,已 有 许多 关于 线 排 顺 序 的
常用 计算 机 程序 建立 起 来 。
要 记 住 的 最 重要 的 一 点 是 ,作为 最 后 结果 的 线性 排比 常 有 赖 于 裂 矣 处 罚 的 选取 ,而 后 者 又 有 赖
于 ,相对 于 点 替换 的 频率 裂缝 事件 在 DNA 和 有 蛋白质 进 化 中 的 频率 究竟 是 多 少 的 这 样 一 些 关键 的 假
ye wa
3.4 核 苷 酸 替 换 数 的 间接 佑 计
在 估计 两 序列 间 核 苷 酸 蔡 换 数 方面 ,最 完全 的 解决 可 通过 比较 它们 的 核 苷 酸 顺 序 而 得 到 。 不 过 ,
蔡 换 数 也 可 从 其 他 类 型 的 分 子 数 据 ,象限 制 酶 图 谱 或 者 DNA 一 DNA 杂交 得 到 的 数据 间接 地 推断 出
来 。
限制 性 核酸 内 切 酶 片段 模式 和 位 点 图 谱
限制 性 核酸 内 切 酶 (restriction endonucleases) 或 限制 酶 (restriction enzymes) 能 识别 被 称 为 识别 顺
FF (recognition sequences) 的 特殊 双 链 ':DNA 序列 ,并 在 识别 顺序 上 或 其 近 旁 切 开 该 DNA。 识别 顺序 通
常 长 为 4 或 6 碱 基 对 ,它们 中 许多 都 是 回 文 ( 即 它们 是 旋转 对 称 的 )。 识 别 顺序 可 能 是 唯一 的 (例如
EcoRI) ,也 可 能 不 是 唯一 的 (例如 Hind I 工 )( 见 表 3 一 1) 。 切 点 称 为 拼接 位 点 (splicing site) 或 限制 位 点
(restriction site) 。 许 多 限制 性 内 切 核酸 酶 以 一 种 错开 的 方式 切 开 双 链 DNA, 所 以 将 产生 “粘性 末端 ”
(sticky ends) ,以 后 它们 可 在 连接 酶 (ligase) 的 作用 下 相互 连接 (ligated)。 这 就 是 为 什么 限制 酶 能 在 遗
传 工 程 中 成 为 一 种 极 有 用 的 工具 的 原因 。 表 3 一 1 列 出 了 几 种 限制 酶 的 识别 顺序 和 拼接 位 点 。
表 3 一 1 几 种 限制 性 核酸 内 切 酶 的 识别 顺序 和 切 点
酶 ‘ 识别 顺序 (RS) 切割
识别 位 点 A SS. ee
CAE BD 2K WR) 大 小 不 确定 性 回 文 “邻接 在 RS 中 错开 式
EcoR | 1_¢ 2A Aree
5) —G-LA—A- eer 03 P ~~ . . / ae
(Escherichia coli) 3 —C —T eee
Hind I 5 —G—T —Py Y py—A—c—3'
6 Se 4p oH oe =
(Haemophilus influenzae) 3'—C—A—Pu ah 1 7G8
Hae I 5'—G—=G 4+ c—c-3
4 = 半 + 起 =
(Haemophilus aegy ptus) eee Oe 4S Sx BY
Bbv I 5 —G—CH AG eens!
$ = “= ete = 5
(Bacillus brevis) GT 人
Nei I 5 CG + c/G—G—G—3!
5 25 + 中 下
(Neisseria cinerea) 3 —G—G_—G/e we wept
Not I 5 —G=C + ¢-—G—c—c—G—c-3'
8 = 十 + +t 7
(Nocardia otitidis-caviarum) 3’—_C—G—C—C—G—G mee
Hinf | 5! —G Aa ae
4 = =: = i ar
(Haemophilus influenzae) 3’—-C—T—N—-A-=G—5'
A
a\ 识 别 顺序 用 黑体 字母 表示 .。 切 点 用 箭头 指出 .不 确定 的 地 方 , 象 Pu: 味 叭 ;Py: 喀 喧 ;C/G:C 或 G;N: 任 何 核 苷 酸 。
Nn 表示 由 mn 个 任意 的 核 苷 酸 组 成 的 序列 。
当 一 个 双 链 的 DNA 片段 受到 水 解 时 , 即 有 各 种 不 同 长 度 的 片段 产生 出 来 。 它 们 可 因 其 各 自 的 长
度 而 在 电泳 凝 胶 上 分 开 , 因 为 在 凝 胶 上 较 短 的 片段 比较 长 的 要 跑 得 更 快 也 移动 得 更 远 。 通 过 用 已 知 长
度 的 DNA 片段 作 基准 ,限制 性 片段 的 长 度 即 可 被 估计 出 来 。 不 同 的 DNA 序列 根据 其 识别 位 点 的 数
目 和 位 置 的 差异 而 受到 限制 酶 的 不 同 切 割 。 a -个 DNA 序列 水 解 产 生 的 片段 的 数目 和 大 小 被 称 为
限制 片段 模式 (restriction-fragment pattern) 。 连 续 而 交互 地 应 用 几 种 能 将 DNA 水 解 成 重 友 片 段 的 限
制 酶 ,常常 可 推断 出 DNA 上 限制 位 点 的 大 概 位 置 ( 图 3 一 7)。 表 示 某 一 DNA 序列 上 限制 位 点 的 位 置
- 37°
的 方案 图 称 限 制图 谱 (restriction map ) 。
应 用 限制 酶 来 推断 两 序列 间 的 替换 数 ,其 背后 的 理由 是 ,两 DNA 序列 的 类 似 性 越 大 则 其 限制 片
段 模式 就 越 相 似 。 通 过 对 DNA 序列 内 限制 位 点 的 分 布 作出 某 些 假 定 , 例 如 , 象 4 种 核 苷 酸 有 相同 的
频率 以 及 它们 在 序列 中 的 空间 分 布 是 随机 的 ,这 样 的 假定 , 则 从 限制 位 点 数据 就 可 以 对 DNA 序列 间
限制 模式 方面 的 进化 变化 进行 研究 ,从 而 估计 出 每 位 点 的 核 苷 酸 替 换 数 (K)。
首先 ,我们 考虑 从 限制 片段 模式 来 估计 开 。 从 共有 片段 数 来 估计 K ,要 求 我 们 对 由 限制 性 核酸 内
切 酶 水 解 的 DNA 的 电泳 模式 进行 直接 比较 .这 里 提供 的 方法 是 由 根 井 和 李 (Nei 和 Li,1979) 创 导 的 。
文献 中 曾 报导 过 另外 两 种 方法 (Upholt,1977;Engels,1981la) ,而 卡 普 兰 (Kaplan,1983) 曾 证 明了 这 3
种 方法 给 出 类 似 的 结果 。
DNA 的 两 序列 间 共 有 DNA 片段 的 期 望 比例 IF) ,可 由
A 2mxy
f= tn (3. 28)
来 估计 ,其 中 mx 和 my APE AES X ALY 7K RG Pe AE AY Bl BE BC. Oxy J Je BB SEAR BY
片段 数 。
根 井 和 李 (CNei 和 Liy,1979) 曾 证 明 , 共 有 片段 的 期 望 比例 (FE) 可 用 在 t 时 间 内 某 一 限制 位 点 保持
不 变 的 概率 (G) 来 表示 ,两 者 之 间 的 近似 关系 为
Fr soz
Ge ™G yr BA Ae ETE A EAE YP td
Bt fe}, 3c 26 FF fe) EA ABO K=2at. WT GRIM KHER 3. 29,8
G = (F(3 一 2G)]1 (3. 30)
Wr AT at — 7 ER A. ABE (Nei, 1987) 建议 用 G=F2 作 为 最 初 尝试 值 . 一 般 只 需要
很 少 几 次 反复 循环 。G 的 估 值 可 使 我 们 得 到 KK 的 估 值 ,关系 如 下 :
aes = in(G) (3. 31)
(3. 29)
让 我 们 来 考虑 下 面 这 样 一 个 例子 : 取 自 两 种 野生 小 麦 (4egiiozs sharonensis 和 Ae. bicornis) 1) FAM
线粒体 DNA 片段 ,用 3 种 限制 酶 ,Ba 1, Hind I fl EcoRI 来 水 解 ,它们 的 识别 顺序 都 为 6 碱 基 对
长 (数据 自 Graur 等 ,1989a) 。4e. sharonensis 水 解 产 生 4 个 片段 ,而 Ae. bicornis 水 解 则 产生 5 个 片段 。
两 个 片段 为 两 种 小 麦 所 共有 。 用 等 式 3. 28 ,我 们 估 出 下 为 2/9 王 0. 222。 现 在 我 们 可 以 开始 由 等 式 3.
30 给 出 的 反复 尝试 过 程 。 我 们 采用 的 G HAW 0. 222'*=0. 687. 第 一 次 循环 后 我 们 得 G=0.775,
而 下 一 次 循环 G=0.753。 随 着 尝试 的 进行 摆 幅 将 越 来 越 小 ,而 在 弟 5 次 和 第 6 次 循环 后 我 们 都 得 到
G=0.758。 因 此 ,我们 终止 反复 尝试 过 程 。 为 了 得 到 两 序列 间 替 换 数 的 估 值 ,我 们 用 等 式 3. 31。 最 后
结果 是 ,两 线粒体 序列 的 相互 差异 用 每 核 苷 酸 位 点 替换 数 K=0. 092 来 估计 。
现在 我 们 考虑 由 限制 位 点 图 谱 估计 两 序列 间 的 核 苷 酸 替 换 数 .在 前 面 的 例子 中 ,限制 位 点 的 位 置
是 未 知 的 。 如 果 限 制 位 点 已 在 DNA 序列 上 定位 ,那么 ,我 们 可 以 直接 从 图 谱 上 找 出 共有 和 非 共有 的
位 点 ,并 估 出 替换 数 。 设 mx 和 my 分 别 为 DNA 序列 X 和 了 中 限制 位 点 的 数目 ,而 mxv 为 两 序列 间 共
有 的 限制 识别 位 点 数 。X 和 在 某 一 给 定位 点 上 共有 同样 的 识别 顺序 的 概率 用 S 表示 ,此 值 可 用
2772Xy
二 mx + my (3432)
估 出 (Nei Al Li,1979), RARER KH H.p. al AA
p=1—S (3. 33)
估计 Er Se Sal UL HA EP PR BC. Pe 3 ia) A TF C8. 19 MEY p 估 出 。
限制 位 点 图 谱 法 比 限制 片段 模式 法 要 乏味 一 些 ,但 却 可 靠 得 多 。 前 者 在 区 值 高 达 0 25 时 仍 可 应
用 , 而 后 者 对 于 K>0. 05 的 情况 就 可 能 是 不 精确 的 。
38 «
ES
酶 工 的 位 点
ae! Fe ee A
; 1 a Oe, en :
Waly At cone
fe 1 A i
(b) 2p i a cr
a
a6 I Ki Nm
心
ul
(e) WHE 片段 中 看 到
] {A,D
2 1A,E
3 B,E
4 B,E
5 CF
Vv
( i ee
(g) iIuid
图 3 一 7 DNA 序列 上 限制 位 点 的 定位 图 。(a) 一 个 假想 的 DNA, 具 有 由 两 种 不 同 的 限制 酶 识别 的 识别 位 点 .该 序
列 的 识别 图 谱 未 知 。(b)3' 端 用 放射 性 标记 . (C)DNA 由 酶 工 水 解 产生 片段 A,B 和 C, 而 由 酶 开水 解 则 产生 片段 D、
正和 FE。(d7 用 一 种 限制 酶 得 到 的 每 一 片段 再 用 另 一 种 限制 酶 水 解 , 产 生出 亚 片 段 1 一 5。(e) 这 些 亚 片 段 被 用 于 鉴别
重 登 片段 。(f) 这 些 亚 片段 按 它们 间 的 重 枉 模 式 指 示 的 秩序 排列 。 (g) 推 理 出 的 DNA 序列 的 限制 图 谱 。 片 段 和 亚 片
段 可 根据 它们 的 长 度 一 个 个 地 鉴别 出 来 ,而 长 度 则 是 从 它们 在 电泳 凝 胶 上 的 位 置 推出 的 。 未 端 片段 和 亚 片 段 则 由
其 放射 性 标记 来 鉴别 。 自 Suzuki 等 (1989) 修 改 而 成 。
DNA—DNA 杂交
DNA—DNA 杂交 (DNA 一 DNA hybridization ) 技 术 是 以 这 样 的 事实 为 根据 的 : 双 链 DNA 分 子 的
热 稳定 性 有 赖 于 两 条 链 间 核 苷 酸 匹配 的 比例 。 随 着 匹配 比例 的 降低 , 双 链 的 热 稳定 性 也 降低 。 在 两 条
链 来 自 同 一 序列 的 双 链 DNA( 即 同 源 双 链 (homoduplex) 分 子 ) 中 ,匹配 的 比例 根据 定义 应 为 100 和 % 。
另 一 方面 ,在 两 条 链 来 源 不 同 的 双 链 DNA( 即 异 源 双 链 (heteroduplex) 分 子 ) 中 ,匹配 的 比例 则 小 于 1。
其 大 小 有 赖 于 这 两 个 序列 自 它 们 从 某 一 共同 祖先 分 化 以 来 究竟 累积 了 多 少 核 苷 酸 关 异 。 所 以 , 异 源 双
链 DNA 将 会 在 比 同 源 双 链 DNA 低 的 温度 下 变性 或 熔 解 成 单 链 。
DNA 杂交 试验 的 基本 实验 程序 如 图 3 一 8 所 示 。 大 致 上 ,在 重复 序列 被 除去 以 后 ,该 程序 包括 将
来 自 两 不 同 物种 的 变性 DNA 的 混合 物 缓慢 冷却 ,以 制造 出 人 工 杂 种 DNA 分 子 。 然 后 ,将 该 混合 物 逐
DNA- DNA
通过 单 链 重新 退火 athe
IE 形成 的 DNA- DNA 双 链
50
区 0
A 物 种 同 源 双 链 和
R
ja
Ra
3
异 源 双 链 a
#
NIVWV :
B 物种 同 源 双 链
图 3 一 8 从 DNA 一 DNA 杂交 研究 推论 出 的 顺序 类 似 性 。 双 链 分 子 被 熔 解 成 单 链 的 DNA。 同 源 双 链 和 异 源 双 链 通
过 单 链 的 重新 退火 而 形成 。50% 的 DNA 熔 解 成 单 链 的 温度 用 Tm 表示 ,测定 两 种 同 源 双 链 和 异 源 双 链 的 Tm。 两 .
种 同 源 双 链 间 的 Tm 值 可 能 是 不 同 的 ,同样 两 互 不 相同 的 异 源 双 链 类 型 间 的 Tm 值 也 可 能 是 不 同 的 。 自 Avers
〈《1989) 修 改 而 成 。
渐 加 热 ,并 在 每 一 温度 下 测定 溶液 中 单 链 DNA 的 百分比 。 关 于 此 法 (TEACL 法 ) 的 详细 介绍 ,可见 例
如 享 特等 (Hunt 等 ,1981) 的 论述 。
杂种 DNA 的 热 稳 定性 ,用 50%% 的 杂种 DNA 解 离 成 单 链 时 的 温度 来 度量 。 然 后 将 此 半 熔 解 温度
与 50 为 的 同 源 双 链 DNA 变 成 单 链 时 的 温度 比较 。 注 意 , 在 每 一 次 种 间 比 较 中 ,我 们 有 两 种 同 源 双 链 ,
每 物种 各 有 一 种 ,所 以 ,习惯 上 我 们 用 它们 的 半 熔 解 温度 的 平均 值 。 同 源 双 链 和 蜡 源 双 链 的 半 熔 解 温
度 间 差 异 ,ATm, 由 经 验证 明 , 与 碱 基 对 误 配 的 比例 近似 地 线性 相关 (Britten 等 ,1974)。 我 们 将 这 种 关
系 表示 成
户 一 CATm (3. 34)
这 里 p 是 误 配 的 比例 ,C 是 一 个 常数 。C 的 值 通过 对 碱 基 对 误 配 度 已 知 的 异 源 双 链 进行 DNA 一 DNA
杂交 试验 ,而 从 经 验 上 得 到 。C 值 被 发 现 随 实验 条 件 的 不 同 而 在 C=0. 01 和 C=0. 015 之 间 变 化 。 已
知 ATm 的 实验 误差 是 非常 大 的 ,因此 ,对 同样 的 物种 对 应 该 做 许多 次 重复 观察 。
现在 让 我 们 来 考虑 下 面 的 一 个 数字 例 ( 数 据 来 自 Caccone 和 Powell,1989)。 KA AK ARBRE
(Pan paxzzscxs) 雄 性 的 同 源 双 链 DNA 的 平均 Tm 值 , 分 别 为 59.50C 和 59.12C 。 于 是 , 同 源 双 链 分 子
的 LE 平均 值 为 59. 31C 。 两 交互 的 异 源 双 链 DNA 的 Tm 平 均值 则 为 57. 59C 。 因 此 ,ATm 为 1.
72C. 由 等 式 3. 34, 我 们 得 到 一 个 每 核 苷 酸 位 点 大 约 0. 017 一 0. 026 次 替换 的 差异 。
. 40°
习题
1. 证 明 等 式 3. 3 Xt t=O 成 立 , 即 , 若 t=0 则 它 将 简化 成 等 式 3. 1 。
2. 导出 等 式 3. 10, 并 证 明 在 朱 克 斯 - 坎 托 模型 下 Poa =Pcaw =Praw
3. 当 a=B 时 ,木村 的 两 参数 模型 将 变 得 与 朱 克 斯 和 坎 托 的 一 参数 模型 等 同 。 为 了 证 实 这 一 点 。
证 明 : 当 此 条 件 满 足 时 ,等 式 3. 13 将 变 得 与 等 式 3. 11 相同 , 且 等 式 3.14 和 3.15 都 变 得 与 等 式 3. 12
相同 。
4. 用 等 式 3. 13,3.14 和 3.15 证 明 ,在 木村 的 两 参数 模型 下 -一 个 序列 中 4 种 核 昔 酸 的 平衡 频率
都 是 相同 的 ( 即 1/4) ,这 与 一 参数 模型 的 结果 一 样 。
5. ASK 3.16 SS 3.17,
6. 对 以 下 两 个 序列
Ser Thr Glu Met Cys Leu Met Gly Gly
TCA ee uns AMG TCT TTA . ATG | GGG GGA
ee eon | GGG. CATA TAT) :CTAC ATG GGTin ATA
Ser Thr Gly Ile Tyr Leu Met Gly Tle
计算 (\a) 每 同 义 位 点 的 同 义 替 换 数 和 (b) 每 非 同 义 位 点 的 非 同 义 替 换 数 。
7. 根据 木村 的 两 参数 模型 ,两 序列 间 的 差异 数 为 P 二 Q ,证 明 当 转换 和 颠 换 合 起 来 考虑 时 等 式 3.
21 将 被 简化 成 等 式 3. 19。
8. 用 点 阵 法 线性 排比 以 下 两 个 顺序 :
AATGCTTGCATGGGGCTAGTT
ATTGCTGCATGAGGCGCGCTAGT
选 出 两 种 可 能 的 线性 排比 ,并 决定 用 每 核 苷 酸 为 2 BY He BE Ah Sa — Sp a AY
裂缝 处 罚 ,比如 说 10 ,该 选择 会 受到 影响 吗 ?
5 3 2 4
Vv AEE ae, SS ee ee), ere |
1 + 3 6
人
图 3 一 9 两 限制 性 内 切 核酸 酶 图 谱 的 假想 例 。 序 列 上 的 数字 代表 这 些 片 段 的 长 度 (以 kb 为 单位 )。
9. 从 图 3 一 9 中 的 两 序列 的 限制 位 点 图 谱 , 估 计 两 序列 间 核 苷 酸 的 替换 数 , 用 (a) 共 有 片段 的 比
例 , 和 (b) 共 有 限制 位 点 的 比例 。 限 制 性 内 切 核酸 酶 的 识别 顺序 为 4 RR. PA 6 RE
点 的 限制 性 内 切 核 酸 酶 ,将 会 有 什么 样 的 结果 ? 该 差异 的 原因 是 什么 ?
后 继 阅 读 文献
Doolittle. R. F. 1990. Molecular Evolution: Computer Analysis of Protein and Nucleic Acid Se-
quences, Academic Press, San Diego, CA
Li, W.-H..C. -C. Luo and C. -I. Wu. 1985. Evolution of DNA sequences . pp. 1—94, In R. -
MacIntyre (ed. ), Molecular Evolutionary Genetics, Plenum, New York.
Nei, M. 1987 Molecular Evolutionary Genetics, Columbia University Press. New York.
4 核 昔 酸 蔡 换 的 速率 和 模式
前 一 章 中 导出 的 数学 理论 可 用 于 核 苷 酸 替 换 速 率 的 研究 之 中 ,而 该 速率 则 是 分 子 进化 研究 里 的
一 个 基本 量 。 事 实 上 ,为 了 阐明 某 一 DNA 序列 进化 的 特性 ,我 们 需要 知道 , 它 进 化 得 究竟 有 多 快 ,以
及 其 组 成 部 分 的 核 苷 酸 替 换 速 率 是 多 少 。 比 较 一 下 基因 和 不 同 DNA 区 域 间 的 替换 速率 也 是 很 有 趣
的 ,因为 这 可 以 帮助 我 们 理解 进化 中 核 苷 酸 蔡 换 的 机 制 。 知道 了 核 音 酸 蔡 换 的 速率 ,还 使 我 们 能 对 物
种 间 的 分 岐 演化 这 样 的 进化 事件 ,给 出 一 个 时 间 年 代 来 .不 过 ,要 想 做 到 这 一 点 ,我 们 必须 知道 从 一 组
物种 佑 出 的 速率 是 否 能 适用 于 另 一 组 生物 种 群 。 这 就 提出 了 这 样 一 个 问题 , 即 ,速率 在 不 同 的 进化 谱
系 间 是 怎样 变化 的 。
4.1 TRARY RR
% TE WR PF 4 HY BE (rate of nucleotide substitution ) 被 定义 成 每 年 每 位 点 的 替换 数 ,并 可 用 两 同 源
序列 间 的 替换 数 开 , 除 以 2 工 来 算出 ,这 里 工 是 两 序列 间 发 生 分 岐 的 时 间 ( 图 4 一 1)。 即 ,
人 入 (4.1)
祖先 序列
序列 1 序列 2
图 4 一 1 两 同 源 序列 在 工 年 前 从 某 一 共同 祖先 序列 分 岐 而 来 。
两 序列 发 生 分 岐 的 时 间 工 ,假定 与 两 物种 发 生 分 化 的 时 间 相 同 , 且 通常 都 用 古生物 学 数据 资料 来 推
算 。
本 节 我 们 将 处 理 不 同 基因 间 , 和 某 一 基因 的 不 同 区 域 间 的 速率 变异 问题 。 为 此 目的 ,建议 对 所 有
被 考虑 的 基因 使 用 同样 的 物种 对 。 这 有 两 重 原因 。 首先 ,关于 分 岐 时 间 的 古生物 学 估计 通常 都 有 很 天
的 不 确定 性 。 用 同一 对 物种 ,我 们 就 可 以 无 须知 道 分 岐 时 间 而 去 比较 各 基因 间 的 进化 速率 。 其 次 , 替
换 速 率 在 各 谱系 间 可 能 变化 很 大 ( 见 第 48 页 ) ,在 这 种 情况 下 ,两 基因 间 速 率 上 的 差异 可 能 是 由 谱系
间 的 差异 所 造成 ,而 不 是 由 两 基因 本 身 的 差异 所 造成 的 。
目前 研究 核 苷 酸 蔡 换 速率 的 最 合适 的 数据 来 自 哺 乳 动物 ,这 是 因为 ,有 关 哺 乳 动物 的 DNA 序列
的 数据 最 为 丰富 ,有 关 哺 乳 类 的 化 石 记 录 相 对 而 言 特征 比较 明确 .全面 ,再 加 上 可 以 得 到 哺乳 类 之 间
相当 可 靠 的 分 岐 时 间 的 缘故 。
编码 区
我 们 在 表 4 一 1 中 列 出 了 36 种 为 蛋白 质 编码 的 基因 的 同 义 蔡 换 速 率 和 非 同 义 替 换 速 率 。 这 些 速
率 是 从 人 类 与 中 齿 类 同 源 基因 间 的 比较 中 算出 的 。 根 据 与 真 兽 亚 纲 哺乳 类 的 辐射 演化 有 关 的 古生物
学 证 据 , 人 类 := 吵 齿 类 的 分 岐 时 间 已 被 设 定 为 8000 万 年 前 。
© 42°
表 4 一 1 ”哺乳 类 各 为 蛋白 质 编码 的 基因 的 同 义 蔡 换 速 率 和 非 同 义 蔡 换 速率 ”
基因 非 同 义 替 换 速 率 (X103) 同 义 替 换 速 率 (X10?)
组 蛋白
组 蛋白 3 135 0. 00 士 0. 00 6. 38+1.19
组 蛋白 1 101 0. 00 士 0. 00 GE 已 - 上 3 多
收编 系统 蛋白
肌 动 蛋白 a 376 0.01 士 0.01 3. 68 士 0. 43
肌 动 蛋白 349 0. 03 士 0. 02 3.1340. 39
WR . HS Ak A ft TR HE AK
生长 激素 释放 抑制 因子 一 28 28 0. 00 士 0. 00 3. 97 士 2. 66
胰岛 素 51 Oss Os 4.0242. 29
促 甲状 腺 素 118 0. 33 士 0. 08 BT
胰岛 素 样 生 长 因子 工 179 0. 52 士 0. 09 2. 32+0. 40
促 红细胞 生成 素 191 0.72+0.11 4. 34+0. 65
胰岛 素 C MK 35 0. 91+0. 30 6. 7743. 49
甲状 旁 腺 素 90 0. 94 士 0. 18 4.18 士 0. 98
促 黄体 生成 激素 141 1. 02+0. 16 3. 29+0. 60
生长 激素 189 1.23 0. 15 4. 95+0. 77
尿 激酶 一 血 纤 蛋白 溶 酶 原
435 1. 28+0. 10 3. 92+0. 44
活化 因子
白细胞 中 介 素 I 265 1.42+0. 14 "4. 6040. 65
松 驰 肽 54 2.5140. 37 7.49+6. 10
血红 和 蛋白 和 肌 红 蛋白
o- 珠 蛋 自 141 M5550. 11 5. 14+0. 90
肌 红 蛋白 153 0. 56+0. 10 4.44+0. 82
B- 珠 蛋白 144 0. 80 士 0. 13 3. 05 士 0. 56
载 脂 蛋白
E 283 0. 98 士 0. 10 4.0440. 53
A 三 时 243 1. 57 士 0. 16 4. 47 士 0. 66
A 一 RN 371 1.58+0. 12 4. 15+0. 47
免疫 球 蛋 白
IgVu 100 1.0740. 19 5. 661. 36
IgY, 321 1.46+0. 13 5. 1140. 64
Igk 106 1. 8740. 26 5. 90+1. 27
FRR
al 166 1.4140. 13 3.5340. 61
Bl 159 2. 2140. 24 5. 88+1. 08
Y 136 2. 79+0. 31 8. 59+2. 56
其 他 蛋白 质
醛 缩 酶 A 363 0. 07 士 0. 03 3.59+0. 52
Fe Bi ORS BR AR HK BH IE 217 0.1340. 04 2.1340. 35
He
肌 酸 激酶 M 380 0. 15+0. 03 3. 08+0. 37
甘油 醛 -3- 磷 酸 脱 氢 酶 331 0. 20 士 0. 05 2. 8440. 37
FLA A 331 0. 2040. 04 5. 03+0. 61
乙酰 胆 碱 受 体 y 亚 基 , 540 . 0. 29+0. 04 3. 2340. 3]
it AF AG RY 411 ADS a 5. 82+0. 67
AA 590 0. 9140. 07 6. 63+0. 61
平均 * 0. 85(0. 73) 4.61(1. 44)
a. 所 有 速率 都 以 人 和 嗜 齿 类 基因 间 的 比较 为 根据 , 且 分 岐 时 间 设 定 为 8000 万 年 以 前 。 速 率 以 每 10° 年 每 位 点 替换 数 为 单位 。
b.L= 受 比较 的 密码 子 数 。 :
c. 平均 指 算术 平均 值 ,括号 内 的 值 为 标准 偏差 ,都 是 用 所 有 基因 的 值 算出 的 。
我 们 注意 到 , 非 同 义 替 换 的 速率 在 基因 间 变 化 极 大 。 变 化 幅度 从 组 蛋白 3 和 组 蛋白 4 的 有 效 数 字
为 零 ,到 干扰 素 Y 的 每 年 每 非 同 义 位 点 2.79 又 10-?" 替 换 。 某 些 激素 (例如 生长 激素 释放 抑制 因子 一 28
和 胰岛 素 ) 是 极其 保守 的 ,而 另 一些 激 素 则 或 者 以 中 间 速 率 ( 例 如 促 红细胞 生成 素 ) 进 化 ,或 者 以 高 速
率 ( 例 如 白细胞 中 介 素 I 和 松 驰 肽 ) 进 化 .血红蛋白 和 肌 红 和 蛋白 以 中 速 进化 ,而 载 脂 蛋 白 和 免疫 球 重 昌
则 进化 得 非常 迅速 。
。 43-¢
ev wm we —_ — . —
同 义 蔡 换 的 速率 变化 也 相当 大 ,不 过 比 起 非 同 义 替 换 来 速率 变化 要 小 得 多 。 可 以 证 明 , 基 因 间 同
义 蔡 换 速 率 方面 的 变异 明显 地 大 于 仅 由 统计 学 波动 造成 的 期 望 变异 。
对 表 4 一 1 中 绝 大 多 数 基因 来 说 , 同 义 替 换 的 速率 大 大 超过 非 同 义 蔡 换 的 速率 。 如 在 一 个 最 极端
的 例子 ,组 蛋白 3 中 ,虽然 从 其 氨基 酸 顺 序 看 它 是 进化 上 最 为 保守 的 蛋白 质 中 的 一 种 ,但 其 同 义 蔡 换
的 速率 却 非 常 高 。 对 表 4 一 1 中 的 基因 来 说 , 非 同 义 蔡 换 的 平均 速率 为 每 年 每 非 同 义 位 点 0585 久 10 *
替换 。 同 义 替 换 的 平均 速率 为 每 年 每 同 义 位 点 4.6X10 "替换 , 即 为 非 同 义 替 换 平均 速率 的 5 倍 。
非 编码 区
来 自 非 编 码 区 的 数据 远 不 如 来 自 编码 区 的 数据 丰富 ,所 以 目前 只 做 过 有 限 的 比较 分 析 工作 。( 注
意 ,要 估 出 某 一 序列 中 的 替换 速率 ,我 们 必须 至 少 有 来 自 两 个 物种 的 数据 。) 因 为 大 多 数 已 发 表 的 序列
为 mRNA ,它们 不 含 内 含 子 和 侧 区 域 , 所 以 ,其 5 和 3' 不 翻译 区 是 唯一 能 进行 仔细 研究 的 非 编码 区 .
表 4 一 2 列 出 了 根据 人 与 咕 齿 类 比较 得 到 的 16 种 基因 中 这 两 个 区 域 的 替换 速率 。 在 这 两 个 区 域 中 不
同 基因 间 的 速率 变化 都 非常 大 ,但 这 种 变异 可 能 很 大 程度 上 代表 了 抽样 所 造成 的 影响 ,因为 这 两 区 域
通常 都 非常 短 。 在 几乎 所 有 基因 中 ,5' 和 .3' 不 翻译 区 中 的 速率 都 低 于 四 重 简 并 位 点 上 的 替换 速率 ( 即 ,
其 上 所 有 可 能 的 核 苷 酸 蔡 换 都 是 同 义 蔡 换 的 位 点 )。5 和 3' 不 翻译 区 的 平均 速率 分 别 为 每 年 1. 96 X
10 "和 2.10X10 替换, 它们 都 约 为 四 重 简 并 位 点 上 的 平均 速率 ,每 年 3. 55X10 替换 的 60% 。
表 4 一 2 根据 人 与 小 鼠 或 大 鼠 的 基因 间 比 较 ,得 到 的 为 蛋白 质 编码 的 基因 的 Rs 不 翻译 区 和 四 重 简 并 位 点
上 的 核 背 酸 蔡 换 速 率 *
5' 不 翻译 区 3' 不 翻译 区 四 重 简 并 位 点
> ye ce 速率 二 速率 L 速率
ACTH 9099 7 二 0ORT 07 «| 25 上 01 275 Beyer
醛 缩 酶 A 124 1. 08:0.26 154 1:7340.32 195 3.160.408
载 脂 蛋白 A— 83 3.0640. .63053473 二 全 35 160 3. 38 士 0. 50
aK AE 23 1. 27+0. 69 84 1.70+0.42 . 153 ‘4.0040. 60
Na, K-ATP fig 8 118 2.45+0.45 1117 0.5740.06 118 2.87+0.54
肌 酸 激酶 M 70 1.714:0.46 968 1.79-0.30 178 2. 812:028m
o- 胎 蛋 自 47 3.6441.13 144 2.79+0.49 225 4.144+0.54
o- 珠 蛋白 34 1.5640.65 90° 2.2140.50 81 4.47+0.98 ©
B- 珠 蛋白 50 1.3040.46 126 2.85+0.49 78 2. 42+0. 56
甘油 醛 -3- 磷 酸 脱 氢 酶 70 -153440.38 121 1.74 土 0.36 .170 2. 430. 39
生长 激素 21. -1.79+0.85 91. 1.8340.41 83 3.8240.78
胰岛 素 56 2.92+0.80 ‘53° 3.09+0.81 62 4.19+1.00
白细胞 中 介 素 :1 59 1.09 寺 0.38 1046 2.02+0.14 105 2.97+0.60
乳酸 脱氧 酶 A 95 2.7940.85 , 470 2.4840.23 152 346440560
pi aac aes 61 1.88+0.52 111 2.5740.48 23 2.37+1.00
酸 三 甲 基 内 盐 1
甲状 旁 腺 素 84. «1.794043 228 2.2140.30 38 3.85+1.21
平均 * 1. 96(0. 78) 2. 10(0. 61) 3. 33(0. 69)
a. 速率 以 每 10? 年 每 位 点 替换 数 为 单位 。 b. L= fi BM.
c\ 平 均 指 算术 平均 ,括号 内 的 值 为 标准 偏差 ,都 是 用 所 有 基因 的 值 算出 的 。
假 基 因 (pseudogenes) 是 一 些 由 功能 基因 派生 ,但 由 于 发 生 了 阻止 其 正常 表达 的 突变 而 退化 成 无
功能 的 DNA 序列 (第 六 章 和 第 七 章 )。 由 于 它们 不 受 功 能 限制 ,所 以 ,它们 可 以 期 望 以 较 高 的 速率 进
化 。 表 4 一 3 列 出 了 乳牛 和 山羊 的 4y 队 和 凡 ' 假 基因 中 苦 换 速率 间 的 比较 ,以 及 B 一 和 7 一 珠 蛋 自 基因
中 非 编 码 区 和 四 重 简 并 位 点 上 的 速率 间 的 比较 。 这 些 假 基因 中 的 速率 事实 上 略 高 于 其 他 区 域 中 的 速
。44。
率 。 看 来 这 一 点 对 假 基 因 来 说 是 普遍 成 立 的 ,尽管 目前 有 关 假 基因 的 资料 尚 属 有 限 。
表 4 一 3 乳牛 和 山羊 的 B 一 和 7 一 珠 蛋 和 白 基 因 间 的 分 岐 ,以 及 B 一 珠 蛋 和 白 假 基因 间 的 分 上
EEN BR 和 小 珠 蛋白 基因 。
统计 量 SFL BUT mmm? WAP SUT gL BH
HAHA 5.3 Tad . 1 BiG 8.1 8.8 6 | Shah
标准 误差 u2 2.0 2.5 O07 2.2 1.5 0.9
an FL = {0 Jak ; UT = 76 aa OK ah 5 DA Pe IE — WO A PE A
4 一 2 中 .我 们 对 基因 的 不 同 区 域 中 .以 及 假 基 因 中 的 替换 速率 进行 了 比较 .关于 5' 和 3' 不 翻译
1
po
as
kx KI
‘ = : 忌 +i
各 ae
a a ry
i en Rar
3 Kl bd Ma > x aes
# mR ot & Fs ats
x hk § tal KK ling
di ZK is : nee
id hs He = :
ei 2 3
Fe Ag Fee
- Fe FS ASe
ix 2 eS
M iw pies
i a Oar
= ie
be te ne
5 a
基因 假 基因
图 4 一 2 大
区 域 , 非 简 并 位 点 ,两 重 简 并 位 点 和 四 重 简 并 位 点 的 速率 ,都 是 将 表 4- 2 中 所 列 基因 加 以 平均 后 的 平
均 速 率 。5' 侧 区 域 的 速率 ,通过 假定 该 速率 与 四 重 简 并 位 点 上 的 速率 之 比 为 5. 3/8. 6( 即 由 表 4 一 3 得
出 的 值 ), 和 四 重 简 并 位 点 上 的 平均 速率 为 每 年 3. 33X10-? 替 换 ( 表 4 一 2) 而 算出 。 内 含 子 的 速率 ,3/
侧 区 域 的 速率 以 及 假 基 因 的 速率 也 按 同 样 方式 算出 。 由 于 以 有 限 的 资料 为 基础 而 作出 的 估计 已 经 够
多 了 ,又 由 于 一 个 区 域 中 的 速率 会 因 基 因 的 不 同 而 有 差异 ,所 以 ,图 4 一 2 中 展示 的 速率 可 能 对 任何 一
个 具体 的 基因 都 是 不 适用 的 ,但 它 却 提供 了 不 同 DNA 区 域 中 的 替换 速率 间 一 个 大 致 的 .一 般 性 的 比
较 . 有 了 这 种 思想 准备 ,我 们 将 看 到 ,一 个 基因 中 的 替换 速率 以 四 重 简 并 位 点 上 的 为 最 高 ,内 含 子 中 和
3' 侧 区 域 中 要 略 低 一 些 ,3' 不 翻译 区 域 ,5' 侧 区 域 ,5' 不 翻译 区 域 和 两 重 简 并 位 点 有 中 等 大 小 ,而 非 简
并 位 点 上 的 为 最 低 。 平 均 下 来 假 基因 有 最 高 的 替换 速率 ,虽然 它 只 比 一 个 功能 基因 的 四 重 简 并 位 点 上
的 速率 稍 高 一 些 。
4.2 和 蔡 换 速率 变异 的 原因
为 了 推理 出 DNA 区 域 间 替 换 速率 出 现 变 异 的 原因 ,我们 应 注意 到 ,替换 速率 是 由 两 个 因子 所 决
” 定 的 :(1) 突 变 率 和 (2) 一 个 突变 的 固定 概率 (第 二 章 )。 后 者 又 与 该 突变 是 有 利 的 .中 性 的 还 是 有 害 的
有 关 。 由 于 突变 率 看 来 在 一 个 基因 内 变化 不 大 而 在 不 同 基因 间 则 可 能 变化 较 大 ,所 以 ,我 们 将 对 一 个
“基因 的 不 同 区 域 间 的 速率 变异 和 不 同 基因 间 的 速率 变异 分 别 讨论 。
不 同 基因 区 域 间 的 变异
我 们 首先 考虑 一 个 基因 中 同 义 位 点 和 非 同 义 位 点 间 的 大 差异 。 由 于 一 个 基因 内 同 义 位 点 与 非 同
义 位 点 上 的 突变 率 应 该 相同 ,或 者 至 少 是 非常 相似 ,所 以 ,替换 速率 上 的 差异 就 可 归 因 于 两 种 不 同类
。 495。
型 位 点 间 纯 洁 化 选择 的 强度 上 的 差异 。 这 可 用 分 子 进 化 的 中 性 学 说 来 理解 (第 二 章 )。 结 果 会 导 - 氮
基 酸 替换 的 突变 比 同 义 的 改变 对 该 蛋白 质 的 功能 造成 有 害 影响 的 机 会 要 高 。 所 以 , 绝 大 多 数 非 同 义 突
变 都 将 受 纯洁 化 选择 而 从 群体 中 清除 。 其 结果 将 使 非 同 义 位 点 上 的 替换 速率 降低 。 相 比 之 下 , 同 义 的
改变 有 较 高 的 机 会 是 中 性 的 ,而 它们 中 在 群体 中 固定 的 也 要 多 些 。
当然 , 非 同 义 替 换 可 能 有 幸 使 蛋白 质 的 功能 得 到 改善 。 然 而 ,如 果 有 利 选 择 在 该 蛋白 质 的 进化 中
起 主要 作用 的 话 , 则 非 同 义 蔡 换 的 速率 应 该 超过 同 义 替 换 的 速率 .事实 上 ,在 某 些 免疫 球 蛋 白 基 因 里 ,
决定 互补 性 的 区 域 (CDRs,, 又 以 高 可 变 区 著称 ) 中 非 同 义 的 速率 高 于 同 义 的 速率 。 这 种 较 高 的 速率 已
经 归 因 于 对 抗体 多 样 性 的 超 显 性 选择 (CTanaka 和 Nei,1989)。 不 过 , 当 考 虑 的 是 整个 免疫 球 蛋 自 基 因
时 , 非 同 义 的 速率 仍然 大 大 低 于 同 义 的 速率 ( 表 4 一 1) 。 这 个 结果 指出 ,即使 在 免疫 球 蛋白 中 ,大 多 数
非 同 义 突变 也 是 不 利 的 ,并 且 将 从 群体 中 清除 。 休 斯 和 根 井 (Hughes 和 Nei,1989) 曾 报导 在 主 组 织 相
容 性 复合 体 基 因 的 某 些 区 域 中 有 类 似 情形 , 即 非 同 义 替 换 的 速率 超过 同 义 替 换 的 速率 。 他 们 把 非 同 义
替换 有 更 高 的 速率 归 因 于 超 显 性 选择 。
一 个 基因 中 同 义 的 和 非 同 义 的 速率 间 的 对 比 证 明了 分 子 进化 中 一 个 众所周知 的 原则 , 即 ,对 某 一
大 分 子 的 功能 限制 越 强 , 则 其 进化 的 速率 就 越 缓 慢 。 杰 村 Kimura,19837 曾 用 一 个 简单 模型 将 此 原则
表达 成 一 个 公式 。 假 定 某 一 分 子 中 所 有 突变 的 某 一 部 分 上 ,是 选择 中 性 或 近 下 竹 的 ;而 其 余 的 则 是 有
Sica ae ee a ne ea ed 它们 对 整个 分 子 进 化
的 速率 没有 多 大 贡献 )。 如 果 我 们 用 vr 表示 每 单位 时 间 每 位 点 的 总 突变 率 , 那 么 ,中 性 突变 的 突变 率
即 为 zw 王 zrf。 根 据 分 子 进化 的 中 性 学 说 ,替换 速率 为 民 王 wm (第 二 章 )。 因 此 ,
/大 C4.2)
在 任 一 给 定 基因 内 ,该 zr 值 可 假定 对 同 义 位 点 和 非 同 义 位 点 都 是 相同 的 。 然 而 ,fs 值 则 是 同 义 位 点 的
比 非 同 义 位 点 的 高 ,所 以 前 者 要 比 后 者 进化 得 快 。 虽 然 该 模型 是 过 于 简单 了 ,但 它 对 解释 不 同 DNA
区 域 间 速率 上 的 差异 却 很 有 帮助 。
依 上 述 模型 看 ,最 高 的 速率 预期 应 出 现在 一 个 没有 任何 功能 的 序列 中 ,由 于 没有 功能 ,所 以 它 里
面 的 所 有 突变 都 是 中 性 的 ( 即 ff=1)。 事 实 上 , 假 基 因 看 起 来 的 确 有 最 高 的 核 苷 酸 蔡 换 速率 ( 表 4 一 3
和 图 4 一 2)。5 和 3!' 不 翻译 区 有 比 编码 区 中 的 同 义 替 换 更 低 的 替换 速率 ,这 一 观察 事实 进一步 支持 解
释 问 题 的 中 性 路 线 , 因 为 这 些 区 域 含 有 关于 转录 起 始 和 终止 的 信和 号
在 一 个 蛋白 质 内 ,有 不 同 结构 和 功能 的 区 域 看 来 受 着 有 差别 的 功能 限制 ,并 以 不 同 速率 进化 着 。
胰岛 素 原 为 此 提供 了 一 个 极 好 的 例子 。 它 由 A,B 和 C 三 个 片段 组 成 (图 4 一 3) ,片段 C 位 于 分 子 的 中
间 ,并 在 活性 激素 (胰岛 纪 上 ) 形 成 期 间 被 除去 即 胰岛 素 是 由 余下 的 A 和 B 两 个 片段 所 构成 的 。 片 段 C
人
B 链 C ik A 4
(一
胰岛 素 被 切除 的 肽
进化 速率 0.13x 102/ 位 点 /年 ”进化 速率 0.97 x 10/ 位 点 /年
图 4 一 3 AAA AEA IR Sy ACN Fo Ls 44) 0 C 肽 编码 的 UNA 区 域 中 核 将 酸 赫 换 速 率 间 的 比较 。 成 熟 的 胰岛 素 分 子
由 一 条 人 A 链 和 一 条 也 链 ,通过 二 硫 键 (S) 联 结 而 成 。 自 Kimura(1983) 修 改 而 成 。 ,
对 胰 马 素 的 激素 活性 不 起 任何 作 用 ,而 被 认为 只 对 产生 该 激素 的 正确 三 级 结构 有 促进 效果 。 结 果 ,为
C 户 段 编 码 的 区 域 的 非 同 义 替 换 速 率 , 为 A 链 和 也 链 编码 的 区 域 的 平均 非 同 义 替 换 速 率 的 7 倍 多
(图 4 一 3)。 然 而 ,C 片段 上 一 定 仍 受 着 相当 程度 的 限制 ,因为 该 区 域 中 的 非 同 义 替 换 速 率 还 是 比较 低
的 , 它 与 一 珠 蛋 日 中 的 相应 速率 大 致 相当 ( 表 4 一 1)。
s。 0,。
基因 间 的 变异
为 了 对 基因 间 非 同 义 替 换 速率 方面 的 大 变异 作出 解释 ,我 们 必须 再 次 考虑 这 样 两 个 可 能 的 牧 事
者 :突变 率 和 选择 强度 .不 同 的 基因 有 相同 的 突变 率 , 这 样 的 假定 在 这 种 情况 下 可 能 不 能 成 立 , 因 为 基
因 组 的 不 同 区 域 可 能 有 着 不 同 的 突变 倾向 。 沃 尔 夫 等 (Wolfe 等 ,1989a) 曾 提出 ,哺乳 动物 细胞 核 基 因
组 的 不 同 区 域 , 在 突变 率 方 面 的 差异 相互 间 以 一 个 数值 为 2 的 因子 来 区 别 。 然 而 ,不 同 基因 组 区 域 间
突变 率 上 出 现 2 倍 的 差异 ,甚至 不 能 算 作 造 成 非 同 义 替 换 速 率 方面 将 近 1000 倍 的 出 人 的 部 分 原因 。
所 以 ,决定 非 同 义 替 换 速 率 的 最 重要 因素 看 来 还 是 选择 强度 , 它 又 转 而 由 功能 限制 所 决定 。
为 了 说 明 功 能 限制 的 效应 ,让 我 们 考虑 一 下 载 脂 蛋 白 和 组 蛋白 3, 它 们 有 着 差异 显著 的 非 同 义 蔡
换 速 率 。 载 脂 蛋 白 是 兰 椎 动物 血液 中 各 种 脂 类 的 主要 载体 ,而 它们 的 脂 类 结合 区 大 部 分 由 下 水 性 残 基
所 组 成 。 对 来 自 哺 乳 纲 各 目的 载 脂 蛋白 的 顺序 比较 分 析 表 明 ,该 区 域内 由 一 个 下 水 性 氨基 酸 ( 比 如 纺
氨 酸 、 亮 氨 酸 ) 去 替换 另 一 个 踊 水 性 氨基 酸 , 这 在 许多 位 点 上 都 是 可 以 接受 的 (Luo 等 ,1989)。 这 种 不
太 严 格 的 结构 要 求 可 用 来 解释 为 什么 这 些 基因 中 的 非 同 义 的 速率 会 相当 高 ( 表 4 一 1)。
处 于 另 一 个 极端 的 是 组 蛋白 3。 因 为 组 蛋白 3 中 的 大 多 数 氨 基 酸 在 核 小 体 ( 图 4 一 4) 形 成 时 ,将 直
接 与 DNA 或 其 他 核心 组 蛋白 相 所 作用 .所 以 .可 以 合理 地 假定 .只 有 很 少 几 种 可 能 的 替换 能 在 不 妨
联结 者 DNA 组 蛋白 2A,2B,3,4
组 蛋白 1
图 4 一 4 一 个 核 小 体 的 示意 图 。DNA 双 螺 旋 ( 黑 色 带 ) 转 着 核心 组 蛋白 iA 2A.2K.3 Fe 4 SH) BK, BE
白 1( 淡 灰色 ) 与 该 核心 粒子 的 外 部 和 联结 者 DNA( 白 色 带 ) 相 结合 。 自 Stryer (1988) 修 改 而 成
碍 该 蛋白 质 功 能 的 条 件 下 发 生 。 此 外 ,组 蛋白 3 还 必须 维持 其 严格 的 致密 性 和 高 度 碱 性 ,这 对 与 酸性
的 DNA 分 子 相互 作 用 是 必要 的 。 结 果 , 组 蛋白 3 对 大 多 数 分 子 变 化 都 绝 不 容忍 。 事 实 上 ,这 种 和 蛋白质
是 已 知 的 进化 最 为 缓慢 的 和 蛋白质 之 一 , 比 载 脂 和 蛋白 要 慢 1000 多 倍 。
同 义 替 换 的 速率 为 什么 也 会 因 基 因而 异 还 不 太 清楚 。 出 现 这 种 变异 可 能 有 两 个 原因 。 首先 ,基因
组 的 不 同 区 域 间 突 变 率 可 能 是 不 同 的 ,因而 同 义 替 换 速 率 上 的 变异 可 能 简单 地 反映 出 基因 所 处 的 染
色 体 位 置 (Wolfe 等 ,1989a)。 这 种 可 能 性 因 这 样 的 事实 而 得 到 进一步 的 支持 , 即 , 真 核 生 物 的 基因 组
是 由 被 称 为 同 质 段 的 明显 地 以 GC 为 内 容 的 片段 所 构成 的 ,这 些 片段 可 能 是 独立 复制 的 因而 可 能 表
现 出 不 同 的 突变 率 ( 第 八 章 )。 第 二 个 原因 可 能 是 ,在 某 些 基因 中 ,并 不 是 所 有 密码 子 都 是 在 适合 度 上
等 价 的 。 结 果 , 有 些 同 义 替 换 可 能 会 受到 选择 的 排斥 。 这 种 纯洁 化 选择 就 会 在 基因 间 产 生 同 义 替 换 速
率 方 面 的 变异 。 然 而 ,虽然 纯洁 化 选择 已 被 证 明 能 影响 同 义 替 换 的 速率 ,能 影响 细菌 .酵母 和 果 蝇 的 基
因 组 中 同 义 密 码 子 的 使 用 模式 ,但 现在 还 不 清楚 这 类 选择 是 否 在 哺乳 类 中 发 生 作 用 ( 见 第 55 页 ) 。
还 有 一 种 现象 也 曾 受到 注意 , 即 一 个 基因 中 的 同 义 蔡 换 速 率 和 非 同 义 替 换 速 率 间 存在 一 种 正 相
关 (Graur,1985; Li 等 ,1985b)。 若 假定 突变 率 随 基因 而 变 (因此 有 些 基因 的 同 义 和 非 同 义 的 替换 速率
将 都 很 总 ) ,或 者 假定 同 义 位 置 上 的 选择 大 小 受 邻 近 的 非 同 义 位 置 上 核 苷 酸 组 成 的 影响 , 则 该 现象 即
可 得 到 解释 CTicher 和 Graur, 1989).
4.3 一 个 正 选 择 例子 :乳牛 和 叶 猴 的 浴 菌 酶
如 前 面 的 章节 所 讨论 的 那样 ,基因 组 的 绝 大 多 数 基因 和 非 基因 区 域 中 核 苷 酸 替 换 的 速率 和 模式 ,
e 47 e
都 可 以 通过 四 突变 输入 ,@ 中 性 或 近 中 性 等 位 基因 的 随机 遗传 漂 变 ,和 人 排斥 有 害 等 位 基因 的 纯洁 化
选择 ,这 三 方面 的 结合 来 加 以 解释 .然而 ,在 浴 菌 酶 的 例子 中 ,对 有 利 突 变 的 正 选择 曾 被 证 明 在 某 些 哺
乳 类 谱系 中 起 作用 。
前 肠 发 酵 消 化 曾 在 有 胎盘 哺乳 类 的 进化 中 独立 地 两 次 出 现 , 一 次 在 反刍 动物 (例如 乳牛 ) 中 , 另 一
次 在 疣 猴 类 (例如 叶 猴 ) 中 。 在 这 两 种 情况 中 ,对 别 的 哺乳 动物 来 说 通常 不 在 胃 中 分 弯 产 生 的 溶菌 酶 ,
它 能 补充 进来 ,以 消化 在 前 肠 执行 发 酵 任 务 的 细菌 的 细胞 壁 。 斯 图 尔 特 和 威尔逊 (Stewart 和 Wilson,
1987) 曾 对 来 自 乳 牛 . 叶 猴 、 独 卯 .人 \ 大 鼠 . 马 和 鸡 的 溶菌 酶 进行 过 氨基 酸 顺 序 比 较 ( 表 4 一 4) 。 他 们 注
意 到 ,乳牛 和 叶 猴 间 有 4 个 独特 地 共有 的 氨基 酸 。 对 这 一 观察 结果 有 两 种 可 能 的 解释 。 第 一 种 :有 可
能 乳牛 在 进化 上 与 叶 猴 的 亲缘 关系 比 与 马 的 更 近 , 于 是 这 些 独特 地 共有 的 氨基 酸 , 只 代表 出 现在 它们
的 共同 祖先 中 未 发 生 改 变 的 氨基 酸 顺 序 。 乳 牛 和 叶 猴 间 系 统 发 生 关系 更 近 的 假定 已 知 是 错误 的 。 另
一 种 ,这 些 在 该 两 物种 中 独特 地 共有 的 氨基 酸 ,可 能 是 独立 地 发 生 在 两 个 谱系 中 的 一 系列 平行 蔡 换 的
结果 。 事 实 上 ,将 氨基 酸 蔡 换 的 顺序 重建 后 ,斯图尔特 和 威尔逊 CStewart and Wilson,1987) 发 现在 乳
牛 和 叶 猴 谱系 中 有 7 个 平行 或 趋同 替换 (图 4 一 5)。
表 4 一 4 不 同 物种 的 溶菌 酶 间 顺 序 的 成 对 比较 ”
物 种
物种
MH AR Bb Bi 人 大 鼠 乳牛 5%
叶 猴 14 inte +38 32 65
Hh Hb 0 14 33 39 65
人 0 1
K fa 0 1 i
A+ 4 0
马 0 0
自 Stewart 和 Wilson(1987) 。
a. 对 角 线 上 的 数 为 物种 间 氨 基 酸 的 差异 数 , 而 对 角 线 下 的 数 为 物种 间 独 特地 共有 的 残 基数 。
而 且 , 已 经 确定 ,这 些 替换 中 有 些 对 溶菌 酶 在 低 pH 值 下 更 好 地 行使 功能 有 贡献 , 象 在 反刍 动物
人
K14 K21 V23 E41 E50 N67 D75 N87 K119 K126
32| 叶 猴
See |
L17_ $101
12
D37 H62 N82 T90
i Bh
M29 R41 A47 R50 L79 R115 R122
图 4 一 5 乳牛 和 叶 钦 溶菌 酶 中 的 平行 或 趋同 氨基 酸 替 代 。 谱 系 的 长 度 与 沿 该 谱系 发 生 的 氨基 酸 替 代数 成 正比 。 每
次 替代 用 替代 后 氨基 酸 的 一 字母 缩写 ( 表 1 一 1) 表 示 , 其 后 续 数字 表示 替代 发 生 的 位 置 。 箭 头 指出 了 叶 猴 中 发 生 的
7 次 替代 ,它们 以 与 乳牛 谱系 平行 或 趋同 的 形式 发 生 。 与 乳牛 胃 溶 菌 酶 (没有 画 出 ) 的 氨基 酸 差 异 数 写 在 方块 之 中 。
自 Stewart 和 Wilson, (1987).
消化 系统 中 发 现 的 那些 酶 。 相 反 , 叶 猴 和 乳牛 溶菌 酶 在 高 pH AF AO AO. BR
可 以 不 出 什么 差错 地 推论 ,我 们 这 里 处 理 的 是 一 个 有 利 蔡 换 在 不 同 进 化 路 线 中 平行 地 发 生 , 表 现 出 对
类 似 的 选择 因子 平行 地 适应 的 例子 。
4.4 分子 钟
在 对 来 自 不 同 物种 的 血红 蛋白 和 细胞 色素 e 的 蛋白 质 顺序 比较 研究 中 , 朱 克 坎 德尔 和 波 林
。48 。
《Zuckerkandl 和 Pauling,1962,1965) 以 及 马 苞 利 阿 什 4Margoliash ,1963) 首 次 注意 到 ,这 些 蛋 白质 中
的 氨基 酸 替 换 速 率 在 不 同 的 哺乳 类 谱系 中 近似 相同 。 因 此 朱 克 坎 德尔 和 波 林 (Zuckerkandl 和 Paul-
ao
之 ,就 是 存在 着 一 种 分 子 钟 (molecular clock)。 这 一 提议 马上 激 起 了 人 们 对 将 大 分 子 用 于 进化 研究 的
极 大 兴趣 。 事 实 上 ,如果 蛋 白质 是 以 恒定 的 速率 进化 着 的 ,那么 ,它们 将 可 用 于 决定 物种 分 岐 的 年 代 ,
并 用 来 重建 生物 间 的 系统 发 育 关 系 。 这 将 与 通过 测定 放射 性 元 素 的 衰变 来 决定 地 质 年 代 类 似 。
分 子 钟 假说 也 激 起 了 大 量 的 争论 。 例 如 ,经 典 进化 论 学 者 们 就 反对 这 种 说 法 ,因为 进化 速率 恒定
的 说 法 与 在 表 型 和 生理 学 水 平 上 进化 速率 的 变化 无 常 对 不 上 号 。 当 速率 恒定 假说 用 于 估计 人 与 非洲
猿 间 的 分 岐 时 间 ,得 到 一 个 500 万 年 的 估 值 CSarich 和 Wilson ,1967) 时 ,该 假说 受到 了 特别 强烈 的 反
对 。 因 为 ,在 古生物 学 家 中 占 统治 地 位 的 观点 是 ,人 和 猿 的 分 岐 至 少 应 在 1500 万 年 前 ,两 者 差 得 太 远 。
许多 分 子 进化 科学 家 们 也 对 分 子 钟 假说 的 正确 性 提出 了 异议。 特别 是 古 德 曼 (Goodman ,1981) 以 及
他 的 同事 们 (Czelusniak 等 ,1982)。 他 们 认为 ,进化 速率 常常 在 基因 重复 之 后 出 现 加 速 , 而 蛋白 质 顺 序
在 适应 性 辐射 的 年 代 里 进化 要 快 得 多 。 例 如 ,他 们 主张 ,在 基因 重复 使 vc 和 有 8 血红 蛋白 分 开 之 后 出 现
了 极 高 的 氨基 酸 蔡 换 速 率 , 而 这 种 高 替换 速率 则 是 由 于 改善 血红 蛋白 功能 的 有 利 突变 所 造成 的 。
虽然 速率 恒定 假说 一 直 是 有 争议 的 ,但 它 已 广泛 用 于 分 岐 时 间 的 估计 和 系统 发 育 树 的 重建 中
(Nei,1975; Wilson 等 ,1977) 。 所 以 ,分 子 钟 假说 的 正确 性 在 分 子 进 化 中 是 一 个 生死 依 关 的 问题 。 近 几
年 中 DNA 顺序 数据 的 迅速 积累 为 检验 该 假说 提供 了 一 个 全 新 的 机 会 。 用 这 类 数据 与 用 蛋白 质 顺 序
数据 相 比 可 使 我 们 更 近 地 检 验 该 假说 ,而 与 DNA 一 DNA 杂交 数据 和 免疫 距离 数据 相 比 , 则 可 得 到 更
直接 的 解释 。
相对 速率 测验
关于 分 子 钟 假说 的 争论 常常 引起 有 关 物 种 分 岐 年 代 的 异议 .为 了 避免 这 一 问题 , 萨 里 奇 和 威尔逊
(Sarich 和 Wilson ,1973) 提 出 了 一 种 不 需要 知道 分 岐 年 代 的 检验 法 。 该 检验 法 称 相 对 速率 测验 (rela-
tive-rate test), 如 图 4 一 6 所 示 。 假定 我 们 要 比较 谱系 A 和 B 中 的 速率 。 于 是 ,我 们 用 第 3 个 物种 C 作
为 参照 物 。 我们 应 该 确定 ,该 参照 物种 的 分 岐 过 程 发 生得 比 物 种 A 和 也 间 的 分 岐 更 早 。 例 如 ,为 了 比
较 人 和 马 来 猩 猩 谱 系 中 的 速率 ,我 们 用 一 种 猴 作 为 参照 物 。
A B C
图 4 一 6 用 于 相对 速率 测验 的 系统 树 。O 表示 物种 A 和 也 的 共同 祖先 。
从 图 4 一 6 很 容易 看 出 ,物种 A 和 C 间 的 替换 数 KAc 等 于 从 点 O 到 点 A RA AY RR (Kon) FIM
点 O 到 点 CC 发生 的 替换 数 (Koc) 之 和 。 即 ,
Kac = Koa + Koc (4, 3a)
类 似 地 ,有 :
Kec 一 天 os + Koc (4. 36)
和
Kas = Koa + Kos (4. 3c)
FAN KacsKac fl Kan fe MF OR IE EB Fie Ha CG = BE), A. BR ATT DAR Sh tS 个 方程 , 找
到 | Koa > Kop Fi Koc Wk :
+496
Kac += Kaz “sx Kec
Koa a 2 (4, 4a)
Ss See
Kos = pears 34 学 ae (4. 46)
Koc = Kac + Koc — Kas (A. 4c)
2
现在 我 们 可 以 通过 Koa Al Kos 的 值 ,来 决定 替换 速率 在 谱系 A MIBABPEAHMS. AWHA AB
最 后 地 共有 一 个 共同 祖先 以 来 所 经 过 的 时 间 ,定义 为 对 两 个 谱系 是 相等 的 。 所 以 , 按 分 子 钟 假说 ,KoA
和 Kos 应 该 相等 BY ,Ko 一 Kos 王 0。 从 等 式 4.3a 和 4.3b FT WA AH » Koa —Kos=Kac—Kes. 故而 ,我 们
可 以 从 天 Ac 和 Kesc 来 直接 比较 A 和 B 中 的 替换 速率 。
小 鼠 和 大 鼠 中 接近 相等 的 速率
表 4 一 5 展示 了 用 相对 速率 测验 法 进行 的 小 鼠 和 大 鼠 中 同 义 替 换 速 率 的 比较 。 表 中 的 物种 A 此
HE) BL. i FP BWM ARK. A.A 天 Ac 一 Kesc 的 值 为 一 正 号 , 则 表示 小 鼠 中 的 速率 高 于 大 鼠 中
的 ,而 若 为 负 号 则 指示 实际 情况 正好 相反 。
表 4 一 5 小 鼠 (物种 A) 和 大 鼠 ( 物 种 B) 间 每 100 位 点 的 同 义 替 换 数 差异 (KAc-Kac)
基因 LY 下 AAAENKEE Kac— Kec
载 脂 蛋白 E 201 7.4 6108 59.5 1.845.3
肌 动 蛋白 a 249 17.9 58.2 59.1 —0.9+4.8 —
肌 动 蛋白 233) 19.70 SO 4654 5.0+4. 6
Thy-1 抗原 116. 19.3 5L8 5703 —5.5+68
乳酸 脱 氢 酶 A 219 30.9 80.4 80.3 0.148. 2
糖 蛋 白 激素 ,ax WE 58) “730.8 297.7 Gaus 13.4+18.5
胰 马 素 样 生长 因子 1 130 4.8 37.0 40.9 =3° 92-28
心房 钠 尿 因子 107 20.4 69.7 57.4 12. 348.3
生长 激素 2 i a ee iy
FAR AR ER AL B G0 "ba? eee ee 7 ceo Lig fc oh
FS Fy FRR SS BH Dik 154 Dh GIRS Bee y 8.8+6.5
醛 缩 酶 A 184. 15 a 57.5 63.3 Sa ec eS
肌 酸 激酶 M 251 /1722) 28.6. Bee 3.64.3
ie J Bit FE AA A FAL 35 19 Oy Aeon aee7 8.8410. 2
rath 1
Sit 2187 19.0 59.8 59.4 0.421. 5
A Li 等 (1987a)
a 工 一 受 比较 位 点 数 。Ki 一 物种 1 和 j 间 每 100 位 点 的 替换 数 。 人 为 参照 物种 (c), 但 肌 酸 激酶 M 为 一 例外 ,该 行 数据 是 用 免 的 顺
序 作 为 参照 物 得 出 的 。
由 于 受 资 料 限 制 , 我 们 用 作 参 照 物 的 是 人 或 兔 的 顺序 ,而 不 是 从 与 小 鼠 和 大 鼠 的 亲缘 关系 更 近 的 物
种 , 象 仓 鼠 或 豚鼠 中 得 到 的 顺序 。 结 果 ,Kcs 一 Kec 的 估 值 表现 出 较 大 的 统计 误差 ( 表 4 一 5)。 不 过 ,小 鼠
和 大 鼠 中 的 蔡 换 速率 接近 相等 ,这 一 点 是 相当 明显 的 。 换 句 话说 , 当 将 所 有 顺序 一 起 考虑 时 ,该 速率 差
接近 于 0。 关 于 这 两 个 物种 中 非 同 义 蔡 换 的 速率 ,可 得 出 同样 的 结论 (Li 等 ,1987a) 。
人 中 的 速率 低 于 猴 的 速率
根据 免疫 距离 和 蛋白质 顺序 数据 , 古 德 曼 (Goodman,1961) 及 其 同事 们 (Goodman 等 ,1971 ) 提
出 ,大 科 动 物 ( 人 和 和 猿 ) 自 它们 从 远古 时 代 与 猴 分 离 后 ,出 现 了 速率 减缓 。 然 而 ,威尔逊 等 (Wilsom 等 ,
1977) SQ BR DE ,减缓 是 一 种 人 为 现象 ,是 用 了 对 人 一 狼 分 岐 时 间 的 错误 估 值 的 结果 。 他 们 用 免疫 上 距离 数
s。 DO0O。
据 和 蛋白质 顺 序数 据 做 了 两 次 相对 速率 测验 ,结论 是 ,没有 任何 表明 人 科 动 物 速率 减缓 的 证 据 。
DNA 顺序 数据 可 对 上 述 争 论 给 出 一 个 更 好 的 解决 。 在 表 4 一 6 中 ,相对 速率 测验 法 被 用 于 比较 人
谱系 和 古 世 界 猴 谱系 的 核 苷 酸 替 换 速率 。 在 所 有 检验 中 ,谱系 也 是 人 的 谱系 ,而 谱系 A 为 猴 的 谱系 。
谱系 C 是 参照 物种 ( 见 表 下 的 注释 )。 因 此 ,速率 差 (KAc 一 Kac) 为 正 号 意味 着 人 谱系 曾 较 慢 地 进化 着 ,
而 为 负 号 则 意思 相反 。
表 4 一 6 古 世 界 猴 谱系 (A) 和 人 谱系 (B) 间 每 100 MANA RE FM (Kac— Kac)"
顺序 位 点 数 KAB KAc 一 KBc
人 站 珠 蛋 白 假 基因 2000 7.4 2 Bball
同 义 位 点
BRA 71 8.9 2: 85.6
载 脂 蛋 白 A-i 158 7.9 =—§..da 408
促 红细胞 生成 素 145 ‘A? S125. 9
ma- 抗 胰 和 蛋白 酶 140 10.9 6.7 士 6.8
胰岛 素 84 18. 6 a OsTen
Aa F
0- 珠 蛋白 601 4.7 3.4+1.4
不 翻译 区 和 侧 区 域
BEA 179 4.6 21. 7
3- 珠 蛋白 172 8.8 6.1 士 3. 2
总 计 3550 60:7 Zaz 0.16" ™
a. 所 用 参照 物种 为 泉 猴 (一 珠 蛋 白 假 基因 ), 狐 猴 (B 一 和 8 珠 蛋 白 ), 小 鼠 或 大 鼠 ( 促 红 细胞 生成 素 , 载 脂 蛋 白 A 一 I, 和 xl 一 抗 胰
蛋白 酶 ) 和 狗 ( 胰 岛 素 ) 。
** 在 1% 水 平 与 0 差异 显著 。
我 们 注意 到 ,9 个 所 用 的 顺序 中 只 有 2 个 为 负 号 。 速 率 上 的 差异 即使 在 只 用 刀 假 基因 时 也 是 很 显著
的 。 若 将 所 有 顺序 一 起 考虑 , 则 Kac—Kec=2. 3%, i Kas=6.7%. Ask. Hitt RRIBRA PH K (A
(Koa) W(6. 7%+2.3%)/2=4.5%, AKA PAW K (A Kon) RA 6.7% —4.5% =2. 2%, HA RIBA
以 4.5/2. 22 倍 于 人 谱系 的 速率 更 快 地 进化 着 。
了 岩 齿 类 中 的 速率 高 于 灵 长 类 中 的 速率
FAA Wu 和 Li,1985) 曾 用 相对 速率 测验 法 来 比较 员 齿 类 谱系 和 人 类 谱系 中 的 替换 速率 , 参
照 物 则 用 偶蹄 类 或 食肉 类 谱系 。 他 们 的 结论 是 , 吗 齿 类 谱系 同 义 替 换 的 速率 约 为 人 类 谱系 的 2 倍 。 不
过 要 注意 ,速率 上 的 估计 差异 指 长 期 内 ( 即 从 员 齿 类 一 灵 长 类 分 岐 到 现在 的 时 期 ) 的 平均 值 .由 于 在 发
生 分 岐 的 那 一 时 期 和 其 后 的 短 时 期 里 两 谱系 中 的 替换 速率 应 是 相似 的 ,所 以 ,速率 差异 一 定 是 随时 间
而 增加 的 。 因 此 ,以 上 估计 的 速率 差异 值 可 能 是 一 个 低估 值 。 要 想 知 道 更 近 时 期 的 速率 差异 ,我 们 需
要 分 别 估 出 员 齿 动物 内 和 灵 长 动物 内 的 替换 速率 。
表 4 一 7 展示 了 灵 长 类 和 吵 齿 类 中 的 替换 速率 的 比较 。 如 果 我 们 假定 人 一 黑猩猩 的 分 岐 发 生 在 七
百 万 年 前 ,而 人 一 古 世 界 猴 的 分 岐 发 生 在 二 千 五 百 万 年 前 , 则 人 和 黑猩猩 的 顺序 间 平 均 速率 为 每 年 每
位 点 1.3X10“ 替 换 , 而 人 与 古 世 界 猴 的 顺序 间 则 为 每 年 每 位 点 2.2X10“ 蔡 换 。 这 一 结果 与 古 世界
猴 谱系 以 2 倍 于 人 谱系 的 速率 进化 的 结论 是 一 致 的 。 如 果 我 们 假定 小 鼠 一 大 鼠 的 分 岐 发 生 在 一 千 五
百 万 年 前 , 则 小 鼠 和 大 鼠 的 顺序 间 平 均 速率 为 每 年 每 位 点 7.9X10 “ 蔡 换 。 因 此 , 趾 齿 类 中 的 速率 可
能 是 较 高 等 的 灵 长 类 中 的 速率 的 4 到 6 倍 。 虽 然 关 于 所 用 的 分 岐 时 间 还 不 是 很 可 靠 , 但 吵 齿 类 顺序 的
进化 比 灵 长 类 顺序 要 快 得 多 ,这 一 点 是 很 明显 的 。
表 4 一 7” 灵 长 类 和 财 齿 类 中 每 年 每 位 点 同 义 蔡 换 的 平均 速率
物种 对 位 点 数 百分比 分 岐 蔡 换 速率 (X10-9)
人 对 黑猩猩 921 1.9 1. 3(0. 9 一 1. 9)b
人 对 古 世 界 猴 998 11.0 2.2(1. 8 一 2. 8)
小 鼠 对 大 鼠 3886 2357 7. 9(3. 9 一 11.8)
自 Li 等 (1987a)
a. 所 用 分 岐 时 间 , 人 一 黑猩猩 为 7(5 一 10) 百 万 年 前 ,人 一 古 世 界 猴 为 25(20 一 30) 百 万 年 前 ,小 鼠 一 大 鼠 为 15(10 一 30) 百 万 年
前 。
b. 括号 内 的 值 为 从 分 岐 时 间 的 上 限 估 值 和 下 限 估 值 得 到 的 速率 估 值 构成 的 范围 。
不 同 进化 谱系 间 蔡 换 速率 上 出 现 变异 的 原因
猴 的 替换 速率 高 于 人 的 以 及 吵 齿 类 的 替换 速率 高 于 灵 长 类 的 ,这 也 许 能 用 所 谓 世 代 时 间 效 应
(generation-time effect) 来 加 以 解释 ( 儿 ohne,1970) 。 路 齿 类 的 世代 时 间 比 人 的 要 短 得 多 ,所 以 ,如 果 在
这 些 生 物 间 每 世代 的 种 系 复制 没有 很 大 差别 的 话 , 则 每 年 的 种 系 DNA 复制 的 次 数 在 路 齿 类 中 就 可
能 比 在 人 类 中 要 高 许多 倍 。 因 为 突变 大 多 在 DNA 复制 的 过 程 期 间 积累 ,所 以 ,复制 的 周期 数 越 多 , 则 :
突变 错误 也 将 发 生得 越 多 。 这 一 因素 也 许 能 在 很 大 程度 上 解释 路 齿 类 的 替换 速率 高 于 人 类 的 替换 速
率 的 现象 。 类 似 地 , 儿 有 比 人 短 的 世代 时 间 , 所 以 ,应 该 预期 它 将 有 较 高 的 替换 速率 。
替换 速率 上 的 差异 也 可 部 分 地 归 因 于 DNA 修复 系统 的 效率 方面 的 差异 (Britten ,1986)。 已 有 的
有 限 资料 表明 Ma RA Eh ARIK DNA 修复 系统 ,因而 ,在 每 一 复制 周期 中 将 积累 更 多 突变 。
以 上 结果 不 应 拿 来 作为 不 存在 分 子 钟 的 证 据 。 我 们 注意 到 ,替换 速率 上 的 差异 是 在 具有 很 不 相同
的 世代 时 间 的 生物 间 被 观察 到 的 。 当 具有 相近 的 世代 时 间 的 生物 , 象 小 鼠 和 大 鼠 进行 比较 时 ,速率 恒
定 规律 表现 得 相当 明显 。 所 以 ,虽说 没有 一 个 关于 所 有 哺乳 类 的 全 球 性 时 钟 ,但 关于 许多 亲缘 关系 较
近 的 物种 类 群 的 地 方 性 时 钟 也 许 是 存在 的 。
4.5 细胞 器 DNA 中 的 替换 速率
与 细胞 核 基 因 组 相 比 ,细胞 器 基因 组 要 小 得 多 ,也 更 容易 进行 实验 研究 .而且 ,在 哺乳 动物 线粒体
基因 组 中 蔡 换 速率 特别 高 (Brown 等 ,1979)。 这 一 发 现 激 起 了 人 们 对 细胞 器 DNA 的 进化 问题 的 更 大
兴趣 。
哺乳 动物 线粒体 基因 组 由 一 个 环 状 、 双 链 DNA 组 成 。 长 为 15,000 一 17,000 碱 基 对 (bp) ,近似 地
相当 于 最 小 的 动物 细胞 核 基 因 组 的 1/10,000。 它 只 含有 单一 的 ( 即 非 重复 的 ) 序 列 :13 个 为 蛋白 质 纺
码 的 基因 ,2 个 rRNA 基因 ,22 个 tRNA 基因 和 一 个 调控 区 ,后 者 含有 复制 和 转录 的 起 始 位 点 。 该 基
因 组 在 结构 上 是 非常 稳定 的 ,这 一 点 ,从 不 同 种 的 哺乳 动物 间 其 基因 组 大 小 变异 不 大 即 可 看 册 。
与 其 成 鲜明 对 照 的 是 ,植物 的 线粒体 基因 组 却 展现 出 较 大 的 结构 变异 性 。 它 们 经 历 了 频繁 的 重
HE. 重复 和 缺失 (Palmer,1985)。 为 此 ,基因 组 大 小 在 40,000bp 到 2,500,000bp 的 范围 内 变化 .植物 中
的 线粒体 基因 组 可 能 是 线 状 的 ,也 可 能 是 环 状 的 ,而 在 许多 情况 中 ,遗传 信息 被 分 割 成 相互 独立 的
DNA 分 子 , 后 者 被 称 为 亚 基因 组 环 。 植 物 线粒体 的 编码 内 容 还 没有 全 部 确定 ;不 过 ,我 们 确 已 知道 ,有
3 个 确定 TRNA 的 基因 、 数 目 还 不 清楚 的 tRNA 基因 和 大 约 15 个 一 30 个 为 蛋 和 白质 编 码 的 基因 ,其 中
有 些 已 被 鉴别 出 来 了 。 (在 植物 线粒体 基因 组 中 结构 基因 可 能 以 多 重 拷贝 出 现 .) 目 前 ,尽管 植物 线 粒
体 基 因 组 在 大 小 上 有 很 大 变异 性 ,但 在 编码 内 容 上 却 没 有 表现 出 性 质变 异 的 迹象 ,
维 管 植物 的 叶绿体 基因 组 是 环 状 的 ,大 小 在 120,000 到 220,000bp 的 范围 内 变化 ,平均 大 示 为
1505000bp(Palmer,1985)。 尽 管 在 大 小 上 有 如 此 大 的 变异 ,但 该 基因 组 已 知 在 结构 上 是 稳定 的 。 烟草
(Nicotiana iabpacxzz) 的 叶绿体 基因 组 已 经 被 完全 定 序 了 (Shinozaki 等 ,1986)。 它 是 一 个 环 状 分 子 ,长
155,844bp 含有 37 个 tRNA 基因 (其 中 8 个 含有 单 内 含 子 ) ,8 个 rRNA 基因 ,和 45 个 为 蛋白 质 编码
的 基因 [其 中 5 个 含有 单 内 含 子 ,其 中 2 人 站 含有 两 内 含 子 ) 。 两 条 链 都 用 于 编码 。Nizcoriazna tabacum 的
. 52 .
叶绿体 基因 组 还 含有 59 个 功能 不 知 的 外 加 开 读 框架 ,其 中 2 个 则 捅 进 了 内 含 子 。
哺乳 动物 线粒体 基因 中 同 义 替 换 的 速率 已 估 出 ,为 每 年 每 同 义 位 点 5.7X10 8 HR (Brown 等 ,
1982)。 这 大 约 是 细胞 核 中 为 蛋白 质 编 码 的 基因 的 同 义 替 换 值 的 10 倍 。 非 同 义 替 换 的 速率 在 13 个 为
蛋白 质 编码 的 基因 中 变化 很 大 ,但 通常 都 比 细胞 核 基 因 的 平均 非 同 义 替 换 速 率 大 得 多 .哺乳 动物 线 粒
体 中 这 些 高 替换 速率 的 原因 ,看 来 是 相对 于 细胞 核 而 言 它 有 较 高 的 突变 率 。 高 突变 率 则 是 由 于 (a) 线
粒 体 中 的 DNA 复制 过 程 保 真 度 低 ,(b) 缺 乏 修复 机 制 或 修复 机 制 效率 极 差 ,和 (c) 诱 变 剂 浓度 高 ( 例
如 超 氧化 物 基 团 O, ) ,后 者 是 线粒体 执行 代谢 功能 的 结果 。 另 一 方面 ,作用 在 非 同 义 突变 上 的 纯洁 化
选择 的 强度 ,看 来 与 作用 在 细胞 核 基 因 上 的 属 同一 数量 级 。
根据 几 个 基因 顺序 或 限制 酶 图 谱 资料 进行 的 早期 研究 指出 ,叶绿体 基因 有 上 比 哺乳 动物 细胞 核 基
FA AFG AY 4% FF PR FR EK (Curtis 和 Clegg,1984;Palmer,1985) ,用 核 苷 酸 蔡 换 表 示 则 植物 线粒体 DNA
进化 缓慢 ,虽然 它 频 繁 地 经 历 着 顺序 重 排 (Palmer 和 Hebron ,1987)。 这 些 结果 近 来 被 更 广泛 的 DNA
顺序 分 析 所 证 实 (Wolfe 等 ,1987,1989) 。
表 4 一 8 展示 了 高 等 植物 的 这 3 种 基因 组 中 替换 速率 的 比较 。 每 非 同 义 位 点 的 平均 替换 数 (KA)
在 叶绿体 和 线粒体 基因 组 中 是 相似 的 ,但 每 同 义 位 点 的 平均 替换 数 (K.) 却 很 不 相同 ,在 单子 叶 植物 与
双子 叶 植 物 间 比 较 , 叶 绿 体 基 因 组 中 的 开 . 几乎 是 线粒体 基因 组 中 的 3 倍 ; 而 在 玉米 与 小 麦 或 大 麦 间
比较 则 前 者 是 后 者 的 6 倍 。 以 下 ,我 们 将 采用 前 一 个 比值 ,因为 它 是 根据 更 大 的 数据 组 而 得 到 的 。 植
物 细 胞 核 基 因 中 的 平均 同 义 替 换 速 率 约 为 叶绿体 基因 的 4 倍 。 于 是 植物 线粒体 .叶绿体 和 细胞 核 基因
中 的 同 义 蔡 换 速 率 , 近 似 地 呈 1 :3:12 这 样 的 比例 。
表 4 一 8 植物 叶绿体 、 线 粒 体 和 细胞 核 基 因 中 核 背 酸 蔡 换 速率 的 比较 ”
基因 组 Ks Ls Ka i
单子 叶 与 双子 叶 植物 间 的 比较
叶绿体 基因 0.58+0.02 4177 0.05+0.00 14421
线粒体 基因 0.2140.01 1219 0.04+0.00 4380
玉米 与 小 麦 或 大 麦 间 的 比较
细胞 核 基 因 0.7140.04 1475 0.06+0.00 5098
叶绿体 基因 0.17+0.01 2068 0.01+0.00 7001
线粒体 基因 0 OF 2413 0.01+0.00 1526
B Wolfe , (1987,1989b)
a. 开 ,: 每 同 义 位 点 的 蔡 换 数 ;KA: 每 非 同 义 位 点 的 蔡 换 数 ;L.: 同 义 位 点 数 ;LA: 非 同 义 位 点 数 。
如 果 我 们 把 玉米 与 小 麦 间 的 分 岐 时 间 取 为 50 一 70 百 万 年 (Stebbins ,1981;Chao 等 ,1984) , 那
么 , 表 4 一 8 中 关于 细胞 核 的 数据 则 表现 出 一 个 每 年 每 位 点 5.1 一 7.1X10“ 替 换 的 平均 同 义 速率 。 这
与 在 哺乳 类 细胞 核 基 因 中 看 到 的 同 义 蔡 换 速 率 ( 表 4 一 1) 相 似 。
有 趣 的 是 ,细胞 器 的 基因 组 中 核 苷 酸 替 换 的 速率 与 结构 变化 的 速率 无 关 。 在 哺乳 类 中 ,以 核 苷 酸
替换 表示 的 线粒体 DNA 的 进化 非常 迅速 ,但 其 基因 的 空间 排列 和 基因 组 的 大 小 却 在 各 物种 间 保 持
稳定 。 相 反 , 植 物 的 线粒体 基因 组 经 历 了 频繁 的 结构 变化 ,但 其 核 苷 酸 替 换 速 率 却 极 低 。 在 叶绿体
DNA 中 , 核 苷 酸 蔡 换 速 率 和 结构 进化 都 很 缓慢 .替换 速率 和 结构 进化 速率 间 无 相关 性 ,这 表示 两 个 过
程 是 独立 地 进行 的 。
4.6 假 基 因 中 的 核 苷 酸 蔡 换 模式
因为 点 突变 是 DNA 序列 进化 中 最 重要 的 因素 之 一 ,所 以 分 子 进化 学 家 们 长 期 以 来 一 直 对 决定
自发 突变 的 模式 (pattern of spontaneous mutation) 怀 有 兴趣 (例如 ,Beale 和 Lehmann,1965; Zuck-
erkandl 等 ,1971)。 该 模式 可 以 被 当 作 一 个 标准 ,用 于 推论 : 任 一 给 定 DNA 序列 中 核 背 酸 间 相互 变换
的 观察 频率 与 在 无 选择 下 , 即 在 选择 中 性 (selective neutrality) 下 ,预期 的 值 究竟 偏离 多 远 。
研究 点 突变 模式 的 途径 之 一 ,是 检验 不 受 选 择 限 制 的 DNA 区 域 中 的 替换 模式 。 假 基因 在 这 里 特
别 有 用 。 由 于 它们 无 功能 ,所 以 ,所 有 发 生 在 假 基 因 中 的 突变 都 是 选择 中 性 的 , 且 以 相同 的 概率 在 群体
中 固定 。 于 是 , 假 基因 中 的 核 苷 酸 蔡 换 模式 预期 将 反映 出 自发 点 突变 的 模式 。
图 4 一 7 表示 推论 假 基因 序列 中 的 核 苷 酸 桩 换 的 一 种 简单 方法 (Gojobori 等 ,1982;Li 等 ,1984)。
f
/
/
/
序列 1 序列 2 序列 3
( 假 基 因 ) (有 功能 的 ) 〈 有 功能 的 )
图 4 二 7 推论 假 基 因 序 列 中 核 音 酸 堆 换 模 式 的 系统 笠 ” 虚 线 的 含义 是 无 功能 。
序列 1 是 一 个 假 基因 ,序列 2 是 其 有 功能 的 对 应 物 ,来 自 同 一 物种 ,而 序列 3 则 是 假 基因 出 现 前 即 发
生 分 岐 的 功能 序列 。 假定 在 某 一 核 苷 酸 位 点 上 ,序列 1 和 2 分别 各 为 A 和 G. 那 么 ,我 们 可 以 假定 , 若
序列 3 中 该 位 点 上 为 G 则 假 基 因 序 列 中 该 核 苷 酸 从 GEA AMARA 3 中 该 位 点 上 为 A 则 序列 2
PARRA A 变 成 G。 不 过 ,如 果 序 列 3 中 的 是 工 或 C, 则 我 们 不 能 决定 变化 的 方向 ,而 车 出 现 这
种 情况 则 该 位 点 将 从 比较 中 排除 。 由 于 假 基 因 中 的 替换 速率 通常 大 大 高 于 其 同 源 的 功能 基因 中 的 速
率 , 所 以 ,一 个 基因 与 一 个 假 基 因 间 核 苷 酸 顺 序 上 的 差异 ,在 绝 大 多 数 情 况 下 都 被 认为 是 假 基因 中 的
改变 所 造成 的 。
表 4 一 9 中 的 和 矩阵 代表 从 13 种 哺乳 类 假 基 因 序列 推 论 出 的 替换 的 联合 模式 。 抢 阵 中 的 每 一 个 项
和 ,都 代表 一 个 随机 序列 ( 即 四 种 碱 基 以 相同 的 频率 出 现 其 中 的 序列 ) 中 每 100 次 替换 里 碱 基 从 i 变 成
j 的 期 望 次 数 。 例 如 ,far 一 4.7, 表 示 所 有 替换 的 4.7%% 为 从 A BMT.
表 4 一 9 假 基 因 中 的 替换 模式
到
从 A Ae ( G 行 总 计
4.7 士 1.3 5.0+0.7 9.4+1.3 19.1
(5.341.4) \Gi6+0.8) (10.821.4)-° °(21.2)
本 Ae Ae 8. 2+1.3 3. 3 士 1. 2 15. 9
(4.8+1.1) (9241.3) (3.641.383) . (17:6)
A 6.5+1.1 21.0+2.1 4.2+0.5 3h 7
(7141: 3) (C18. 2352989 (4. 2+0. 6) (29.5)
a 20.742.2 7.24+1.1 5.3+1.0 33. 2
(18.64£1.9) (7.741.3) (5.541. 3) (31. 8)
31.6 32.9 18.5 16.9
列 总 计
(30.5) (31. 2) (20. 3) (18. 1)
A Gojobori “ , (1982) Al Li , (1984)
ae 表 中 项 为 以 13 种 哺乳 类 假 基 因 序 列 为 根据 推论 出 的 , 碱 基 从 i 变 为 j 的 百分数 (fi)。 括 号 中 的 值 是 把 所 有 CG BE RIA
中 排除 后 得 到 的 。
我 们 注意 到 ,突变 的 方向 是 非 随机 的 。 例 如 ,A 变 成 G 比 变 成 工 或 C 更 常 发 生 。 从 右上 角 到 左下
角 的 对 角 线 上 的 4 个 元 是 转换 的 加 值 , 其 余 的 8 个 元 代表 颠 换 。 所 有 转换 ,特别 是 C~>T 和 G->A,, 都
比 颠 换 更 常 发 生 。 转 换 的 相对 频率 之 和 为 59.2% ( 若 CG 二 核 苷 酸 被 排除 则 为 54.4% , 见 下 )。 我 们
注意 到 在 随机 突变 下 转换 的 期 望 比 例 仅 33%% ,因为 只 有 4 种 转换 却 有 8 种 颠 换 。 该 观察 比例 几乎 是
在 随机 突变 下 预期 值 的 两 倍 。
我 们 也 注意 到 ,有 些 核 苷 酸 比 另 一 些 要 更 容易 突变 。 在 表 4 一 9 的 最 后 一 列 ,我们 列 出 了 从 ATA
。54。
C 和 6G 突变 成 别 的 核 苷 酸 的 相对 频率 。 如 果 4 种 核 苷 酸 都 有 相同 的 突变 性 , 则 我 们 应 期 望 该 列 中 的 每
一 个 元 都 有 一 个 25%% 的 值 .实际 上 ,我们 看 到 ,G 以 33. 2 儿 的 相对 频率 突变 ( 即 ;G 是 一 种 高 可 突变 的
核 背 酸 ) ,而 工 则 以 15.9%% 的 相对 频率 突变 ( 即 它 达 不 到 那 种 可 变 程度 )。 HEHE A—-9 的 最 后 一 行 ,我 们
列 出 了 所 有 经 突变 而 变 成 AT.C AG 的 相对 频率 。 我 们 注意 到 ,所 有 突变 的 64.5%% 是 变 成 A 或 1
的 ,而 随机 过 程 期 望 的 值 应 为 50% 。 由 于 C 和 G 有 一 种 频繁 地 变 成 A 或 工 的 倾向 ,又 由 于 A AT AH
如 C 和 G 那 样 可 突变 ,所 以 , 假 基因 预期 应 变 得 富 含 A 和 T 工 .这 对 其 他 一 些 不 受 功 能 限制 的 非 编 码 区
应 该 也 是 成 立 的 。 事 实 上 , 非 编 码 区 普遍 发 现 是 富 AT 的 。
表 4 一 9 中 的 结果 是 根据 有 意义 的 链 , 即 未 被 转录 的 链 而 得 出 的 。 所 以 ,从 G 到 和 A 的 变化 实际 上
意味 着 一 个 G:C 对 被 一 个 A:T 对 所 取代 。 这 种 情况 的 出 现 , 可 以 是 有 意义 的 链 中 G 突变 成 A 的 结
果 , 也 可 能 是 与 前 者 互补 的 链 中 C 突变 成 工 的 结果 。 类 似 地 ,从 C 到 工 的 变化 ,也 可 能 是 在 一 条 链 中
C 突变 成 工 或 在 另 一 条 链 中 G 突变 成 A 的 结果 。 如 果 两 条 链 间 突变 的 模式 没有 差别 ,那么 我 们 应 有
fcA 王 fcr。 类 似 地 ,我们 应 能 得 到 fac 一 frcsfAr 一 frA,fAc 一 freyfcA 一 fcr 和 fcc 王 fcc。 这 些 等 式 仅 近 似 地 成
立 , 且 事实 上 这 两 条 链 间 的 突变 模式 可 能 存在 较 小 的 不 对 称 性 。 这 种 不 对 称 性 可 能 是 由 于 DNA 复制
期 间 ,先导 链 和 滞后 链 间 在 复制 机 制 方面 有 差异 所 造成 (Wu 和 Maeda, 1987).
已 知 从 C 到 工 的 转换 ,除了 碱 基 误 配 以 外 ,还 可 能 是 从 甲 基 化 了 的 C 残 基 经 脱 氨 而 变 成 工 残 基 ,
这 样 一 种 转变 过 程 而 实现 的 (Coulonder 等 ,1978;Razin 和 Riggs,1980) 。 该 作用 将 提高 C:G->T 工 :A Al
G:C>A:T. Bil fer All fox 3. HF AE RE DH DNA 中 约 90% WY EAL AY C RAE RHE TE 5’— CG)
一 3 二 核 苷 酸 中 (CRazin 和 Riggs,1980), 所 以 ,该 效应 将 主要 以 CG — KH B® MK TG 或 CA 的 形式
表现 出 来 。 一 个 基因 变 成 假 基因 后 ,这 类 变化 将 不 再 受 任何 功能 限制 ,因而 ,如 果 在 基因 的 沉默 化 (si
lencing)( 即 失去 功能 ) 发 生前 CG 的 频率 相对 而 言 较 高 , 则 它 能 为 CT 工 和 G->~A 转换 作出 显著 贡献 。
对 看 来 曾 在 这 假 基 因 的 祖先 序列 中 出 现 过 CG 二 核 苷 酸 的 那些 位 点 予以 排除 ,由 此 而 得 到 的 替换 模
式 在 表 4 一 9 的 括号 中 给 出 。 此 模式 也 许 更 适合 于 :预测 一 个 长 期 不 受 功 能 限制 的 序列 (例如 一 个 内 含
子 的 某 些 部 分 ) 中 的 突变 模式 ,因为 在 这 样 的 序列 中 将 只 有 少量 CG SRK RATE. HERR CG 二 核 苷
酸 后 得 到 的 模式 有 点 不 同 于 不 经 排除 而 得 到 的 模式 。 特 别 地 ,4 种 转换 间 的 相对 频率 差异 显著 性 略 有
降低 ,而 各 颠 换 的 相对 频率 , 除 G->C 和 C>G 外 , 则 略 有 升 高 。
4.7 同 义 密 码 子 的 非 随 机 应 用
由 于 遗传 密码 的 简 并 ,20 种 氨基 酸 中 大 多 数 都 是 由 一 个 以 上 的 密码 子 编码 的 (第 一 章 )。 因 为 同
义 突变 不 造成 氨基 酸 顺 序 中 的 任何 变化 , 且 因为 自然 选择 被 认为 主要 在 蛋白 质 水 平 上 起 作用 ,所 以 ,
同 义 突变 曾 被 当 作 选择 上 呈 中 性 的 突变 的 候选 者 (Kimura,1968;King 和 Jukes,1969)。 然 而 , 若 所 有 ,
同 义 突变 事实 上 都 是 选择 中 性 的 ,那么 ,为 同一 个 氨基 酸 编码 的 同 义 密码 子 就 应 该 以 多 少 有 点 相同 的
频率 应 用 。 不 幸 的 是 , 随 着 DNA 顺序 资料 的 积累 ,逐渐 表明 同 义 密码 子 的 应 用 ,在 原核 生物 和 真 核 生
物 的 基因 中 都 显然 是 非 随机 的 (Grantham 等 ,1980)。 事 实 上 ,在 许多 酵母 的 基因 和 大 肠 杆菌 的 基因
中 ,应 用 上 的 偏 斜 是 极 显 著 的 。 例 如 ,在 大 肠 杆菌 CEschnerzchiza coli) > REA I Comp A) 中 的 23 个 亮
酸 残 基 里 , 有 21 个 由 密码 子 CUG 编码 ,尽管 为 亮 氨 酸 编码 的 还 有 5 种 密码 子 。 这 种 偏 斜 不 能 用 非 随
机 突变 来 解释 。 如 何 解 释 这 种 广泛 存在 的 密码 子 非 随机 应 用 现象 ,成 了 一 个 有 争议 的 问题 ,好 在 对 此
间 题 看 来 已 出 现 了 一 些 明确 的 答案 。
有 助 于 理解 非 随机 应 用 现象 的 一 个 观察 事实 是 ,一 个 生物 中 或 有 亲缘 关系 的 物种 中 的 基因 ,一般
表现 出 对 同 义 密 码 子 的 选取 有 同样 的 模式 (Grantham 等 ,1980) 。 于 是 ,哺乳 动物 \ 大肠 杆菌 和 酵母 的
基因 被 归 为 不 同 的 密码 子 应 用 类 型 。 格 兰 瑟 姆 等 (Grantham 等 ,1980) 因此 而 提出 了 基因 组 假说
(genome hypothesis)。 按 其 假说 ,任何 给 定 基因 组 中 的 基因 在 同 义 密码 子 的 选取 方面 都 采用 同样 的 纺
码 策略 , 即 在 密码 子 应 用 上 的 偏 斜 是 物种 特异 的 。 基 因 组 假说 被 证 明 一 般 说 来 是 正确 的 ,虽然 在 一 个
基因 组 的 不 同 基因 间 密 码 子 应 用 有 着 相当 大 的 异 质 性 ( 见 下 面 )。
大 肠 杆菌 和 酵母 中 密码 子 应 用 的 研究 , 极 大 地 增加 了 我 们 对 影响 同 义 密码 子 选取 的 因素 的 认识 。
© DD。
波斯 特等 (Post 等 ,1979) 发现, 大 肠 杆 菌 核糖 体 蛋白 基因 ,优先 应 用 于 被 含量 最 多 的 tRNA 种 类 识别
的 同 义 密 码 子 。 他 们 认为 ,这 种 偏向 是 自然 选择 的 结果 ,因为 应 用 由 含量 最 多 的 tRNA 种 类 翻译 的 密
码 子 ,将 会 增加 翻译 的 效率 和 精确 性 。 他 们 的 发 现 曾 激励 池村 (kemura,1981,1982) 去 收集 有 关 大 肠
杆菌 和 酵母 Saccharomyces cerevisiae ( Hie 74 BE AE) A tRNA 种 类 的 相对 丰 度 的 资料 。 他 证 明 , 在 这 两
个 物种 中 ,一 个 基因 中 同 义 密码 子 的 相对 频率 与 识别 它们 的 tRNA 种 类 的 相对 丰 度 间 存 在 着 正 相 关 。
对 于 高 度 地 表达 的 基因 而 言 , 这 种 相关 非常 强 。 例 如 ,在 大 肠 杆菌 中 4 种 亮 氨 酸 tRNA 里 含量 最 多 的
是 tRNA , 它 识 别 CUG 密码 子 , 而 ompA 基因 也 主要 用 这 种 密码 子 为 亮 氢 酸 编码 ( 见 上 面 )。
图 4 一 8 表示 6 个 亮 氨 酸 密码 子 的 频率 和 识别 它们 的 tRNA 的 相对 丰 度 间 的 对 应 关系 。 在 大 肠 杆
0.4
dq tRNA.
tRNAS*
=) tRNAGUR
a
ome) Ga ie) ae i i oo BB
CUG CUA anil CUA CUC UUG UUA
+
6
CUU UUA CuUG="CUU
1.0 高 水 平 表 达 基 因 1.0 高 水 平 表 达 基 因
Bt 0.8 0.8
i
Ray
“ 0.4 0.4
Mh
z
ss 0 0
CUG GUA. (GUG -LUG CUA. CUC UUUG “UUA
+ + ft
CUU UUA CUG =CUU
1.0 1.0
ht 0.8 0.8
紧 低 水 平 表 达 基 因 低 水 平 表 达 基 因
#
EE
1] 0.4 : 0.4
小
gf
fc
° CCUG TGUA* =“CUC *UUG y CUA CUE § 'UUG UUA
BW: ae
CUUATUVA CUG CUU
图 4 一 8 ”关于 亮 氨 酸 的 密码 子 应 用 的 相对 频率 ( 白 柱 体 ) 和 相应 的 识别 tRNA 种 类 的 相对 丰 度 ( 黑 柱 体 ) 间 关系 的
图 解说 明 ,(a) 在 大 肠 杆 菌 中 和 (b) 在 Sacharomyces cerevisiae P Ao F (4) 40 E. coli 中 密码 CUC 和 CUU 间 的 符号 ) 表
示 这 类 密码 子 对 中 的 密码 子 都 是 由 同一 种 tRNA 来 识别 的 (例如 , 瑟 . co 中 CUC 和 CUU 都 由 tRNA: 呈 来 识别 ) 。
菌 中 ,tRNA "” 是 含量 最 多 的 tRNA 种 类 ,而 事实 上 ,在 高 水 平 表 达 的 基因 中 ,CUG( 由 这 种 tRNA if
别 的 密码 子 ) 的 应 用 比 另外 5 种 密码 子 要 频繁 得 多 。 另 一 方面 ,在 酵母 中 ,含量 最 丰富 的 亮 氨 酸 tRNA
种 类 是 tRNA, ,而 被 这 种 tRNA 识别 的 密码 子 (UUG) 也 是 数量 上 占 优 势 的 密码 子 。 对 比 之 下 ,在 以
较 低 水 平 表 达 的 基因 中 ,tRNA 丰 度 和 各 密码 子 间 的 对 应 在 这 两 个 物种 里 都 要 弱 得 多 (图 4 一 8)。
在 决定 高 水 平 表 达 的 基因 中 密码 子 的 应 用 模式 方面 ,翻译 效率 的 重要 性 已 得 到 以 下 观察 的 进 一
步 支 持 (Ikemura,1981) 。 已 知 密码 子 - 反 密码 子 配对 在 第 3 位 上 出 现 摇 摆 (wobbling) 。 例 如 , 反 密 码 子
的 第 工 位 上 的 U 既 可 与 A 也 可 与 G 配 对 。 类 似 地 ,G 既 可 与 C 也 可 与 U 配对 。 但 是 , 反 密 码 子 第 1 位
«56°
上 的 C 则 只 能 与 密码 子 第 3 位 上 的 G 配 对 ,以 及 A 只 能 与 可 配对 。 播 摆 还 可 能 通过 这 样 的 事件 来 实
现 :有 些 tRNA 在 第 1 反 密 码 位 置 上 含有 经 修饰 过 的 碱 基 , 而 这 类 tRNA 能 识别 一 种 以 上 的 密码 子 。
例如 ,次 黄 味 叭 (一 种 经 过 修饰 的 腺 味 叭 ) 可 与 U`C\A 三 种 碱 基 中 的 任何 一 种 配对 。 有 趣 的 是 ,大 多
数 能 识别 一 种 以 上 密码 子 的 tRNA ,都 表现 出 对 其 中 的 某 一 种 有 不 同 的 偏爱 。 例如 , 反 密 码 子 的 摇摆
位 置 上 的 4 一 硫 尿 喀 啶 (SU) ,可 以 识别 密码 子 播 摆 位 置 上 的 A 和 Gy; 然而 ,与 以 G 结尾 的 密码 子 相
比 , 它 对 以 A 结尾 的 密码 子 表现 出 明显 的 偏爱 。 这 种 偏爱 在 高 度 地 表达 的 基因 中 应 会 反映 出 来 . 大肠
杆菌 中 两 个 为 赖 氨 酸 编码 的 密码 子 是 由 一 种 tRNA 识别 的 ,该 tRNA 分 子 在 反 密 码 子 的 摇摆 位 置 上
有 S4U ,而 事实 上 ,在 大 肠 杆菌 的 omzp A 基因 中 ,19 个 赖 氨 酸 密码 子 里 15 个 是 AAA, 只 有 《4 个 是
AAG 。
表 4 一 10 列 出 了 由 夏普 等 (Sharp 等 , 1988) 广 泛 收集 的 密码 子 应 用 资料 中 的 一 部 分 。 对 每 一 组 同
义 密码 子 来 说 ,如 果 应 用 机 会 均等 , 则 每 种 密码 子 的 相对 频率 应 该 是 1。 然 而 ,大 多 数 情况 下 显然 并 非
如 此 。 而且; 在 大 肠 杆 菌 和 酵母 这 两 个 物种 中 ,密码 子 应 用 偏 斜 都 是 在 高 水 平 表 达 的 基因 中 比 在 低 水
平 表达 的 基因 中 更 严重 .对 此 差异 的 一 个 简单 解释 是 ,在 高 水 平 表达 的 基因 中 对 翻译 效率 和 精度 的 选
择 要 强 一 些 , 所 以 密码 子 应 用 偏 斜 也 就 显著 一 些 。 另 一 方面 ,在 低 水 平 表 达 的 基因 中 选择 相对 而 言 较
弱 , 所 以 ,该 应 用 模式 主要 受 选择 压力 和 随机 遗传 漂 变 的 影响 ,因而 偏 斜 程度 也 低 一 些 (Sharp 和 Li,
1986).
表 4 一 10 .4 个 物种 中 的 密码 子 应 用 ”
氨基 酸 - 密码 子 Escherichia Coli Saccharomyces Cerevisiae Drosophila Melanogaster 人
高 低 高 低 sy 低 G+C A+T
Leu UUA 0.06 1. 24 0. 49 1.49 0. 03 0. 62 0. 05 0. 99
UUG 0,07 0. 87 5. 34 1.48 0. 69 1.05 0.31 oy Hyon
cou “0 13 0.72 0.02 . 073 0. 25 0. 80 0. 20 1.26
Bue 017-0. 65 0. 00 0.51 0.72 0. 90 1. 42 0. 80
CUA. 0.04 0.31 0.15 0. 95 0. 06 0. 60 0.15 , £0.57
CUG 5.54 2. 20 0.02 °° 0.84 4.25 2. 04 3. 88 1. 38
Wa \aGOU 241 1.09 2.07 1.13 0. 56 0.74 0. 09 1. 32
GUC 0.08 0.99 1.91 0:76 , ‘1.59 0. 93 1. 03 0. 69
GUA 1.12 0. 63 0. 00 1,18: © :0..06 0.53; 0.11 0. 80
GUG ~ *0. 40 1.29 0. 02 0.93 1.79 1. 80 2.78 1.19
Ile AUU 0.48 1. 38 1.26 1.29 0.74 Doe 0.45 1. 60
AUC 2.51 1.12 1.74 0. 66 2. 26 0. 95 2.43 0.76
AUA _ 0.01 0.50 . 00 1.05 0. 00 0. 78 0.12 0. 64
Phe ©UUU 0.34 133. «(0.19 1. 38 0.12 0. 86 0.27 1.20
UUC 1.66 0. 67 1.81 0. 62 1. 88 1.14 1.73 0. 80
Met AUG 1.00 1.00 1.00 1.00 1.00 1. 00 1.00 » 1.00
A Sharp # , (1988)
a. 对 每 一 同 义 密码 子 组 来 说 ,相对 频率 之 和 等 于 该 组 中 的 密码 子 数 。 例 如 , 亮 氨 酸 有 6 个 密码 子 , 所 以 关于 这 6 个 密码 子 的 相对 频率
之 和 即 应 为 6。 在 均等 地 应 用 下 ,一 组 中 每 一 密码 子 的 相对 频率 应 为 1, 所 以 各 值 与 1 的 偏差 指示 应 用 上 偏 斜 的 程度 。 高 和”* 低 "表示
以 高 水 平 表 达 和 以 低 水 平 表 达 的 基因 。 对 人 来 说 ,“G 十 C?" 意 味 着 高 GC 区 ,而 “A 十 IT 意味 着 高 AT 区 。
总 之 ,在 大 肠 杆菌 和 酵母 中 , 同 义 密码 子 的 选取 受 着 RNA 可 用 性 和 其 他 与 翻译 效率 有 关 的 因素
的 限制 。 这 些 限制 结果 将 以 纯洁 化 选择 表现 出 来 ,从 而 减缓 了 同 义 替 换 的 速率 (Ikemura,1981;Kimu-
ra,1983)。 事 实 上 ,已 经 得 到 证 明 的 是 , 肠 道 细菌 的 基因 中 同 义 替 换 的 速率 与 密码 子 应 用 的 偏 斜 程度
#2 ff #3 (Sharp #l Li, 1986). ELS Saami ee trea BLL a
学 说 的 证 据 , 因 为 它 可 用 选择 限制 越 强 结果 进化 速率 就 越 低 这 一 原理 来 加 以 解释 ( 见 第 TH
Kimura; 1983) 。
表 4 一 10 5B FR AB HY, FRR HP BY Hi BY EF AK de aS 029 AE GE AIR OF de aS 2 TA He
重 得 多 ,这 指出 对 翻译 效率 的 选择 在 决定 这 种 生物 里 同 义 密 码 子 的 选取 方面 也 起 重要 作用 。
在 许多 人 的 基因 中 , 密码 子 倾向 于 以 G 或 C 结尾 ( 即 在 第 3 位 置 上 有 较 高 的 GC 含量 ), 而 在 另 一
些 基因 中 却 有 较 低 的 第 3 位 置 GC 含量 。 不 过 ,有 几 种 原因 可 用 来 说 明 为 什么 该 偏 斜 可 能 与 基因 表达
的 水 平 无 关 。 首 先 ,ae 一 和 B 一 珠 蛋 白 基 因 在 密码 子 的 第 3 位 上 有 不 同 的 GC 含量 (分 别 为 高 含量 和 低
含量 ) ,但 它们 在 同样 的 组 织 ( 红 细胞 ) 中 以 近似 相等 的 量 表达 ,因而 它们 应 该 有 相同 的 表达 水 平 。 其
次 ,在 鸡 的 基因 中 ,密码 子 应 用 的 频率 与 tRNA 的 可 用 性 无 关 (Ouenzar 等 ,1988), 虽然 该 观察 也 许 不
能 直接 地 用 诗人 的 基因 。 最 后 ,第 3 密码 子 位 置 上 的 GC 含量 与 侧 区域 中 和 肉 含 子 中 的 GC 水 平 有 很
强 的 相关 性 (第 八 章 ,Bernardi 和 Bernardi, 1985;Aota 和 Ikeimura,1986 ) 。 例如 ,oa 一 珠 蛋 白 基 因 GC 含
量 高 且 它 位 于 高 GC 区 域 ,B 一 珠 蛋 白 基 因 GCC 含量 低 而 它 位 于 低 GC 区 域 ( 第 八 章 ,Bernardi 等 ;
1985) 。 计 是 ,看 来 人 基因 中 的 密码 子 应 用 偏 斜 , 极 大 地 因 含 有 该 基因 的 区 域 中 GC 的 含量 而 决定 。 正
如 将 要 在 第 八 章 讨论 的 那样 ,一 个 区 域 中 的 GC 含量 是 由 自然 选择 还 是 由 突变 偏 斜 所 决定 ,这 仍 是 一
个 有 争议 的 问题 。 不 过 ,由 于 一 个 基因 中 第 3 密码 子 位置 上 的 GC 含量 倾向 于 高 于 其 周围 区 域 中 的 含
量 ( 第 作 章 ;Aota 和 全 emura,1986), 所 以 ,有 可 能 人 的 基因 中 密码 子 应 用 模式 受到 某 种 程度 的 自然 先
择 的 影响 。 要 得 到 对 影响 人 中 密码 子 应 用 的 因素 的 更 多 知识 ,还 需要 做 进一步 的 研究 。
习题
1. 等 式 4.1 的 分 母 为 什么 是 2T AAT?
2. 图 4 一 9 表示 来 自 橄榄 狮 卯 CPazzo anubis) Mi 5 KBE (Pongo pygmaeus) 61 一 珠 蛋白 基因
的 第 1 和 第 2 外 显 子 的 DNA 顺序 。 用 一 参数 模型 分 别 算出 3 个 密码 子 位 置 中 每 一 个 的 每 位 点 替换
数 。 哪 一 个 位 置 进化 得 最 快 ? Ata?
b: ATG GCG CTG TCC GCG GAG GAC CGG GCGGCT GTG CGC GCC CTG
o: ATG CGC CTG TCC GCG GAG GAC CGG GCGCTG GTG CGT GCC CTG
b: TGG AAG AAA CTG GGA AGC AAT GTT GGCGTC TAT GCT ACT GAG
o: TGG AAG AAG CTG GGC AGC AAC GTC GGCGTC TAC ACG. ACA GAG
b: GCC CTG GAG AGG ACC TTC CTG GCT TTCCCC GCC ACG AAG ACC
o; GCC CTG GAG AGG ACC TTC CTG GCC TTCCCC GCA ACG AAG ACC
b: TAC TTC TCC CAC CTA GAC CTG AGC CCCGGC TCC GCC CAG GTT
o: TAC TTC TCC CAC CTG GAC CTG AGC CCCGGC TCC TCA CAG GTC
b; AGA GCA CAC GGC CAG AAG GTG GCG GACGCG CTG AGC CTC GCC
o: AGA GCC CAC GGC CAG AAG GTG GCG GACGCG CTG AGC CTC GCC
b; GTG GAG CGC CTA GAC GAC CTA CCC CGCGCG CTG TCC GCT CTG
o: GTG GAG CGC CTG GAC GAC CTA CCC CACGCG CTG TCC GCG CTG
b; AGC CAT CTG CAC GCT TGC CAG CTG CGAGTG GAC CCA GCT AAC
o: AGC CAC CTG CAC GCG TGC CAG CTG CGAGTG GAC CCG GCC AGC
b: TTC CCG
o; TTC CAG
图 4 一 9 A&E MHL (Cb) fo DRE B(C0)H O1L—-KREGKA PHRF 1 f 2% DNA MA, FARA Shaw 等 ,
(1987) 4 Marks ¥ , (1986).
3. 图 4 一 10 RAK A MHA REY 91 一 珠 蛋 白 基 因 中 第 1 SAB FH DNA 顺序 。 用
Ca) 一 参数 模型 ,和 (b) 两 参数 模型 ,算出 替换 数 。 这 两 个 估计 有 差别 吗 ? 将 此 结果 与 你 在 习题 2 中 得 到
的 结果 相 比 较 ,那么 ,该 内 含 子 的 进化 比 外 显 子 中 3 个 密码 子 位 置 上 的 进化 是 快 还 是 慢 ?
。58 。
b: TGCGGCGAGGCTGGGCGCCCCCGCCCTCCGGGGCCCTGCCTCCCCAAGCC
o: TGCGGCGAGGCTGGGCGCCCCCGCCCCC-AGGGCCCTCCCTCCCCAAGCC
b: CCCCGGACGCGCCTCACCGCCGTTCCTCTCGCAG
o: CCCCGGACTCGCCTCACCCACGTTCCTCTCGCAG
图 4 一 10 RA MRMHH (Df BREE (0)H 61 一 珠 蛋 白 基 因 中 第 1 个 内 含 子 的 DNA 顺序 。 一 个 裂 镍 用 - 标 出 。 资 料
取 自 Shaw 等 ,(1987) 和 Marks 等 ,(1986)
4. 图 4 一 11 表示 来 自 人 仓鼠, 大 鼠 和 小 鼠 的 核 仁 素 基 因 中 的 第 1 个 内 含 子 的 部 分 DNA MF. 以 仓
鼠 的 顺序 作为 参照 物 , 用 相对 速率 检验 法 来 决定 ,大 鼠 谱系 和 小 鼠 谱 系 间 替换 速率 上 是 否 存在 差异 。
m: GTAAGAGGCCTGGCGCGCCGACGCGGACGACTAGGCCTGCTTTCGGAGGG
r: GTAATAGGCCTGACGCGCGAACACGGACGACTAGGCCTGCTTTCTGAGAG
h: GTGAGAGGCCTCGCGCGCGCCGACGGACGGACGGGCCTGCTTTCTGAGGG
m: GCGCGCGCGCCGTCGCGGAGGGGAGGAGGGCTTGCGCGCAATCCCGGGCG
r: GCGCGCGCGCCGTCGCGGAGGGGAGGAGGGCCTGCGCACAGTCCCGGGCG
h; GCGCGCGCGCGGTCGCTCAGGGGAGGAGGGCCTGCGCGCAA TCCCGGGCG
m: CGTTCGAGGGCGCCAGCTGGGGAACTCTCGCGCGACT AGCGGGAGGTCTC
r: CGTTCGAGGGCGCA TGCTGGGGAAGTCTCGCGCGACT AGCGGAGGGTCTC
h: CGTTCGAGGGCGCA TGCTGGGGAAGTCTCGCGCGACTAGCGGAGGGTCTC
图 4 一 11 ABDA(Mm). KAD PEACH HRERRA PRL 个 内 含 子 的 部 分 DNA 顺序 。 裂 名 (缺失 和 插入 ) 已 被
略 去 。 资 料 取 自 Bourbon 等 ,(1988)
5. 艾滋 (AIDS) 病 毒 的 两 个 品系 用 WMJ1 和 WMJ2 表示 ,在 1984 年 10 月 3 日 和 1985 年 1 月 15
日 从 一 个 两 岁 的 孩子 身上 分 离 出 来 (Hahn 等 ,1986)。 这 个 孩子 假定 只 受过 一 次 感染 (由 她 的 母亲 在
围 产 期 传 给 )。 这 两 个 分 离 物 间 外 壳 蛋 白 (exv) 基 因 中 每 同 义 位 点 的 同 义 替 换 数 为 0.0164(Li 等 ,
1988) 。(a) 假 定 WMJ2 直接 从 WMJ1 进化 而 来 并 假定 这 两 个 顺序 在 1984 年 10 月 3 日 分 开 , 求 同 义
替换 速率 的 最 大 估 值 。(b) 假 定 这 两 个 品系 在 被 感染 时 即 开始 分 岐 ,并 假定 它们 已 独立 地 进化 了 两
年 , 求 该 基因 同 义 替 换 速 率 的 最 小 估 值 .这 些 蔡 换 速 率 比 对 哺乳 动物 的 基因 加 以 平均 的 同 义 替 换 速率
( 表 4 一 1) 要 快 多 少 ?
6. 从 大 肠 杆 菌 .酵母 和 人 中 各 找 出 一 个 完整 的 cDNA 或 基因 顺序 。 对 每 一 种 基因 编 一 个 密码 子
应 用 表 ( 即 列 出 每 种 密码 子 在 基因 中 被 使 用 的 次 数 ) 。 那 么 ,该 密码 子 应 用 是 否 偏 斜 ? 在 哪 方 面 偏 斜 ?
密码 子 应 用 模式 在 这 3 种 基因 中 是 否 相 似 ? MRAZ WER AX 检验 法 去 判断 ,在 每 一 种 基
因 中 绩 氨 酸 密码 子 的 应 用 与 该 族 密码 子 机 会 均等 地 应 用 的 偏差 是 否 具 有 统计 学 意义 。
后 继 阅读 文献
Ikemura, T. 1985. Codon usage and tRNA content in unicellular and multicellusar organisms. Mol.
Biol. Evol. 2: 13—34
Kimura, M. 1983. The Neutral Theory of Molecular Evolution. Cambridge University Press, Cam-
bridge.
MacIntyre, R. J. (ed. ). 1985. Molecular Evolutionary Genetics. Plenum, New York.
Nei, M. 1987. Molecular Evolutionary Genetics. Columbia University Press, New York.
Sharp, P. M. and W. -H. Li. 1986 An evolutionary perspective on synonymous codon usage in uni-
cellular organisms. J. Mol. Evol. 24: 28—38
Steinhauer, D. A. and J. J. Holland. 1987. Rapiel evolution of RNA viruses. Annu. Rev. Microbiol.
41: 409— 433.
5 分子 系统 发 育
分 子 系统 发 育 是 用 分 子 生 物 学 技术 对 生物 间 的 进化 关系 进行 的 研究 。 它 是 分 子 进化 中 的 一 个 领
域 , 近 十 年 来 已 引起 了 广泛 关注 ,这 主要 是 因为 在 许多 情况 下 系统 发 育 关 系 用 任何 别 的 方法 都 难以 佑
价 的 缘故 .本 章 的 目的 是 ,解释 如 何 用 分 子 数据 来 构建 系统 树 , 以 及 给 出 一 些 例子 , ae 些 存在
已 久 的 系统 发 育 问题 ,分 子 方法 能 够 提供 比 传统 方法 要 清晰 得 多 的 解答 。
5.1 “分子 数 据 对 系统 发 育 研究 的 影响
rT TET eae Lie 甚至 早 于 备 德 尔 定 律 被 重新 发 现 的 1900 年 。 免 疫
化 学 研究 表明 , 血清 学 交叉 反应 在 亲缘 关系 较 近 的 生物 间 比 在 关系 较 远 的 生物 间 强 。 这 些 发 现 的 进化
含义 被 纳 托 尔 (Nutall,1904) 用 来 推论 各 不 同 动物 类 群 间 的 系统 发 育 关 系 。 例 如 , 他 断定 人 类 最 近 乡
的 亲属 是 猿 , 其 后 ,亲缘 关系 由 近 及 远 依 次 为 : 古 世 界 猴 ,新 世界 猴 和 原 猴 。
自 十 九 世 纪 六 十 年 代 后 期 以 来 ,分 子 生物 学 中 的 各 种 技术 都 得 到 发 展 , 从 而 开始 了 将 分 子 数据 广
应 用 于 系统 发 育 的 研究 .特别 是 在 十 九 世纪 七 十 年 代 和 十 九 世 纪 八 十 年 代 , 用 蛋白 质 顺序 资料 研究
分 子 系统 发 育 进 展 极 快 。 花 费 不 大 但 便利 得 多 的 方法 , 象 蛋白 质 电 泳 ,DNA 一 DNA 杂交 和 免疫 学 方
法 ,虽然 不 如 蛋白 质 顺 序 测定 来 得 精确 , 却 也 被 广泛 用 于 群体 间或 亲缘 关系 较 近 的 物种 间 的 系统 发 育
关系 的 研究 中 。 这 些 方法 的 应 用 也 刺激 了 遗传 距离 的 测定 和 系统 树 构建 法 的 发 展 ( 见 ,Fitch 和 Margo-
liash , 1967; Nei, 19755 Felsenstein , 1988) 。
A+ Sth 40 /\ + 4 0 Je RY DNA 顺序 资料 的 积累 , 已 经 对 分 子 系统 发 译 产 生 了 巨大 的 影
Me]. DNA 顺序 资料 不 仅 更 为 丰富 ,而且 比 蛋 白质 顺序 资料 更 容易 分 析 。 因 此 ,它们 一 方面 已 被 用 于 推
断 象 人 与 猿 那样 亲缘 关系 很 近 的 物种 间 的 系统 发 育 关 系 ( 见 第 72 页 ), 另 一 方面 又 被 用 来 研究 一 些 非
常 古老 的 进化 事件 , 象 线粒体 和 叶绿体 的 起 源 ( 见 第 76 页 ), 门 和 界 的 分 化 (Woese,1987) 等 。 将 来 ,
DNA 定 序 看 来 将 用 于 解决 系统 发 育 研究 中 许多 长 期 得 不 到 解决 的 问题 , 象 细菌 和 单 细胞 真 核 生 物 间
的 进化 关系 (Sogin 等 ,1986,1989) ,这 用 任何 传统 的 进化 研究 方法 都 不 可 能 得 到 解决 。 事 实 上 ,分 子
oh paeennale Cae eS ee be ee RS Ra eae
的 系统 发 育 树 。
当然 ,我 们 也 不 放弃 进化 研究 的 传统 手段 ,象形 态 学 .解剖 学 .生理 学 和 古生物 学 等 。 因 为 , 不 同方
法 可 提供 互相 补充 的 数据 。 我 们 注意 到 ,分 类 学 主要 以 形态 学 和 解剖 学 资料 为 依据 5 而 古生物 学 信息
则 是 能 提供 用 于 进化 研究 的 时 间 框 架 的 唯一 资料 。
5.2 系统 树
地 球 上 的 一 切 生命 形式 ,不 管 是 现存 的 还 是 已 经 灭绝 了 的 ,都 有 一 个 共同 的 起 源 , 它 们 的 祖先 可
以 追溯 到 大 约 在 40 亿 年 以 前 生存 的 一 种 或 几 种 生物 。 因 此 ,所 有 动物 植物、 细菌 通过 祖 藉 而 相互 关
联 。 亲 缘 关 系 近 的 生物 是 由 一 个 较 近 代 的 共同 祖先 传 下 来 的 ,亲缘 关系 远 的 生物 则 由 较 远 古 的 共同 祖
先 传 下 来。 系统 发 育 研究 的 目的 是 :(1) 建 立 各 生物 间 正 确 的 系谱 学 联系 ,和 (2) 估 计 各 生物 自 它们 从
最 后 一 个 共同 祖先 那里 分 岐 以 来 的 分 岐 的 时 间 。
在 系统 发 育 研究 中 ,一 组 生物 类 群 间 的 进化 关系 常用 系统 树 (phylogenetic tree) 来 图 示 说 明 。 系 统
树 是 一 种 由 节点 和 分 枝 组 成 的 图 象 , 其 中 任何 两 个 邻近 的 节点 都 只 由 一 个 分 枝 来 联结 (图 5 一 1)。 节
s。 00。
点 (nodes) 代 表 分 类 学 单位 ,而 分 枝 (branches) 则 用 祖 类 和 祖先 来 定义 这 些 单位 间 的 关系 。 一 个 树 的 分
枝 模式 被 称 为 拓扑 图 (topology) 。 枝 长 (branch length) 通常 代表 在 该 分 枝 中 曾 发 生 过 的 变化 数 。 由 节
点 表示 的 分 类 学 单位 可 以 是 物种 、 群 体 . 个 体 或 基因 。
在 处 理 系统 树 时 ,我们 要 分 清 外 节点 (external nodes) 和 内 节点 (internal nodes)。 例 如 ,图 5 一 1a
中 ,节点 ABC、D 和 匡 是 外 节点 ,其 余 的 都 是 内 节点 。 外 节点 代表 处 于 比较 中 的 现存 分 类 学 单位 ,并
被 命名 为 操作 中 的 分 类 学 单位 (operational taxonomic units) 即 OTU 。 内 节点 则 代表 祖先 单位 。
图 5 一 1 为 处 理 一 个 系统 树 的 两 种 普通 方法 的 示意 图 。 在 图 5 一 la 中 ,其 分 枝 是 无 尺度 的 (un-
时 间 1 单位
图 5 一 1 一 个 关于 5 个 OTU 的 系统 树 的 两 种 可 供 采用 的 表示 法 。(a) 无 尺度 的 分 枝 :现存 的 OTU 排 成 一 条 线 , 节
点 位 于 与 分 岐 时 间 成 比例 的 地 方 。(b) 有 尺度 的 分 枝 :分 枝 的 长 度 与 分 子 变 化 数 成 比例 。
scaled) ,它们 的 长 度 与 已 注 明 在 分 枝 上 的 变化 数 不 成 比例 。 这 种 表示 法 使 我 们 能 将 现存 的 OTU 排 成
一 条 直线 ,而且 在 分 岐 时 间 已 知 或 已 估 出 时 ,还 可 把 代表 分 岐 事件 的 节点 按时 间 尺 度 来 排列 。 在 图 5
一 lb 中 ,分 岐 是 有 尺度 的 (scaled), 且 其 长 度 正 比 于 变化 数 。
如 果 任 何 两 个 OTU 间 的 距离 等 于 将 它们 联 起 来 的 所 有 分 枝 的 长 度 之 和 , 则 这 样 的 树 即 被 称 为
是 加 性 的 (additive) 。 例 如 , 若 可 加 性 成 立 , 则 图 5 一 la 中 OTUA AIC 间 的 距离 应 等 于 2 十 1 十 3 十 2 王
8。 两 个 OTU 间 的 距离 可 直接 从 分 子 数 据 ( 例 如 DNA 顺序 ) 算 出 ,而 枝 长 则 可 按 某 些 规 则 从 OTU 间
距离 估 出 ( 见 第 77 页 )。 如 果 在 任 一 核 苷 酸 位 点 上 曾 发 生 过 多 重 替 换 , 则 可 加 性 一 般 不 成 立 ( 图 3 一
cy
若 一 个 节点 只 有 两 个 直接 的 后 代 谱系 , 则 它 是 两 分 又 的 (bifurcating), 若 它 有 两 个 以 上 的 直接 后
代 谱 系 则 是 多 分 又 的 (multifurcating)。 为 简便 起 见 ,我 们 将 只 考虑 象 图 5 一 1 中 那样 的 两 分 又 树 。
有 根 树 和 无 根 树
系统 树 可 以 是 有 根 的 (rooted) 也 可 以 是 无 根 的 (unrooted) (图 5 一 2)。 在 有 根 树 中 ,存在 一 个 被 称
为 根 ( 图 5 一 2a 中 的 R) 的 特殊 节点 ,由 此 导向 任何 别 的 节点 都 具有 唯一 途径 .每 一 途径 中 的 方向 与 进
化 时 间 相 对 应 ,而 根 则 是 所 有 正 被 研究 的 OTU 5 OTU 间 的 关系 具
体 化 而 未 定义 进化 途径 的 树 ( 图 5 一 2b) 。
对 3 个 物种 来 说 ,存在 着 3 种 可 能 的 有 根 树 , 但 只 有 一 种 无 根 树 (图 5 一 3). 对 n 个 OTU 而 言 , 两
分 叉 有 根 树 的 数目 (Ng) 由 :
CM EEN
Nr = on-2 (yn 赴 9)! ere
给 出 ,其 中 nS2. Mt n>3, MANA RAND) A:
ee OY Ph)
be i-%s, =9)) 5
注意 ,n 个 OTU 的 可 能 无 根 树 数 等 于 Cn 一 1 个 OTU 的 可 能 有 根 树 数 .OTU 从 2 到 10 的 可 能 有 根 树
“0l,。
(a) A (>) C
B D
A
RET Pd. Cc
big
B
E
时 间
图 5 一 2 (a) 有 根系 统 树 和 无 根系 统 树 ”箭头 指示 从 根 (R) 到 OTUD) 的 唯一 途径
(a) (b)
ley eee’ i a OK ;
| 一 <
C
图 5 一 3 从 3 种 OTU 可 能 会 构建 出 3 种 不 同 的 有 根 树 (a), 但 却 只 有 一 种 无 根 树 (b) 。
和 无 根 树 的 数目 列 于 表 5 一 1。 我 们 看 到 , 随 着 n 的 增加 Nu ANe 都 极 快 地 增 大 ,而 到 10OUT 时 已 经
有 200 多 万 两 分 叉 无 根 树 和 将 近 3500 万 有 根 树 了 。 由 于 这 些 树 中 只 有 一 种 能 正确 地 表示 这 些 OIU
间 真 实 的 进化 关系 ,所 以 , 当 n 较 大 时 ,推论 出 真实 的 系统 树 通常 是 非常 困难 的 。
表 5 一 1 对 1 一 10 OTU 可 能 的 有 根 树 和 无 根 树 的 数目
OTU 数 有 根 树 数 无 根 树 数
2 1 1
3 3 1
4 15 3
5 105 15
6 954 105
7 10395 954
8 135135 10395
9 2027025 135135
10 34459425 2027025
自 Felsenstein(1987)
真实 树 和 推测 树
导致 任何 类 群 的 OTU 形成 的 物种 形成 事件 的 秩序 ,在 历史 上 是 唯一 的 。 所 以 ,在 用 某 一 给 定数
的 OTU 建立 的 所 有 可 能 的 树 中 ,只 有 一 种 能 代表 真实 的 进化 历史 。 这 样 一 种 系统 树 称 为 真实 树 (true
tree)。 用 某 一 组 数据 和 某 种 构 树 法 得 到 的 树 称 推 测 树 (inferred tree), 推测 树 可 能 与 真实 树 等 同 ,也 可
能 与 真实 树 不 同 。
基因 树 和 物种 树
表示 一 和 群 物种 的 进化 途径 的 系统 树 称 物种 树 (species tree)。 若 系统 树 是 根据 来 自 各 物种 的 一 个
。62 。
基因 构成 的 , 则 该 推测 树 即 为 基因 树 (gene tree)(Nei,1987) 。 它 与 物种 树 有 两 个 方面 不 同 。 第 一 ,从 两
不 同 物 种 取样 的 两 基因 的 分 岐 可 能 在 时 间 上 早 于 两 物种 的 分 岐 (图 5 一 4) , 这 将 造成 高 估 了 枝 长 的 结
果 , 但 如 果 我 们 处 理 的 是 长 期 进化 ,在 这 个 过 程 中 由 物种 内 遗传 多 态 性 造成 的 分 岐 成 分 可 以 忽略 的
话 , 则 还 不 至 于 出 现 严重 问题 .
|
G |
| |
|
G |
|
| |
P ) \
7 ~
om \
现在 a, bc ‘ de f
图 5 一 4 本 图 表示 : 若 群 体 在 时 刻 卫 是 着 传 上 多 态 的 , 则 基因 分 化 (4 ) 通 常 比 群 体 分 化 (D) 出 现 得 早 。 结 果 形 成 用 a
一 上 表示 的 6 个 等 位 基因 的 基因 进化 史 用 实 线 表示 ,群体 分 岐 则 以 虚线 表示 。 自 Nei(1987) 。
基因 树 的 第 2 个 问题 是 ,基因 树 的 分 枝 模式 ( 即 它 的 拓扑 图 ) 可 能 与 物种 树 的 不 同 。 图 5 一 5 展示
了 这 两 种 树 间 的 3 种 不 同 的 可 能 关系 。 基因 树 (a) 与 (b) 的 拓扑 图 和 与 其 对 应 的 物种 树 的 图 等 同 ( 例
时 间
4p ty A A A
T
ble ty B B B
Xx Z hy 5X Y Z X Y Z
1 — e=T2N : : } po TANe : 7 TN
(a) 本 0) (0)
im S-5 ty Abt 46 WY ) fo JK tC) TL 3 种 可 能 关系 。 在 (a) 和 (b) 中 ,物种 树 的 拓扑 图 与 基因 树 的 等 同 。 注
意 ,(a) 中 基因 的 分 岐 时 间 大 致 等 于 群体 的 分 岐 时 间 。 而 (b) 中 却 不 然 ,基因 X 和 立 的 分 岐 时 间 大 大 早 于 各 自 所 属 的
群体 的 分 岐 时 间 。 在 (c) 中 ,基因 树 的 拓扑 图 与 物种 树 的 不 同 。 对 于 中 性 等 位 基因 ,每 种 树 出 现 的 概率 已 在 该 树 的 下
面 列 出 .ti 是 第 一 次 物种 形成 事件 发 生 的 时 间 ,t; 是 第 三 次 物种 形成 事件 发 生 的 时 间 。 图 中 工 =ti 一 tb,Ne WEAK
群体 大 小 。 自 Nei(1987) 。
如 ,X 和 YY 形成 一 簇 )。 然 而 基因 树 (c) 却 与 真实 的 物种 树 不 同 , 因 为 此 时 立 和 2Z 是 姐妹 类 群 . 当 第 一
次 物种 分 化 和 第 二 次 物种 分 化 间 的 时 间 间 隔 (ti 一 tz) 较 短 时 ,得 到 错误 的 树 (c) 的 概率 将 是 相当 高 的 ,
这 种 情况 在 确定 人 、 黑 猩猩 和 大 猩猩 间 的 系统 发 育 关 系 时 可 能 确实 存在 。 为 了 避免 得 到 这 种 错误 类
型 ,在 构建 系统 树 时 就 必须 用 许多 基因 。 为 了 避免 随机 误差 也 需要 大 量 数据 。 因 为 核 苷 酸 蔡 换 是 随机
地 发 生 的 ,所 以 有 可 能 会 产生 随机 误差 。 例 如 图 5 一 5a 中 ,谱系 Z 累积 的 替换 可 能 会 因 机 遇 而 比 谱系
X 和 Y 的 少 ,尽管 它 发 生 分 枝 的 时 间 要 更 早 一 些 。
5.3 系统 树 的 构建 方法
文献 中 已 有 许多 构 树 方法 被 提出 来 。 有 关 的 详细 处 理 读 者 可 参考 史 尼 斯 和 索 卡 尔 (Sneath 和
Sokal,1970) 、 根 井 (Nei,1987) 以 及 费 尔 森 施 泰 因 (Felsenstein ,1988) 等 的 论述 。 这 里 我 们 讲 4 种 在 系
统 发 育 研究 中 常 被 用 到 的 方法 。 为 简单 起 见 , 我 们 考虑 核 苷 酸 顺序 数据 ,但 所 讲 到 的 方法 同样 也 可 用
于 其 他 类 型 的 分 子 数 据 , 象 氨基 酸 顺 序数 据 。
以 下 所 讲 的 方法 可 分 成 两 种 类 型 :距离 矩阵 法 (distance matrix methods) 和 最 节省 法 ( maxmum
parsimony methods) 。 在 距离 矩阵 法 中 , 进化 距离 (通常 为 分 开 两 分 类 学 单位 的 核 苷 酸 或 氨基 酸 蔡 换
数 ) 按 所 有 可 能 的 分 类 单位 对 算出 , 并 用 根据 距离 值 间 的 某 些 函 数 关 系 建立 的 算法 来 构建 系统 树 。 在
最 节省 法 中 ,应 用 了 特性 状态 (例如 , 某 一 个 位 点 上 的 核 苷 酸 或 氮 基 酸 ), 而 导致 这 些 特性 状态 的 最 短
途径 即 被 选取 为 系统 树 。
不 加 权 算 术 平 均 组 对 法 (UPCMA)
不 加 权 算 术 平 均 组 对 法 (unweighted pair group method with arithmetic mean)(UPGMA) 是 一 种
简单 的 构 树 法 。 它 最 初 本 用 来 构建 分 类 学 表 型 关系 图 , 即 能 反映 出 各 OTU 间 的 表 型 相似 性 的 树
(Sokal 和 Michener,1958; 并 见 第 68 页 ) ,但 如 果 进 化 速率 在 不 同 谱系 间 近 似 地 恒定 ,以 至 进化 距离 与
分 岐 时 间 之 间 存 在 近似 的 线性 关系 , 则 它 也 可 用 来 构建 系统 树 (Nei,1975 ) 。 MRS
核 苷 酸 ( 或 氨基 酸 ) 替 换 数 这 样 的 线性 距离 太 度 就 应 该 被 用 到 了 。
UPGMA 法 采用 连续 聚 类 算法 ,在 此 法 中 局 部 拓扑 关系 按 相 似 性 的 级 别 来 鉴别 , rr ae
是 分 步 实 现 的 。 也 就 是 说 ,我 们 首先 从 所 有 OTU 中 找 出 两 个 最 相似 的 OTU ,并 把 它们 看 成 一 个 新
OTU。 这 样 的 OTU 我 们 称 之 为 复合 OTU (composite OTU)。 接 着 ,从 这 种 新 的 OTU 群 中 我 们 再 找
出 有 最 大 相似 性 的 对 子 , 如 此 继续 下 去 ,直到 我 们 最 后 仅 留 下 2 个 OTU 时 为 止 。
为 了 对 此 法 作出 具体 说 明 ,让 我 们 来 考虑 一 个 包含 4 个 OTU 的 例子 。 成 对 的 进化 距离 , A A Fe
i AIK FE (Jukes 和 Cantor,1969) 所 估计 的 那样 (第 三 章 ) ,由 以 下 矩阵 所 给 出 :
OTU
OTU A B C
B dap a
C dac dac
D dap dpp dep
He EHP yA Be OTUi 和 j 间 的 距离 。 最 先 被 聚 类 的 两 个 OTU 是 距离 最 短 的 那 两 个 。 我 们 假定
dAs 有 最 小 值 , 则 OTUA 和 是 最 先 被 聚 类 的 ,而 分 枝 点 则 放 在 距离 为 dan /2 替换 的 地 方 ( 图 5 一 6a) 。
(a) A
B (c) A
3 B
diapyc
2
C
D
d(ABC)D
B5—6 444 0TU 校 UPGMA 法 分 步 构 建 系统 树 的 示意 图 ( 详 见 正文 )
第 一 次 聚 类 后 ,A 和 了 B 被 看 成 一 个 复合 OTU , 据 此 而 算出 一 个 新 距离 矩阵 ,
* 64.6
OTU
OTU (AB) 人
全 deAB)c
D d(apyp dep
FE WH 58 BEB pd capyc= (dac tdac)/2sdcasyp= (dAp 十 dap)/2。 换 言 之 ,一 个 单 OTU 和 一 个 复合 OTU 间 的
ee. KM OTU 与 该 复合 OTU 的 各 组 成 单 OTU 间距 离 的 平均 值 。 如 果 dcAsyxc 是 新 矩阵 中 的 最 小
距离 ,那么 ,OTU C 将 加 入 到 复合 OTU(CAB) 中 , 且 在 diapye/2 处 有 一 个 分 枝 节点 (图 5 一 6b) 。
最 后 一 步 是 将 最 后 剩 下 的 OTUD 与 复合 OTU(CABC) 聚 类 。 整 个 树 的 根 位 于 dluAscp/2 王 [CdAb 十
dsp 十 dco)/3]/2 处 。 用 UPGMA 法 推测 出 的 最 后 树 如 图 5 一 6c 所 示 。
在 UPGMA 法 中 ,两 个 复合 OTU 间 的 距离 用 每 一 复合 OTU 中 的 所 有 组 成 OTU 间距 离 的 算术
平均 算出 。 例 如 ,复合 OTU Gj) 和 复合 OTU(Cmn) 间 的 距离 为 :
(dint + din + dim + din)
dijon) = 4 Roxana)
#2 & OTU Gjk) Al (mn) HIF PBA:
doy t Gakic Gn di, + a. d .
d Giit)Gmn) = fet ie he he te Ee) (5. 4)
变形 距离 法
。 如果 假定 速率 恒定 在 各 谱系 间 不 成 立 , 则 UPGMA 法 可 能 会 给 出 错误 的 拓扑 图 。 例 如 ,假定 图 5
.= 一半 中 的 系统 树 是 真实 树 ,而 各 OTU 对 的 进化 距离 则 由 以 下 矩阵 给 出 :
OTU
OTU A B C
B 8
Cc 7 9
D 12 14 11
用 UPGMA 法 ,我 们 得 到 的 推测 树 在 分 枝 模式 上 与 真实 树 不 同 ( 图 5 一 7b)。 如 ,推测 树 中 OTUA AIC
被 组 合 在 一 起 了 ,而 在 真实 树 中 ,A 和 B 才 是 姐妹 OTU 。( 注 意 , 此 例 中 可 加 性 不 存在 。 如 ,A 和 了 B 间
的 真实 距离 为 8. 而 估 出 的 联结 A 和 B 的 分 枝 . 其 枝 长 之 和 为 3.50 十 0.75 十 4.25 一 8. 50) 。
(a)
5-7 (a) RK A RES Cb) IR AR. HER A ARR AL EY — AR REO AREA UPGMA
方法 构造 。(c) 此 树 由 变形 距离 法 推断 得 到 。 根 必须 在 OTUD 和 OTUA、B 与 C 的 共同 祖先 节点 之 间 ,, 但 准确 的 位
点 不 能 确定 。
不 过 ,该 配 扑 图 错误 也 许 能 用 被 称 为 变形 距离 法 (transformed distance method ) 的 校正 方法 来 订
IE (Farris, 1977 ;Klotz 等 ,1979) 。 简单 地 说 ,此 法 是 用 一 个 组 外 单位 (outgroup) 作 参 照 物 ,来 对 被 研究
谱系 间 进 化 速率 不 等 的 情况 作 一 些 校正 ,然后 对 新 得 到 的 距离 矩阵 应 用 UPGMA 法 ,从 而 推测 出 该
树 的 拓扑 图 .组 外 单位 是 一 个 我 们 对 其 有 外 在 认识 的 OTU .这 些 外 在 认识 ,如 分 类 学 的 或 古生物 学 的
知识 ,能 清楚 地 表明 ,该 OTU 已 先 于 所 有 其 他 被 研究 的 OTU 而 从 其 共同 祖先 分 岐 出 来 。
在 现在 的 例子 中 ,我 们 假定 分 类 单位 D 对 所 有 别 的 分 类 单位 来 说 是 一 个 组 外 单位 。 那 么 D 即 可
当 作 参照 物 ,并 用 下 式 来 变换 距离
< sani! IT (5.5)
‘J
Cd! f AB IE PE BS i= AB B& Cydp=(dantdantden)/3. dr S| AZEW T RIED Ad’ BY 1 AB 2
正 的 。 做 此 手续 是 因为 ,实际 上 上 距离 不 可 能 是 负 的 。 对 于 有 n 个 OTU( 不 包括 组 外 单位 ) 的 一 般 情 形 ,
2
在 我 们 的 例子 里 , 瑟 一 交 而 新 距离 抢 阵 中 关于 分 类 单位 A.B 和 C 的 值 为
OTU
OTU A B
B 10/3
C 13/3 13/3
Hd As 有 最 小 值 ,所 以 A AB 最 先 被 聚 类 在 一 起 ,然后 ,C 再 加 和 到 该 树 中 。 根据 定义 ,组 外 单位 O-
TUD 决定 该 树 的 根 , 因 而 最 后 加 入 该 树 。 这 样 就 给 出 了 正确 的 拓扑 图 (图 5 一 7c)。 在 上 例 中 ,我 们 仅
考虑 了 3 个 分 类 单位 和 1 个 组 外 单位 ,但 此 法 可 很 容易 地 推广 到 更 多 分 类 单位 和 /或 更 多 组 外 单位 的
场合 。
在 许多 具体 情况 下 ,不 可 能 预先 决定 被 研究 的 分 类 单位 中 哪 一 个 是 组 外 单位 。 为 了 克服 这 一 困
难 , 两 步 进行 法 已 被 提 了 出 来 (Li,1981)。 第 一 步 ,用 UPGMA 法 先 推出 该 树 的 根 。 然 后 ,处 于 根 一 侧
的 分 类 单位 被 当 作 参 照 物 (组 外 单位 ), 对 处 于 根 的 另 一 侧 的 谱系 间 不 相等 的 进化 速率 做 校正 ,以 后 再
做 相反 方向 的 校正 。 在 我 们 的 例子 中 ,此 法 也 能 找 出 正确 的 树 。
近邻 关系 法
在 一 个 无 根 两 分 又 树 中 ,如 果 两 个 OTU 通过 一 个 内 部 节点 联结 , 则 它们 就 被 说 成 是 近邻 Cneigh-
bors)。 例 如 ,图 5 一 8a 中 ,A 和 也 是 近邻 ,C 和 D 也 是 如 此 。 与 之 相 比 , 图 5 一 8b 中 ,A 和 C 不 是 近邻 ,
BAC 也 不 是 。 然 而 ,如 果 我 们 把 OTUA 和 也 结合 成 一 个 复合 OTU , 则 复合 OTU(CAB) 和 单 OTUC
就 变 成 了 一 对 新 近邻 。
现在 我 们 假定 ,图 5 一 8a 中 展示 的 树 是 真实 树 。 那 么 , 若 可 加 性 存在 则 我 们 应 有
dac + dgp = dan + de =a+b+e+d + 24 = dag + dcp + 2x - AB G2
这 里 x 是 内 部 分 枝 的 长 度 。 因 此 ,以 下 两 个 条 件 成 立 :
daz + dcp < dac + agp (5, 7a)
和
dap + dcp < dan + dac (5. 75)
这 两 个 条 件 总 称 为 四 点 条 件 (four-point condition) 。 即 使 可 加 性 只 不 过 近似 地 存在 ,这 些 条 件 可 能 也
是 成 立 的 。
反之 ,对 系统 发 育 关 系 不 知 的 4 个 OTU 而 言 ,以 上 两 个 条 件 可 用 来 找 出 近邻 (A 和 B;C MD).
一 旦 这 两 对 近邻 被 确定 ,系统 树 的 拓扑 图 也 就 被 确定 了 。
萨 塔 斯 和 特 韦 尔 斯 基 (Sattath 和 Tversky,1977) 提出 以 下 方法 来 处 理 多 于 4 个 OTU 的 情况 。 首
先 , 象 在 UPEGMA 中 的 情况 一 样 算出 距离 矩阵 。 对 每 种 可 能 的 四 单位 组 ,比如 OTUi,j,m Ain, WH di
十 dadn 十 dn 和 do 二 dm。 假定 第 一 个 和 的 值 最 小 ,那么 ,我 们 把 1 和 j 对 以 及 m 和 mn 对 都 记 1 分 ,而 i
和 本 对 和 mn 对 .和 m 对 ,j 和 mn 对 则 都 记 0 分 否则, 如果 dm 十 ds 有 最 小 值 , 则 我 们 就 给 1 和 曾 对
以 及 j 和 mm 对 记 1 分 ,而 给 其 他 4 种 可 能 的 对 子 记 0 分 。 在 对 所 有 可 能 的 四 单位 组 都 评 过 分 以 后 ,得
总 分 最 高 的 对 子 即 被 选 为 第 一 个 近邻 对 ,并 把 它 当成 一 个 OTU 来 处 理 , 下 一 步 ,如 在 UPGMA 中 的
情况 一 样 算出 新 距离 矩阵 ,然后 重复 以 上 过 程 选 出 第 二 个 近邻 对 。 此 过 程 继 续 到 所 有 OTU 被 聚 类 时
止 。 在 我 们 考虑 猿 和 人 的 系统 发 育 时 将 给 出 此 法 的 详细 说 朋 ( 见 第 72 页 )。 *
. 66 °*
Cc
图 5 一 8 (a) 有 4 个 OTU 和 (Cb) 有 5 个 OTU 的 两 分 又 无 根 树 。
以 近邻 关系 概念 为 根据 的 另 一 种 方法 曾 由 菲 奇 (Fitch,1981) 提 出 。 塞 图 和 根 井 (Saitou 和 Nei,
1987) 曾 提 出 一 个 称 为 近邻 结合 法 Cneighbor-joining method ) 的 方法 。 这 是 连续 地 找 出 使 树 的 总 长 度
最 小 的 近邻 对 的 方法 。
最 节省 法
最 节省 或 最 少 进化 的 原则 涉及 : 找 出 一 个 要 求 最 小 进化 变化 数 的 树 ,以 解释 被 研究 OTU 间 观 察
到 的 差异 ,这 样 一 种 树 称 为 最 节省 树 (maximum parsimony tree) 。 常 常 可 以 发 现 不 止 一 种 树 有 同样 的
最 小 变化 数 , 所 以 ,推测 出 的 树 可 能 不 是 唯一 的 。
下 面 讨论 的 方法 最 初 是 为 了 处 理 氨 基 酸 顺序 数据 而 提出 的 GEck 和 Dayhoft,1966), 后 来 经 修改
fa RAT AH BI FF Bitch ,1977) 。 .
我 们 先 对 信息 位 点 (informative sites) 进 行 定 义 。 一 个 核 苷 酸 位 点 是 具有 系统 发 育 方 面 的 信息 的 ,
仅 当 它 在 众多 的 树 中 偏向 其 中 一 些 树 时 ,为 了 说 明 信 息 入 所 和 非 信息 位 点 问 的 区 别 ,让 我 们 考虑 以 下
位 点
顺序 2
1 A Giese GS Oe: A
2 Apna awe Ty G CG
3 | es ee SR ae) Es ae Oa Om
4 in the ae Diatiie woe Pere a, G
对 4 个 OTU 有 3 种 可 能 的 无 根 树 ( 图 5 一 9)。 位 点 1 不 是 有 信息 的 ,因为 所 有 顺序 在 该 位 点 上 都
有 A, 以 至 在 3 种 可 能 的 树 中 都 不 需要 任何 变化 。 在 位 点 2 上 ,顺序 1 有 A, 而 所 有 其 他 顺序 都 有 G,
所 以 只 需 作 一 简单 假定 , 即 谱系 中 核 苷 酸 从 G 变 成 A 导 至 了 顺序 1。 于 是 ,这 一 位 点 也 不 是 有 信息
的 ,因为 对 这 3 种 可 能 的 树 来 说 每 种 都 只 需要 1 次 变化 。 如 图 5 一 9a 所 示 , 对 位 点 3 来 说 ,这 3 种 可 能
的 树 中 的 每 一 种 都 需要 2 次 变化 ,所 以 也 不 是 有 信息 的 。 注 意 , 如 果 假 定 图 5 一 9a 的 树 I 中 联结 OTU
1 和 :2 的 节点 上 的 核 苷 酸 是 C( 或 A) 而 不 是 G, 则 该 树 所 需要 的 变化 数 仍 为 2。 图 5 一 9b 表明 对 于 位
点 4 这 3 种 树 的 每 一 种 都 要 求 3 次 变化 ,所 以 位 点 4 也 是 非 信 息 的 。 对 于 位 点 5, 树 工 只 要 求 1 次 变
化 ,而 树 工 和 开 则 各 要 求 2 次 变化 (图 5 一 9c) ,所 以 该 位 点 是 有 信息 的 。
从 这 些 例子 中 我 们 看 到 ,就 我 们 所 谈 到 的 分 子 数 据 而 言 , 仅 当 一 个 位 点 上 至 少 有 两 种 不 同类 型 的
核 苷 酸 、 每 种 类 型 至 少 在 两 个 被 研究 顺序 中 出 现时 ,该 位 点 才 是 有 信息 的 .在 上 例 中 ,信息 位 点 用 星 号
C* ) 指 出 。
为 了 推出 一 个 最 节省 树 ,我 们 首先 要 找 出 所 有 信息 位 点 。 接 着 ,对 每 种 可 能 的 树 我 们 算出 每 一 信
息 位 点 上 的 最 小 替换 数 。 在 上 例 中 ,对 于 位 点 5.7 和 9, 树 I 分 别 需要 1.、1 和 2 次 变化 , 树 工 分别 需要
2.2 和 1 次 变化 , 树 开 分 别 需要 2.2 和 2 次 变化 。 最 后 一 个 步 聚 是 ,对 每 种 树 将 所 有 信息 位 点 上 的 变
化 数 加 和 ,并 选 出 总 替换 数 最 小 的 那 种 树 。 在 我 们 的 例子 中 ,因为 树 I 在 信息 位 点 上 需要 的 变化 数 最
af
* O/ .
gt I i I 树 亚
G Gz
(a) 1G A 3 Bone A G2 1 : ‘
a ° A A iG
位 点 3 Gc A A
=
Uh A4 3A A 4 4A A3
(b) 1A T3 1A F C2 1A Ps
和
位 点 4 C 一 一 -一 T 人 ATTTEOI
} . e 9
nincit es 3T G4 re T3
“od 1G A3 1 fe? ae 2
de e A A
位 点 5 G A Pr A
2G A4 3A A4 4A A3
图 5 一 9 关于 4 个 DNA 顺序 (1.2,3 和 4) 的 3 种 可 能 的 无 根 树 (I,IL 和 下 ) 这 4 个 顺序 曾 被 用 来 选取 最 节省 树 册
(REX) 。 终端 节点 处 指出 了 现存 物种 中 该 同 源 位 置 上 的 核 音 酸 种 类 。 分 枝 上 的 每 一 个 国 点 表示 一 次 替换 , 它 被 放
在 发 生 替 换 欧 分 村 上 。 注 意 , 每 种 树 的 两 个 内 部 节点 上 的 核 苦 酸 只 表示 了 几 种 可 供 选 择 的 构建 中 的 一 种 。 例 如 , 树 -
IE (c) 的 两 个 内 部 节点 上 可 能 都 是 G 而 不 是 A( 右 下 角 )。 在 这 种 情况 下 ,两 次 着 换 将 位 于 章 致 物种 3 和 4 的 分 枝
上 。 而 所 要 求 的 替换 最 小 数 却 保持 相同 。
小 (4), 所 以 选中 树 I
在 有 4 个 OTU 的 情况 下 ,一 个 信息 位 点 只 偏向 3 种 可 供 选取 的 树 中 的 一 种 .例如 ,位 点 5 偏向 树
I 甚 过 树 工 和 树 开 ,因而 被 说 成 是 支持 树 工 的 。 容 易 看 出 ,受信 息 位 点 支持 数 最 大 的 那 种 树 就 是 最 节
省 树 。 例 如 ,上 例 中 , 树 工 受 2 个 位 点 支持 , 树 工 受 1 个 位 点 支持 ,而 树 正 无 位 点 支持 ,结论 不 言 自 明 。
5.4 表 型 学 与 进化 枝 学
分 类 学 中 长 期 存在 的 争论 就 是 那些 一 直 在 “进化 枝 学 家 ”和 ”“ 表 型 学 家 ” 间 发 生 的 言辞 刻薄 的 争
论 。 进 化 枝 学 (cladistics) 这 个 词 可 以 定义 为 研究 进化 途径 的 科学 。 换 句 话说 ,进化 枝 学 家 对 这 样 一 些
问题 感 兴趣 :在 一 群生 物 中 存在 多 少 分 枝 ? 哪些 分 枝 与 别 的 哪些 分 枝 相 联 ? 分 枝 次 序 如 何 (Sneath 和
Sokal,1973)? 一 种 表示 这 种 祖先 一 后 代 关 系 的 树 状 网 络 称 进化 分 枝 图 (cladogram) 。 换 柯 话 说 , spss
枝 图 即 指 一 种 有 根系 统 树 的 拓扑 图 。
另 一 方面 , 表 型 学 (phenetics) 是 根据 一 群生 物 间 的 相似 程度 来 研究 它们 间 的 关系 的 科学 , 引 以 为
据 的 类 似 性 可 以 是 分 子 上 的 、 表 型 上 的 或 解剖 学 上 的 。 表 示 表 型 学 关系 的 树 状 网 络 称 表 型 关系 图
(Phenogram)。 虽 然 表 型 关系 图 可 以 当 作 进化 枝 学 关系 的 指示 物 来 用 ,但 它 可 不 必 与 进化 分 枝 图 等
同 。 如 果 在 分 岐 时 间 和 遗传 学 上 的 (或 形态 学 上 的 ) 分 岐 程度 间 存 在 线性 关系 , 则 这 两 种 树 可 能 会 变 得
相互 等 同 。
在 上 面 所 讨论 的 方法 中 ,最 节省 法 是 进化 枝 学 方法 的 一 个 典型 代表 ,而 UPGMA 法 则 是 二 种 典
型 的 表 型 学 方法 。 然而 ,其 他 方法 却 不 能 按 以 上 标准 简单 地 进行 分 类 。 例 如 ,变形 距离 法 和 近邻 关系
法 常常 被 说 成 是 表 型 学 方法 ,但 这 是 一 种 不 确切 的 说 法 。 虽 然 这 些 方法 用 了 类 似 性 (或 不 似 性 引 臣
离 ) 太 度 , 但 它们 并 没有 假定 类 似 性 和 进化 关系 间 直接 关联 ,也 并 不 打算 推测 表 型 学 关系 ,
在 分 子 系统 发 育 中 , 用 更 合理 一 些 的 分 类 方法 应 把 它们 分 成 距离 法 和 特性 状态 法 (distance and
character-state approaches) . 属于 前 者 的 方法 根据 距离 尺度 , 象 核 苷 酸 或 氨基 酸 的 替换 数 等 ,而 后 者 则 ;
依靠 该 特性 的 状态 ,如 某 一 特定 位 点 上 的 核 昔 酸 或 氨基 酸 ,或 某 - DNA 位 置 上 缺失 或 插入 的 出 现 或
. 68 .
不 出 现 等 。 根 据 这 种 分 类 , 则 UPGMA 法 ,变形 距离 法 和 近邻 关系 法 都 是 距离 法 ,而 最 节省 法 则 是 一
一 直 有 这 样 一 种 说 法 , 即 ,特性 状态 法 比 距 离 法 更 有 效用 ,因为 该 原始 资料 是 一 串 特性 状态 (例如
核 苷 酸 顺 序 ), 而 将 特性 状态 数据 转变 成 距离 矩阵 以 后 ,有 些 信息 就 丢失 了 。 然 而 我 们 注意 到 ,虽然 最
节省 法 事实 上 应 用 的 是 原始 资料 ,但 通常 它 仅 用 了 可 用 资料 的 一 小 部 分 。 例 如 ,第 75 页 上 的 例子 中 ,
只 有 3 个 位 点 被 用 于 分 析 中 , 倒 有 6 个 位 点 被 排除 在 外 了 。 为 此 ,此 法 常 比 有 些 距 离 矩阵 法 的 效率 低
(fal Gn KL Saitou 和 Nei,1986)。 当 然 , 如 果 信 息 位 点 数 多 , 则 最 节省 法 一 般 是 非常 有 效 的 。
最 后 ,应 该 注意 到 ,不 管用 何 种 方法 ,一 个 推测 树 常 难免 有 拓扑 图 错误 。 为 了 得 到 正确 的 树 ,通常
需要 大 量 数据 资料 。
5.5 枝 长 的 估计
除了 在 UPGMA 法 中 外 ,我 们 都 不 曾 讨论 过 怎样 去 估计 梳 长 的 问题 。 现 在 ,我们 在 该 树 的 拓扑 图
已 被 推测 出 来 的 假定 下 ,来 处 理 这 一 问题 。 我 们 只 考虑 用 距离 矩阵 法 推测 出 来 的 树 对 于 最 节省 法 来
说 ,这 个 问题 要 复杂 得 多 ( 见 Fitch,1971)。 下 面 讨 论 的 方法 是 菲 奇 和 马 戈 利 阿 什 (Fitch 和 Margoliash,
1967) 的 方法 。
首先 ,我 们 考虑 一 种 最 简单 的 情形 , 即 一 个 有 3 个 OTU(CA,B 和 C) 和 1 个 节点 的 无 根 树 ( 图 5 一
10a)。 设 xy 和 2z 分 别 是 导向 A.B 和 CC 的 分 枝 的 长 度 。 很 容易 看 出 以 下 等 式 成 立 :
za 一 工 十 y (5. 8a)
dy = 2+2 (5. 8b)
due = 9 +z (5. 8c)
(b)
at :
图 5 一 10 AIA DRA MH (Fitch 和 Margoliash ,1967) 法 计算 枝 长 时 采用 的 无 根系 统 树 。(a) 有 3 个 OTU 的
树 ,(b) 有 5 个 OTU 的 树 。
从 这 些 等 式 ,我 们 得 到 以 下 解 :
phe: fant duc — doe (5. 9a)
ae dap + dpc — dac
eet tt a0)
z= dac + dpc — dap
2
我 们 现在 来 处 理 有 3 个 以 上 OTU 的 情形 .为 简单 计 ,我 们 假定 有 5 个 OTU(1,2,3,4 M5). mK
拓扑 图 和 各 枝 长 如 图 5 一 10b 所 示 。 假 定 OTU 1 和 2 是 构 树 过 程 中 最 先 被 聚 类 的 OTU , 则 我 们 分 别
用 A 和 Bi 来 表示 OTU1 和 2 而 把 所 有 别 的 OTU(3、4 和 5) 放 在 一 个 复合 OTU 中 ,并 表示 成 C。 通 过
。69 。
(5. 96)
(5. 9c)
这 种 安排 ,我 们 可 以 用 等 式 5. 9a 一 5.9c 来 估计 导向 A.B 和 C 的 分 枝 的 长 度 . 不 过 ,现在 dac 一 de 一
(dys tdyytdis)/3»drc=dorsis) = (des tdou+dos)/3 于 是 ,我 们 有 a=x Mb=y. 接着 OTUI M2 Ram
_ 个 复合 OTU。 下面 再 假定 ,复合 OTU(12) 与 单 OTU3 是 下 一 个 要 结合 在 一 起 的 对 子 。 于 是 ,我 们
分 别 把 复合 OTU(12) 和 单 OTU3 用 A 和 B 表 示 , 把 其 余 的 OTU( 即 4 和 5) 放 在 新 的 复合 OTUC
中 。 以 上 述 同 样 的 方式 ,我 们 将 得 到 x,y 和 z。 注 意 ,这 时 d=y,c 十 (a 十 b)/2=x。 从 前 一 次 我 们 得 到
的 关于 a 和 b 的 值 ,可 以 算出 c。 继 续 进 行 这 样 的 过 程 , 直 到 所 有 枝 长 都 得 到 时 为 止 。
注意 ,有 时 某 一 被 估 出 的 枝 长 可 能 会 是 负 的 。 由 于 实际 枝 长 绝 不 可 能 是 负 的 ,所 以 ,最 好 用 0 来 代
替 这 样 的 估 值 。
作为 应 用 上 述 方 法 的 一 个 例子 ,让 我 们 来 算 一 下 图 5 一 7c 中 那个 树 的 各 枝 长 。 为 便于 说 明 ,我 们
把 在 推测 该 树 的 拓扑 图 时 用 过 的 距离 矩阵 再 次 列 出 。 为 了 避免 与 等 式 5.9 中 的 符号 混淆 ,我 们 把 O-
TUA,B,C 和 D 分 别 地 重新 命名 为 OTU1,2,3 和 4。
OTU
OTU 1 2 3
2 8
3 7
因为 OTU1 和 2 最 先 被 聚 类 ,所 以 ,我 们 把 OTU3 和 4 放 在 一 个 复合 OTUC 中 ,从 而 先 算 出 导向
OTU1 和 2 的 两 个 分 枝 的 长 度 (a 和 b)。 而 我 们 有 das=diz=8,dac= (di3tdy)/2=(74+12)/2=9. 5
和 dac 一 (d: 十 dx)/2 王 11.5。 由 等 式 5. 9a 一 5. 9c ,我们 有 :a=—x= (84+ 9. 5—11. 5)/2=3,b=y=(8+
11. 5 一 9)/2=5。 下 一步 我 们 把 OTU1 和 2 处 理 成 OTU(12) 并 用 A Hm. FH, RNA :das=—day;:=
(dis+do3)/2=(7+9)/2=8,dac=daz= (dis tda)/2= 124+14)/2=13,dsce=du=1l. AK RES
sh 5. 9a 一 5. 9c, RITA :x= (8+13—11)/2=5,d=y=(8+11—13)/2=3,e=z= (134+11—8)/2=8.
由 图 5 一 7c 可 以 看 出 (a 十 b)/2 十 cx, 所 以 ,c 王 1。 至 此 计算 完毕 。 然 而 请 注意 ,由 于 我 们 不 知道 根 的
准确 位 置 , 所 以 我 们 不 能 估 出 联系 根 和 OTUD 的 分 枝 的 长 度 , 而 只 能 估 出 从 OTUA,B AC 的 共同 祖
先 节点 通过 根 到 OTUD WK EE. Bl e=8.
5.6 寻找 无 根 树 的 根
大 多 数 构 树 法 得 到 的 都 是 无 根 树 。 为 了 找到 无 根 树 的 根 ,我们 通常 都 需要 一 个 组 外 单位 ( 即 一 个
OTU ,其 外 在 信息 ,如 古生物 学 证 据 , 清 楚 地 表明 它 比 那些 被 研究 的 分 类 单位 更 早 地 发 生 分 枝 )。 而 根
则 被 放 在 该 组 外 单位 和 将 它 和 别 的 OTU 联结 起 来 的 节点 之 间 。
虽然 我 们 必须 能 肯定 该 组 外 单位 的 确 比 所 有 别 的 分 类 单位 更 旱地 发 生 分 岐 ,但 奉劝 各 位 ,不 要 选
一 个 与 被 研究 的 各 分 类 单位 亲缘 关系 过 于 遥远 的 组 外 单位 ,因为 ,在 这 样 的 情况 下 很 难得 到 该 组 外 单
位 与 其 他 分 类 单位 间 的 可 靠 估 值 。 例 如 ,在 构建 一 组 有 胎盘 哺乳 类 间 的 系统 发 育 关 系 时 ,我 们 可 以 用
一 种 有 袋 类 作为 组 外 单位 。 仅 当 所 用 的 DNA 序列 在 进化 中 是 高 度 保守 的 时 , 鸟 类 才 可 能 被 当成 可 靠
的 组 外 单位 。 在 此 例 中 植物 与 真菌 显然 也 够 资格 作为 组 外 单位 ,不 过 ,仅仅 因为 它们 与 哺乳 类 的 关系
太 过 遥远 用 它们 作 组 外 单位 ,结果 就 可 能 会 出 现 严重 的 拓扑 图 错误 。 用 一 个 以 上 的 组 外 单位 (假若 它
们 与 别 的 分 类 单位 都 不 是 关系 遥远 ) , 则 一 般 能 改善 该 树 拓扑 图 的 估计 结果 。 该 组 外 单位 还 必须 在 系
统 发 育 上 与 别 的 OTU 不 至 于 太 接 近 , 因 为 ,在 这 种 情况 下 我 们 不 能 肯定 它 是 一 个 真正 的 组 外 单位 ,
即 不 能 肯定 它 与 其 他 OTU 的 分 歧 早 于 这 些 OTU 相互 间 的 分 岐 。
在 缺少 组 外 单位 的 情况 下 ,我 们 可 以 通过 假定 进化 速率 在 所 有 分 枝 上 近似 一 致 来 放置 根 。 在 这 种
假定 下 ,我 们 把 根 放 在 两 个 OTU 间 的 最 长 路 组 的 中 点 处 ‘on Sill
Se —
5.7 物种 分 岐 时 间 的 估计
因为 计生 物 学 记录 远 不 够 完全 ,所 以 我 们 常常 不 去 管 物种 分 岐 的 年 代 。DNA 顺序 数据 在 这 方面
s。70 。
可 能 会 给 出 很 大 帮助 。 从 以 前 的 研究 中 获知 我 们 假定 某 一 DNA 序列 的 进化 速率 ,为 每 年 每 位 点 r 替
换 。 为 了 得 到 物种 A 和 也 间 的 分 岐 时 间 (T) ,我 们 对 来 自 这 两 个 物种 的 该 顺序 进行 比较 ,并 算出 每 位
点 替换 数 (K)。 如 第 四 章 所 示 , 我 们 有 以 下 等 式 :
K
= oF (5.. 40)
Att .T 估计 为
K
T=> (5.11)
如 在 第 四 章 所 说 明 过 的 那样 ,从 一 组 生物 得 到 的 核 苷 酸 替 换 速率 也 许 不 能 用 于 另 一 组 生物 .为 了
避免 出 现 这 样 的 问题 ,我 们 可 通过 加 进 第 3 个 物种 C( 它 与 物种 对 A 和 B 的 分 岐 时 间 已 知 ) ,来 估计
替换 速率 (图 5 一 11)。 设 Kij 是 物种 1 和 j 间 每 位 点 核 苷 酸 替 换 数 ,那么 , 核 苷 酸 替 换 速 率 可 由
fly Kac + Koc
一 一 《5. 12)
图 5 一 11 eit poked ia A ay A LEX)
估 出 。 物 种 A FB ial Ay AI 4D ek et Me (TA:
fie Kas _ 2K asl) (5. 13)
2r — Kac + Kee
fit, RZET. CMT, 未 知 的 情况 下 ,Ti 由 下 式 给 出 ;
(Kac + Kyc)T,
thas
以 上 公式 均 假 定 速率 恒定 。 但 如 前 一 章 中 所 讨论 的 那样 ,此 假定 常常 是 不 成 立 的 ,所 以 估 出 的 分
岐 时 间 应 该 小 心 处理 。 李 和 谷村 (Li 和 Tanimura,1987) 曾 提出 一 种 方法 ,此 法 能 降低 替换 速率 不 等 对
分 岐 时 间 估 计 的 影响 。
早先 我 们 已 经 注意 到 ,两 顺序 间 的 分 岐 时 间 可 能 比 携带 这 两 个 顺序 的 两 物种 间 的 分 岐 时 间 早 。 不
过 ,如 果 我 们 关心 的 是 长 期 分 岐 事件 ,比如 说 几 百 万 年 或 更 长 的 时 间 等 级 , 则 这 种 误差 通 常 并 不 很 严
重 。 还 应 该 注意 ,分 岐 时 间 的 估 值 通常 承受 着 较 大 的 随机 误差 。 为 了 减少 这 类 误差 ,在 估计 中 应 该 用
许多 顺序 。
T; (5. 14)
5.8 进化 校
系统 发 育 研究 的 目的 是 建立 不 同 物种 间 的 进化 关系 。 特 别 地 ,我 们 对 找 出 自然 进化 枝 (clades) 感
兴趣 。 一 个 进化 枝 被 定 尽 成 一 组 有 共同 祖先 的 物种 ,而 该 祖先 却 不 为 这 一 进化 枝 外 的 其 他 物种 所 共
有 。
图 5 一 12 BMH AWN 3 个 网 ;总 纲 , 卜 行 网 和 哺乳 纲 间 的 进化 关系 。 我 们 看 到 ,经 典 分 类 学 把
疏 行 类 指定 为 一 个 独立 的 网, 这 与 进化 枝 的 定义 不 符 , 因 为 这 3 类 疏 行 动物 与 另 一 个 类 群 一 一 鸟 类 有
共同 祖先 ,而 后 者 则 并 不 被 包括 在 疏 行 岗 的 定义 范围 内 。 另 一 方面 , 鸟 类 与 甸 类 倒 的 的 确 确 地 构成 了
一 个 自然 进化 枝 , 初 龙 亚 纲 , 因 为 它们 所 共有 的 一 个 共同 祖先 不 为 除 鸟 类 和 乌 类 以 外 的 任何 现存 生物
所 共有 。 类 似 地 ,所 有 鸟 类 和 所 有 有 怜 行 类 合 在 一 起 构成 一 个 自然 进化 枝 。
四 71 .
LF
i ~¥5 <
a
ARS Ah I
6808 C T ak; CG I
6971 G G a 到 I
来 自 Maeda 等 (1988) 的 数据
人 3 HEH RH OE KH H AATATA AATATA I
1472 G G A A I
2131 A A I
2224 A G A G I
2341 G a &: G C 下
2635 G G A A I
A Williams 和 Goodman(1989) 2X ft AK .
a、\ 位 点 序数 对 应 于 原始 来 源 中 给 出 的 序数 。 所 用 序列 的 总 长 度 为 10. 2 kb, 约 为 表 5 一 2 中 所 用 序列 的 2 倍 。
b、 假 定 : I ,人 和 黑猩猩 在 一 个 进化 枝 中 ; 工 , 黑 猩猩 和 大 猩猩 在 一 个 进化 枝 中 ;下 人 和 大 猩猩 在 一 个 进化 枝 中 。
c、\ 一 个 星 号 表示 在 该 位 点 上 缺失 一 个 核 苷 酸 。
另外 还 有 些 类 型 的 分 子 数 据 也 支持 人 和 黑猩猩 聚 类 的 结论 。 例 如 ,DNA 一 DNA 杂交 数据 (Sibley
和 Ahlguist,1984;Caccone 和 Powell,1989) 明 确 地 表示 ,在 图 5 一 14 里 3 种 供 选取 的 系统 发 育 关系
中 ,人 和 黑猩猩 聚 被 类 成 一 个 进化 枝 。 于 是 ,与 人 关系 最 近 的 现存 亲属 是 两 种 黑猩猩 ,其 后 为 大 猩猩 、
马 来 猩 猩 和 9 PARR
5.10 线粒体 和 叶绿体 的 内 共生 起 源
基本 上 有 两 种 理论 解释 真 核 生 物 中 与 细胞 核 分 开 的 线粒体 和 叶绿体 基因 组 的 存在 。 第 二 种 理论
例如,,Cavalier-Smith,1975) 认 为 ,细胞 器 的 基因 是 自体 起 源 的 ,是 通过 直接 的 父子 关系 从 细胞 核 基
因 传 下 来 的 。 细 胞 核 基因 组 的 某 些 部 分 被 并 人 到 一 个 由 膜 包 被 的 细胞 器 中 ,接着 假定 它 的 准 独 立 存
在 ,从 而 完成 了 这 一 起 源 过 程 。 与 其 不 同 的 是 ,内 共生 学 说 (例如 Margulis,1981) 认 为 核 外 DNA. 的 起
源 是 外 源 性 的 。 按 照 这 种 看 法 真 核 生 物 的 祖先 吞噬 了 原核 生物 ,接着 ,由 于 互利 或 有 共生 关系 的 缘故 ,
后 者 被 保留 了 下 来 。 随 着 时 间 的 流逝 ,这 种 内 共生 通过 某 些 基因 的 丢失 而 变 得 更 为 密切 , alan
了 强制 性 共生 者 ( 即 ,不 能 在 其 宿主 体外 独立 地 存在 的 生物 )。
“= 现在 ,分 子 证 据 绝对 地 支持 内 共生 学 说 。 使 叶绿体 和 原核 生物 的 基因 组 与 真 核 生物 的 基因 组 区 分
开 来 的 生化 特性 , 列 于 表 5 一 5 中 。 然 而 ,最 根本 的 文 持 来 自 IRNA 顺序 数据 。 由 于 rRNA 顺序 有 较 低
的 替换 速率 ,所 以 ,它们 已 被 证 明 对 处 理 涉 及 非常 古老 的 进化 分 岐 事件 的 问题 是 很 有 用 的 。
ite BL ve Fl Bt FE AR (Schwarz il Kossel, 1980) wE HA. K A AK (Zea mays) 叶 绿 体 中 的 16SrRNA ;其
$F A FF GK A KATA CE. coli) fY 16SrRNA 的 极为 相似 。 在 细胞 核 的 和 叶绿体 的 zRNA 顺序
la] , 这 种 类 似 程 度 就 要 低 得 多 。 来 自 光 合 蓝 细 菌 的 16SrRNA 顺序 的 详细 分 析 (Giovannovi 等 ,1988)
支持 这 样 的 看 法 : 即 ,绿色 的 叶绿体 来 自 一 群 称 为 蓝 细菌 的 光合 细菌 (Bonen 等 ,1979)( 见 图 5 一 16a) 。
s。 76°
as -ec
表 5 一 5 将 叶绿体 和 原核 生物 的 基因 组 与 真 核 生物 的 核 基因 组 区 别 开 来 的 分 子 特征
1. 无 组 蛋白 DNA
2. 大 小 为 120,000 一 150*000 碱 基 对
3. 环 状 基因 组
4. 转录 的 利 福 平 敏感 性
5. BRE IRA HE EK . MEH .spectromycin 和 巴 龙 霉 素 抑制
6. 翻译 对 放 线 菌 酮 的 不 敏感 性
7. 翻译 以 甲 酰 甲 硫 氨 酸 为 起 始
8. mRNA 的 多 聚 腺 苷 缺失 或 很 短
9. 原核 促进 子 结构
rRNA 顺序 的 系统 发 育 分 析 表 明 , 线 粒 体 来 自 紫色 细菌 的 a 分 枝 ( 图 5 一 16a;Cedergren 等 ,
1988) 。 然 而 ,所 用 的 细胞 核 rRNA 顺序 指出 :高 等 植物 在 大 约 与 动物 和 真菌 相同 的 时 刻 发 生 分 枝 (图
5 一 16b), 这 与 传统 观点 一 致 ;而 线粒体 rRNA 顺序 却 指 出 ,高 等 植物 在 非常 接近 紫色 细菌 的 根 处 聚
类 ,与 真菌 .绿色 藻类 和 动物 则 是 分 离 的 (图 5 一 16a)。 这 是 与 传统 观点 , 即 把 高 等 植物 和 绿色 藻类 组
合 在 一 个 进化 枝 中 的 观点 相 矛 盾 的 。 为 此 缘故 ,格雷 等 (Gray 等 ,1989) 曾 提出 ,高 等 植物 的 线粒体 中
的 rRNA 基因 ,, 有 上 比 其 他 生物 线粒体 中 的 rRNA EE HE 此 假说 是 否 会 被 进 一 步 的 证
据 所 支持 ,我 们 将 拭目以待 。
5.11 分子 古 生物 学
从 微克 量 保存 下 来 的 组 织 中 得 到 的 不 纯 样本 的 DNA, 现 在 已 有 可 能 对 它 的 片段 加 以 定 序 了 。 所
采用 的 方法 是 聚合 酶 链 式 反 应 法 (PCR)。PCR 是 通过 应 用 两 种 已 知 引 物 来 使 某 序 列 混合 物 中 的 一 种
独特 序列 扩 增 的 方法 (图 5 一 17; Saiki 等 ,1985,1988;Scharf 等 ,1986;Engelke #,1988). 每 一 引物 和
一 个 DNA 的 互补 小 段 附 着 ,从 而 引发 DNA 多 聚 酶 的 结合 ,然后 拷贝 该 片段 。 由 于 每 一 新 产生 的 拷贝
都 可 充 作 进一步 复制 时 的 模板 ,所 以 靶 片 段 的 拷贝 数 将 呈 指 数 增长 用 此 法 有 可 能 将 混合 物 中 的 某 一
被 选 定 的 DNA 片段 合成 产生 许多 拷贝 ,此 时 混合 物 中 其 他 DNA 序列 可 能 会 远 为 超 量 地 存在
(Kocher 等 ,1989)。 因 此 ,采用 PCR 我 们 可 以 从 博物 馆 标 本 , 象 保存 下 来 的 有 机 物质 (主要 是 皮肤 和
肌肉 )、 严 重 损坏 的 考古 学 遗物 甚至 骨骼 中 找 回 某 些 特别 的 DNA 序列 (Hagelberg 等 ,1989) 。
应 用 此 法 现在 已 可 能 建立 某 些 已 灭绝 物种 , 象 南非 斑 肪 和 澳大利亚 袋 狼 间 的 系统 发 育 关 系 ,或 决
定 斯 堪 的 那 维 亚 铁 器 时 代 的 沼泽 地 人 和 埃及 木 万 伊 ,这 些 已 灭绝 人 类 群体 间 的 祖先 -后 毅 关 系 。 对 后
两 个 人 类 群体 的 形态 学 比较 ,得 到 的 结果 比较 含糊 。
应 用 PCR 法 ,托马斯 等 (Thomas 等 ,1989) 已 能 对 来 自 袋 狼 Thylacinus cynoce phalus 和 其 他 涡 大
利 亚 与 南美 有 袋 类 的 线粒体 的 219 个 核 苷 酸 加 以 定 序 和 比较 ,并 且 与 来 自 有 胎盘 类 的 同 源 顺 序 比 较 。
应 用 此 法 ,他 们 已 能 在 以 下 两 种 说 法 间作 出 取 含 :(a) 袋 狼 与 南美 的 有 袋 动物 类 群 有 亲缘 关系 ,和 (b)
袋 狼 与 其 他 澳大利亚 有 袋 类 的 亲缘 关系 很 近 。 从 这 些 顺 序 比 较 中 得 出 的 结论 是 , 袋 狼 与 另外 两 种 澳 大
利 亚 有 袋 类 , 儿 近 灭绝 的 塔 斯 马 尼 亚 魔鬼 (一 种 袋 获 ,Sarcopjzlus harrisii) AYR K All W. Fi (— PPAR fh.
Dasyurus maculatus) A {BRIE RARKA (AS — BB HAAS AO (— BPE RR . Philander opossum an-
dersoni) AA RHI MWRAKACA 5 一 18)。 于 是 , 袋 狼 和 南美 有 袋 动 物 间 形 态 学 上 的 相似 ,被 认为 是
一 个 形态 学 水 平 上 趋同 进化 的 例子 , 它 在 线粒体 DNA 中 没有 平行 关系 。
5.12 ” 深 色 海滩 省 :物种 保护 生物 学 中 的 一 次 教训
最 后 一 只 深 色 海滩 省 死 于 1987 年 6 月 16 日 ,地 点 在 佛罗里达 州 俄 伦 多 附近 沃 特 . 迪斯尼 世界
的 动物 园 里 。 深 色 海 滩 汰 在 1872 年 被 发 现 。 因 其 墨色 的 外 瑶 而 被 明确 地 归 类 成 一 AS WRC Ammodra-
mus maritimus nigrescens) , A.m. nigrescens 的 地 理 分 布 被 限 制 在 佛罗里达 州 布 列 伐 得 县 中 的 盐 碱 沼泽
or 7
(a)
a
am. 高 等 植物
绿色 藻类
真菌
MY
纤毛 虫 类
绿色 藻类
一 线粒体
AMM, fy Fh, -=-=--- 叶绿体
一 an
20
oe
(b) had
ERA
高 等 植物
原生 生物
ee),
图 5 一 16 《〈a) 从 小 亚 基 rRNA 的 顺序 推测 出 的 无 根 树 中 真 细菌 一 叶绿体 一 线粒体 部 分 。 注 意 , 来 自 绿色 莹 类 和 植
物 的 叶绿体 顺序 都 是 单 源 发生 的 ,而 线粒体 顺序 则 是 多 源 发 生 的 。(b) 从 细胞 核 小 亚 基 rRNA 顺序 推测 出 的 无 根
树 。 步 聚 1( 用 圆圈 标 出) 是 早期 内 共生 、 假 定 已 产生 了 大 多 数 真 核 生 物 的 线粒体 基因 组 , 步 聚 2 是 后 期 共生 ,Gray
等 (1989) 假 定 它 贡 献 了 高 等 植物 线粒体 的 TRNA 基因 。 每 一 分 枝 的 长 度 与 其 两 个 内 部 点 间 的 替换 数 成 比例 ,比例
尺度 如 图 中 所 示 。 自 Gray 等 (1989) 修 改 而 成 。
地 带 ( 图 5 一 19), 到 了 1980 年 ,自然 界 中 只 能 找到 6 个 个 体 , 全 是 雄性 。 显 然 该 群体 的 灭绝 已 命中 注
定 , 于 是 ,一 个 人 工 杂 交 计 划 被 当 作 为 保护 该 亚 种 的 基因 的 最 后 一 搏 而 展开 了 。
在 这 种 情况 下 ,保护 方案 就 是 将 这 些 濒 临 灭 绝 的 亚 种 的 雄性 个 体 ,与 来 自我 们 所 能 找到 的 与 其 亲
缘 关 系 最 近 的 亚 种 的 峻 体 交 配 。 然 后 , 子 一 代 的 杂种 肉体 再 与 该 雄 体 回 交 ,它们 产生 的 后 代 又 再 次 与
原 雄 体 回 交 ,此 过 程 循环 往复 直至 该 雄 体 死去 为 止 。 该 实验 的 关键 是 要 决定 应 从 哪 种 群体 中 选取 峻
体 , 即 决定 哪 一 个 亚 种 在 系统 发 育 上 最 接近 该 濒临 灭绝 的 亚 种 。
«78°
.
Nearer eeeerenccee ee
扩 增 循环
| 引物 延长
ER
| eam ai en
图 5 一 17 用 聚合 酶 链 式 反应 法 (PCR) 使 混合 物 中 的 特定 DNA 序列 扩 增 。DNA 经 加 热 解 链 成 单 链 分 子 。 两 个 合成
的 DNA 小 片段 (锯齿 状 波纹 线 ) 各 与 靶 序 列 (黑色 粗 线 ) 一 端 上 的 特别 顺序 互补 , 充 作 引物 。 每 一 引物 各 与 不 同 链 上
的 互补 顺序 结合 。 然 后 ,DNA 多 聚 酶 通过 在 引物 上 添加 核 苷 酸 来 使 其 延长 。 很 快 地 , 靶 序 列 的 精确 复制 品 即 产生
了 。 在 以 后 的 循环 中 ,原始 靶 序 列 及 其 复制 品 都 可 充 作 模板 。 相 反 , 不 含 与 引物 互补 的 顺序 的 DNA 分 子 则 不 被 扩
增 。 因 此 ,不 纯 的 DNA 混合 物 也 可 用 来 只 对 其 中 的 一 种 序列 进行 扩 增 ,即使 在 其 他 序列 远 为 过 量 地 存在 的 情况 下 ,
这 一 点 也 能 办 到 。 更 详细 说 明 见 Mullis(1990) 。
在 海滩 省 的 例子 中 ,有 8 个 可 区 别 的 亚 种 供 选 取 。 这 些 物 种 的 地 理 分 布 范 围 如 图 5 一 19 Pe. 根
据 形 态 学 和 行为 特征 所 作出 的 决定 是 ,最 接近 深 色 海 滩 涛 的 亚 种 为 斯 科 特 的 海滩 淮 (4. mm.
peninsulae) ,它们 栖息 在 佛罗里达 湾 的 沿岸 。 在 此 决定 下 ,xzgrescexns 亚 种 的 几 个 雄 体 与 来 自 peninsulae
亚 种 的 肉体 交配 。 已 取得 了 两 次 成 功 的 回 交 , 而 由 此 产生 的 群体 则 此 后 维持 近 交 ,以 期 有 一 天 能 将 这
“重建 2 的 亚 种 放 回 到 它 原来 的 栖息 地 中 去 。
为 了 看 一 看 该 肉体 的 选择 是 否 正 确 , 阿 维 斯 和 纳 尔 了 进 (Avise 和 Nelson ,1989) 曾 进行 过 有 关 线 粒
体 DNA 的 限制 酶 模式 的 比较 ,材料 的 一 方 来 自己 故 的 纯 种 xzgrescens 的 标本 , 另 一 方 来 自 海滩 省 现
存 8 个 亚 种 中 的 5 个 , 共 39 个 个 体 。 他 们 选择 线粒体 DNA AULT RA. BH. AH PR LK
DNA 已 知 进化 非常 迅速 (第 四 章 ), 因 此 它 可 以 为 区 别 亲 缘 关 系 较 近 的 生物 提供 一 个 分 辩 率 较 高 的 解
决 途径 。 其 次 ,线粒体 是 母系 遗传 的 ,所 以 不 会 发 生 因 等 位 基因 分 离 而 造成 的 复杂 局 面 。 最 后 ,由 于 母
系 传 递 模 式 来 自己 故 雄 性 深 色 海滩 省 中 的 线粒体 DNA ,并 不 曾 转移 到 复原 育种 方案 中 的 杂种 个 体
里 .所 以 ,虽然 细胞 核 中 的 某 些 基因 已 在 杂种 中 生存 了 下 来 ,但 深 色 海 滩 和 做 的 线粒体 基因 却 不 一 样 , 它
们 是 真正 的 灭绝 了 。
根据 限制 酶 模式 , 阿 维 斯 和 纳尔逊 (Avise 和 Nelson,1989) 用 UPGMA 法 和 最 节省 法 ,构建 出 了
海滩 汰 几 个 亚 种 间 的 进化 关系 (图 5 一 20) 。 从 图 中 可 以 看 到 ,大 西洋 沿岸 群体 ,包括 深 色 海滩 省 在 内 ,
.79 。
(RB)
Trichosurus
图 5 一 18 AR (Thylacinus) fo 6 tH AA RF ARG HH 12 SrRNA 顺序 作出 的 最 节省 树 。. 该 树 用 乳牛 (Bos) 作 组
外 单位 找到 了 根 . 分 枝 上 的 数字 代表 替换 数 。 自 Thomas 等 (1989) 。
大 西洋
mirabilis
墨西哥 湾
5-19 RE (Ammodrumus. ar 二 ) 的 可 本 基 汪 和 LA 区 别 的 亚 种 的 地 理 分 布 。 自 Avise 和 Nelson
(1989). |
相互 间 几 乎 是 不 可 区 别 的 。 在 此 研究 中 3 个 海湾 沿岸 的 亚 种 也 有 同样 的 关系 。 相 比 之 下 ,大 西洋 沿岸
亚 种 与 海湾 沿岸 亚 种 间 则 有 相当 明显 的 区 别 。 这 两 大 类 群 间 的 每 位 点 核 苷 酸 蔡 换 数 估计 约 为 1 贤 。 如
果 海 滩 尖 的 线粒体 DNA 以 与 哺乳 类 和 其 他 鸟 类 的 线粒体 DNA 大 致 相同 的 速率 进化 ( 即 每 百 万 年 2
一 4 狼 的 顺序 分 岐 ) ,那么 ,这 两 大 类 群 的 群体 是 在 大 约 25 万 一 50 万 年 前 发 生 分 离 的 。 虽 然 这 些 对 分
岐 的 绝对 年 代 的 估 值 ,由 于 缺乏 确定 的 统一 标准 而 停留 在 定性 水 平 , 但 它们 却 与 已 得 到 的 海平 面 开 始
下 降 的 年 代 一 致 得 相当 好 。 由 于 海平 面 下 降 ,佛罗里达 半岛 露出 水 面 , 从 而 对 半岛 两 侧 的 群体 起 了 生
殖 屏障 的 作用 。 1
更 重要 的 是 , 阿 维 斯 和 纳尔逊 (Avise 和 Nelson ,1989) 的 分 子 研究 表明 , 深 色 海 滩 兴 亚 种 与 另 两
个 大 西洋 亚 种 ( 即 A. m. maritima Fl A. m. jaacgilliurazz) 在 分 子 上 不 可 区 别 ,而 它 与 海湾 亚 种 , 象 4. m.
peninsulae 却 是 相当 不 同 的 ,但 繁殖 计划 中 却 从 后 者 里 选 出 肉体 。 结 果 , 深 色 海滩 省 的 救援 方案 也 许 是
建立 在 错误 的 系统 发 育 前 提 上 的 。 该 方案 可 能 不 是 在 重建 一 个 灭绝 了 的 亚 种 ,而 是 创造 了 一 个 新 亚
种 。 所 以 ,系统 发 育 关系 方面 的 知识 在 生物 多 样 性 的 保护 中 ,对 作出 合理 决定 是 至 关 重要 的 。 分 类 学
* 80°
亚 种
maritima, macgillvraii, nigrescens
macgillvrait
macgillvrait
maritima
fisheri, juncicola, peninsulae
fisheri
| peninsulae
. , MEP HH
peninsulae
fisheri
juncicola
ned Sate PRED! leds ae
1.0 0.75 0.50 0.25 0
顺序 分 岐 (% ) (7)
图 5 一 20 UPGMA 系统 树 图 ,表示 海滩 和 瞧 的 大 西洋 沿岸 群体 和 海湾 沿岸 群体 间 的 线粒体 DNA 基因 型 区 别 。 应 用
最 节省 法 可 得 到 许多 同样 节省 的 树 , 其 中 包括 与 所 示 图 等 同 的 树 。 所 有 供 选 取 的 树 都 涉及 大 西洋 进化 枝 内 部 或 海
湾 进 化 枝 内 部 少量 的 分 枝 重 排 ,但 这 两 个 类 群 间 的 界线 却 维持 不 变 。 系 统 树 图 中 同样 的 亚 种 名 多 次 出 现 ,这 表示 属
于 同一 亚 种 的 不 同 个 体 展 现 出 不 同 的 限制 酶 模式 。 反 之 , 几 个 亚 种 名 在 一 个 分 枝 的 末端 处 出 现 则 表示 ,根据 形态 学
和 动物 地 理学 而 被 归于 不 同 亚 种 的 某 些 个 体 , 对 所 使 用 的 那些 酶 表现 出 相同 的 限制 酶 模式 。 自 Avise 和 Nelson
(1989).
上 的 失误 也 许 会 使 那些 愿望 良好 的 努力 变 得 劳 而 无 功 。
习题
1. 对 4 个 OTU:A,B,C 和 D, 画 出 所 有 可 能 的 有 根 和 无 根 树 。
2. 找 出 以 下 5 个 假想 顺序 中 的 所 有 信息 位 点
eee. 2) he
(AS eGiwh) Goede «Anse A
eee eseG A T FT G A
meee te 6G) UA Qin A
ae mT GY by AgTy el iA
MP A Coleg! And 人
$ 3. (a) 用 UPGMA 法 ,(b) 用 变形 距离 法 ,和 (c) 用 萨 塔 特 和 特 韦 尔 斯 基 的 近邻 关系 法 ,对 以 下 距
离 矩 阵 构建 系统 树 。 在 变形 距离 法 的 场合 ,假定 OTU E 对 所 有 其 他 OTU 而 言 是 一 个 已 知 的 组 外 单
fii .
OTU
OTU en 2
B 3
G a ‘7
D {Barkeig 3
| E Beihai haz * Gs
4. 图 5 一 15b 中 的 树 是 用 萨 塔 特 和 特 韦 尔 斯 基 的 近邻 关系 法 得 到 的 ( 见 第 66-67 页 和 74 一 75
e Site
页 ) 。 请 用 第 69-70 页 里 介绍 的 方法 证 明 在 该 树 上 所 标 出 的 枝 长 。
5. 在 经 典 昆 虫 分 类 学 中 ,不 完全 变态 类 (如 直 翅 目 ) 和 完全 变态 类 (如 双 翅 目 、 鳞 翅 目 , 同 翅 目 ) 间
的 分 岐 曾 被 假定 是 非常 远古 的 事件 。(a) 用 图 5 一 21 中 的 6 个 5SrRNA 顺序 和 UPGMA 法 来 构建 系
统 树 。(b) 用 其 中 5 个 顺序 (ab.c.e 和 1f 和 最 节省 法 来 构建 一 个 无 根系 统 树 。 把 根 放 在 联结 组 外 单位 |
Artemia salina ({) #l #4 OTU 的 分 枝 上 。 这 两 种 树 与 经 典 分 类 学 结果 一 致 吗 ? 这 两 种 构建 法 结果 能 得
到 相同 的 拓扑 图 吗 ? 如 果 不 同 , 那 么 造成 这 种 差异 的 原因 是 什么 ?
(a) GCCAACGTCCATACCACGTTGAAAGCACCGGTTCTCGTCCGATCACCGAAGTTAAGCAGC
(b) GGCAACGACCATACCACGTTGAATACACCAGTTCTCGTCCGATCACTGAAGTTAAGCAAC |
(C) GCCAACGTCCATACCACGTTGAAAACACCGGTTCTCGTCCGATCACCGAAGTCAAGCAAC
(d) GCCAACGTCCATACCACGTTGAAAACACCGGTTCTCGTCCGATCACCGAAGTTAAGCAAC
(e) GCCAACGACCATACCACGCTGAATACATCGGTTCTCGTCCGATCACCGAAATTAAGCAGC
(人 ACCAACGGCCATACCACGTTGAAAGTACCCAGTCTCGTCAGATCCTGGAAGTCACACAAC
(a) GTCGGGCGCGGTTAGTACTTGGATGGGTGACCGCCTGGGAACCCCGCGTGACGTTGGCA
(bb) GTCGGGCGTAGTTAGTACTTGGATGGGTGACCGCTTGGGAACACTACGTGCCGTTGGCA
(c) GTCGGGCGTAGTCAGTACTTGGATGGGTGACCGCCTGGGAACACTACGTGATGTTGGCT
(d) GTCGGGCGCGGTCAGTACTTGGATGGGTGACCACCTGGGAACACCGCGTGCCGTTGGCT
(e) ETCGGGCGCGGTTAGTACTTAGATGGGGGACCGCTTGGGAACACCGCGTGTTGTTGGCC
() GTCGGGCCCGGTCAGTACTTGGATGGGTGACCGCCTGGGAACACCGGGTGCTGTTGGCA
图 5 一 21 ABA 6H PR AwH SS rRNA AHH DNA WMA. (a) & (Acheta domesticus, HA) (b) HF & (A-
cyrthosi phon magnoliae , 8 A) (c) ¥& (Bombyx mori, H 38H )(d) # (Philosamia cynthia , $ 38 BH ) (e) 3 (Drosophila
melanogaster , % #8 A) (f) F 7 HAM (Artemia salina, ¥ 7% A). HARK A Kawata 和 Ishikawa( 1982) ,Morton 和 Sprague
(1982) ,Gu # (1982) ,Bagshaw # (1987) ,Cave 等 (1987) ,以 及 Samson 和 Wegnez(1988) 。
后 继 阅读 文献
Felsenstein, J. 1988. Phylogenies from molecular sequences: Inference and reliability. Annu. Rev.
Genet. 22: 521—565
Goodman, M. (ed. ) . 1982. Macromolecular Sequences in Systematic and Evolutionary Biology.
Plenum, New York. |
Hillis, D. M. and C. Moritz (eds. ) . 1990. Molecular Systematics. Sinauer Associates, Sunderland.
MA. _
Margulis, L. 1981. Symbiosis in Cell Evolution. Freeman, San Francisco.
~ Nei, M. 1987. Molecular Evolutionary Genetics. Columbia University Press, New York.
Sneath, P. H. A. and R. R. Sokal. 1973. Numerical Taxonomy. Fréeman, San Francisco.
Woese, C. R. 1987. Bacterial evolution. Microbiol. Rev. 51: 221—227.
e 82
a ’ = wees veep 4
6 由 基因 重复 和 外 显 子 混 匀 造 成 的 进化
最 先 注意 到 基因 重复 在 进化 中 的 重要 性 的 是 霍 尔 丹 (Haldane,1932) 和 马 勒 (Muller,1935)。 他 们
认为 ,一 个 基因 的 多 余 复 本 也 许 能 发 生 引起 岐 化 的 突变 ,因而 最 终 将 会 以 一 个 新 基因 的 形式 出 现 。 大
BF (Ohno,1970) 以 分 子 的 .生物 化 学 的 和 细胞 学 的 证 据 为 赁 ,把 这 种 看 法 引 向 了 极端 ,主张 基因 重复
是 唯一 能 引起 新 基因 产生 的 途径 。 虽 然 ,现在 已 经 知道 还 有 一 些 别 的 产生 新 功能 的 方式 ( 见 第 95-96
页 ) ,但 大 野 的 观点 在 很 大 程度 上 还 是 成 立 的 。
断裂 基因 的 发 现 启 发 了 吉尔 伯 特 (Gilbert,1978) ,于 是 他 提出 ,内 含 子 间 的 重组 为 基因 间 外 显 子
序列 交换 提供 了 一 种 机 制 . 已 经 发 现 的 许多 这 类 外 显 子 交 换 的 例子 表明 ,这 种 机 制 在 真 核 生物 的 基因
以 出 现 新 功能 的 形式 进化 中 ,起 着 十 分 显著 的 作用 。
6.1 DNA 重复 的 类 型
— DNA 片段 的 拷贝 数 增 加 可 由 几 种 类 型 的 DNA 重复 (CDNA duplication) 所 引起 。 这 通常 根据
所 涉及 的 基因 组 区 域 的 幅度 来 分 类 。 已 经 知道 有 以 下 几 种 类 型 的 重复 :(1) 部 分 基因 重复 或 基因 内 重
(partial or internal gene duplication),(2) 全 基因 重复 (complete gene duplication) ) ,(3) 部 分 染色 体重
(partial chromosomal duplication)、,(4) 非 整数 倍 重复 或 染色 体重 复 (aneuploidy or chromosomal du-
plication), 和 (5) 多 倍 性 重复 或 基因 组 重复 (polyploidy or genome duplication) 。 前 4 种 类 型 又 称 区 域
性 重复 (regional duplication) ,因为 它们 影响 的 不 是 整个 单 倍 的 染色 体 组 .大 野 (Ohno,1970) 曾 极 力主
张 ,基因 组 重复 一 般 要 比 区 域 性 重复 更 为 重要 一 些 , 因 此 在 后 一 种 情况 下 , 结构 基因 的 调节 系统 可 能
只 有 部 分 发 生 了 重复 ,而 这 种 不 平衡 可 能 会 破坏 重复 基因 的 正常 功能 .然而 ,正如 以 下 所 讨论 的 ,区 域
性 重复 显然 在 进化 中 也 起 着 非常 重要 的 作用 。
DNA 重复 长 期 以 来 一 直 被 认为 是 造成 基因 组 大 小 进化 的 一 个 重要 因素 ( 见 Ohno,1970)。 特 别
地 ,全 基因 组 重复 或 它 的 某 一 主要 部 分 ,如 一 条 染色 体 的 重复 ,可 能 会 造成 基因 组 大 小 突然 而 极 大 的
增长 。 基 因 组 重复 事件 曾 在 各 种 不 同 的 生物 类 群 的 进化 中 反复 地 被 记录 到 ,而 在 植物 、 真 骨 鱼 类 和 两
栖 类 中 最 为 突出 。 造 成 基因 组 扩大 的 进化 途径 将 在 第 八 章 中 进行 讨论 。
6.2 域 和 外 显 子
一 个 蛋白 质 域 (domain) 是 蛋白 质 中 一 个 定义 明确 的 区 域 , 它 区 别 于 蛋白质 中 的 其 它 部 分 ,或 者 执
行 某 一 特殊 功能 ,如 与 基质 结合 ,或 者 构成 该 蛋白 质 内 的 一 个 稳定 、 紧 密 的 结构 单位 ,前 者 称 为 功能 域
(functional domain) , 后 者 则 称 结构 域 (structural domain ) 或 组 件 (module)(Go 和 Nosaka,1987)。 定
义 一 个 功能 域 的 边界 常常 是 很 困难 的 ,因为 在 许多 情况 下 功能 是 由 散布 在 整个 多 肽 里 的 氨基 酸 残 基
执行 的 。 另 一 方面 ,一 个 结构 组 件 则 是 由 一 段 连续 的 氨基 酸 片段 所 构成 的 。
在 考虑 产生 多 重 域 蛋白 质 的 可 能 进化 机 制 时 ,以 上 区 别 是 相当 重要 的 .如 果 一 个 功能 域 相当 于 一
个 组 件 ,那么 , 它 的 重复 将 会 增加 功能 片段 的 数目 .反之 ,如 果 功 能 是 由 散布 在 不 同 组 件 中 的 氨基 酸 残
基 执 行 的 , 则 一 个 组 件 重 复 所 造成 的 影响 也 许 从 功能 上 看 是 不 成 气候 的 。 在 许多 蛋白 质 中 看 到 的 内 部
重复 常常 对 应 于 结构 组 件 或 者 单 组 件 的 功能 域 (Barker 等 ,1978 ) 。
从 理论 上 讲 ,结构 域 和 外 显 子 在 基因 中 的 排列 间 也 许 能 设想 出 几 种 可 能 的 关系 (图 6 一 1)。 乡
(Go,1981) 发 现 ,在 许多 内 部 结构 域 划分 已 经 确定 的 球状 蛋白 质 中 ,基因 的 外 显 子 和 该 域 之 间或 多 或
e 83e
加 | 外 显 子 1 HEF2 HEF3 外 显 子 4
基因
蛋白 质
(b) 外 显 子 1 外 显 子 2 外 显 子 3 外 显 子 4
基因
ZE 蛋白 质
G 外 显 了 1 外 显 子 2
基因
(dj) BFL ”外 显 子 2 外 显 子 3 “外 显 子 4 外 显 子 5 外 显 子 6 -
基因
人 SEF1 ”外 显 子 2 ”外 显 子 3 HBTS HBTS
图 6 一 1 基因 中 外 显 子 的 排列 与 它 所 编码 的 蛋白 质 的 结构 域 之 间 的 可 能 关系 :(a) 每 一 外 显 子 正 好 对 应 于 一 个 结
构 域 ;(b) 仅 近似 地 对 应 ;(c) 一 个 外 显 子 为 两 个 或 更 多 的 域 编 码 ;(d) 一 个 结构 域 由 2 个 或 多 个 外 显 子 编码 ;和 (e) 外
显 子 和 域 之 间 不 对 应 。 该 蛋白 质 的 4 个 结构 域 用 不 同 的 矩形 块 ( 画 有 斜 条 纹 的 ,黑色 的 、 白 色 的 和 打上 点 的 ) 表 示 。
少 地 存在 着 精确 对 应 (图 6 一 la\b)。 在 某 几 个 例子 中 ,可 看 到 一 个 组 件 由 一 个 以 上 的 外 显 子 编码 的 现
象 图 (6 一 1d)。 在 她 的 研究 中 ,没有 发 现 一 个 蛋白 质 的 组 件 结构 与 其 基因 的 外 显 子 划分 间 完 全 不 二 臻
的 情况 \ 图 6 一 le)。 然 而 ,在 为 数 不 少 的 例子 中 , 却 可 以 看 到 儿 个 邻近 的 域 是 由 同一 个 外 显 子 编码 的
(图 6 一 lc)。 例 如 ,血红 蛋白 和 有 分 别 由 4 个 域 构成 ,而 它们 的 基因 却 只 分 别 由 3 个 外 显 子 所 组 成 ,
其 中 第 2 个 外 显 子 则 为 2 个 邻近 的 域 编码 。 乡 认为 ,由 于 两 个 外 显 子 间 的 内 含 子 丢失 ,结果 出 现 了 两
外 显 子 的 合并 。 事 实 上 ,存在 于 植物 中 的 同 源 蛋 白质 一 一 豆 血 红 和 蛋白, 其 基因 中 就 可 看 到 在 由 珠 蛋 白
的 域 结构 预测 的 位 置 处 (第 68 个 氨基 酸 之 后 ) 正 好 含有 一 个 额外 的 内 含 子 。 所 以 , 珠 蛋 白 基因 家 族 进
化 期 间 , 有 的 谱系 失去 了 一 些 或 者 全 部 内 含 子 (图 6 二 2)。
在 大 多 数 情 况 下 ,蛋白质 水 平 上 的 域 重复 常 指示 出 在 'DNA KE EMT EF ES. HUE
表明 外 显 子 重复 是 内 部 重复 的 最 重要 类 型 之 一 。 真 核 生 物 的 基因 一 般 由 许多 外 显 子 和 内 含 子 组 成 第,
一 章 六 而 相 邻 的 外 显 子 常常 是 等 同 的 或 相互 间 非 常 相似 的 。 这 些 事实 表明 ,现代 生物 中 许多 复合 基因
e。 8414。
Sao SaaS 人 ET 于 -二 -二
豆 血 红 蛋 白 基因 肌 红 蛋白 基因 冰 椎 动物 珠 蛋白 基因 He AeA
| 全 部 内 合子 丢失
中 心 内 含 子 丢失
祖先 珠 蛋 白 基 因
图 6 一 2 珠 蛋 自 基 因 进 化 期 间 的 内 含 子 丢失 。 原始 珠 蛋 白 基 因 有 3 个 内 含 子 和 4 个 外 显 子 。 豆 血红 有 蛋白 基因 保留
着 祖先 结构 ,而 其 他 谱系 则 至 少 丢 失 了 一 个 内 含 子 。 注 意 , 内 合子 并 未 按 比例 大 小 画 。 哺 乳 动物 ( 牛 ,人 ,小 鼠 , 猪 和
海 鹏 ) 的 肌 红 有 蛋白 基因 中 的 两 个 内 含 子 长 各 为 一 4800bp 和 一 3400bp, ,而 珠 蛋 白 和 豆 血 红 蛋 白 基 因 的 同 源 内 含 子 则
分 别 只 有 108 一 192bp 和 103 一 904bp 长 。 豆 血红 蛋白 基因 的 中 间 内 仿 子 为 99 一 234bp 长 (Blanchetot 等 ,1983) 。 珠
蛋白 的 资料 来 自 许 多 两 栖 类 , 岛 类 和 哺乳 类 。 豆 血红 蛋白 的 资料 来 自 3 种 豆 类 (Phaseolus vulgaris, Glycine max 和
Vicia faba) 。
是 通过 原始 基因 的 内 部 重复 和 随后 的 修饰 进化 而 来 的 。 这 类 原始 基因 假定 只 含 1 个 或 少数 几 个 外 显
子 , 且 只 能 执行 简单 的 生物 学 功能 (Li,1983) 。
6.3 域 重 复 和 基因 的 延长
对 真 核 生物 的 现 有 基因 的 勘测 表明 ,内 部 重复 在 进化 中 是 频繁 发 生 的 。 这 种 在 基因 大 小 上 的 增
加 ,或 基因 的 延长 (gene elongation) ,是 简单 基因 回复 合 基因 进化 中 最 重要 的 步骤 之 一 。 理论 上 基因 的
延长 也 可 通过 其 他 方式 发 生 .。 例 如 ,将 一 个 终止 密码 子 转变 成 一 个 有 意义 的 密码 子 的 突变 也 能 使 基因
延长 (第 一 章 )。 类 似 地 ,一 个 外 来 DNA 片段 插入 某 一 外 显 子 中 ,或 出 现 删 除 拼接 位 点 的 突变 ,也 能 得
到 同样 的 结果 。 不 过 ,这 类 分 子 变 化 大 多 数 将 破坏 延长 后 的 基因 的 功能 ,因为 加 进去 的 区 域 是 由 几乎
随机 排列 的 氨基 酸 所 构成 的 。 事 实 上 ,在 绝 大 多 数 情 况 下 ,这 类 分 子 变化 是 与 病理 学 表象 一 起 而 被 发
现 的 。 例 如 ,异常 血红 蛋白 恒 春 (Constant Spring) 和 Icaria 分 别 是 由 将 终止 密码 子 变 成 谷 氨 酰 胺 和 赖
氨 酸 的 突变 所 引起 的 。 由 于 这 种 突变 ,这 些 变异 型 的 w 链 上 增加 了 30 $A (Weatherall 和 Clegg,
1979)。 相 比 之 下 ,一 个 结构 域 的 重复 倾向 不 会 造成 这 类 问题 。 事 实 上 ,这 类 重复 有 时 甚至 能 加 强 新 产
生 的 蛋 自 质 的 功能 ,例如 ,增加 活性 位 点 的 数目 即 可 达到 这 一 点 。
所 以 ,进化 期 间 基 因 的 延长 看 来 主要 靠 域 的 重复 来 实现 。 在 下 节 中 ,我 们 将 给 出 一 个 基因 内 重复
的 例子 ,以 说 明 进 化 期 间 基 因 延 长 的 后 果 。
卵 类 粘 蛋白 基因
卵 类 粘 蛋 白 是 一 种 存在 于 鸟 类 的 卵 白 中 的 蛋白 质 , 它 能 抑制 一 种 催化 蛋白 质 分 解 的 胰 蛋 白 酶 的
活性 。 卵 类 粘 蛋 白 多 肽 可 被 划分 成 3 个 功能 域 (图 6 一 3)。 每 一 个 域 都 能 和 一 个 分 子 的 胰 蛋 和 白 酶 或 其
他 丝氨酸 类 蛋白酶 结合 。 为 这 3 个 功能 域 编 码 的 DNA 区 域 明 显 地 有 着 共同 的 进化 起 源 , 且 相互 间 由
内 含 子 所 隔 开 (Stein 等 ,1980)。 这 3 个 区 域 中 ,每 一 个 都 是 由 被 一 个 内 含 子 隔 断 的 两 个 外 显 子 所 构
成 , 且 这 两 个 外 显 子 间 不 表现 出 相似 。 于 是 , 卵 类 粘 蛋 白 基 因 看 来 是 由 一 个 原始 的 单 域 基因 经 两 次 内
部 重复 而 得 来 的 ,其 中 每 次 重复 都 涉及 两 个 邻近 的 外 显 子 。 由 于 域 I 和 工 相互 间 比 它 们 中 的 任 一 个 和
域 革 之 间 都 更 为 相似 ,所 以 它们 可 能 是 经 第 2 次 重复 而 得 到 的 ,而 域 正则 是 第 1 次 重复 的 产物 。
RBS i Sie tt
表 6 一 1 列 出 了 几 个 证 据 表 明 它 们 在 其 进 史 中 发 生 过 内 部 重复 的 基因 名 单 。 这 些 基 因 全
85。
相似 性 百分数
域 AEB BEM
I vs. I 46 66
II vs. II 30 42
I vs. II 33 50
图 6 一 3 分 尖 性 卵 类 粘 蛋 白 的 3 PAIR, PAMRRRKES MER K+ HMMA. A Stein F, (1980).
表 6 一 1 具有 内 部 域 重 复 的 蛋白 质
序 OB 蛋白 质 的 长 度 。 重复 的 长 度 重复 的 次 数 重复 的 百分比
免疫 球 蛋 白 E- 链 C 区 (人 ) 423 108 4 100
免疫 球 蛋白 7Y- 链 C 区 (人 ) 329 108 3 98
血清 白 蛋白 (人 ) 584 195 3 100
小 白 蛋白 (人 ) 108 a5 2 72
蛋白 酶 抑制 因子 ,Bowman-Birk 型 (大 豆 ) 71 28 2 79
蛋白 酶 抑制 因子 , 颌 下 腺 型 ( 吵 齿 类 ) 115 54 2 94
KAKA (Clostridium pasteurianum) 55 28 2 100
ii AF ES FE IR COA) 790 79 5 50
钙 依 赖 性 调节 蛋白 (人 ) 148 74 2 100
原 肌 球 蛋白 < 链 ( 人 ) 284 42 7 100
A Barker 4 (1978)
a 氨基 酸 残 基数 。b. 由 重复 顺序 占据 的 部 分 占 蛋 白质 总 长 的 百分比 。
. 86 .
都 涉及 一 个 或 多 个 域 重 复 ,而 其 中 有 些 序列 则 是 由 一 个 原始 序列 经 多 次 重复 而 得 到 的 ,结果 使 这 种 重
复 性 结构 占据 了 整个 蛋白 质 的 长 度 。 在 这 些 例 子 中 ,每 一 例 的 重复 事件 都 可 从 和 蛋白质 或 DNA 顺序 的
类 似 而 轻易 地 推测 出 来 .也 许 还 有 许多 别 的 复合 基因 也 是 经 基因 内 重复 而 进化 的 ,但 它们 的 重复 区 域
相互 间 可 能 已 分 岐 到 这 样 一 种 程度 ,以 致 它们 间 的 顺序 同 源 性 已 经 不 能 被 辨认 出 来 了 。 在 某 些 情 况
下 ,如 免疫 球 蛋 白 基因 的 恒定 区 和 可 变 区 ,我 们 可 以 通过 比较 这 些 域 的 二 级 结构 来 推测 其 共同 祖先 ,
因为 二 级 结构 有 比 氨 基 酸 顺序 更 强 的 保守 性 .所 以 ,蛋白 质 中 的 内 部 重复 极 有 可 能 比 经 验 数据 所 指示
的 更 多 地 普遍 地 存在 着 。
6.4 基因 家 族 的 形成 与 新 功能 的 获得
一 次 全 基因 重复 产生 两 个 等 同 的 拷贝 。 它们 将 如 何 进化 则 会 因 情 况 而 异 。 例 如 ,这 些 拷 贝 可 能 保
留 其 原始 功能 ,从 而 使 该 生物 产生 更 多 的 某 种 RNA 或 蛋白 质 。 此 外 ,其 中 一 个 拷贝 可 能 会 因 一 次 有
害 突变 而 丧失 能 力 , 从 而 变 成 一 个 无 功能 的 假 基 因 ( 见 第 89 页 )。 然 而 ,更 重要 的 是 ,基因 重复 可 能 会
导致 产生 遗传 新 型 或 新 基因 的 结果 。 如 果 重 复 中 一 个 拷贝 保留 其 原始 功能 ,而 另 一 个 则 累积 分 子 变
化 ,以 致 于 最 终 变 得 能 执行 完全 不 同 的 功能 ,那么 ,产生 遗传 新 型 或 新 基因 的 情况 就 会 出 现 了 。
重复 的 基因 可 以 分 成 两 类 :变异 的 重复 和 不 变 的 重复 。 不 变 的 重复 (invariant repeats) 相 互 间 在 顺
序 上 是 等 同 的 或 近似 地 等 同 的 。 在 有 些 情 况 下 表明 ,等 同 顺序 的 重复 与 某 一 基因 产物 的 增 量 合成 有
关 , 该 产物 则 是 生物 的 正常 功能 所 必需 的 。 这 样 的 重复 称 为 剂量 重复 (dose repetitions) 。 无 论 何 时 出 现
需 产 生 大 量 特别 的 RNA 或 蛋白 质 产物 的 代谢 需要 ,剂量 重复 就 会 十 分 普遍 的 出 现 (Ohno,1970)。 代
表 性 的 例子 有 :执行 翻译 功能 不 可 缺少 的 rRNA 的 基因 和 tRNA 的 基因 ,以 及 染色 体 首要 结构 蛋白 ,
组 蛋白 的 基因 ,因此 必须 被 大 量 地 合成 。
变异 的 重复 (variant repeats) 由 一 个 基因 的 多 拷贝 所 构成 ,虽然 这 些 找 贝 相 互 类 似 , 但 在 其 顺序 方
面 却 或 多 或 少 地 有 一 定 程 度 的 差异 。 有 趣 的 是 ,变异 的 重复 有 时 能 执行 显然 不 同 的 功能 。 例 如 ,在 血
液 凝结 过 程 中 起 裂解 血 纤 蛋 白 原作 用 的 凝血 酶 ,和 消化 性 酶 胰 蛋 白 酶 ,都 是 源 自 一 个 原始 基因 的 重
复 。 类 似 地 , 乳 清 蛋白 ,催化 乳糖 合成 的 酶 的 一 个 亚 基 , 和 通过 裂解 某 些 细菌 细胞 壁 中 的 多 糖 成 份 来 溶
解 它们 的 溶菌 酶 ,在 谱系 上 是 相关 的 。 功 能 上 的 分 化 通常 需要 大 量 的 替换 。 不 过 ,在 某 些 情况 下 ,一 个
新 的 功能 有 可 能 在 数目 相对 较 小 的 替换 之 后 产生 (例如 , 见 Betz 等 ,1974) 。
在 一 个 基因 组 中 属于 某 一 群 重复 顺序 的 所 有 基因 , 合 起 来 被 称 为 一 个 基因 家 族 (gene family ) 或
多 基因 家 族 Cmultigene family) 。 一 个 基因 家 族 的 成 员 通 常 位 于 同一 染色 体 上 相互 间 极 靠近 的 地 方 。 在
某 些 情况 下 ,一 些 功能 性 的 或 非 功 能 性 的 家 族 成 员 可 能 会 位 于 别 的 染色 体 上 。
当 重 复 基因 在 功能 或 顺序 上 变 得 相互 间 差 异 很 大 时 ,再 把 它们 归 成 同一 基因 家 族 也 许 就 不 合适
了 。 戴 霍 夫 (Dayhoff,1978) 造 了 一 个 词 : 超 家 族 (superfamily) 来 描绘 关系 密切 和 关系 朴 远 的 蛋白 质 间
的 联系 。 据 此 ,在 氨基 酸 水 平 上 相互 至 少 展示 出 50% 相 似 性 的 蛋白 质 , 可 以 被 看 成 是 一 个 家 族 的 成
员 ; 而 当 同 源 蛋 白质 展示 出 的 相似 性 小 于 50% 时 则 被 看 成 是 一 个 超 家 族 的 成 员 。 例如 ,a 一 珠 蛋白 和
一 珠 蛋 白 被 分 类 在 两 个 不 同 的 家 族 中 ,而 它们 和 肌 红 蛋白 一 起 则 构成 了 珠 蛋 白 超 家 族 ( 见 第 99 页 ) 。
然而 ,这 两 术语 并 不 总 是 能 按 戴 霍 夫 的 标准 来 严格 地 应 用 的 。 例 如 ,人 和 鲁 的 w 珠 蛋 白 链 仅 展现 出
46 听 的 顺序 相似 性 ,这 就 低 于 为 归于 同一 基因 家 族 所 划 的 界限 。 为 此 缘故 ,将 蛋白 质 归 类 成 家 族 和 超
家 族 , 不 仅 要 根据 顺序 的 相似 性 ,而 且 还 要 考虑 关于 功能 类 似 性 或 组 织 特异 性 等 方面 的 辅助 证 据 才 能
决定 。
基因 家 族 内 的 基因 数 变化 极 大 。 有 些 基 因 仅 在 基因 组 内 重复 几 次 ,它们 被 称 为 轻 度 重复 (lowly
repetitive) 。 另 一 些 则 可 能 在 基因 组 中 上 百 次 地 重复 ,因而 被 称 为 是 高 度 重 复 的 (highly repetitive) 。 在
以 下 几 节 中 ,rRNA 和 tRNA 基因 将 被 作为 例子 ,以 说 明 高 度 重 复 的 不 变 基因 。 轻 度 重复 的 基因 将 由
同 功 酶 和 色 敏 感 的 色素 蛋白 基因 作 代表 。
确定 RNA 的 基因
表 6 一 2 列 出 了 几 种 有 机 体 的 rRNA 和 tRNA 基因 的 数目 .哺乳 动物 的 线粒体 基因 组 只 含有 一 个
§/ ©
拷贝 的 12SrRNA 基因 和 一 个 拷贝 的 16SrRNA 基因 。 这 对 线粒体 翻译 系统 来 说 显然 是 足够 了 ,因为
其 基因 组 仅 含 13 个 为 蛋白 质 编码 的 基因 (第 四 章 )。 枝 原 体 是 最 小 的 自我 复制 的 原核 生物 , 它 含 有 两
组 rRNA 基因 。 大 肠 杆菌 的 基因 组 大 小 是 它 的 4 一 5 倍 , 含 有 7 组 rRNA 基因 。 酵 母 中 TRNA 基因 的
数目 大 约 是 140.2 PAA THR AMW EK. MM Xenopus laevis 有 比 人 更 大 的 基因 组 和 更 多 的
rRNA 基因 。 所 以 ,rRNA 基因 的 数目 与 基因 组 大 小 间 存 在 着 很 强 的 正 相 关 。 这 一 规则 对 tRNA 基因
( 表 6 一 2) 和 其 他 确定 RNA 的 基因 来 说 也 是 成 立 的 。
表 6 一 2 各 种 有 机 体 中 每 单 倍 体 基因 组 的 rRNA 和 tRNA 基因 数
rRNA 基因 的 tRNA 基因 组 的
基因 组 来 源
数目 基因 的 数目 近似 大 小 (bp)
人 线粒体 1 22 137 104
枝 原 体 Mycoplasma capricolum 2 ND» 11.08
KBHE E. coli ia ~100 4X 108
酵母 Saccharomyces cerevisiae ; ~140 320—400 5107
果 蝇 D. melanogaster 130—250 HT 5 Que > 2X108 4
人 ~ 300 ~1300 3x 109
IN WE Xenopus laevis 400—600 ~7800 8X 10°
A Li(1983)
a. 对 于 rRNA 基因 ,该 值 指 整 个 rRNA 基因 组 的 数 。
b. ND=X#.
ny Be BS HY SE, 2 rRNA 基因 ,一 般 相 互 间 是 非常 相似 的 。 造 成 这 种 同 源 性 的 一 个 因素 可 能 是
纯洁 化 选择 ,因为 这 些 基 因应 该 遵守 非常 特殊 的 功能 和 结构 要 求 。 然 而 , 同 源 性 常常 会 延伸 到 没有 任
何 功 能 意义 的 区 域 , 而 这 类 同 源 性 的 维持 就 需要 求助 于 别 的 机 制 ( 见 第 99 页 ) 了 。
fe] Tp ais
除了 不 变 的 重复 以 外 ,高 等 生物 的 基因 组 还 含有 许多 其 成 员 相 互 间 已 发 生 不 同 程度 岐 化 的 多 基
因 家族 . 其 中 最 能 说 明 问题 的 例子 是 为 同 功 酶 编码 的 基因 家 族 , 象 乳酸 脱 氢 酶 、 醛 缩 酶 . 肌 酸 激酶 和 两
酮 酸 激 酶 等 。 同 功 酶 (isozymes) 是 催化 同样 的 生化 反应 、 但 在 组 织 特异 性 .生长 调控 .电泳 移动 性 或 生
化 特性 等 方面 相互 间 可 能 有 差别 的 一 类 酶 。 注 意 , 同 功 酶 是 由 不 同 的 基因 座位 ,通常 是 重复 后 的 基因
来 编码 的 ,这 与 异型 酶 (allozymes) 不 同 , 后 者 是 由 同一 个 基因 座位 上 的 不 同等 位 基因 编码 的 、 某 种 酶
的 不 同形 式 。
让 我 们 来 考虑 为 兰 椎 动物 中 乳酸 脱 氢 酶 (LDH) 的 A 和 了 B 亚 基 编 码 的 两 个 基因 。 这 两 种 亚 基 可 形
成 5 种 四 聚 体 同 功 酶 :Ai,A:B,A:B,,AB: 和 了 B,, 所 有 这 些 酶 都 可 在 氧化 态 辅酶 ,尼克 酰胺 腺 味 叭 二 核
音 酸 (NAD+) 的 存在 下 催化 将 乳酸 转变 成 丙酮 酸 的 反应 ,或 在 还 原 态 辅酶 (NADH) 的 存在 下 催化 相
反方 向 的 反应 。 曾 经 有 人 提出 ,LDH 一 B, 和 另外 一 些 富 含 B 亚 基 的 同 功 酶 对 NAD+* 有 较 高 的 亲 和 人 性,
它们 在 一 些 行 有 氧 代谢 的 组 织 如 心脏 中 ,行使 着 真正 的 使 乳酸 脱氧 酶 的 功能 ,而 LDH 一 A, 和 另 一 些
富 含 A 亚 基 的 同 功 酶 则 对 NADH 有 较 高 的 亲 和 性 ,所 以 ,它们 在 一 些 无 氧 代谢 的 组 织 如 骨骼 肌 里 ,
被 特别 地 安排 作为 丙酮 酸 还 原 酶 而 起 作用 (Everse 和 Kaplan,1975;Nadal-Ginard 和 Markert,1975).
图 6 一 和 展示 了 心脏 中 产生 的 LDH 的 发 育 次 序 。 我 们 看 到 ,心脏 存在 的 环境 越 是 厌 氧 ,特别 是 在 怀孕
的 早期 阶段 , 则 富 含 A 亚 基 的 LDH 同 功 酶 所 占 的 比例 就 越 高 。 于 是 ,这 两 个 重复 基因 已 对 不 同 的 组
织 和 不 同 的 发 育 阶 段 发 生 了 特 化 。 因 为 这 两 种 亚 基 存在 于 几乎 所 有 曾 做 过 年 代 测 定 研究 的 兰 椎 动物
中 ,所 以 ,产生 LDH--A 1 LDH—B 的 基因 重复 可 能 发 生 在 养 椎 动物 进化 的 早期 阶段 之 前 或 期 间 。
LDH 的 一 个 有 趣 特 性 是 ,这 两 个 亚 基 能 形成 异 源 多 聚 体 , 从 而 进一步 增加 了 该 酶 的 生理 学 功能 多 样
性 。
° 88 °
§
i
i
:
1
= igi er 3 人 PaCn er eos om,
— Oo oo oo mm
OO aa tae | OO 88
LDH-2 DO OO 8e@e fe He
OO OO 8 a6 a 面
LDH-3 OO @@ 0680 @@ OO
OO 丁力 | ae Pig
‘ipyns OO @@ @@ Oo 二
OO O88 OB oe i. Coe
rps OG deGew--O O
é a | Gs ian | @ Maat i vhs alli ed a
-9 -5 -1 +12 +21 成 年
图 6 一 4 心脏 中 5 种 乳酸 脱 氢 酶 (CDHJ) 同 功 酶 的 发 育 次 序 。 负 数 和 正 数 分 别 表示 出 生前 、 后 的 天 数 。 方 块 表示 B 亚
基 、 圆 圈 表 示 A 亚 基 。 被 涂 黑 了 的 图 形 表 示 在 数量 上 占 优 势 的 形式 。 注 意 在 个 体 发 育 期 间 从 A LABQBLAHHK
移 。 资 料 取 自 Markert 和 Vrsprung(1971).
色 敏 感 色素 蛋白
人 、 狼 和 古 世 界 猴 具 有 3 种 色 敏 感 色素 蛋白 。 蓝 色素 由 一 个 常 染 色 体 基因 编码 ,而 红色 素 和 绿色
素 则 各 由 一 个 X- 连 锁 基 因 编 码 (Nathans 等 ,1986)。 红 和 绿色 素 的 氨基 酸 顺 序 有 UKESAN ME
们 与 蓝 色 素 的 相似 性 却 只 有 43% 。 蓝 色素 基因 和 绿 、 红 色素 基因 的 祖先 在 大 约 5 亿 年 前 发 生 分 岐 。 相
比 之 下 , 红 和 绿色 素 间 的 紧密 连锁 和 高 度 的 同 源 性 指出 ,它们 来 源 于 非常 近期 的 基因 重复 。 因 为 新 世
界 猴 只 有 一 个 X- 连 锁 的 色素 基因 ,而 古 世 界 猴 和 人 则 有 2 个 或 多 个 色素 基因 ,所 以 可 以 假定 ,重复 发
AERA 3500 一 4000 万 年 以 前 \ 古 世界 猴 与 新 世界 猴 分 岐 以 后 的 祖先 中 。 作 为 该 重复 的 结果 ,人 、 猿
和 十 世界 猴 能 分 辨 3 种 颜色 ( 即 它们 是 三 色 性 的 ) ,而 新 世界 猴 , 如 松鼠 猴 , 则 只 能 对 蓝 与 绿 或 蓝 与 红
加 以 区 别 ,但 不 能 对 绿 与 红 加 以 区 别 ( 即 它们 是 二 色 性 的 )。
有 趣 的 是 ,两 个 X- 连 锁 的 等 位 基因 呈 杂 合 状 态 的 雌性 松鼠 猴 是 三 色 性 的 (Jacobs 和 Neitz,1986) 。
另 一 方面 ,只 携带 一 条 X 染色 体 的 雄 体 则 从 未 获得 过 三 色 性 视觉 。 于 是 ,在 人 和 古 世 界 猴 的 场合 ,三
色 性 视觉 是 通过 类 似 于 同 功 酶 的 机 制 ( 即 ,两 个 有 区 别 的 蛋白 质 由 不 同 的 基因 座位 编码 ) 而 获得 的 ,而
杂 合 体 峻 性 松鼠 猴 达到 同样 目的 , 则 是 通过 应 用 两 种 异型 酶 ( 即 , 同 一 基因 座位 上 两 个 不 同 的 等 位 基
因 形 式 ) 来 实现 的 (图 6 一 5)。 如 果 三 色 性 视觉 能 给 予 其 携带 者 以 选择 优势 ,那么 ,新 世界 猴 的 一 基因
座位 上 的 两 个 色 敏 感 等 位 基因 的 长 期 维持 ,可 能 是 通过 一 种 超 显 性 选择 形式 来 实现 的 (第 二 章 )。
6.5 重复 基因 的 无 功能 化
多余 的 重复 基因 更 可 能 是 变 成 无 功能 基因 、 而 不 是 进化 成 一 个 新 基因 ,因为 有 害 突变 远 比 有 利 突
变 发 生得 频繁 。 一 个 重复 基因 的 无 功能 化 即 产生 一 个 假 基因 。 这 样 产生 的 假 基因 称 未 加 工 的 (unpro-
cessed) 假 基因 ,这 与 将 在 第 七 章 中 讨论 的 经 过 加 工 的 假 基因 相反 。 表 6 一 3 列 出 了 在 几 种 珠 蛋 白 假 基
因 中 发 现 的 结构 缺陷 .这些 未 加 工 的 假 基因 大 多 数 含有 多 重 缺 陷 , 象 阅读 框架 移动 成熟 终止 前 终止、
和 拼接 位 点 或 调控 位 点 的 删除 等 ,以 至 很 难看 出 哪 种 突变 是 使 基因 沉默 的 直接 原因 。 在 有 几 个 例子
里 ,也 许 能 找到 “元 凶 ”。 例 如 ,人 的 由 只 含有 一 个 严重 缺陷 ,无 义 突变 ,所 以 它 可 能 是 无 功能 化 的 直接
原因 。 (符号 小 用 来 将 假 基因 与 其 有 功能 的 对 应 物 加 以 区 别 .) 有 些 假 基因 , 象 在 山羊 B 一 珠 蛋 白 多 基
因 家 族 中 的 PB 和 灿 ', 则 是 由 一 个 预先 存在 的 假 基因 重复 而 得 来 的 。
.89 。
X 染色 体 BREE 视觉
————= een ////////// 1/71 sam a
gx ——=—= 一 zz 三 名 性
人 —=—_ -一 CA 一 三 色 性
{LLL
一 [一 -一 CT 一 局
9 新 世界 猴 纯 合 子 上 aa 二 色 性
or
a -一 CT 一 二 色 性
一 LLIB
— 一 DZ 一 bs
9 新 世界 猴 杂 合子 ae zz
—___+— 一 CA 克 一 =
Ga 新 世界 猴 一 色 性
or
一 一 二 二 ES 一 一 2ZZZZDZ 罗 一
ZL 二 色 性
图 6 一 5 人 和 新 世界 猴 (NWM) 的 雄性 和 雌性 中 ,三 色 性 视觉 的 分 子 基础 。 注 意 , 雄 性 新 世界 猴 不 能 获得 三 色 性 视
觉 。 涂 黑 了 的 、 空 心 的 和 画 斜 线 的 矩形 分 别 表示 绿 、 红 和 蓝 色 素 基 因 。
表 6 一 3 珠 蛋 和 白 假 基因 中 的 缺陷 ”
阅读 框架 MAKI REG 拼接 GT/ 改变 了 的 终 SRR Ma
假 基因 TATA 起 始 密码 子
移动 前 终止 AER AGM 止 密码 子 ”号 AATAAA
人 gal 十 十 十 十 十 十 十
A 9 +
小 鼠 a3 十 在 十 十
小 鼠 pad + -
小 山 ph3 ? "4 + oF + + ?
we ge + + + + + + +
山羊 op" 二 十 十 十 十 7
免 gp2 十 十 十 十
A Li(1983)
a\ 加 号 表示 存在 一 种 特别 类 型 的 缺陷 ;问号 表示 有 存在 该 缺陷 的 可 能 性 。
6.6 基因 重复 的 年 代 测 定
两 个 基因 ,如 果 它 们 是 从 一 次 重复 事件 中 得 来 的 则 称 为 平行 相关 的 (paralogous) ,如 果 它 们 是 从
一 次 物种 形成 事件 中 得 来 的 则 称 为 垂直 相关 的 (orthologous) 。 例 如 在 图 6 一 6 中 ,基因 ao 和 有 B 是 从 一 个
祖先 基因 的 重复 中 得 到 的 ,因而 是 平行 相关 的 ,而 来 自 物种 1 的 基因 MRA WH 2 的 基因 w 则 是 垂
. 直 相 关 的 ,来 自 物 种 1 的 B 基 因 和 来 自 物 种 2 的 B 基 因 间 的 关系 也 是 如 此 。
如 果 我 们 知道 基因 c 和 基因 有 B 中 的 替换 速率 , 则 我 们 即 可 从 序列 资料 中 估 出 重复 的 年 代 , 即 To.
而 替换 速率 则 可 根据 垂直 相关 的 基因 间 的 替换 数 ,结合 有 关 物 种 1 和 物种 2 间 分 岐 时 间 Ts 的 知识
(图 6 一 6) 来 佑 出 。 下 面 我 们 将 说 明 Tp 的 估 值 是 怎样 得 到 的 。
。90 。
et ET 全 =
L@ bx 8 |
分 开
EEC
物种 1 物种 2
图 6 一 6 用 来 估计 一 个 基因 重复 事件 的 时 间 (Tp) 的 模型 。a 和 有 B 这 两 个 基因 来 自 Tp 单位 时 间 以 前 一 个 祖先 物种
中 发 生 的 重复 事件 。 后 来 该 物种 分 裂 成 两 个 物种 ,1 和 2, 这 发生 在 Ts 时 间 单 位 以 前 。 在 物种 1 和 物种 2 中 的 两 个
a 基 因 是 重 直 相关 的 ,两 个 B 基 因 也 是 如 此 ,但 wa 基 因 和 B 基 因 间 则 是 平行 相关 的 。
对 于 基因 KK. 为 这 两 个 物种 间 的 每 位 点 替换 数 。 那 么 ,在 基因 ax 中 的 替换 速率 则 由
Rik«
TS
来 估计 。 在 基因 有 B 中 的 替换 速率 ,rs 可 用 同样 方式 得 到 。 这 两 个 基因 的 平均 替换 速率 则 为 :
we
(6. 1)
lat TR
CSE. (6. 2)
—
为 了 估 出 Te, 我 们 需要 知道 基因 和 有 间 的 每 位 点 替换 数 (K。)。 这 个 数 可 从 以 下 4 个 对 子 的 比较 中
得 到 :(1) 来 自 物种 1 的 基因 c 和 来 自 物 种 2 的 基因 8B,(2) 来 自 物 种 2 的 基因 xc 和 来 自 物 种 1 的 基因
B, 3) 来自 物种 1 的 两 个 基因 ,(4) 来 自 物 种 2 的 两 个 基因 。 从 这 4 个 估 值 我 们 能 算出 Kot FH
(Ke) ,进而 我 们 能 估 出 To 为 :
Tp = 300
~260
150 - 200
100 - 140
40 - 80(?)
40 = 50 ~35
ae
™
hi G A
肌 红 蛋白 1 yal 91 y + 5 B
aaa SO
a RIK RIK
图 6 一 8 人 的 珠 蛋 白 基 因 的 进化 史 . 虚线 表示 一 个 假 基因 谱系 。 图 中 只 标 出 了 两 个 G 一 珠 蛋白 基因 中 的 一 个 ,因为
它们 相互 间 发 生 分 岐 的 年 代 还 未 确定 : -
在 4000 万 年 前 (Dayhoff ,1972;Efstratiadis 等 ,1980) ,但 最 近 DNA 顺序 资料 表明 , 它 可 能 早 于 真 兽 类
的 辐射 , 即 在 约 8000 万 年 前 出 现 (Hardison 和 Margot,1984;Goodman 等 ,1984)。 从 以 上 讨论 中 我 们
注意 到 ,在 两 个 家 族 中 ,基因 间 分 岐 时 间 与 基因 间 功 能 或 调节 方面 的 分 岐 程度 之 间 ,存在 着 明显 的 相
Bt
6.8 Fh it FIBA
有 两 类 外 显 子 混 匀 (exon shuffling) :外 显 子 重复 和 外 显 子 搬入。 外 显 子 重复 指 一 个 基因 中 的 一 个
或 多 个 外 显 子 的 重复 ,所 以 它 是 一 种 内 部 重复 ,这 已 在 基因 的 延伸 一 节 中 讨论 过 ( 见 第 81 页 )。 外 显 子
反 入 是 这 样 一 种 过 程 ,通过 该 过 程 结 构 域 或 功能 域 在 蛋白 质 之 间 发 生 交换 ,或 者 被 插 人 一 个 蛋白 质 之
中 。 这 两 类 混 匀 都 曾 在 产生 新 基因 的 进化 过 程 中 被 采用 。 这 里 ,我们 将 讨论 一 个 外 显 子 从 一 个 基 因
插 人 另 一 个 基因 ,结果 产生 镶 府 或 嵌 合 蛋白 质 的 情况 (Doolittle,1985;Patthy,1985) 。
Rik SAR
第 一 个 被 发 现 的 灸 谋 蛋 白质 是 组 织 血 纤 蛋 白 溶 酶 原 活 化 因子 (TPA)( 图 6 一 9)。 血 纤 蛋 白 溶 酶 原
经 TPA 作用 转化 成 它 的 活化 形式 : 血 纤 蛋白 溶 酶 ,后 者 则 将 血 纤 蛋白 、. 血块 中 的 一 种 可 溶性 的 纤维
状 蛋 白质 溶解 。 在 底 物 血 纤 蛋白 的 存在 下 , 血 纤 蛋白 溶 酶 原 转化 成 血 纤 蛋 白 溶 酶 的 过 程 将 被 大 大 加
速 。 血 纤 蛋 白 能 与 血 纤 蛋 白 溶 酶 原 和 TPA 两 者 结合 ,从 而 将 它们 联系 起 来 而 起 催化 作用 。 这 种 分 子
排列 方式 允许 血 纤 蛋白 溶 酶 仅 以 非常 接近 血 纤 蛋白 的 形式 产生 ,从 而 给 予 血 纤 蛋 白 溶 酶 原 以 对 血 纤
蛋白 的 特异 性 。 相 比 之 下 , 尿 激 酶 (UK) ,一 种 尿 液 中 的 血 纤 蛋 白 溶 酶 原 活化 因子 , 则 缺乏 血 纤 蛋 白 特
异性 。 对 TPA 和 UK 的 前 体 尿 激 酶 原 的 氨基 酸 顺 序 比 较 表 明 ,TPA 在 其 氨基 末端 含有 43 个 残 基 序
Fi, im UK 中 却 没有 相应 的 对 应 物 (Banyai 等 ,1983) 。 这 一 片段 能 形成 一 种 手指 样 结构 (图 6 一 9a) ,而
它 和 另 一 种 蛋白 质 的 与 血 纤 蛋白 亲 合 性 有 关 的 指 状 域 是 同 源 的 。 后 一 种 蛋白 质 是 一 种 存在 于 血浆 中
© 93.
组 织 血 纤 蛋 白 溶 酶
原 活 化 因子
FAT
尿 激酶 oa
(a) Af AS
BE If Be UR
OR ant
tr 364 Re
(b) EG K K
TPA
GE K .
puK ZZ.
ro. - Pet- “Eee F Fee + 8
ae Wo W SH. Pee A—{ HH
G CGE Gs SCENE
EGFP
图 6 一 9 (a) 组 织 血 纤 蛋白 溶 酶 原 活 化 因子 (TPA) 与 其 他 涉及 血液 凝结 和 血 纤 蛋白 溶解 的 蛋白 质 中 观察 到 的 各 种
结构 组 件 。 方 框 插图 显示 了 非 蛋 白 酶 区 域 中 组 件 的 结构 : 氏 , 纽 结 杆 状 组 件 ;G, 生 长 因子 组 件 ; 下 , 指 状 组 件 ;C RR
RAK 的 钙 结 合 组 件 。 画 有 斜 线 的 杆 状 图 形 表 示 与 胰 有 蛋白 酶 同 源 的 蛋白 酶 区 域 。 自 Patthy(1985) 修 改 而 成 。
(b) 通 过 外 显 子 插入 组 织 血 纤 蛋 白 溶 酶 原 活化 因子 (TPA) 和 有 蛋白质 而 获得 的 组 件 的 起 源 。pPUK , 尿 激 酶 原 ,EGFP, 表
皮 生 长 因子 前 体 ;FN , 纤 粘 连 有 蛋白 (fibronectin ) 。
或 细胞 表面 上 的 起 促进 细胞 粘着 作用 的 大 分 子 糖 蛋白 称 纤 粘 连 和 蛋白 (EN)( 图 6 一 9b)。 若 指 状 域 片
段 缺 失 会 导 至 TPA 的 血 纤 蛋白 亲 合 性 丧失 。TPA 与 EN 的 同 源 性 限制 在 这 种 指 状 域内 。 所 以 ,外 显
子 混 匀 必定 是 与 TPA M FN 或 某 一 类 似 蛋 白质 那里 获得 该 域 的 事件 有 关 的 。
TPA 还 含有 一 个 与 表皮 生长 因子 (EGF) 和 另 一 些 蛋 白质 的 类 生长 因子 区 域 同 源 的 片段 。 另 一 些
蛋白 质 是 指 象 因子 KK 和 因子 X 之 类 的 蛋白 质 , 它 们 是 在 血液 凝结 过 程 中 促使 血液 结 块 的 酶 。 此 外 ,
TPA 的 羧基 端 区 域 与 胰 蛋 白 酶 和 其 他 胰 和 蛋白酶 样 的 丝氨酸 蛋白 酶 的 酶 蛋白 部 分 同 源 ,这 些 酶 都 起 着
将 蛋白 质 水 解 成 多 肽 片段 的 作用 。 最 后 ,TPA 的 非 酶 蛋白 部 分 含有 两 个 类 似 于 血 纤 蛋白 溶 酶 原 的 纽
结 杆 (Kringle) 的 结构 。( 一 个 纽 结 杆 是 一 个 富 含 半 胱 氨 酸 的 序列 ,序列 中 含有 3 个 内 部 二 硫 桥 并 形成
一 种 有 点 象 丹 麦 蛋 糕 的 纽 结 杆 状 结构 ,这 种 丹麦 蛋糕 的 名 字 是 (Kringle)。 所 以 ,在 TPA 的 进化 期 间 ,
它 至 少 从 其 他 3 个 基因 : 血 纤 蛋白 溶 酶 原 , 表 皮 生 长 因子 和 纤 粘 连 蛋 白 那里 ,夺取 了 至 少 4 个 DNA
片段 (图 6 一 9b)。 而 且 , 这 些 得 来 的 单位 的 连结 处 和 外 显 子 与 内 含 子 间 的 边界 精确 地 一 致 ,于 是 ,就 使
得 关于 外 显 子 事实 上 曾 从 一 个 基因 转移 到 另 一 个 基因 的 想法 更 加 可 信 。 有 关外 显 子 混 匀 的 更 多 例子 ,
可 见 Doolittle(1985) 和 Patthy(1985) 。
外 显 子 混 匀 上 的 相位 限制
为 了 使 一 个 插入 某 一 基因 的 内 含 子 中 的 外 显 子 不 至 于 引起 阅读 框 如 上 的 框架 移动 ,接受 基因 时
的 相位 限制 就 必须 遵守 。 为 了 把 这 种 限制 搞 清楚 ,让 我 们 根据 内 含 子 相对 于 编码 区 的 可 能 位 置 来 将
内 合子 归于 不 同 的 类 型 。 位 于 两 编码 区 之 间 的 内 含 子 , 根 据 编码 区 被 打 断 的 方式 可 被 分 成 3 种 类 型 。
WAAR SEAS HES Zi MERA AM 0 的 内 含 子 ; 如 果 它 位 于 一 个 密码 子 的 第 1 和 第 2
TERR MERAH I 1; 如 果 它 位 于 一 个 密码 子 的 第 2 和 第 3 个 核 苷 酸 之 间 , 则 它 具 有 相位 2
e。 94。
人 外 显 子 类 型
相位 0 相位 0 ay
(c) 3 om 1 2 * 3
相位 0 相位 2 区
图 6 一 10 ASH AFH LF HK 。 外 显 子 用 和 矩形 块 表 示 。 外 显 子 一 内 含 子 连结 处 上 的 数字 指示 外 显 子 的 最
后 一 个 核 苦 酸 的 密码 子 位 置 ,内 含 子 一 外 显 子 连结 处 上 的 数字 则 指示 外 显 子 的 第 一 个 核 音 酸 的 密码 子 位 置 .9 种 可
能 的 外 显 子 类 型 中 只 有 3 种 在 图 中 表示 出 来 了 。
”,(b) 1
(c) 1 3
图 6 一 11 HktFMAASTHER. BHR ERE RI TMRER BA. (a)—Ph0-1 不 对 称 外 显 子 插入 一
个 相位 一 0 内 含 子 ;(b) 一 个 0 一 0 对 称 外 显 子 插 入 一 个 相位 一 1 内 含 子 ;(c) 一 个 0 一 0 对 称 外 显 子 插入 一 个 相位 一
0 内 含 子 。(a) 和 (b) 中 的 插入 为 不 成 功 的 插入 。
〈 图 6 一 10)。 外 显 子 则 根据 其 两 侧 的 内 含 子 而 组 合 归 类 。 例 如 ,图 6 一 10b 中 处 在 中 间 的 外 显 子 ,其 5
端 与 相位 一 0 内 含 子 相 邻 , 其 3' 端 与 相位 一 1 内 含 子 相 邻 ,因而 说 它 是 0 一 1 类 型 。 两 端 由 同样 相位 的
内 含 子 包 围 的 外 显 子 称 为 对 称 的 外 显 子 (symmetrical exon) ,否则 即 为 非 对 称 的 (asymmetrical) 。 例
如 ,图 6 一 10a 中 处 在 中 间 的 外 显 子 是 对 称 的 。 在 9 种 可 能 的 外 显 子 类 型 中 ,3 种 是 对 称 的 (0 一 0,1 一 1
和 2 一 2),6 种 是 非 对 称 的 。
只 有 对 称 的 外 显 子 才能 被 插 和 人 内 含 子 中 。 例如 ,图 6 一 11a 中 ,一 个 0 一 1 外 显 子 插入 一 个 相位 一 0
内 含 子 ,结果 造成 后 面 所 有 外 显 子 的 阅读 框架 移动 。 而 且 , 对 称 外 显 子 的 插 人 也 是 有 限制 的 ;一 个 0 一
0 外 显 子 只 能 插入 相位 为 0 的 内 含 子 ,类 似 地 ,一 个 1 一 1 外 显 子 只 能 插 和 人 相位 为 1 的 内 含 子 ,一 个 2
一 2 外 显 子 也 只 能 插 和 人 相位 为 2 的 内 含 子 , 以 图 6 一 llb 的 情况 为 例 , 一 个 0 一 0 外 显 子 插入 了 一 个 相
位 为 1 的 内 含 子 ,结果 造成 被 插入 外 显 子 和 在 它 3' 端 侧 所 有 外 显 子 的 阅读 框架 移动 。 图 6 一 1lc 则 显
示 ,一 个 0 一 0 外 显 子 插 入 一 个 相位 为 0 的 内 含 子 之 中 将 不 会 引起 阅读 框架 移动 。
6.9 产生 新 功能 的 变通 途径
除了 基因 重复 和 外 显 子 混 匀 以 外 ,还 有 许多 别 的 产生 新 基因 或 新 多 肽 的 机 制 。 以 下 将 考虑 3 种 这
FF AY BL iil 。
重奏 基因
已 经 发 现 , 一 个 DNA 片段 能 通过 用 不 同 阅读 框架 来 为 一 个 以 上 的 基因 编码 。 这 一 现象 在 病毒 、
细胞 器 和 细菌 中 普遍 存在 。 图 6 一 12a 展示 了 一 个 单 链 DNA MP A OX174 的 遗传 图 。 其 中 已 观察 到
LAH RA. ign 基因 也 整个 地 被 包含 在 基因 A DAME K 在 5 端 与 基因 A 重奏 ,在 3' 端 与
基因 C 重 友 。 后 一 情况 的 更 详细 分 析 于 图 6 一 12b 给 出 。
2 个 DNA 序列 的 两 条 互补 链 而 产生 。 wi iu. 人 线粒体 基因 组 中 ,确定 tR-
NA 和 tRNAcn 的 基因 分 别 位 于 不 同 的 链 上 ,并 且 它 们 之 间 有 一 个 3 一 核 昔 酸 重 到 ,前 者 中 读 成 纪 一
CTA 一 3' ,后 者 中 读 成 5 —TAG—3’ (Anderson 等 ,1981) 。
间 题 是 ,在 进化 期 间 重奏 基因 可 能 是 怎样 产生 的 呢 ? 为 了 回答 这 一 问题 ,我 们 注意 到 ,开放 阅读 杠
架 在 整个 基因 组 中 大 量 存在 .因此 ,相当 长 度 的 潜在 编码 区 存在 于 已 有 基因 的 不 同 阅读 框架 中 或 互补
链 上 ,这 是 完全 可 能 的 。 因 为 64 种 可 能 的 密码 子 中 只 有 3 种 是 终止 密码 子 , 所 以 ,即使 一 个 随机 的
(a) 4 (8 DNA 合成 的 起 始 )
壳 形 成 )
KSA
; ) K -(?)
状 蛋白 ) 和
c (DNA 成 熟 )
D (外壳 形 成 )
E (Lysin) (7 #)
( 主 外 壳 钉
状 蛋白 ) (DNA 凝 缩 时 的 内 部 蛋白 )
F
( 主 外 壳 蛋 白 )
(b)
K 蛋白 : M SS RK: Ld UL EL a re
See oS DUES RN Yi TT A. ne
.C 蛋白 :
DNA FFF] =: TCTGATGAGTCGAAAAATTATCTTGATAAAGCAGGAATTACTACTGCTTGTTTACGAATT ~
K&A: No uR? SG WU is ALLS FRR ot P Tee Sr) A ee
ARG. : Ky cS. ky Well Aes Goi |
CHa : Wenereete > LS L Ra a
DNA JF] : AAATCGAAGTGGACTGCTGGCGGAAAATGAGAAAATTCGACCTATCCTTGCGCAGCTCGAG
cea: PLS ee fo Pe VK N
AA:
CEH: 5 S Y F AST F SR ee GL hUcSlCKCUWT:CU#D” A
DNA FEA) =: © AGCTCTTACTTTGCGACCTTTCGCCATCAACTAACGATTCTGTCAAAAACTGACGCGTTG
图 6 一 12 OX174 噬菌体 单 链 环 状 DNA 图 。 注 意 , 为 B 蛋 白质 编码 的 基因 (黑色 ) 被 完全 包含 在 为 A 有 蛋白质 编 码 的
基因 内 ,而 基因 开 则 与 两 个 基因 A 和 C 重 登 。 自 Kornberg(1982) 修 改 而 成 。(b) 显 示 出 与 基因 A 的 5 部 分 和 基因
CHS 部 分 重 三 的 K 基因 的 顺序 。 星 号 表示 终止 密码 子 。( 关 于 氨基 酸 的 单字 母 缩写 见 表 1 一 1)。
。96 。
DNA 顺序 也 可 能 含有 成 百 个 核 苷 酸 长 度 的 开放 阅读 框架 .如果 碰巧 这 样 一 个 阅读 框架 中 含有 一 个 起
始 密码 子 和 一 个 转录 起 始 位 点 ,或 者 通过 突变 产生 了 这 些 位 点 ,那么 ,一 条 额外 的 mRNA 就 将 会 被 转
录 出 来 ,并 随后 被 翻译 成 一 个 新 蛋白 质 。 这 一 新 产物 是 否 有 有 利 功能 那 就 是 另 一 回 事 了 ,但 如 果 它 确
有 , 则 这 种 性 状 就 可 能 会 在 群体 中 固定 。
我 们 也 注意 到 ,为 重 秋 基 因 编 码 的 DNA 区 段 上 的 进化 速率 ,预期 要 低 于 只 用 一 种 阅读 框架 的 类
似 DNA 序列 。 其 原因 是 ,在 重 至 基因 中 非 简 并 位 点 的 比例 要 高 于 非 重 友基 因 中 的 同类 比例 ,这 就 大
大 降低 了 同 义 突变 在 总 突变 中 的 比例 (Miyata 和 Yasunaga,1978).
变通 性 的 拼接
原始 RNA 转录 产物 的 变通 性 拼接 ,可 能 会 造成 从 同一 个 DNA 片段 产生 不 同 多 肽 产物 的 结果 。
在 这 种 情况 下 ,外 显 子 和 内 含 子 间 的 界限 就 不 再 是 绝对 的 了 ,而 是 有 赖 于 所 涉及 的 mRNA。 许 多
RNA 变通 性 加 工 的 例子 已 在 多 细胞 生物 中 被 发 现 。
变通 性 拼接 常 被 用 作 生 长 调节 的 手段 。 在 涉及 果 蝇 D. melanogaster 的 性 别 决定 过 程 的 几 个 基因
中 , 曾 看 到 一 种 非常 有 趣 的 情形 。 至 少 有 3 个 基因 :性 致死 基因 (Szl)、 转 化 基因 (tra) 和 倍 性 基因
(dsz) ,在 雄性 和 峻 性 中 是 以 不 同 的 方式 进行 拼接 的 (图 6 一 13)。 在 dsrz 的 情况 中 ,该 基因 有 6 个 外 显
F SBF 1.2.3 和 4 用 于 雌性 ,而 外 显 子 1.2.3、5 和 6 则 用 于 雄性 。 在 Sol 和 cra 的 情况 下 ,雄性 中
变通 性 拼接 的 产物 含有 成 熟 前 终止 密码 子 , 因 而 是 无 功能 的 。 例 如 ,Szl 的 外 显 子 3 中 含有 一 个 框架
内 的 终止 密码 子 . 但 雌性 的 mRNA 却 不 含 这 种 外 显 子 。
HEHE 前 -mRNA 雄性
mRNA 拼接 sxl 拼接 mRNA
1] 2[4]5]6]7| 8 一 一 4t-—{5 67H 8] 一 一 本
终止
tra
3 4 [2] 3 4] a aS Ae
终止
dsx
Pr] “2-[3[ 4] | fi] 2 [3] 5 | 6 |
图 6 一 13 R# D. melanogaster #2 (A) Fo BEA) P KIRA (Sz), 转化 基因 (ira) 和 售 性 基因 (dsz) 的 拼
接 模 式 。“ 人 停止? 指示 一 个 终止 密码 子 , 它 截断 成 误 mRNA 的 编码 区 ,从 而 造成 产物 无 功能 。 自 Baker(1989) 。
变通 性 拼接 的 一 个 特例 可 用 由 内 含 子 编码 的 蛋白 质 的 例子 来 加 以 说 明 (Perlman 和 Butow,
1989) 。 在 这 类 例子 中 ,该 内 含 子 含 有 一 个 开放 阅读 框架 , 它 为 功能 完全 不 同 于 其 两 侧 外 显 子 所 编码 的
蛋 自 质 的 某 种 蛋白 质 全 部 或 其 一 部 分 编码 .在 有 些 情 况 下 ,这 类 开放 阅读 框架 是 其 上 游 外 显 子 的 延伸
物 ,例如 ,酵母 线粒体 基因 cor | 中 的 内 含 子 al4a( 图 6 一 14a) 。 在 另 一 些 情况 下 ,内 含 子 不 仅 包 括 一 个
游离 态 的 编码 蛋白 质 的 基因 ,而且 还 含有 关于 转录 起 始 和 终止 的 必要 信和 号 (图 6 一 14b)。 内 含 子 al4a
十 分 有 趣 ,因为 它 为 一 种 被 称 为 成 熟 酶 的 酶 蛋白 编码 。 成 熟 酶 对 这 个 内 含 子 从 它 的 前 体 mRNA 上 准
确 地 自我 拼接 去 除 是 必要 的 。 这 种 成 熟 酶 在 DNA 重组 中 还 起 着 内 切 核酸 酶 的 作用 。
要 出 现 变通 性 拼接 的 进化 ,就 需要 重新 产生 一 个 变通 性 拼接 的 联结 位 点 。 因 为 拼接 信和 号 通常 长 为
5 一 10 个 核 苷 酸 ,所 以 通过 突变 这 类 位 点 以 一 种 可 以 查 觉 的 频率 产生 是 有 可 能 的 。 事 实 上 ,从 文献 中
知道 已 有 许多 这 样 的 例子 。 例 如 ,图 6 一 15 所 示 的 例子 中 ,甘氨酸 密码 子 中 的 一 次 同 义 蔡 换 即 把 茶 一
编码 区 变 成 了 拼接 部 位 。 在 图 6 一 15 关于 有 和 #- 地 中 海 贫血 症 的 病理 学 查证 的 例子 中 ,新 的 拼接 位 点 通
常 比 老 的 拼接 位 点 更 强 ( 即 ,该 突变 发 生 后 合成 的 mRNA 大 多 数 为 已 发 生 改 变 的 那 种 类 型 )。 这 样 的
突变 显然 具有 有 害 的 后 果 ,预期 绝 不 会 在 群体 中 固定 。 然 而 ,如 果 新 产生 的 拼接 位 点 要 弱 得 多 , 则 大 多
° 97»
(a) 5 bone party yf
(b) 57 3’
图 6 一 14 内 含 子 为 蛋白 质 编码 的 例子 :(a) 一 个 开放 阅读 框架 ( 画 有 斜 条 纹 ), 它 是 上 游 外 显 子 (空心 矩形 块 ) 的 一
个 延伸 物 (例如 , 酶 母线 粒 体 基因 cor 工 中 的 内 含 子 al4a);(b) 一 个 游离 存在 的 开放 阅读 框架 ,其 转录 起 始 和 终止
信号 位 于 内 含 子 之 中 (例如 ,噬菌体 T4 P sumY RAHAST). KARA Perlman 和 Butow(1989) 。
CaccTGact 寻常 应 有 的 拼接
CAGGTTGGT
时 GIT GGT GGT GAG, GEG, GTC .G6C, AG. cTcen
B- 珠 蛋白 基因 Wes)
Val Gly Gly Glu Ala Leu Gly Arg
ASF
B+ -地 中 海 贫 血 症 基因 GTT GGA GGT GAG GCC GTG GGC AG GTTGGT
人
GAGGTGAGG
@eeoeoeoe ee
寻常 应 有 的 拼接 = RAGGTRACT 、
图 6 一 15 来 自 正 常 个 体 和 吉日 -地 中 海 贫血 症 的 病人 的 8- 珠 蛋 白 基 因 中 ,外 显 子 1 和 内 含 子 工 间 区 域 的 核 昔 酸
顺序 。 发 生 了 突变 的 核 昔 酸 以 黑体 字 表 示 。 箭 头 指示 拼接 位 点 。 每 个 拼接 部 位 都 与 寻常 应 有 的 拼接 部 位 进行 顺序
比较 , 园 点 表示 这 些 拼接 部 位 与 寻常 应 有 的 拼接 部 位 间 有 相同 的 核 苦 酸 。
数 mRNA 将 是 原始 类 型 , 上 且 只 有 少量 的 新 型 mRNA 产生 出 来 。 这 样 的 改变 将 不 会 抹杀 旧 功 能 ,也 为
产生 一 种 具有 新 功能 的 有 用 的 蛋白 质 创 造 了 一 个 机 会 。
基因 分 享
从 产生 新 功能 的 观点 看 , 当 一 个 基因 产物 不 作 任何 氨基 酸 顺 序 方面 的 改变 而 用 来 行使 另外 的 功
能 时 ,一 种 令 人 极 感 兴趣 的 情形 就 出 现 了 。 这 一 现象 曾 被 命名 为 "基因 分 享 ”"( "gene sharing”) (Piatig-
orsky 等 ,1988)。 基 因 分 享 的 意思 是 ,一 个 基因 在 没有 重复 也 没有 失去 原始 功能 的 情况 下 获得 了 并 保
持 着 第 二 种 功能 .不 过 ,基因 分 享 可 能 会 要 求 在 组 织 特异 性 或 发 育 时 序 性 的 调节 系统 方面 发 生 一 点 变
化 。
基因 分 享 最 初 在 晶状体 中 发 现 , 这 里 晶状体 是 构成 眼睛 的 水 晶体 赖 以 维持 透明 和 适当 的 光线 折
射 的 物质 。 最 初 的 发 现 是 ,来 自 乌 类 和 鲍 类 的 皇 晶 状 体 在 氨基 酸 顺 序 上 与 乳酸 盐 脱 氢 酶 BILLDH 一 B4,
见 第 84 页 ) 等 同 ,上 且 具 有 同样 的 LDH 活性 (Wistow 等 ,1987) 。 后 来 的 工作 表明 ,这 “两 种 ”蛋白 质 事实
上 是 同一 种 蛋白 质 , 而 且 是 由 同样 的 基因 来 编码 的 (Hendriks 等 ,1988)。 第 二 种 晶状体 8 存在 于 所 有
鸟 类 和 疏 行 类 之 中 ,也 已 被 证 明 在 顺序 方面 与 另 一 种 酶 等 同 。 这 种 酶 即 精 氨 琥 珀 酸 裂解 酶 , 它 催化 将
精 氨 焉 珀 酸 转 化 成 精 氨 酸 的 反应 。 这 两 个 蛋白 质 好 象 也 是 由 同样 的 基因 编码 的 (Piatigorsky 等 ,
1988) 。 类 似 地 ,七 鳃 鳗 , 真 骨 鱼 类 , 疏 行 类 和 鸟 类 中 的 r 一 晶状体 ,已 被 证 明 与 "一 烯 醇 酶 等 同 并 由 同
样 的 基因 编码 。co 一 烯 醇 酶 是 糖 酵 解 中 的 一 种 酶 ,将 2 一 磷酸 甘油 酸 转化 成 磷酸 烯 醇 式 丙酮 酸 (Piatig-
orsky 和 Wistow,1989)。 于 是 ,3 一 、 插 一 和 一 晶状体 的 例子 说 明 ,一 个 未 经 重复 的 基因 能 通过 基因
分 享 而 获得 额外 的 功能 。 另 一 方面 ,ac.8 和 7 晶状体 则 是 另 一 类 蛋白质 的 经 典 例子 ,这 类 蛋白质 通过
基因 重复 ,以 及 其 后 由 祖先 基因 分 化 成 为 不 同 蛋白 质 编码 的 基因 而 进化 (例如 , 热 震 惊 基因 ,为 暴露 于
过 热 环 境 后 才 表 达 的 蛋白 质 编码 ) 。
s ORs
~~
ba,“
"ae
EC 证 aa
基因 分 享 可 能 是 相当 普通 的 现象 。 事 实 上 ,在 以 上 例子 中 ,那些 酶 和 晶状体 自身 就 可 能 有 两 种 以
上 的 功能 。 例 如 ,r* 一 品 状 体 /% 一 烯 醇 酶 也 能 象 一 个 热 震 惊 蛋白 质 那样 起 作用 。 显 然 基因 分 享 增添 了 基
因 组 的 简洁 性 ,即使 在 真 核 生 物 中 简洁 性 看 来 并 没有 很 高 的 优越 性 (第 八 章 )。 还 要 注意 ,在 晶状体 基
因 分 享 的 例子 中 ,同一 个 多 肽 既 起 着 酶 的 作用 又 有 结构 蛋白 质 的 功能 ,这 就 搅乱 了 酶 和 非 酶 、 或 结构
和 蛋白质 之 间 的 传统 界限 。
6. 10 多 基因 家 族 的 协同 进化
从 十 九 世 纪 七 十 年 代 中 期 到 十 九 世纪 八 十 年 代 中 期 ,关于 DNA 重 退 火 和 DNA 杂交 的 研究 大 量
涌现 ,目的 在 于 探 明 真 核 生物 基因 组 的 结构 和 组 织 。 这 些 研究 揭示 , 较 高 等 生物 的 基因 组 是 由 高 度 重
复 顺序 .中 度 重复 顺序 和 单 拷贝 顺序 等 3 类 序列 所 构成 的 (第 八 章 )。 它 们 还 揭示 出 一 个 有 趣 的 进化 现
象 , 即 :一 个 重复 顺序 家 族 的 成 员 在 一 个 物种 内 相互 间 一 般 是 非常 相似 的 ,而 来 自 不 同 物种 的 该 家 族
的 成 员 ,即使 这 些 物种 间 亲 缘 关 系 很 近 , 相 互 间 也 可 能 是 很 不 一 样 的 。 这 一 现象 最 先 被 布 即 等 (Brown
等 ,1972) 查 觉 ,他 们 是 在 比较 来 自 非 洲 蟾 蜂 Xenopus laevis 和 X. borealis 的 核糖 体 DNA 时 发 现 的 ,后
— FP RB RR AB AT) BIRU AEX. mulleri,
在 Xenopus 38 BAK BS HA HED PE 18S 和 28S 核糖 体 RNA 的 基因 以 成 百 的 拷
贝 数 存在 着 , 且 以 一 列 或 几 个 串联 的 列 的 形式 排列 着 。 每 一 重复 单位 由 一 个 转录 片段 和 一 个 不 转录 片
段 构成 (图 6 一 16)。 转 录 片 段 产生 一 个 45S RNA 前 体 ,该 前 体 经 酶 切割 而 被 划分 成 有 功能 的 18S 和
28S 核糖 体 RNA。 这 种 转录 重复 片段 通过 不 转录 间隔 片段 (NTS) 而 相互 隔 开 。
在 对 X. laevis Fl X. borealis 间 的 核糖 体 RNA 基因 的 比较 中 ,布朗 等 (Brown 等 ,1972) 发 现 ,虽然
这 两 个 物种 的 18S 和 28S 基因 极为 相似 ,但 这 两 个 物种 间 的 NTS 区 域 却 大 不 相同 . 相 比 之 下 ,在 每 一
个 体内 以 及 一 个 物种 的 不 同 个 体 间 .该 NTS 区 域 则 是 非常 相似 的 。 于 是 ,看 起 来 好 象 是 这 样 一 种 情
Bi: BY NTS 区 域 在 不 同 物种 间 迅 速 分 岐 ,但 它们 在 每 一 物种 中 却 是 一 起 进化 的 .布朗 等 (Brown 等 ,
1972) 的 结论 是 ,一 定 有 一 种 “校正 ?机 制 在 起 作用 ,以 使 某 一 突变 从 一 个 间隔 顺序 传 向 邻近 的 间隔 顺
序 , 其 速度 快 于 在 这 些 顺序 中 出 现 新 的 变化 。 他 们 称 这 种 在 一 个 个 体内 显现 的 现象 为 水 平 进化 (hori
zontal evolution) , 以 用 来 与 垂直 进化 相对 照 。 垂 直 进 化 是 指 某 一 突变 在 一 个 繁殖 群体 中 的 传播 . 后来,
有 人 提出 了 并 发 进化 (coincidental evolution) 或 协同 进化 (concerted evolution) 等 等 术语 。 后 一 个 术语
由 齐 默 尔 等 (Zimmer 等 ,1980) 提 出 ,是 目前 文献 中 最 通用 的 术语 。
45S
图 6 一 16 #44 rRNA 基因 的 一 个 典型 重复 单位 的 图 解 表示 。 黑 色 杆 线 表 示 重 复 单 位 ,箭头 指示 转录 单位 。
ETS, 外 转录 间隔 ;ITS, 内 转录 间隔 ;NTS, 不 转录 间隔 。 自 Arnheim(1983).
随 着 限制 酶 分 析 和 DNA 顺序 测定 等 技术 的 出 现 ,已 有 大 量 资料 证 明 多 基因 家 族 中 协同 进化 的
普遍 性 ( 见 Ohta,1980;Dover,1982;Arnheim ,1983 等 综述 ) 。 图 6 一 17 展示 了 一 个 来 自 人 和 黑猩猩 核
糖 体 基因 的 限制 酶 分 析 的 例子 .人 类 中 ,每 一 重复 单位 在 28S 基因 3' 端 的 NTS K PA —4 Hoya | fh
点 , 而 在 黑猩猩 和 其 他 大 型 猿 类 中 则 缺少 这 一 位 点 。 该 瓦 pa I 位 点 很 有 可 能 是 在 人 一 猿 分 枝 之 后 而
在 人 谱系 中 产生 的 ,并 且 最 终 在 每 一 个 人 的 重复 中 固定 了 。NTS 区 中 其 他 限制 性 位 点 也 同 祥 展 示 出
物种 特异 的 同 源 性 。
协同 进化 本 质 上 意味 着 ,一 个 基因 家 族 的 某 个 成 员 并 不 是 与 该 家 族 的 其 他 成 员 剖 不 相干 地 进化
着 的 。 通 过 其 成 员 间 的 遗传 相互 作用 ,一 个 多 基因 家 族 是 以 协同 的 方式 , 象 一 个 整体 一 样 地 一 起 进化
,
299
人 黑猩猩
EcoRI Hindll Belll EcoRI Hind
185 vee ae
Poull Hpal Hindll Poull Poull
图 6 一 17 人 和 黑猩猩 18S 和 28S 核糖 体 基 因 中 的 限制 性 位 点 。 所 用 限制 酶 为 EcoR 1 ,Hind1 ,Puul ,Bglll ,和
末 paI 。 基 因 上 面 标 出 的 限制 位 点 在 物种 中 是 多 态 的 。 基 因 下 面 的 那些 位 点 则 是 单 态 的 。 个 三 角形 表示 NTS 中 长
。 度 上 的 多 态 性 。 自 Arnheim(1983) 修 改 而 成 。
协同 进化 的 机 制
不 等 价 交换 Cunequal crossing-over) 和 基因 转变 (gene conversion) (图 6 一 18) 近 来 被 认为 是 造成 协
(a) (b)
eee. ok etek ee 和 二
起 十
RPh ye pe rue te eu
6-18 (a) 不 等 价 交换 模型 和 (b) 基 因 转变 模型 。 不 等 价 交换 的 结果 是 ,两 条 子 染 色 体 都 出 现 了 重复 数 上 的 改变
和 两 种 重复 类 型 (其 中 一 种 用 星 号 标 出 ) 的 频率 上 的 改变 ,后 者 是 与 亲本 频率 (50% ) 相 比较 而 言 的 。 另 一 方面 ,基因
转变 则 仅 在 其 中 一 条 子 染 色 体 中 改变 两 类 重复 的 频率 ,而 且 对 两 条 染色 体 都 不 改变 它们 的 总 重复 数 。 自 Arnheim
(1983) 修 改 而 成 。
同 进化 的 两 个 最 重要 的 机 制 。 不 等 价 交换 可 以 发 生 在 生殖 细胞 减 数 分 裂 时 某 一 染色 体 的 两 条 姐妹 染
色 单 位 体 间 ,也 可 以 发 生 在 有 丝 分 裂 时 的 两 同 源 染色 体 间 。 一 个 交互 重组 的 过 程 就 是 在 一 条 染色 单 体
或 染色 体 中 产生 某 一 顺序 的 重复 ,而 在 另 一 条 中 则 造成 相应 的 缺失 .图 6 一 18a 展示 出 的 例子 中 ,一 次
不 等 价 交换 事件 导 至 一 条 子 染色 体 上 出 现 3 个 重复 段 的 增幅 ,而 在 另 一 条 上 则 出 现 3 个 重复 段 的 缺
失 。 这 种 不 等 价 交换 的 结果 是 ,两 个 子 染 色 体 都 变 得 比 它们 的 亲本 染色 体 更 为 同 源 化 。 如 果 这 种 过 程
反复 发 生 , 则 每 种 变异 型 重复 在 染色 体 上 的 数目 将 会 随时 间 而 波动 ,最 后 将 有 一 种 类 型 会 在 该 家 族 中
处 于 优势 . 图 6 一 19 是 一 个 假想 出 来 的 例子 ,其 中 类 型 一 4 基因 通过 反复 多 轮 的 不 等 价 交换 而 传 遍 了
某 一 个 基因 家 族 。 不 等 价 交换 曾 用 数学 方法 详细 研究 过 ,并 且 已 取得 了 相当 程度 的 实验 支持 ( 见 O-
hta,1980;Dover,1982;Li 等 ,1985a 等 综述 ) 。
基因 转变 是 一 种 非 交 互 重 组 的 过 程 , 在 此 过 程 中 两 个 序列 相互 作用 的 方式 为 ,其 中 一 个 被 另 一 个
转化 ( 见 Lewin,1990)。 从 协同 进化 过 程 的 观点 看 ,基因 转变 中 最 重要 的 类 型 是 非 等 位 基因 转变 ( 即 ,
位 于 不 同 基因 座位 的 基因 间 的 转变 ,而 不 是 不 同 的 等 位 基因 形式 间 的 转变 )。 图 6 一 18b 是 一 个 非 等 位
基因 转变 的 例子 ,其 中 野生 型 重复 中 有 两 个 转化 成 了 突变 型 。 结 果 ,第 一 条 子 染 色 体 变 得 比 亲 本 染色
体 更 为 同 源 些 ,而 在 第 二 条 子 染 色 体 中 却 未 发 生变 化 。 理 论 研究 表明 ,和 不 等 价 交换 一 样 , 基 因 转 变 也
能 产生 协同 进化 (Ohta,1984; Nagylaki, 1984) 。 基 因 转 变 曾 经 作为 7Y- 珠 蛋白 基因 (Jeffreys,1979;
Scott 等 ,1984) 和 另外 许多 基因 中 ( 见 Dover,1982) 出 现 同 源 化 的 机 制 而 提出 来 过 。
作为 一 种 协同 进化 的 机 制 , 基 因 转变 看 来 有 几 个 胜 过 不 等 价 交换 的 优点 。 首 先 , 不 等 价 交 换 使 一
个 家 族 中 的 重复 基因 的 数目 发 生 改 变 , 故 而 有 时 可 能 会 造成 严重 的 份量 不 平衡 。 基 因 转 变 则 相反 ,并
不 造成 基因 数目 改变 。 其 次 ,基因 转变 不 仅 能 对 串联 的 重复 、 而 且 能 对 分 散 的 重复 起 着 校正 机 制 的 作 -
用 。 相 比 之 下 ,不 等 价 交换 在 所 涉及 的 重复 散布 于 非 同 源 染 色 体 上 时 就 受到 了 限制 。 如 果 这 些 重复 基
。100 。
图 6 一 19 由 不 等 价 交换 导 至 的 协同 进化 。 不 等 价 交 换 事 件 反 复 循 环 使 得 每 一 染色 体 上 重复 基因 变 得 越 来 越 同 源
化 。 该 过 程 还 会 影响 每 一 染色 体 上 重复 顺序 的 数目 。 自 Ohta,(1980)。
因 位 于 染色 体 的 端 粒 部 位 (染色 体 臂 的 末端 ), 象 在 人 和 猿 的 rRNA 基因 中 的 情况 那样 ,或许 它 能 对
非 同 源 染 色 体 起 有 效 作 用 ;而 阁 分散 的 重复 位 于 染色 体 的 中 间 , 象 在 小 鼠 的 rRNA 基因 中 的 情况 那
样 , 则 它 将 受到 极 大 限制 (Arnheim,1983)。 如 果 这 些 重 复 散 布 在 一 条 染色 体 上 , 则 不 等 价 交换 可 能 会
导致 重复 段 间 基因 的 缺失 或 重复 这 样 的 结果 。 例 如 ,图 6 一 20 表示 两 重复 簇 间 不 等 价 交换 的 一 个 假想
重复 重复
图 6 一 20 涉及 散布 重复 (空心 矩形 块 ) 的 交换 。 画 有 针 条 纹 的 憩 形 块 表示 一 个 唯一 的 基因 。 该 交换 事件 后 ,这 一 基
因 在 一 条 染色 体 上 缺失 ,而 在 另 一 条 染色 体 上 则 重复 。
的 例子 ,结果 是 一 条 染色 体 中 某 一 唯一 基因 的 缺 失 , 而 在 另 一 条 染色 体 中 则 相应 地 重复 。 其 中 一 条 染
色 体 或 者 全 部 两 条 染色 体 ,可 能 会 对 携带 它们 的 生物 带 来 有 害 影 响 。 第 三 ,基因 转变 可 以 有 偏向 性 的
方向 。 来 自 真菌 的 实验 资料 已 经 表明 ,基因 转变 方向 上 的 倾斜 是 普遍 的 、 而 且 和 常常 是 强烈 的 (Lamb 和
Helmi, 1982) ,而 理论 研究 业已 证 明 , 轻 微 的 倾斜 就 可 能 对 重复 突变 的 固定 概率 有 很 大 影响 (Nagylaki
和 Petes,1982;Walsh,1985) 。
在 串 联 重复 顺序 的 大 家 族 中 ,不 等 价 交 换 可 能 象 基因 转变 一 样 是 一 个 可 接受 的 过 程 。 首 先 , 在 这
类 家 族 中 ,重复 的 数目 显然 能 极 大 地 波动 而 不 至 引起 显著 的 逆 效 应 。 这 是 从 以 下 观察 中 得 出 的 结论 :
© 10] *
果 蝇 中 确定 RNA 的 基因 的 数目 在 同一 物种 的 不 同 个体 间 ,以 及 不 同 物种 间 变 化 幅度 大 (Ritossa 等 ,
1966;Brown 和 Sugimoto,1973)。 在 人 类 中 ,已 发 现 几 个 串联 重复 的 家 族 , 它 们 在 拷贝 数 方面 展现 出
异乎 寻常 的 变化 程度 (Nakamura 等 ,1987》。 其 次 ,在 一 次 基因 转变 事件 中 ,通常 只 有 一 个 小 区 域 ( 异
源 双 链 区 ) 涉 及 ,而 在 不 等 价 交 换 中 ,染色 体 间 交换 的 重复 数 则 可 能 非常 大 。 显 然 , 交 换 的 重复 数 越 大 ,
协同 进化 的 速率 就 越 高 (Ohta,1983)。 在 有 些 情形 下 ,不 等 价 交换 的 这 一 优点 可 大 到 足以 与 基因 转变
的 优点 相 抗衡 。
除 不 等 价 交 换 和 基因 转变 之 外 ,还 有 一 些 其 他 机 制 , 象 复制 滑脱 和 转 座 ( 第 一 章 和 第 七 章 ), 也 能
造成 某 一 家 族 中 变异 型 基因 的 获得 或 丢失 (Dover,1982)。 最 后 ,应 注意 到 ,协同 进化 不 仅 要 求 突变 在
该 家 族 成 员 间 的 水 平 转移 ( 同 源 化 ) ,而 且 要 求 突变 向 群体 中 的 所 有 个 体 传播 (固定 )。 所 以 ,我 们 还 需
要 考虑 随机 遗传 潭 变 的 效应 。 多 费 (Dover,1982,1986) 对 在 DNA 转移 和 随机 遗传 漂 变 等 各 种 机 制 联
合作 用 下 ,多 基因 家 族 的 协同 进化 过 程 , 起 了 一 个 名 称 , 即 分 子 驱动 (molecular drive) 。
协同 进化 的 进化 论 含意
协同 进化 使 得 某 一 变异 型 重复 能 传 向 所 有 基因 家 族 的 成 员 。 这 种 水 平地 传播 的 能 力 有 着 深远 的
进化 后 果 , 因 为 这 样 一 来 ,一 个 有 利 突变 型 重复 就 能 替代 所 有 其 他 重复 而 在 该 家 族 中 固定 。 我 们 注意
到 ,单单 一 个 变异 型 所 能 给 予 生物 的 选择 优势 通常 是 很 有 限 的 。 然 而 ,如 果 该 突变 传 给 了 许多 甚至 所
有 成 员 的 话 , 则 这 种 优势 就 会 大 大 地 加 强 。 于 是 ,通过 协同 进化 ,一 个 较 小 的 选择 优势 可 以 变 成 较 大 的
选择 优势 。 在 这 方面 ,协同 进化 优 于 基因 家 族 各 个 成 员 的 独立 进化 ( 见 Arnheim, ,1983;Walsh,1985) 。
阿 恩 海 姆 (Arnheim ,1983) 曾 对 RNA 多 聚 酶 | 的 转录 调控 信号 和 RNA 多 聚 酶 工 的 转录 调控 信
号 的 进化 进行 过 比较 。RNA 多 聚 酶 I 只 转录 rRNA 基因 ,而 RNA 多 聚 酶 工 则 转录 所 有 为 蛋白 质 编
码 的 基因 (第 一 章 )。RNA 多 聚 酶 I 的 转录 调控 信号 的 进化 看 来 比 RNA 多 聚 酶 工 的 该 信号 的 进化 要
快 得 多 。 例 如 ,在 无 细胞 转录 系统 中 ,一 种 小 鼠 rRNA 克隆 不 能 在 人 的 细胞 提取 物 中 转录 ,但 来 自 差
异 极 明显 的 物种 的 蛋白 质 编码 基因 的 克隆 却 能 够 在 异 源 系统 中 转录 (例如 ,家 短 的 基因 在 人 的 细胞 提
取 物 中 ,和 哺乳 类 的 基因 在 酵母 的 提取 物 中 )。 阿 恩 海 姆 (Arnheim,1983) 认 为 ,在 关于 RNA SRB |
的 转录 单位 的 例子 中 ,倾向 于 影响 转录 起 始 的 那些 有 利 突变 , 因 协 同 进化 所 造成 的 后 果 可 能 已 传播 到
整个 rRNA 多 基因 家 族 。 与 之 不 同 的 是 ,在 关于 RNA 多 聚 酶 工 的 转录 单位 的 例子 中 ,在 任何 二 个 基
因 中 发 生 的 影响 转录 起 始 的 有 利 突变 ,预期 将 不 会 传 禹 所 有 基因 ,因为 它们 属于 许多 不 同 的 家 族 。
关于 新 基因 产生 的 传统 观点 是 , 先 发 生 一 次 基因 重复 事件 ,然后 该 重复 产生 的 两 个 基因 之 一 逐渐
分 化 而 变 成 一 个 新 基因 。 现 已 搞 清 ,该 过 程 可 能 不 象 以 前 所 假定 的 那样 简单 。 只 要 两 个 基因 分 岐 的 程
度 不 是 很 大 , 则 那个 发 生 分 化 的 拷贝 就 有 可 能 通过 不 等 价 交换 而 被 清除 ,或 者 通过 基因 转变 而 转化 成
保持 原样 的 拷贝 。 在 前 一 种 情况 下 , 它 需 要 再 发 生 一 次 重复 以 产生 一 个 新 的 多 余 拷 贝 ;而 在 后 一 种 情
况 下 则 必须 从 头 开始 分 化 。 所 以 ,重复 基因 的 岐 化 进程 可 能 比 传统 上 认为 的 要 慢 得 多 ,为 此 缘故 一 个
新 基因 从 某 一 多 余 拷 贝 中 产生 的 机 会 就 减少 了 。 另 一 方面 ,基因 转变 也 可 能 会 阻止 一 个 多 余 的 拷贝 长
时 期 地 成 为 无 功能 状态 ,或 者 也 许 能 有 选择 地 使 一 个 “ 死 基因 ”( 假 基因 ) 复 活 过 来 (Walsh,1987) 。
我 们 已 经 习惯 于 假定 ,在 一 次 基因 重复 之 后 ,两 个 随 之 而 来 的 基因 将 随时 间 单调 地 上 岐 化 着 。 在 这
样 的 假定 下 ,我 们 前 面 已 经 证 明 ,推测 重复 事件 的 时 间 是 相当 简单 的 。 例 如 ,人 B 一 和 8 一 珠 蛋 白 的 蛋
白质 顺序 相互 间 相 似 的 程度 比 与 兔 Bl 或 与 小 鼠 B 的 主要 和 次 要 顺序 的 要 高 (Dayhoff,1972)。 因 此 曾
有 过 这 样 的 推测 :人 的 这 两 个 基因 是 从 约 4000 万 年 以 前 的 一 次 重复 事件 中 衍生 而 来 的 ,这 个 时 间 远
在 哺乳 类 辐射 ( 约 8000 万 年 以 前 ) 之 后 。 考 虑 到 重复 基因 能 相互 较 正 这 样 一 个 事实 , 则 这 一 结论 就 可
能 是 错误 的 。 事 实 上 ,近来 已 经 有 人 提出 ,8 和》 基因 起 源 于 发 生 在 哺乳 类 辐射 之 前 的 一 次 重复
(Hardison 和 Margot,1984)。 该 提议 是 根据 这 样 的 观察 事实 而 作出 的 , 免 假 基因 灿 2 的 大 内 含 子 和 3’
不 翻译 区 与 人 的 8 的 相似 程度 比 与 免 Bl 的 高 ,小 鼠 的 假 基因 Bh3 相似 于 其 3 未 端 上 的 8。 如 果 这 一 候
说 结果 是 正确 的 , 则 以 上 例子 极 好 地 说 明了 ,基因 一 校正 事件 将 会 怎样 部 分 或 全 部 地 抹 擦 掉 重 复 基因
间 分 歧 进 化 的 历史 .在 大 的 多 基因 家 族 中 ,基因 一 校正 事件 预期 是 频频 发 生 的 ,在 这 种 情况 下 ,追踪 家
族 成 员 间 的 进化 关系 将 会 更 为 困难 。
。 102。
从 进化 论 的 观点 看 ,多 基因 家 族 的 进化 和 分 群体 的 进化 之 间 存 在 着 某 种 类 比 。 我 们 可 以 把 多 基因
家 族 中 的 每 一 种 重复 看 成 是 分 群体 中 的 一 种 同类 群 。 那 么 重复 间 信 息 的 传递 就 等 价 于 同类 群 间 基 因
或 个 体 的 迁移 。 众 所 周知 ,迁移 将 减少 两 同类 群 间 遗 传 差 异 的 量 , 但 会 增加 一 个 同类 群 中 的 遗传 变异
的 量 ( 例 如 等 位 基因 的 数目 )。 类 似 地 ,重复 间 的 信息 传递 将 会 减少 重复 间 的 遗传 差异 但 将 增加 某 一 基
因 座 位 上 的 遗传 变异 的 量 (Ohta,1983,1984;Nagylaki,1984)。 小 鼠 主 组 织 相 容 复 合体 中 某 些 基因 座
位 是 高 度 多 态 的 ,事实 上 ,已 观察 到 某 一 基因 座位 上 的 等 位 基因 数 多 达 50 个 .所 以 , 曾 有 人 提出 ,这 种
程度 较 高 的 多 态 性 是 由 基因 转变 所 造成 的 (例如 Weiss 等 ,1983; 但 可 参阅 Hughes 和 Nei,1989 ) 。
习题
1、 与 某 一 随机 选 出 的 DNA 片段 的 重复 相 比 ,外 显 子 重复 有 什么 优点 ?
2、 在 重 琵 基 因 中 , 简 并 位 点 的 数目 能 大 大 地 被 削减 。(a) 如 果 下 面 的 顺序 仅 按 第 1 个 阅读 框架 翻
译 , 那 么 将 有 多 少 非 简 并 位 点 ? 多 少 四 重 简 并 的 位 点 ? (b) 如 果 除 了 第 一 个 阅读 框架 外 ,该 顺序 也 按 第
2 个 阅读 框架 翻译 ,那么 将 有 多 少 非 简 并 位 点 和 四 重 简 并 位 点 ? 〈c) 如 果 3 个 阅读 框架 都 进行 翻译 , 那
么 该 顺序 中 的 非 简 并 位 点 和 四 重 简 并 位 点 将 是 多 少 ? 〈3 个 阅读 框架 的 起 始点 各 用 箭头 标 出 )。
CATTCGTCTTTATTCGAAATCGCGTGGACAGCGGTGGATCTCTTTGCGCTGTGCAAAGCAGCGCTGGCGGTT
2
3
3、\ 许 多 多 聚 体 蛋白 质 是 由 重复 基因 编码 的 亚 基 所 构成 。 有 两 种 可 能 情况 :(a) 这 些 亚 基 可 能 全 部
来 自 一 个 基因 座位 ,也 可 能 来 自 不 同 的 基因 座位 。 在 前 一 种 情况 下 该 蛋白 质 被 称 为 是 “ 同 质 型 的 ”, 而
后 一 种 情况 下 则 是 “ 异 质 型 的 "。 假 定 该 蛋白 质 象 乳酸 脱 氢 酶 (LLDH, 见 第 84 页 原版 ) 那 样 是 一 种 四 聚
体 酶 , 且 其 所 有 亚 基 由 两 个 基因 座位 编码 .那么 ,能 产生 多 少 种 不 同 的 同 功 酶 ?(b) 这 样 的 蛋白 质 常 常
是 异 质 型 的 ( 即 ,常常 是 由 不 同 基因 座位 产生 的 亚 基 所 构成 的 )。 例 如 ,哺乳 类 成 体 的 血红 蛋白 是 一 个
由 两 条 链 和 两 条 有 B 链 构成 的 四 聚 体 . 假 定 在 某 一 种 哺乳 动物 中 有 3 个 % 样 基因 座位 和 2 个 B 样 基因 座
位 。 那 么 ,如 果 每 一 个 四 聚 体 是 由 两 个 a 样 基因 座位 产生 的 亚 基 和 两 个 B 样 基因 座位 产生 的 亚 基 所 构
成 的 话 , 则 能 产生 多 少 不 同 的 异 质 型 四 聚 体 ?
4 在 大 鼠 和 小 鼠 的 基因 组 中 有 两 个 为 胰岛 素 编码 的 基因 (前 胰岛 素 原 工 和 I), 而 在 除 呈 齿 类 以
外 的 哺乳 动物 中 则 只 有 一 个 胰岛 素 基 因 。 前 胰岛 素 原 I 基因 被 认为 是 通过 一 个 上 所谓“ 反 录 转 座 “”( 第 七
章 ) 的 过 程 而 产生 的 。 前 胰岛 素 原 I 和 工 这 两 个 基因 都 在 5' 不 翻译 区 中 含有 一 个 小 内 含 子 (长 为 118 个
核 苷 酸 )。 大 鼠 和 小 鼠 中 的 内 含 子 对 子 间 , 核 苷 酸 差异 数 如 下 :
内 合子
内 含 子 小 鼠 1 小 鼠 I KA 1
yf 1 21
A fat I 15 25
AK fa 16 24 18
Ca) REE AY BCE aS 4 ly BT BE EDC BR) BE BL PY A) EDA A
进化 快 ,为 什么 ?(b) 假 定 核 苷 酸 替 换 的 速率 恒定 ,并 且 假 定 小 鼠 和 大 鼠 在 1500 万 年 前 发 生 分 岐 ,请 用
小 鼠 I 和 大 鼠 工 但 排除 小 鼠 工 ,来 估计 前 胰岛 素 原 1 和 工 间 的 分 岐 时 间 。
5、 在 以 下 顺序 的 内 含 子 (虚线 ) 中 插入 一 个 0 一 0 对 称 外 显 子 。 那 么 对 阅读 框架 而 言 将 会 发 生 什么 ?
如 果 插 入 一 个 2 一 2 对 称 外 显 子 会 发 生 什 么 呢 ? 如 果 插 入 一 个 不 对 称 外 显 子 又 会 发 生 什 么 ?
SCOTTCGITCT TTA TTC GAA ATC GCG 一 一 一 TGG ACA GCG GTG AAT CTC
TTT GAC GCT GTG—3’
6 ,为 什么 一 个 串联 重复 的 家 族 能 比 一 个 散布 重复 的 家 族 更 容易 经 历 协同 进化 ? 请 解释
« 103 。
后 继 阅读 文献
Cold Spring Harbor Symposium on Quantitative Biology. 1987. Evolution of Catalytic Function,
Vol. 52. Cold Spring Harbor Laboratory. Cold Spring Habor, NY.
Dayhoff, M. O. 1972. Atlas of Protein Sequence and Structure, Vol. 52. National Biomedical Re-
search Foundation, Silver Spring, MD. ) ,
Dover, G. A. and R. B. Flavell. (eds) . 1982. Genome Evolution, Academic Press, New Reales
Li, W. 一 H. 1983. Evolution of duplicate gene and pseudogene, pp 14—37. In M. Nei and R. K.
Koehn (eds. ) , Evolution of Genes and Protein. Sinauer Associates, Sunderland MA.
Ohno , S. 1970. Evolution by Gene Puplication, Springer-Verlag, Berlin. ;
Ohta, T. 1980. Evolution and Variation of M wegen Families. Springer- -Verlage, JR
oath, Le
«104 «
7 由 转 座 造成 的 进化
基因 组 曾经 被 认为 是 相当 静止 的 实体 ,在 其 中 可 以 给 基因 指定 一 个 界限 明确 的 基因 座位 。 因 此,
基因 被 想象 成 在 漫长 的 进化 时 期 里 一 直 停 留 在 它们 正好 所 处 的 染色 体位 置 上 。 当 芭 芭 拉 .麦克 林 托 克
(Barbara McClintock ) 在 十 九 世 纪 四 十 年 代 发 现 玉米 中 的 某 些 遗传 成 份 能 从 一 个 基因 组 座位 " 跳 到 ?”
另 一 个 上 ,不 时 地 改变 着 结构 基因 的 表达 时 ,基因 组 的 这 种 静态 图 景 开 始 崩 省。 然而 ,这 种 凝固 静止 的
图 景 在 科学 思想 界 中 已 积 习 难 改 , 以 至 于 人 们 花 了 近 40 年 的 时 间 才 认识 到 麦克 林 托 克 这 一 开创 性 发
现 的 意义 。 今 天 我 们 认识 到 ,基因 组 的 结构 组 织 比 以 前 所 想象 的 要 更 富 于 流动 性 ` 且 更 易于 发 生 进 化
变化 。 在 这 一 章 里 ,我 们 将 描述 大 量 有 助 于 遗传 物质 从 一 个 基因 组 处 位 向 另 一 个 处 位 运动 的 可 转 座 因
子 , 并 且 讨 论 这 类 因子 对 进化 过 程 可 能 会 产生 的 影响 。
7.1 转 座 与 反 录 转 座
转 座 (transposition ) 的 定义 是 ,遗传 物质 从 一 个 染色 体位 置 向 另 一 个 位 置 的 运动 。 具 有 能 改变 其
基因 组 位 置 这 种 内 在 光 能 的 DNA 序列 ,被 称 为 易 动 因子 (mobile elements) 或 可 转 座 因子 (transpos-
able elements) .根据 可 转 座 因 子 是 否 被 复制 来 区 分 , 则 有 两 种 类 型 的 转 座 。 在 保守 型 (conservative ) 转
座 中 ,该 因子 从 一 个 位 点 移 到 另 一 个 位 点 (图 7 一 la) , 供 体位 点 上 发 生 了 什么 则 不 清楚 .有 一 种 模型 提
tH, PEAR DNA 的 末端 不 是 相互 连结 的 ,因而 转 座 后 剩余 下 来 的 分 子 就 瓦解 了 。 然 而 ,如 果 细 胞 含有 该
供 体 序列 的 重复 , 则 该 供 体 DNA 种 即 可 避免 从 细胞 谱系 中 丢失 。 在 这 种 情况 下 ,虽然 消耗 了 一 个 拷
贝 ,但 另 一 个 却 幸 存 了 下 来 ,由 此 而 产生 的 谱系 将 在 原始 位 点 上 有 一 个 因子 ,而 在 新 位 点 上 有 第 2 个 因
子 (Berg 等 ,1984) 。 另 一 种 模型 提出 ,该 双 链 断裂 是 由 宿主 的 修复 系统 所 修复 的 。
在 复制 (型 )(replicative) 或 重复 (型 ) (duplicative) 转 座 中 ,可 转 座 因 子 被 拷贝 ,并且 其 中 一 个 拷贝
留 在 原 位 点 处 , 另 一 个 则 插入 一 个 新 位 点 中 (图 7 一 1b)。 所 以 ,复制 型 转 座 的 特征 是 可 转 座 因子 的 拷贝
数 的 增加 .有些 可 转 座 因子 只 采用 一 种 类 型 的 转 座 , 而 另 一 些 则 对 保守 型 和 复制 型 两 种 方式 全 采用 。
在 以 上 转 座 类 型 中 ,遗传 信息 由 DNA 所 携带 。 已 知 遗 传 信息 也 能 通过 RNA 而 转 座 。 在 这 种 模式
中 ,DNA 被 转录 成 RNA, 然 后 RNA 再 反 转 录 成 cDNA( 图 7 一 1C)。 为 了 将 这 两 种 模式 加 以 区 别 ,我 们
把 由 RNA 中 介 的 模式 称 为 反 录 转 座 (retroposition ) 。 转 座 与 反 录 转 座 都 曾 既 在 真 核 生物 中 又 在 原核
生物 中 发 现 ( 见 Weiner 等 ,1986;Temin,1989)。 与 由 DNA 中 介 的 转 座 相 比 , 反 录 转 座 总 是 复制 型 的 ,
因为 被 转 座 的 是 该 因子 的 反 转 录 拷 贝 , 而 不 是 该 因子 本 身 。
当 一 个 可 转 座 因 子 插入 一 个 宿主 基因 组 中 时 ,在 该 插入 位 点 处 的 一 小 段 宿 主 DNA( 通 常 为 4 一
12bp) 被 复制 (图 7 一 1)。 这 种 经 复制 的 重复 有 同一 取向 ,因而 被 称 为 顺 向 重复 (direct repeats) 。 这 是 转
座 和 反 录 转 座 的 特征 标记 。
有 些 可 转 座 因子 能 转 座 到 所 有 细胞 中 去 ;而 另 一 些 则 是 高 度 特异 的 。 例 如 , 果 蝇 DD. melanogaster
的 已 因子 通常 仅 在 生殖 细胞 中 是 易 动 的 。 转 座 的 接受 位 点 的 基因 组 位 置 在 不 同 可 转 座 因 子 中 也 表现
出 有 变异 。 有 些 因子 对 某 一 特别 的 基因 组 位 置 表 现 出 不 寻常 的 偏爱 。 例 如 ,7S4 总 是 精确 地 将 自己 控
人 到 大 肠 杆 菌 的 半 乳 糖苷 酶 操纵 子 中 的 同一 点 上 ,所 以 ,每 个 细菌 只 能 含有 一 个 拷贝 的 TS4(Klaer
等 ,1981) 。 另 外 一 些 , 象 噬菌体 Mw, 则 能 随机 地 转 座 到 几乎 任何 基因 组 位 置 上 。 许 多 可 转 座 因 子 则 表
现 出 中 等 程度 的 基因 组 位 置 偏向 性 。 例 如 , 玖 .coii 的 Tzl10 转 座 子 ,其 40 被 发 现 位 于 ac Z 基因 中 ,成
为 基因 组 的 精细 结构 部 分 ; 己 因 子 对 X 染色 体 有 亲 合 性 , 且 偏 向 于 插 人 从 5 端 靠 近 基 因 编 码 区 的 序列
中 ,而 不 是 编码 区 之 中 .有 些 可 转 座 因子 对 某 种 特别 的 核 苷 酸 组 成 展示 出 有 更 高 的 亲 合 性 .例如 ,Ts1
. 105
(a) 可 转 座 因子 =
Oe ree A Se 一 一 和 一 一
Ee Rs ? —_—_—_ — 本 一
供 体 接受 物 村
,
(b) 可 转 座 因 子 = .
oy A a a esd ee
| xm
EN
三 上 —S—_ YY
供 体 接受 物
(c) 可 转 座 因子 ca
ca, 一 一 -一 加 -一 一 一
| 二
eS WS |
| mas
2 SA
整合
—_ 二 -一 一
供 体 接受 物
图 7 一 1 (ay) 保 守 型 转 座 。 该 因子 从 供 体 位 点 转 座 到 靶 位 点 。 供 体位 点 处 发 生 了 什么 则 不 清楚 。 该 供 体 分 子 可 能 会
瓦解 ,这 对 于 具有 一 个 以 上 染色 体 找 贝 的 细菌 而 言 是 可 以 忍 受 的 。 另 一 种 可 能 性 是 ,该 双 链 的 断裂 处 被 宿主 的 修复
系统 所 修复 。(b) 复 制 型 转 座 。 该 因子 被 复制 ,并 且 有 一 个 拷贝 插入 一 个 靶 位 点 处 ,而 另 一 个 拷贝 则 保留 在 供 体位 点
上 。 关 于 保守 型 和 复制 型 转 座 的 更 详细 解释 可 参阅 Lewin (1990)。(c) 反 录 转 座 。 该 因子 转录 成 RNA, 然 后 RNA 再
反 转 录 成 DNA。 该 DNA 拷贝 插入 宿主 基因 组 。 作 为 反 录 转 座 的 一 个 例子 可 见 图 7 一 4。 注 意 , 转 座 与 反 录 转 座 都 会
在 新 插入 成 份 的 两 端 各 产生 一 小 段 重 复 ( 黑 矩形 块 )。
偏爱 富 含 AT 的 插入 位 点 (Devos 等 ,1979) 即 是 如 此 。
7.2 可 转 座 因 子
可 转 座 因子 ,根据 其 转 座 模式 和 其 所 含 基因 的 数目 与 类 型 ,可 分 成 三 类 :插入 序列 、 转 座 子 和 反 录
因子 。
插入 序列
4fi A FF 9 Cinsertion sequences) 是 最 简单 的 可 转 座 因 子 。 它 们 除 具 有 为 转 座 所 必需 的 部 分 外 不 带 上
。106。
toe See ig > Senin Se ea | ee. 9
+ tang
FE fal it 18 fs B.A Fe HE KK Eb i HF 700 — 2500bp, & Ze AM BA, EB PS RA FE OK PA
fa A Fr 5) eB a TS 加 上 后 随 的 类 型 号 数 来 表示 。 一 个 来 自 肠 道 细 菌 E. coli Shigella dysinteria 的 插
人 序列 ,7S1 的 结构 ,如 图 7 一 2a 所 示 。7531 在 长 度 上 约 为 770 个 核 苷 酸 , 包 括 两 个 颠倒 的 非 等 同 末 端 重
复 ,每 个 各 23bp。 它 含有 两 个 阅读 框架 ,7zs4 和 7zsB,, 它 们 为 一 种 或 两 种 形式 的 转 座 酶 (transposase)
编码 。 转 座 酶 是 一 种 催化 可 转 座 因子 向 插入 位 点 插入 的 酶 在 五 .co 中 有 几 十 种 不 同类 型 的 插入 人 序
列 , 从 自然 界 分 离 出 的 品系 ,其 大 多 数 的 基因 组 中 所 含 每 种 序列 的 数 是 可 变 的 (Sawyer 等 ,1987) 。
转 座 子
转 座 子 (transposons) 是 易 动 因子 ,通常 长 为 2500 一 7000bp 左右 ,大 多 数 在 基因 组 中 作为 散在 重
复 顺 序 的 家 族 而 存在 。 它 们 与 插入 序列 的 区 别 是 还 带 有 所 谓 外 源 性 基因 (exogenous genes) , il — #6 4
除 与 转 座 有 关 的 功能 之 外 的 功能 蛋白 质 编 码 的 基因 。( 注 意 , 在 有 些 文献 中 命名 方式 较 混 乱 , 有 时 转 座
子 这 个 术语 被 用 来 指 所 有 可 转 座 因子 ,包括 插入 序列 ` 反 录 转 座 子 等 .) 在 细菌 中 , 转 座 子 用 前 组 Tn
和 后 随 的 类 型 号 数 来 表示 .有 些 细菌 转 座 子 是 复合 转 座 子 (complex tremsposons) 或 混合 转 座 子 (com-
posite transposons) ,这 样 命 名 是 因为 ,有 两 个 完整 而 独立 的 可 转 座 插入 序列 以 任意 一 种 排 向 从 两 个 侧
面 夹 拥 着 一 个 或 多 个 外 源 性 基因 (图 7 一 2b). 有 趣 的 是 ,在 复合 转 座 子 情况 下 ,不 仅 整个 转 座 子 能 作为
一 个 整体 转 座 , 而 且 两 侧 的 一 个 或 两 个 择 和 序列 还 能 独立 地 转 座 .。 因 为 转 座 的 功能 是 由 揪 人 序列 编码
的 ,所 以 .复合 转 座 子 通常 不 含有 一 种 独立 的 转 座 酶 基因 。
(a)
1st Plea] cB
(b)
Tr9 》 151 IS
(c)
Tr
-(d)
oj pm dtm xe Uma YORE
图 7 一 2 maPHOPTE RAT HRA. ZEACATMEEZ. (AKA E. coli f° Shigella dysenteria 的 插
入 序列 TS1 两 侧 由 长 为 23bp 的 不 完美 颠倒 重复 所 夹 拥 。(b) 来 自 巨 .coiz 的 复合 转 座 子 Tnz9, 含 有 两 拷贝 7S1, 分 别 位
于 co 基因 两 侧 。cat 基 因为 具有 和 氟 霉 素 抗 性 的 蛋白 质 编 码 。(c) 来 自 玖 .coli 的 转 座 子 Tmn3, 能 产生 链 霉 素 抗 性 ,含有 3
个 基因 , 其 中 两 个 (tmzzpR 和 pa) 在 一 条 链 中 转录 ,第 三 个 (imp4) 则 在 另 一 条 中 转录 。T7mz3 两 侧 都 有 长 为 38bp 的 完美
fi) SB .(d) & A Staphilococcus aureus 的 T7z554 缺 少 末 端 重复 ,含有 5 个 基因 和 1 个 开放 阅读 框架 (ORF)。 其 中 3 个
A (inpA.tnpB 和 z 加 pbpC) 为 转 座 酶 编码 , 且 作 为 一 个 单位 而 被 转录 。spc 和 ermA ARAM FMR EME FR fo
SEHK spo 基因 为 依赖 S 一 腺 若 甲 硫 氨 酸 的 甲 基 化 酶 编码 ,是 在 与 别 的 基因 不 同 的 链 中 转录 的 。ORF 被 大 量
转录 ,但 是 否 被 翻译 则 尚 不 得 而 知 。 画 有 斜 条 纹 的 矩形 块 不 含 开放 阅读 框架 。
其 他 的 细菌 转 座 子 ,以 及 许多 真 核 生 物 的 转 座 子 ,其 两 侧 只 有 较 短 的 不 同 取向 的 重复 顺序 (图 7 一
2c) ,并 且 不 含 插入 序列 。 然 而 ,并 非 所 有 转 座 子 都 是 在 结构 上 对 称 的 .有 些 具 有 不 对 称 的 末端 ,缺少 颠
倒 的 或 顺 向 的 末端 重复 (图 7 一 2d)。 动 物 中 有 些 转 座 子 (例如 果 蝇 中 的 尸 因子) 的 编码 区 被 内 含 子 所
隔断 (图 7 一 3)。
Lt mT |
图 7 一 3 X88 D. melanogaster 的 书 因 子 的 模式 结构 图 .该 因子 两 仙 有 长 为 31bp 的 短 颠 倒 重复 ,其 编码 区 含有 4 个 外
显 子 ( 白 和 矩形 块 ), 由 3 个 内 含 子 ( 黑 和 矩形 块 ) 所 隔断 。 该 因子 长 为 2900bp 左右 。
细菌 中 的 转 座 子 常常 带 有 这 样 一 些 基 因 ,它们 能 给 予 携带 者 以 抗生素 抗 性 (如 T”*554) ,重金 属 搞
性 (如 Tz21) 或 抗 热 性 (如 Tz1681)。 质 粒 则 可 把 这 样 一 些 转 座 子 从 一 个 细胞 带 到 另 一 个 细胞 , 结 采 ,
w 了 OA
抗 性 就 能 迅速 传 遍 到 整个 暴露 于 这 样 一 些 环境 因子 中 的 细菌 群体 中 。
有 几 种 吹 菌 体 事 实 上 是 细菌 中 的 转 座 子 ,或 转 座 性 鸣 菌 体 (transposing bacteriophages) 例 如 , WE
tk Mu 就 是 一 个 非常 大 的 转 座 子 (一 38000bp) , 它 不 仅 为 那些 调控 其 转 座 的 酶 编码 ,而且 还 为 大 量 构
成 其 DNA 包装 所 必需 的 结构 蛋白 质 编码 。
许多 类 型 的 转 座 子 在 动物 、 植 物 和 真菌 的 基因 组 中 广泛 分 布 .例如 果 蝇 DD. melanogaster 就 含有 50
一 100 种 不 同类 型 的 转 座 子 ,而 且 都 是 多 重 拷贝 的 (Rubin,1983) 。
反 录 因子
反 录 因子 (retroelements) 是 含有 一 个 为 反 转 录 酶 编码 的 基因 的 DNA 序列 或 RNA 序列 , 反 转 录
酶 则 催化 以 RNA 为 模板 的 DNA 的 合成 。 由 此 而 产生 的 DNA 分 子 称 互补 (的 )DNA (complementary
DNA. cDNA)。 这 些 的 确 转 座 的 反 录 因子 是 通过 反 录 转 座 过 程 而 转 座 的 .有 一 些 不 同类 型 的 反 录 因
子 ,我 们 采用 由 特 明 (Temin,1989) 提 出 的 分 类 ,并 将 它们 列 于 表 7 一 1。
反 录 病毒 (retroviruses) 是 一 些 结构 上 类 似 于 转 座 子 的 RNA 病毒 .虽然 它们 是 所 有 反 录 因子 中
最 复杂 的 ,但 我 们 还 是 最 先 讨 论 它 们 ,因为 反 录 转 座 概 念 起 源 于 对 反 录 病毒 生命 周期 (图 7 一 4) 的 发
现 。 反 录 病 毒 的 颗粒 称 为 病毒 粒子 (virion), 它 侵入 某 一 宿主 细胞 以 后 ,其 基因 组 RNA 即 被 反 转 录 成
病毒 DNA。 该 DNA 能 整合 到 宿主 基因 组 中 , 变 成 一 个 前 病毒 (provirus) 。 接 下 来 ,前 病毒 DNA 转录
成 RNA, 它 们 既 可 作为 合成 病毒 蛋白 质 的 mRNA, 又 可 作为 病毒 的 基因 组 ,并 被 包装 到 具有 感染 性
的 病毒 粒子 中 。 病 毒 粒 子 一 旦 形成 ,周期 即 可 再 次 开始 。
表 7 一 1 反 录 因子 和 反 录 序列 的 分 类
因 cia 反 转 录 酶 转 座 LTR’ 是 否 存在 病毒 粒子
反 录 子 是 否 否 否
反 转 录 子 是 是 否 否
反 录 转 座 子 是 是 是 否
反 录 病毒 是 是 是 是
拟 反 录 病 毒 是 否 是 是
反 录 序列 否 否 否 ra
自 Temin(1989).
a,LTR, KA Sn HR .
反 录 病毒 至 少 具 有 3 个 基因 :gag,zpol 和 ex( 图 7 一 5)。 这 些 基 因 分 别 为 几 种 内 部 蛋白 质 、 几 种 酶
(包括 一 种 反 转 录 酶 ) 和 一 种 被 膜 蛋白 编码 .许多 反 录 病毒 还 有 别 的 基因 :例如 艾滋 病毒 至 少 有 6 个 额
外 基因 。 反 录 病 毒 的 编码 区 两 侧 有 长 未 端 重复 (long terminal repeats, LTRs) .LTR 含有 与 转录 (在 前
病毒 阶段 ) 有 关 的 启动 子 和 与 反 转 录 ( 在 病毒 阶段 ) 有 关 的 启动 子 。
反 转 录 子 (retroposons) 和 反 录 转 座 子 (retrotransposons) 是 不 构成 病毒 粒子 的 可 转 座 因 子 , 所 以 ,
它们 与 反 录 病毒 不 同 , 不 能 独立 地 穿越 细胞 而 转 座 .它们 间 的 相互 区 别 是 ,是 否 存在 末端 重复 顺序
(CLTR)( 表 7 一 1)。 注 意 , 有 些 作 者 是 将 反 转 录 子 和 反 录 转 座 子 当 作 同义词 来 用 的 。 果 蝇 中 的 copia A
子 代 表 一 种 典型 的 反 录 转 座 子 ; 它 的 两 端 都 具有 LTR ,并 且 还 含有 一 段 长 的 开放 阅读 框架 ,其 中 有 类
似 于 反 录 病毒 的 pol 基因 的 区 域 . 图 7 一 5b 所 示 的 是 另 一 个 反 录 转 座 子 的 例子 , 即 粘 性 霉菌 Dic-
tyostelium discoideum 中 的 DTIRS 一 1 因子 。D. discoideum 平均 含有 40 个 左右 的 完整 DTIRS 一 1 拷贝 ,以
及 大 约 200 一 300 个 的 DTIRS 一 1 片段 。 有 趣 的 是 ,DTIRS 一 1 有 一 种 将 自己 插入 别 的 DTIRS 一 1 序列 中 ,从
而 抵消 它们 的 作用 的 倾向 ,这 或 许 是 粘性 霉菌 基因 组 中 存在 许多 有 缺陷 的 DTIRS 一 1 片段 的 原因
(Cappello 等 ,1984) .DTRS 一 1 基因 的 转录 受 发 育 阶段 诱导 ,也 受热 震惊 的 诱导 。
与 反 录 转 座 子 不 同 , 反 转录 子 不 含 LTR. YA D. melanogaster 中 的 C34 因子 是 一 个 反 转 录 子
(图 7 一 5c)。 这 种 反 转 录 子 含有 两 个 ORF。.ORF 一 1 含有 一 个 与 反 录 病毒 的 pol 基因 类 似 的 区 域 ,而
OREF 一 2 则 含有 7 个 由 非常 短 的 间隔 顺序 隔 开 的 外 显 子 。
反 录 子 (retrons) 是 最 简单 的 反 录 因子 (图 7 一 5d) 。 它 们 曾 在 某 些 细菌 基因 组 中 发 现 (Inouye 等 ,
“108。
一 反 录 病毒 受 体
HH Iz Fe a
复制 成 DNA
病毒 mRNA
整合 了 的 前 病毒
细胞 幸存 并 继 终
不 定时 地 产生 病毒
图 7 一 4 一 个 反 录 病毒 生命 周期 的 概貌 。 反 录 病 毒 的 病毒 粒子 附着 到 细胞 表面 的 一 个 受 体 上 .基因 组 RNA 注入 细
胞 质 中 ,在 那里 通过 反 转 录 酶 的 作用 而 被 反 转 录 。cDNA 穿 入 细胞 核 ,并且 可 能 会 整合 到 宿主 细胞 的 基因 组 之 中 。
整合 进去 的 前 病毒 被 转录 成 ,(1) 用 于 合成 病毒 蛋白 的 mRNA, 和 (2) 基 因 组 RNA。 该 基因 组 RNA 与 结构 蛋白 质 和
酶 性 蛋白 质 装 配 成 有 感染 性 的 病毒 粒子 ,以 出 芽 的 形式 穿 出 细胞 膜 。 自 Watson 等 (1987) 。
1989;Lampson 4, 1989), th, & 4E 44 'W Oenothera berteriana 的 线粒体 基因 组 中 发 现 (Schuster 和 Bren-
nicke. 1987) ,它们 的 开放 阅读 框架 中 有 与 其 他 反 转 录 酶 基因 类 似 的 顺序 。 然 而 , 反 录 子 不 切 离 , 因 而
是 构成 基因 组 整体 的 必要 部 分 .与 前 病毒 不 同 , 反 录 子 没有 LTR ,也 不 能 构成 病毒 粒子 。
拟 反 录 病毒 (pararetroviruses) ,如 乙 型 肝炎 病毒 ,是 结构 上 类 似 于 反 录 病毒 ,但 已 失去 了 将 自己 插
入 宿主 基因 组 中 的 能 力 的 一 类 病毒 .由 于 这 个 缘故 它们 是 不 够 作为 可 转 座 因 子 的 资格 的 ,虽然 它们 显
然 与 反 录 病毒 有 着 共同 的 进化 起 源 。
所 有 反 录 因子 的 反 转录 酶 都 有 某 些 氨基 酸 等 同性 ,这 一 事实 表明 了 这 些 因 子 有 一 种 共同 的 进化
起 源 .由 于 反 录 子 与 反 录 病毒 的 复杂 结构 相反 具有 简单 性 ,又 由 于 细菌 的 古老 性 ,所 以 , 特 明 (Temin,
1989) 认 为 ,进化 的 途径 是 从 反 录 子 到 反 转 录 子 、 到 反 录 转 座 子 . 到 反 录 病毒 .到 拟 反 录 病毒 (图 7 一 6)。
当然 , 某 些 现存 的 反 录 转 座 子 有 可 能 是 从 反 录 病毒 衍生 而 来 ,而 不 是 从 它 周围 的 另 一 通路 衍生 而 来 。
gag pol env
ORE-1
(b) Gil Pure
—
(c)
图 7 一 5 RRAFHRABH TAM ERATARHABGHRAHEK; MPAA MH SRAM A ZEURAT;
BRAEAH ERARKA ME AZ(LTR) ORF, PHA RER (a) MMRRME MAE HH AM AAA
等 同 的 LTR ,各 长 482 和 472bp。 该 编码 区 为 两 个 多 重 蛋 和 白 前 体 编码 。 由 gag-poll 区 编码 的 多 重 蛋 白 前 体 将 分 裂 成 两
个 多 重 蛋 白 , 分 别 对 应 于 gag 和 pol.gag 多 重 蛋 白 产生 4 种 内 部 病毒 蛋白 质 , 分 别 用 p15,p12,p27,p10 表 示 。zpol 多
重 蛋 白 则 分 裂 成 3 种 酶 ,一 种 蛋白 酶 ,一 种 反 转 录 酶 ,和 一 种 内 切 核酸 酶 /整合 酶 。 由 ezm 编码 的 多 重 蛋 白 前 体 分 裂
成 两 种 被 膜 蛋 白 、 分 别 用 p70 和 plsxA A. (b) HH | B (Dictyostelium discoideum) 4 KR 4 HF DIRS—1. MI) #4
LTR 长 为 200 一 350bp.ORF 一 2 含有 一 个 顺序 与 反 录 病毒 的 pol 基因 类 似 的 区 域 ;(c) 果 晶 D. melanogaster 的 反 转
RF G34.ORF 一 1 含有 一 个 顺序 与 反 录 病毒 的 pol 基因 类 似 的 区 域 。 注 意 LTR 缺乏 这 一 特征 。(d) 来 自 粘 球菌
M yxococcus xanthus 的 反 录 子 。 其 中 ,masr- 基因 被 转录 成 RNA; 而 isQd 基因 则 从 互补 的 链 上 转录 ,然后 再 经 由 该 反 录
子 的 ORF 编码 的 反 转 录 酶 反 录 成 DNA。 反 录 产 生 的 两 个 分 子 接着 通过 2' 、5'- 磷 酸 二 酯 键 而 相互 连结 ,从 而 形成 被
称 为 复 找 贝 单 链 DNAIOnmESDNA) 的 分 枝 形 分 子 。 注 意 这 里 没有 LTR。
环 状 DNA 病毒
失去 反 转 录 酶
拟 反 录 病毒
失去 转 座 能 力
反 录 病毒
| 获得 结构 基因
反 录 转 座 子
获得 LTR
反 转 录 子
获得 转 座 能 力
发 于
图 7 一 6 反 录 因 了 于 的 一 种 可 能 进化 路 线 的 模式 图 。
7.3 反 录 序列
反 录 序列 (retrosequences 或 retrotranscripts) ,是 通过 RNA 的 反 转 录 而 得 到 、 接 着 整合 到 基因 组
中 、 但 缺乏 产生 反 转 录 酶 能 力 的 基因 组 的 序列 ( 表 7 一 1)。 产 生 反 录 序 列 的 模板 通常 是 某 一 基因 的
RNA 转录 本 .有 些 作者 把 反 录 序列 称 为 “ 非 病 毒 的 反 转 录 子 ”例如 Weiner 等 ,1986) 。 一 种 产生 反 录
序列 的 过 程 如 图 7 一 7 所 示 .如 果 某 一 基因 不 在 任何 种 系 细 胞 中 转录 ,那么 ,产生 反 录 序列 就 需要 RNA
跨越 细胞 障碍 .这 可 以 通过 以 下 方式 实现 , 即 RNA 分 子 被 包 进 某 一 反 录 病毒 的 病毒 粒子 中 ,然后 传 .
送 到 种 系 细 胞 ,并 在 那里 被 反 转 录 (Linial,1987) 。 这 一 过 程 被 命名 为 反 录 转 染 (retrofection ) 。
es。 1]110。
|
|
由 于 反 录 序列 起 源 于 RNA 序列 ,所 以 它们 带 有 一 些 进行 过 RNA 加 工 的 标记 ,因而 又 称 为 加 工
后 序列 (processed sequences) 。 反 录 序 列 的 特征 包括 :(1) 缺 少 内 含 子 ,(2) 与 基因 的 转录 区 域 有 精确 一
致 的 边界 ,(3) 在 3' 端 有 poly-A 延伸 物 ,(4) 在 两 端 都 有 短 的 顺 向 重复 ,这 指示 可 能 已 涉及 转 座 ,(5) 各
种 转录 后 的 修饰 ,如 短 核 苷 酸 延 伸 物 的 加 入 或 去 除 ,以 及 (6) 序 列 所 在 染色 体 上 的 位 置 已 不 同 于 转录
产生 RNA 的 原始 基因 的 基因 座位 。
存在 有 两 种 类 型 的 反 录 序列 :加 工 后 基因 (或 反 录 基因 ) 和 加 工 后 假 基因 (或 反 录 假 基因 )
| #2
ee ea
| 加 工
cap BM pApaps~~ RNA
| ses
Mt etpt DNA
| ee
__ #4 DNA
| DNA 修复
a 加 工 后 的
基因
图 7 一 7 加工 后 反 录 序列 的 产生 . 黑 块 状 体 表示 外 显 子 .波纹 线 表 示 mRNA 中 的 多 聚 A 尾 巴 和 cDNA 中 的 互补 多
% T.DNA 被 转录 成 前 体 mRNA ,然后 被 加 工 成 mRNA。mRNA 再 被 反 转 录 成 cDNA,cDNA 则 整合 进 基 因 组
DNA 中 。 裂 缝 被 修复 ,这 样 在 插入 的 反 录 序列 两 段 侧 就 产生 了 两 段 顺 向 的 短 重 复 ( 黑 水 平 箭头 )。 如 果 cDNA 从 合
成 RNA 的 细胞 转播 入 到 一 个 不 同 细 胞 的 基因 组 中 , 则 产生 反 录 序列 的 过 程 就 需要 mRNA 包装 进 一 个 反 录 病毒 料
子 中 ,并 且 转 移 到 那个 郑 细胞 里 。 这 样 的 过 程 称 反 录 转 染 。
反 录 基因
加 工 后 基因 (processed gene) 或 反 录 基因 (retrogene) 是 一 种 有 功能 的 反 录 序列 , 它 产 生 的 蛋白质
与 产生 该 反 录 基因 的 原 基 因 所 产生 的 蛋白 质 等 同 或 接近 等 同 。 有 几 个 原因 可 以 说 明 为 什么 一 个 反 转
录 的 基因 保留 其 功能 的 可 能 性 很 小 .第 一 , 反 转 录 过 程 是 很 不 精确 的 ,以 至 RNA 模板 与 cDNA 之 间
可 能 会 出 现 许 多 差异 (突变 )。 第 二 ,除非 加 工 后 基因 是 从 一 个 由 RNA 多 聚 酶 下 转录 的 基因 衍生 而
来 ,否则 它 通常 不 含有 那些 位 于 不 转录 区 中 的 必需 调控 序列 .第 三 ,加 工 后 基因 有 可 能 被 插 人 到 不 适
于 其 正确 表达 的 基因 组 位 置 上 .事实 上 ,在 绝 大 多 数 情况 下 ,一 个 加 工 后 基因 就 是 一 个 “垂死 者 ”。
令 人 惊奇 的 是 ,加 工 后 的 有 功能 基因 已 被 发 现 , 虽 然 它们 看 来 是 非常 罕见 的 .人 的 磷酸 甘油 酸 激
酶 CPGK) 多 家 族 由 一 个 活性 的 X 一 连锁 基因 、 一 个 加 工 后 的 X 一 连锁 基因 和 一 个 额外 的 常 染 色 体 基
因 所 组 成 .该 X 一 连锁 基因 含 11 个 外 显 子 和 10 个 内 合子 。 另 一 方面 , 它 的 常 染 色 体 同 源 物 却 是 不 寻常
的 , 它 没有 内 含 子 并 且 它 的 3' 端 由 一 个 poly-A 尾巴 的 剩余 物 构成 侧翼 ,这 极 有 力 地 表明 曾 发 生 过 涉
及 mRNA 的 反 转 录 过 程 。 有 趣 的 是 ,该 常 染色 体 的 PCK 基因 几乎 独特 地 在 备 丸 中 表达 .于 是 , 反 转
录 而 成 的 PGK 基因 不 仅 保留 了 完整 的 阅读 框架 和 转录 并 产生 有 功能 的 多 肽 的 能 力 , 而 且 还 获得 了
一 种 新 的 组 织 特异 性 (McCarrey 和 Thomas,1987) 。 鸡 中 的 肌肉 特异 的 钙 调 素 (calmodulin) 基 因 也 是
无 内 含 子 的 ,显然 也 是 经 由 反 转 录 酶 中 介 的 事件 而 产生 的 (Gruskin 等 ,1987)。
大 鼠 和 小 鼠 的 前 胰岛 素 原 II 基因 可 能 是 半 加 工 反 录 基因 (semiprocessed retrogene) 的 一 个 代表 性
例子 .该 基因 在 5' 不 翻译 区 中 有 一 个 长 119bp 的 内 含 子 。. 相 比 之 下 , 它 的 同 源 物 前 胰岛 素 原 工 ,含有 与
etl *
它 同样 的 小 内 含 子 , 另 外 还 有 一 个 存在 于 ec 肽 编码 区 中 的 较 大 (499bp) 内 含 子 。 来 自 其 他 哺乳 类 ,包括
其 他 路 齿 类 在 内 的 所 有 前 胰岛 素 原 基因 也 含有 两 个 内 含 子 。 而 且 , 前 胰岛 素 原 1 基因 两 侧 由 短 重 复 夹
拥 , 且 在 多 聚 腺 苷 化 信号 后 有 一 段 短 多 聚 AGpoly-A) 区 (Soares 等 ,1985) 。 这 些 特征 表明 ,前 胰岛 素 原
I 基因 可 能 是 从 被 部 分 加 工 的 前 胰岛 素 原 工 基因 的 前 体 mRNA 衍生 而 来 的 半 加 工 反 录 基 因 。 事 实
上 ,根据 这 两 个 前 胰岛 素 原 基因 间 的 比较 ,前 胰岛 素 原 I 看 来 是 从 一 个 偏离 了 正轨 的 前 体 mRNA 转
录 本 衍生 而 来 的 ,该 转录 本 起 始 于 正常 帽子 部 位 上 游 的 500 个 碱 基 对 处 , 且 只 有 第 一 个 内 含 子 从 它 里
面 切 离 了 。 正 是 因为 该 偏离 了 正轨 的 转录 本 含有 未 被 正常 转录 的 5' 调 探 序列 , 反 录 基因 在 整合 到 一
新 基因 组 位 置 后 才 保 留 了 它 的 功能 。
加 工 后 假 基因
加 工 后 假 基 因 (processed pseudogene) 或 反 录 假 基 因 (retropseudogene) 是 一 个 失去 其 功能 的 反 录
序列 . 它 带 有 一 切 有 功能 的 反 录 序列 的 标记 ,但 却 有 一 些 妨碍 其 表达 的 分 子 缺 陷 。 一 个 有 功能 的 基因
Mm. A 了 工 广 AL » Cane be Ue 556s 2 eee
SOD-1 ATG GCG ACG AAG GCC G¥C TCC Gee CTG AAG GGC GAC GGC CCA Gia
69.1 ATA ATG AIG AAG CECHATC. TAC. Se TTG AAG GGc CAG AGC ccc Tc
f° M M «Kk °¥° MM (-Y "\ RR K 6 CG) O°” See
SOD-1 Q G I I N i E Q K ' E 9 N G
CAG GGC ATC. ATC AAT TTC.) GAC ACAGSARG 469 Ciiticon hae AGT AAT GGA
69.1 CAG ccc A 'E°ATC CAT’ TY “CAG CHO Bee AA AAT GAA.
Co. uv: 5 S ky 242%
P V 二 S I K G L 下 E - 可 转 座 因 子 的 个 体 而 言 的
平均 适合 度 为 a, ta:
w= ee | 和 Kee
(Charlesworth ,1985) 。
4£ FR WD. melanogaster 的 情况 中 ,有 约 50 个 转 座 子 家 族 , 每 个 家 族 平 均 在 基因 组 中 出 现 10 次
(Finnegan 和 Fawcett,1986) ,于 是 n 王 500。 因 为 比 u 至 少 小 一 个 数量 级 ,所 以 u 一 Yu 一 10 +。 解 等
式 7.1, 我 们 得 只 =0. 95。 于 是 ,适合 度 上 的 降低 为 s 王 1 一 0.95 王 0.05。 由 等 式 7. 1 给 出 的 平衡 的 稳定
性 ,要 求 适合 度 的 对 数 衰减 比 n 的 线性 增加 更 陡峭 (Charlesworth,1985) .不 过 ,为 了 运算 简单 ,我 们 候
定 呈 线性 ,那么 ,每 增加 一 个 转 座 子 适合 度 的 降低 近似 为 0.05/500 王 10“。 这 样 小 的 选择 系数 本 质 上
意味 着 ,一 个 生物 体 中 的 可 转 座 因子 的 拷贝 数 主要 是 由 随机 遗传 漂 变 所 决定 的 .如 果 一 个 生物 体 含 有
数目 更 大 的 可 转 座 因 子 , 甚 至 在 果 蝇 中 可 转 座 因子 数 大 大 超过 500 的 可 能 性 也 是 存在 的 (Rubin,
1983) ,那么 ,一 个 转 座 子 对 适合 度 的 效应 也 许 要 比 上 面 所 得 到 的 更 小 。
关于 对 抗 拷贝 数 增 加 的 选择 的 一 个 可 采用 形式 是 自我 调控 转 座机 制 , 即 转 座 的 频率 随 拷贝 数 的
增加 而 降低 ,或 切 离 的 频率 随 拷 贝 数 的 增加 而 增加 ( 见 Chenlesworth # Langley ,1989).
7.8 水 平 基 因 转 移
水 平 基因 转移 (horizontal gene transfer) 被 定义 成 遗传 信息 从 一 个 基因 组 向 另 一 个 基因 组 ,特别
是 在 两 个 物种 之 间 的 转移 .这 个 术语 的 提出 是 为 了 把 这 类 转移 与 通常 的 “垂直 转移 ”区 别 开 来 ,后 者 则
是 亲 代 把 遗传 信息 传 给 子 代 的 转移 。 水 平 基因 转移 要 求 ,(1) 在 各 生物 体 和 各 细胞 间 转 输 遗 传 信息 的
交通 工具 ,和 (2) 将 外 源 DNA 片段 插入 宿主 基因 组 中 的 分 子 机 制 。 反 录 病 毒 能 完成 这 两 个 任务 ,因为
它们 既 能 把 染色 体 的 DNA 挫 和 到 它们 的 基因 组 中 ,又 能 跨越 物种 界线 (Benveniste 和 Todaro,1976;
Bishop ,1981) 。 在 转 座 子 以 及 其 他 类 型 的 DNA 中 介 的 转 座 中 ,跨越 细胞 的 传输 必须 由 一 个 传染 因子
来 提供 ,如 质粒 事实 上 ,许多 自然 界 中 出 现 的 质粒 都 含有 可 转 座 因 子 , 这 些 因子 可 以 从 质粒 上 离开 而
向 细菌 染色 体 移动 ,也 可 相反 方向 地 移动 。
通过 发 现 某 一 具体 基因 的 系统 发 育 分 布 中 的 显著 不 连续 性 ,也 许 能 检 出 一 个 水 平 基因 转移 事件 。
例如 ,细菌 Salmonella typhimurium 含有 一 个 类 组 蛋白 基因 , 据 我 们 所 知 它 在 其 他 细菌 中 没有 对 应 物
(Higgins 和 Hillyard,1988) 。 当 发 现 基 因 系 统 发 育 和 物种 系统 发 育 之 间 明 显 地 存在 矛盾 时 ,特别 是 顺
序 类 似 性 看 来 反映 了 地 理 上 的 近似 而 不 是 系统 发 育 上 的 亲缘 性 时 ,或许 也 可 以 怀疑 有 水 平 基因 转移 。
作为 例子 ,我们 考虑 一 下 图 7 一 15a 中 的 系统 发 育 树 .假定 B 从 A 那里 分 岐 后 ,发 生 了 一 个 DNA 片段
从 物种 也 向 物种 C 的 转移 。 在 除 发 生 了 水 平 转移 的 基因 外 的 任何 基因 的 顺序 比较 的 基础 上 ,我 们 可
望 得 到 一 个 正确 的 物种 间 系统 发 育 关 系 。 对 比 之 下 ,如 果 我 们 采用 发 生 了 水 平 转移 的 DNA 片段 , 则
我 们 将 得 到 如 图 7 一 15b 中 那样 的 错误 树 。 不 过 ,我 们 也 注意 到 , 除 水 平 基因 转移 外 还 有 别 的 因素 也 能
造成 物种 树 和 基因 树 之 间 的 矛盾 (第 五 章 )。
(a) (b)
基因 转移
B a: A B
图 7 一 15 水 平 基因 转移 的 情况 下 系统 树 的 构建 Ca) 真实 树 ,(b) 推 测 树 。
两 类 序列 能 被 水 平地 转移 : (1) 从 可 转 座 因子 衡 生出 的 序列 ,和 (2) 基 因 组 序列 ,基因 组 序列 的 水
平 基因 转移 的 例子 中 ,很 少 有 已 被 令 人 信服 地 证 实 了 的 。 许 多 原来 这 样 声 称 的 例子 ,后 来 发 现 并 不 能
得 到 分 子 证 据 的 支持 .而 且 , 我 们 注意 到 ,一 个 发 生 了 水 平 转移 的 基因 在 宿主 中 保留 其 功能 性 的 情况
是 很 罕见 的 ,预期 比 一 个 在 同一 物种 内 从 一 个 基因 组 位 置 到 另 一 个 位 置 转移 的 基因 ( 见 第 111 页 ) 更 少
病毒 基因 从 狮 狂 到 猫 的 水 平 转移
脊 椎 动物 基 因 组 中 含有 许多 与 反 录 病毒 同 源 的 序列 .这 些 序列 是 真 核 生物 细胞 核 DNA 的 正常
组 份 , 称 为 内 源 性 反 录 病毒 序列 (endogeneous retroviral sequences) 或 病毒 基因 (virogene) .有 几 个 内 源
性 反 录 病毒 序列 在 肴 椎 动物 的 种 间 转 移 的 例子 (综述 见 Benveniste, 1985). H+ — fil 53% A Bb BEY c
型 病毒 基因 有 关 ( 图 7 一 16)。
与 独 独 的 病毒 基因 同 源 的 序列 已 在 所 有 古 世 界 猴 的 细胞 DNA 中 检 出 。 它们 间 的 顺序 类 似 性 是
与 物种 间 的 分 类 学 关系 紧密 相关 的 。 于 是 ,该 病毒 基因 在 灵 长 类 中 至 少 存在 了 3 千 万 年 .有趣 的 是 6 种
RM (Felix catxs) 亲 缘 关 系 密 切 的 猫 也 含有 这 一 序列 ,虽然 在 亲缘 关系 较 远 的 猫 科 动 物 、 象 狮 , 豹 和
短 尾 猫 , 以 及 任何 其 他 食肉 动物 中 ,都 不 存在 这 一 序列 .所 以 ,这 一 序列 极 有 可 能 是 在 过 去 某 一 时 刻 在
物种 间 水 平 转移 的 。 水 平 传递 的 年 代 和 方向 可 从 两 类 资料 中 推出 :(1) 顺 序 类 似 性 和 (2) 古 地 质 学 信
¢ 120°
1B ttt Fr ae
猫 科
2
其 他 食肉 动物 “
图 7 一 16 十 世界 猴 和 猫 的 系统 发 育 树 。 含 有 型 病毒 基因 的 物种 用 实 线 标 出 。 来 自 狂 独 和 狮 尾 独 狂 的 c 型 病毒 基
因 展 现 出 与 猫 的 c 型 病毒 基因 有 最 大 的 类 似 性 。 因 此 ,在 大 约 1 千 万 前 可 能 发 生 了 一 次 水 平 基因 转移 ,该 转移 是 从
狂 狂 和 狮 尾 狂 狂 的 祖先 到 与 狮 \ 鹏 和 猎豹 等 的 谱系 分 岐 后 的 现代 猫 的 祖先 。 自 Benveniste (1985) 修 改 而 成 。
息 。
所 有 含 狂 独 病毒 基因 的 猫 种 都 来 自 地 中 海地 区 ,而 来 自 东 南亚 、 新 世界 和 非洲 的 猫 科 动物 则 缺少
该 序列 .因此 ,转移 发 生 在 猫 科 动物 的 大 辐射 之 后 , 且 被 限制 在 一 个 地 理 区 域 中 。 这 一 结论 指出 ,水 平
基因 转移 的 年 代 在 500 一 1000 万 年 前 。 传 递 方向 则 可 这 样 推出 :一 方面 考虑 该 序列 在 灵 长 类 中 的 分 布 ,
另 一 方面 考虑 它 在 猫 类 中 的 分 布 。 因 为 所 有 古 世 界 猴 都 具有 该 病毒 基因 ,而 只 有 几 种 猫 才 具 有 该 基
因 . 所 以 ,只 能 假定 猫 类 是 从 儿 独 那里 获得 该 序列 ,而 不 是 相反 ,这 才 是 合理 的 .这 一 结论 在 考虑 到 以
下 事实 后 得 到 强化 : 猫 类 与 3 种 独 独 (Pazio cynoce phalus, P. papio 和 已 .haxozacdzyas) 和 亲缘 关系 密切
AY Bi FE Bb Bi (Theropithecus gelada) 中 的 病毒 基因 ,它们 的 相似 程度 比 猫 类 与 任何 其 他 灵 长 类 序列 的
相似 程度 要 更 高 一 些 . 因 此 ,该 序列 一 定 是 独 卯 和 狮 尾 独 狮 与 山 灰 分 岐 后 不 久 而 从 它们 的 祖先 转移 到
猫 类 中 去 的 (图 7 一 16)。 从 对 独 狂 的 研究 中 得 出 的 年 代 与 从 对 猫 类 的 研究 中 得 出 的 年 代 一 致 得 相当
.
尸 因子 在 果 蝇 的 种 间 的 水 平 转移
水 平 基因 转移 的 另 一 个 例子 与 刀 . melanogaster 中 的 书 因 子 有 关 。 正 如 前 面 所 讲 的 ,在 近 40 年 的
时 间 里 已 因子 已 迅速 传 遍 了 D. melanogaster 的 自然 群体 ( 见 第 114 页 )。 而 己 因 子 不 存在 于 与
melanogaster 亲缘 关系 很 近 的 一 些 种 , 象 D. mauritania,D. sechellia, D. simulans 和 D. yakaba 等 之 中 。
那么 这 些 因子 是 从 哪里 来 的 呢 ? 丹尼尔 斯 等 (Daniels 等 ,1990) 曾 对 成 百 种 果 蝇 进行 了 普查 ,结果 表
明 , 除 D. melanogaster 外 ,zzelazogaster 类 亚 组 的 任何 其 他 种 中 都 未 发 现 已 序列 .相反 ,亲缘 关系 下 远
的 willistoni 24 Fl saltans 组 的 所 有 种 都 含有 书 因子 和 类 尸 因 子 。 尤 其 是 ,D, willistoni 的 己 因 子 被 发 现
除了 一 个 碱 基 蔡 换 外 完全 等 同 于 D. melanogaster 中 的 因子 ,这 指示 D. willistoni 在 P A ¥% 2!) D.
melanogaster 的 水 平 基 因 转 移 中 ,起 着 供 体 物种 的 作用 。
有 几 个 原因 使 得 我 们 怀疑 这 种 水 平 基因 转移 是 最 近 才 发 生 的 .首先 ,来 自 刀 .aelanogaster 和 来 目
D. willistoni 的 书 序 列 间 的 接近 等 同 ,表明 发 生 分 岐 的 时 间 非 常 短 .其 次 ,来 自 地 理 位 置 相距 很 还 处 的
D. mmzelanogaster, 它 们 的 书 序 列 间 几乎 没有 遗传 变异 性 ,这 指示 自己 因子 导入 万 .melanzogaster 以 来 时
2 121 *
间 还 很 短 ,以 至 还 来 不 及 积累 遗传 变异 性 .最 后 ,已 因子 在 也. melanogaster 中 出 现 的 地 理 模 式 , 以 美洲
大 陆 中 的 群体 最 先 获 得 它 ,看 来 它 指示 着 涉及 了 一 次 非常 近期 的 侵 和 人 事件 ,时 间或 许 在 近 50 年 之 内 。
习题
1. 反 录 因 子 和 反 录 序列 间 的 差异 是 什么 ?
2. 给 出 一 个 基因 组 序列 ,你 怎么 能 讲 出 它 是 不 是 一 个 反 录 序列 呢 ?
3. 怎样 才能 将 加 工 后 假 基因 和 未 加 工 假 基因 加 以 区 别 ?
4. 大 多 数 加 工 后 假 基因 都 是 “垂死 者 ”。 请 解释 ,为 什么 这 一 条 件 使 它们 成 了 推测 点 突变 模式 的 极
好 材料 ( 见 第 四 章 和 Li 等 ,1984) 。
5. 解释 为 什么 反 录 基因 很 少见 。
6. 为 什么 Alu 序列 在 人 类 和 其 他 灵 长 类 的 基因 组 中 含量 会 如 此 丰富 ?
7. Alu 序列 曾 被 认为 是 有 功能 的 ,但 现在 却 普遍 相信 它们 是 加 工 后 假 基 因 。 在 此 假说 下 ,4zx 序列
应 该 象 其 他 假 基 因 那 样 迅 速 地 进化 。 那 么 , 表 7 一 3 中 的 数据 与 这 一 假说 相 容 吗 ?
表 7 一 3 4/x 序列 之 间 以 及 1 一 珠 蛋 自 假 基因 之 间 顺 序 岐 化 的 程度
百分比 岐 化 度
物种 对 一 一
Alu 序列 7 BEA
AM BBE De 2 lak 1.7
AM KBE 3.7+1.9 ail
% 4 A Koop 等 (1986a) 和 Li 等 (1987a)
a. 7 个 垂直 相关 的 序列 被 用 来 计算 平均 值 和 标准 偏差 。
8. 试 列 举 转 座 对 宿主 可 能 产生 的 有 利和 不 利 效应 。
后 继 阅 读 文献
Berg. D. E. and M. M. Howe (eds). 1989. Mobile DNA. Academic Society for Microbiology.
Washington DC.
Compbell, A. 1983. Transposons and their evolutionary significance. pp. 258— 279. In M. Nei and
R. K. Koehn (eds) . Evolution of Genes and Proteins. Sinauer Associates. Sunderland. MA.
Charlesworth, B. and C. H. Langley. 1989. The population 了 of Drosophila transposable el-
ements. Annu. Rev. Genet. 23: 251— 287. |
Doolittle. R. F., D-F. Feng. M.S. Johnson and M. A. McClure. 1989. Origins and evolutionary rela-
tionships of retroviruses. Quart. Rev. Biol. 64: 1— 30.
Lewin, B. 1990. Genes IV. Oxford University press. Oxford.
Scaife, J.. D. Leach and A. Galizzi (eds. ). 1985. Genetics of Bacteria. Academic Press, New York.
Shapiro, J. A. (eds) . 1983. Mobile Genetic Elements. Academic Press, New York.
Varmus, H. 1988. Retroviruses. Science 240: 1427—1435.
Weiner, A.M., P. L. Deininger and A . Efstratiadis. 1986. Nonviral retroposons: Genes, pseu-
dogenes. and transposable elements generated by the reverse flow of genetic information. Annu. Rev.
Biochem. 55: 631— 661
* Tee
8 基因 组 的 组 织 化 和 进化
关于 基因 组 的 组 织 化 和 进化 的 讨论 应 该 包括 3 个 不 同 的 课题 .第 一 个 是 基因 组 大 小 ,这 在 不 同 生
物 间 变 化 极 大 .这 种 变化 是 如 何 形成 的 ?增加 和 降低 基因 组 大 小 以 产生 这 种 变化 的 机 制 是 什么 ?第 二
个 是 基因 组 中 的 遗传 信息 。 基 因 组 主要 是 由 基因 的 DNA 构成 的 吗 ? 还 是 主要 是 由 非 基 因 的 序列 构成
的 ?基因 组 中 有 许多 重复 序列 吗 ? 而 如 果 是 这 样 那么 重复 序列 的 染色 体 分 布 模式 是 什么 ? 非 基因 部 分
有 功能 吗 ?或 者 它 只 是 "废物 ?第 三 个 课题 涉及 基因 组 的 核 苷 酸 组 成 。 基 因 组 的 不 同 区 域 中 在 组 成 上
有 蜡 质 性 吗 ? 什 么 机 制 使 核 苷 酸 在 组 成 方面 造成 区 域 性 差异 ?
二
单 倍 体 基因 组 , 象 在 精子 细胞 核 中 的 那样 ,其 DNA 的 量 称 基 因 组 大 小 (genome size) 或 C 值 (C
value) ,这 里 C 来 自 “constant”( 常 数 ) 或 “characteristic”( 特 征 ) ,表示 单 倍 体 基 因 组 的 大 小 在 任何 一 个
物种 中 都 是 相当 恒定 的 这 样 一 个 事实 。 反 之,C 值 在 原核 生物 和 真 核 生 物 的 各 物种 间 则 变化 幅度 极
二
表 8 一 1 常用 于 测试 基因 组 大 小 的 单位 换算
换算 因子
单位 微微 克 its WIE x
微微 克 1 6. 02X10" 0. 98 X 109
道 尔 顿 1.66 10-12 1 1.62X10-3
碱 基 对 1.021079 618 1
真 核 生物 中 细胞 核 基因 组 的 大 小 通常 用 微微 克 (pg)DNA 来 度量 (1pg 王 10 “g)。 较 小 一 些 的 原
核 生物 的 基因 组 则 通常 用 道 尔 顿 来 度量 , 道 尔 顿 即 一 个 原子 或 分 子 的 相对 质量 单位 .还 有 更 小 的 基因
组 , 象 细胞 器 和 病毒 等 的 基因 组 ,以 及 某 些 特殊 的 DNA 延伸 物 , 它 们 的 大 小 则 常用 双 链 DNA 或
RNA 的 碱 基 对 (bp) 或 千 碱 基 对 (kb) 来 表示 (1kb 王 1000bp)。 为 避免 混乱 ,我们 将 只 用 bp 和 kb。 单 位
换算 因子 可 见 表 8 一 1。
8.2 细菌 的 基因 组 大 小 的 进化
细菌 的 基因 组 大 小 其 变化 幅度 超过 了 20 倍 ,从 某 些 限制 性 细胞 间 寄 生物 中 的 约 6X 10°bp 到 几 种
蓝 细 菌 中 的 10"bp 以 上 ( 表 8 一 2)。 最 小 的 游离 生活 的 原核 生物 , 枝 原 体 , 含 有 包括 50 种 核糖 体 蛋 昌 在
内 的 350 个 为 蛋白 质 编 码 的 基因 ,两 组 rRNA 基因 (5S,16S 和 23S), 和 大 约 40 个 tRNA 基因 .因此 ,一
个 枝 原 体 的 基因 组 由 大 约 400 个 基因 所 构成 ,这 接近 于 所 猜测 足够 维持 机 体 自 主 性 生活 的 最 小 数目
(Muto 等 ,1986) 。 其 他 细菌 中 的 基因 数 大 致 在 500 到 8000 的 范围 内 变化 , 换 句 话说 ,在 特征 细菌 的 种 类
中 ,基因 数 上 的 变异 与 C 值 方面 的 变异 相同 .因此 ,细菌 看 来 不 会 含有 大 量 的 非 基 因 的 DNA.
细菌 的 基因 组 可 被 划分 成 3 个 部 分 :(1) 染 色 体 DNA,(2) 源 于 质粒 的 DNA, 和 (3) 可 转 座 因 子
(Hartl 等 ,1986) 。 染 色 体 部 分 含有 为 生长 和 代谢 功能 所 必需 的 蛋白 质 编码 基因 (70 一 80% ) ,间隔 序列
和 各 种 信号 序列 (20 一 30%)、 编 码 RNA 的 基因 (一 1%), 以 及 一 些 通 常 长 度 在 几 十 个 碱 基 对 这 一 级
别 上 的 短 重复 序列 。 细 菌 常 带 有 许多 作为 染色 体外 遗传 成 份 的 质粒 ,然而 ,在 有 些 例 子 中 ,一 些 来 自 质
粒 的 基因 却 发 现 被 整合 在 细菌 染色 体 中 。 可 转 座 因 子 是 某 些 细 菌 基因 组 的 普通 组 分 。 例 如 , 正 .coli 的
.123 。
染色 体 , 至 少 含 有 6 个 不 同类 型 的 插入 序列 各 1 一 10 个 拷贝 (第 七 章 )。 基 因 组 的 非 染 色 体 部 分 (包括 染
色 体 中 的 插入 序列 和 来 自 质 粒 的 基因 ) 看 来 要 比 染 色 体 部 分 小 一 个 数量 级 。
表 8 一 2 ”细菌 中 C 值 的 范围
分 类 单位 基因 组 大 小 的 范围 (kb) 比例 (最 高 /最 低 )
真 细菌 650 一 13200 20
革 兰 氏 阴 性 650 一 7800 12
革 兰 氏 阳 性 1600 一 11600 7
蓝 细 菌 3100 一 13200 4
枝 原 体 650 一 1800 3
古 细菌 1600 一 4100 3
资料 自 Cavalier-Smith(1985).
细菌 中 基因 组 大 小 的 分 布 是 不 连续 的 ,在 模 值 约 0.8X10",1.6X10 和 4.0 久 10*bp 处 呈现 出 主
峰 , i ZE7. 2X 10°M8. OX 10°bp 处 有 几 个 副 峰 (Herdman ,1985)。 这 种 分 布 引出 了 这 样 的 看 法 : 较 大 的
基因 组 是 从 较 小 的 基因 组 经 连续 循环 的 基因 组 重复 进化 而 来 的 .由 于 基因 组 大 小 和 细菌 的 系统 发 育
间 看 来 没有 显著 关系 ,所 以 ,已 经 出 现 了 这 样 一 个 提议 :基因 组 重复 在 细菌 谱系 的 进化 中 是 频频 出 现
的 (Wallace 和 Morowitz,1973).
应 用 根据 rRNA 顺序 比较 而 得 出 的 尝试 性 细菌 系统 发 育 , 替 德 曼 (Herdman,1985) 曾 找 出 了 基
因 组 大 小 变化 与 系统 发 育 史 的 关系 。 其 结果 指示 ,基因 组 重复 在 不 同 细 菌 谱 系 中 是 独立 地 发 生 的 .。 有
趣 的 是 ,许多 重复 看 来 曾 在 进化 中 的 某 一 相当 特别 的 时 刻 , 即 氧 在 大 气 层 中 出 现 后 不 久 , 大 约 在 18 亿
年 前 ,同时 出 现在 几 种 不 同 的 细菌 谱系 中 的 。
概括 起 来 ,细菌 中 基因 组 大 小 的 分 布 能 用 几 个 过 程 的 结合 来 加 以 解释 :(1) 某 些 谱系 中 呼吸 代谢
独立 进化 期 间 的 基因 组 重复 ,(2) 独 立地 出 现在 许多 谱系 中 的 ,随后 的 基因 组 重复 。(3) 小 规模 的 缺失
和 插入 ,(4) 复 制 性 转 座 ,(5) 主 要 来 自 质 粒 的 基因 的 水 平 转移 ,和 (6) 许 多 寄生 性 谱系 中 大 量 DNA 丢
三
8.3 真 核 生 物 的 基因 组 大 小 和 C-- 值 悖 论
真 核 生物 中 的 C 值 通常 比 原核 生物 中 的 要 大 得 多 ,但 也 有 例外 。 例 如 ,酵母 Saccharomyces cere-
visiae 的 基因 组 就 比 许多 革 兰 氏 阳 性 菌 和 大 多 数 蓝 细菌 的 小 .因为 真 核 生物 的 基因 组 有 多 重 的 复制 原
点 ,而 大 多 数 原核 生物 看 来 只 有 一 个 ,所 以 ,在 复制 出 较 小 原核 生物 基因 组 所 需 的 相同 的 时 间 里 , 真 核
生物 复制 出 的 DNA 的 量 就 要 大 得 多 。
真 核 生 物 中 的 C 值 变化 要 比 细菌 中 的 大 得 多 ,从 8.8X10*bp 9. 9X 10" bp, He Fel HE Ut 80000 FF
( 表 8 一 3)。 单 细胞 的 原生 生物 ,特别 是 肉 足 类 变形 虫 ,在 C 值 上 表现 出 的 变化 最 大 。3 个 羊膜 类 的 纲
《哺乳 类 、 乌 类 和 疏 行 类 ) 则 相反 ,在 真 核 生物 中 以 它们 在 基因 组 大 小 上 的 变化 小 (最 高 相差 4 倍 ) 而 显 ,
得 不 同 寻常 。 其 他 的 纲 ,对 那些 C 值 数 据 大 体 上 存在 者 而 言 ,表现 出 至 少 100 倍 的 变异 。
有 趣 的 是 , 真 核 生 物 间 基因 组 大 小 上 的 巨大 种 间 差 异 看 来 与 生物 的 复杂 性 和 生物 所 编码 的 可 能
基因 数 没有 什么 关系 。 例 如 , 几 种 单 细 胞 的 原生 动物 具有 上 比 哺乳 动物 要 多 得 多 的 DNA( 表 8 一 4) ,而 后
者 据 推 测 应 要 更 复杂 一 些 。 而 且 , 一 些 复杂 性 看 来 相似 的 生物 (例如 , 果 蝇 与 蝗虫 ,洋葱 与 百合 ,双核 草
履 虫 (Paramecium azelia) 与 尾 草 履 虫 (P. caxdatxx) 却 展示 出 极 大 的 C 值 差 异 ( 表 8 一 4) AC
与 基因 组 中 所 含 的 遗传 信息 的 认定 数量 间 缺 乏 对 应 的 现象 ,以 C a Hit KOC 值 矛盾 (CC value
paradox) ) 而 著称 于 文献 之 中 。 在 姐妹 种 ( 即 一 些 相互 在 形态 学 上 极为 相似 ,以 至 表 型 上 不 可 区 分 的 种 )
的 比较 中 CC 值 矛 盾 也 是 明显 的 。 在 原生 生物 、 真 骨 鱼 类 ,两栖 类 和 显 花 植物 中 ,许多 姐妹 种 ,尽管 根据
姐妹 种 的 定义 这 些 生 物 间 的 复杂 性 没有 什么 差异 ,但 在 它们 的 C 值 上 却 差别 极 大 。 我 们 可 以 假定 一
个 物种 不 可 以 具有 少 于 保证 其 生命 功能 所 必需 的 DNA 的 量 , 但 我 们 必须 解释 为 什么 有 那么 多 物种
含有 远 远 过 剩 的 DNA 的 量 。
9 12a"
Pin Tay a amin « wet te
a
表 8 一 3 不 同 真 核 生 物 类 群 中 的 C 值 范围
分 类 单位 基因 组 大 小 范围 (kb) 比例 (最 高 /最 低 )
原生 生物 23,500 一 686,000,000 29,191
眼 虫 类 98,000 一 2,350,000 24
纤毛 ( 亚 门 ) 类 23,500 一 8,620,000 367
肉 足 (总 纲 ) 类 35,300 一 686,000,000 19,433
真菌 8,800—1,470,000 167
动物 49,000 一 139,000,000 23837
海绵 49,000—53,900 1
环节 动物 882,000 一 5,190,000 6
软体 动物 421,000 一 5,290,000 13
甲壳 类 686,000 一 22,100,000 32
昆虫 98,000 一 7,350,000 75
棘皮 动物 529,000 一 3,230,000 6
Ke ait 637,000— 2,790,000 4
B45 1,470,000—15 800,000 11
真 骨 鱼 类 .382,000 一 139,000,000 364
两 栖 类 931,000 一 84,300,000 91
MAT 1,230,00—5,340,000 4
BX 1,670,000—2,250,000 1
哺乳 类 1,420,000 一 5,680,000 4
植物 50,000 一 307,000,000 6,140
2s 80,000—30,000,000 375
蕨 类 植物 98,000 一 307,000,000 3,133
裸子 植物 4,120,000 一 76,900,000 17
被 子 植物 50,000 一 125,000,000 2,500
资料 自 Cavalier-Smith(1985) 及 其 他 来 源 。
要 搞 清 楚 的 第 一 个 问题 是 ,基因 组 大 小 和 基因 的 数目 间 是 否 存 在 相关 .换言之 ,基因 组 大 小 上 的
差异 应 归 因 于 基因 的 DNA 还 是 非 基因 的 DNAY? 真 核 生 物 在 为 蛋白 质 编码 的 基因 数 上 表现 出 约 有 50
倍 的 变异 ,从 酵母 中 的 约 3000 个 到 哺乳 动物 中 的 150000 个 左右 (Cavalier-Smith,1985) 。 这 种 50 倍 的 差
异 显然 不 足以 解释 细胞 核 DNA 在 含量 上 的 80000 倍 的 变异 。 再 者 ,基因 数 是 与 结构 复杂 性 正 相 关 的 ,
而 基因 组 大 小 则 不 是 .mRNA 分 子 长 度 上 的 种 间 差 异 也 不 能 解释 C 一 值 矛 盾 。 在 不 同 生物 间 编 码 区
和 非 编码 区 的 平均 长 度 都 有 着 差异 的 情况 下 ,基因 长 度 和 基因 组 的 大 小 间 就 不 会 存在 相关 。
几 种 编码 RNA 的 基因 的 重复 程度 与 基因 组 大 小 间 的 正 相 关 业 已 被 发 现 ( 第 六 章 )。 类 似 地 , 象 端
粒 、 着 丝 粒 和 复制 器 基因 ,这样 一 些 在 有 丝 分 裂 和 减 数 分 裂 期 间 为 染色 体 复 制 、 分 离 和 重组 所 必需 的
调控 序列 ,它们 的 拷贝 数 与 基因 组 大 小 间 也 存在 相关 性 .不 过 ,所 有 这 些 基因 只 构成 基因 组 的 一 小 部
分 ,以 至 RNA 基因 和 调控 序列 等 的 在 数量 上 的 差异 并 不 能 解释 基因 组 大 小 上 的 差异 。
总 之 ,我 们 只 剩 下 非 基因 DNA 部 分 作为 造成 C 一 值 矛 盾 的 唯一 嫌疑 犯 。 换 句 话说 , 真 核 基因 组 的
主要 部 分 是 由 不 含 遗传 信 息 的 DNA 所 构成 的 . 曾 有 估计 认为 ,每 基因 组 非 基因 IDNA 的 量 在 真 核 生
物 中 从 约 3.0X10sbp 到 1.0X10abp 以 上 (10 万 倍 范围 ) 之 间 变 化 , 且 构 成 了 基因 组 的 量 的 不 到 302 至
几乎 100% (Cavalier-Smith ,1985) 。
R84 按 基因 组 大 小 等 级 的 真 核 生物 的 C 值
物种 C 值 (kb)
Navicola pelliculosa tt ¥ ) 35,000
Drosophila melanogaster (FR: #8) 180,000
Parameciunm aurelia( # € 4) 190,000
Gallus domesticus (34) 1,200,000
Erysiphe cichoracearum( Ei fai) 1,500,000
Cyprinus car pio( M##) 1,700,000
Lam preta planeri(+t #8 #8 ) 1,900,000
Boa constrictor (WE) 2,100,000
Parascaris equorum (4. #3] ) 2,500,000
Carcarias obscurus( # ) 2,700,000
Rattus norvegicus(K fa) 2,900,000
Xenopus laevis (#f) 3,100,000
Homo sapiens K ) 3,400,000
Nicotiana tabaccum (48 ©) 3,800,000
Paramecium caudatum(#f € 4) 84600,000
Schistocerca gregaria (4 2 ) 9,300,000
Allium cepa i) : 18,000,000
Coscinodiscls asterom phalus #E 9) 25,000,000
Lilium Poe (AF) 36,000,000
Am phiuma means (4 #6) 84,000,000
Pinus resinosa(# ) 68,000,000
Proto pterus aethiopicus (fiii £4. ) 140,000,000
Ophioglossum petiolatum Bk) 160,000,000
Amoeba proteus AE FG #2) 290,000,000
Amoeba dubia (AE 6 8) 670,000,000
资料 自 Cavalier-Smith(1985) ,Sparrow 等 (1972) 和 其 他 参考 文献 。
8.4 真 核 生物 基 因 组 的 重复 结构
真 核 生 物 的 基因 组 有 两 大 特征 :(1) 序 列 的 重复 ,和 (2) 组 成 分 隔 化 ,分 隔 成 以 特别 的 核 苷 酸 组 成
而 相互 区 别 的 特征 片段 .重复 DNA(repetitive DNA) 是 由 不 同 长 度 和 组 成 的 核 苷 酸 序列 所 构成 ,这 些
序列 以 串 接 或 散在 的 形式 在 基因 组 中 几 次 出 现 。 不 发 生 重 复 的 DNA 片段 被 称 为 单 拷贝 DNA(single-
copy DNA) 或 单一 DNA(Cunique DNA) .基因组 中 由 重复 序列 占据 的 部 分 在 各 分 类 单位 间 变 化 极 大 。
在 酵母 中 ,该 部 分 的 量 约 为 20% ;而 在 哺乳 类 中 , 则 高 达 60%% 的 DNA 是 重复 性 的 .在 植物 中 ,该 部 分
可 超过 80% ,而 且 比 它 更 高 的 值 也 曾 被 记录 到 (Flavell,1986 ) 。
布 里 滕 和 科恩 (Britten 和 Kohne ,1968) 所 做 的 关于 DNA 双 链 重新 结合 的 经 典 研 究 表明 , 较 高 ,
等 的 真 核 生物 ,其 基因 组 大 致 分 分 成 4 部 分 : 折 回 DNA (foldback DNA), BBS DNA (highly repeti-
tive DNA) ,中 度 重 复 DNA(Cmiddle-repetitive DNA) 和 单 拷贝 DNA( 图 8 一 1) 。 折 回 DNA 由 回 文 DNA
顺序 所 构成 ,一 旦 这 种 变性 了 的 DNA 被 允许 复 性 时 ,该 顺序 可 以 形成 发 夹 式 的 双 链 结构 。 高 度 重复
部 分 是 由 长 度 从 几 个 到 成 百 个 核 苷 酸 的 短 序列 所 构成 ,其 重复 数 平均 为 50 万 次 .中 度 重复 部 分 由 平均
达成 百 或 成 千 碱 基 对 的 长 序列 所 构成 ,它们 在 基因 组 中 以 成 百 的 次 数 出 现 。
根据 重复 在 基因 组 中 散在 的 模式 ,重复 部 分 已 被 发 现 是 由 两 类 重复 家 族 所 构成 的 :区 域 性 重复 家
* 126°
族 和 散在 的 重复 家 族 。
0
20 高 度 重复 DNA DNA
2
. 局
= 40 | 中 度 重复 DNA
>0. 9, Ar LA u/v<0. 11.
除 GC 突变 压力 外 ,突变 引起 的 变化 也 受 选择 限制 。 换 句 话 说 ,替换 的 模式 是 由 突变 模式 和 对 抗
某 些 突变 的 纯洁 化 选择 的 模式 所 决定 的 (第 四 章 )。 某 一 特定 区 域 中 的 选择 限制 越 弱 ,GC 突变 压力 对
GC 组 成 的 影响 就 越 强 .图 8 一 5 展示 了 总 GC 含量 与 3 个 密码 子 位 置 上 GC 含量 间 的 相关 ,数据 来 自 11
° 132"
iy
86g 4
ke ee 2 2H
2 Bee a it
at tk gh th ke OK HR BS am we x
ke FF go RS MR eo
Bal 上 pHkK © et eee we
100 ; f
| we
*
密码 子 GC 含量 (% )
20 40 60 80
基因 组 GC 含量 ( % )
图 8 一 5 总 基因 组 DNA 和 第 一 、 第 二 以 及 第 三 密码 子 位 置 间 GC 含量 的 相关 。 虚 线 表示 基因 组 中 与 密码 子 中 GC
含量 间 完 全 对 应 时 的 理论 期 望 关 系 。 自 Muto 和 Osawa (1987).
种 细菌 ,覆盖 了 范围 相当 广 的 GC 含量 值 . 我 们 看 到 ,第 三 密码 子 位 置 上 的 相关 与 无 选择 情况 下 的 预
期 相关 类 似 。 另 一 方面 ,第 一 和 第 二 密码 子 位 置 上 的 相关 ,在 正 相 关 的 情况 下 , 则 表现 出 平缓 得 多 的 坡
度 。 根 据 下 面 所 说 的 事实 这 很 容易 得 到 解释 , 即 作用 在 大 多 数 简 并 的 密码 子 第 三 位 置 上 的 选择 , 远 不
如 第 一 和 第 二 位 上 的 那样 严峻 (第 四 章 ) ,以致 于 第 三 位 上 的 GC 水 平 很 大 程度 上 是 由 突变 压力 来 决
定 的 。
8.8 兰 椎 动物 基因 组 的 组 成 上 的 组 织 化
图 8 一 6 展示 了 不 同 生 物 类 群 中 的 GC 含量 .有趣 的 是 ,虽然 多 细胞 的 真 核 生 物 的 基因 组 大 小 一 般
要 比 原核 生物 的 大 ,但 真 核 生物 中 的 GC 含量 却 表现 出 了 小 得 多 的 变异 .特别 地 , 关 椎 动物 的 基因 组
显示 出 有 相当 一 致 的 GC 含量 ,处 在 从 约 40%% 到 45% 的 范围 中 (Sueoka,1964)。 兰 椎 动物 中 的 GC 含量
处 于 一 个 较 小 的 范围 内 的 部 分 原因 也 许 是 , 肴 椎 动物 与 细菌 不 同 ,它们 相互 分 岐 的 时 间 还 不 够 长 ,所
以 还 不 能 在 GC 含量 上 积累 较 大 的 差异 。
虽然 脊椎 动物 在 基因 组 的 GC 含量 上 有 一 致 性 ,但 它 的 基因 组 却 有 着 比 原核 生物 基因 组 更 复杂
的 组 成 上 的 组 织 化 。 当 养 椎 动物 的 基因 组 被 随机 地 裁剪 成 长 30 一 100kb 的 片段 ,并且 将 这 些 片 段 按 其
碱 基 组 成 分 离 时 ,这 些 片段 即 聚 类 成 为 数 不 多 的 、 可 通过 其 GCC 含量 而 相互 区 别 的 ( 富 GC 片段 比 富
AT 片段 重 ) 类 型 .每 一 类 都 以 有 虽 不 等 同 但 却 相 似 的 碱 基 组 成 带 为 特征 (Bernardi 等 ,1985 ; Bernardi,
上
0 FS5.*
IT
wR
& 植物
#5
®
时
Pa e
w | Fees
iis 3
1
Q | saw
wy 10
le
20 30F 0 50 60 70 80
GC 含 量 (% )
图 8 一 6 不 同 生物 美 群 中 的 GC 组 成 。 自 Sueoka(1964)。
1989) 。
温 血 和 冷血 状 椎 动物 的 基因 组 间 在 组 成 上 的 组 织 化 方面 有 明显 差异 (Bernardi 等 ,1985,1988) 。
图 8 一 7a 展示 了 ,来 自 鲤 Cyzprzzzs carpio 和 两 栖 类 Xenopus laevis AA) WURK B 3A ih HED D :
MW RAA GRD NH EB DNA 组 分 的 相对 量 和 浮力 密度 .在 鸡 . 小 鼠 和 人 的 基因 组 中 ,有 两 个 轻 组
SLA LD) ,代表 了 约 三 分 之 二 的 基因 组 ,以 及 两 个 或 三 个 重组 分 (Hi ,H:, 和 了:75 代 表 余 下 的 三 分
之 一 。 相 比 之 下 ,来 自 大 多 数 冷 血 兰 椎 动物 的 基因 组 DNA 则 主要 为 轻 组 分 (图 8 一 7a) .例如 ,在 Xeno-
pus 中 ,密度 高 于 1.704g/cm 的 DNA 片段 占 基 因 组 的 比例 少 于 10%%, 相 比 之 下 温 血 兰 椎 动物 则 占 30
—40%,
DNA 片段 的 组 成 上 的 分 布 很 大 程度 上 是 与 这 类 片段 的 大 小 独立 的 ,这 指示 出 在 非常 长 的 DNA
链 中 有 某 种 组 成 上 的 同 质 性 .这 种 同 质 的 长 段 术语 称 为 同 质 段 (isochore)。 图 8 一 7b 展示 了 来 自 温 血
SHAD Hh) AK DNA 的 镰 典 式 组 织 化 ( 即 , 轻 与 重 同 质 段 轮流 出 现 )。 当 这 些 同 质 段 在 DNA 裁剪
期 间断 裂 时 ,4 种 较 大 的 有 不 同 GC 含量 的 分 子 家 族 即 产生 了 。 贝 尔 纳 迪 等 (Bernardi 等 ,1985) 的 结论
是 , 富 GC 的 ( 重 的 ) 同 质 段 约 占 温 血 状 椎 动物 基因 组 的 三 分 之 一 ,而 在 冷血 养 椎 动物 中 则 几乎 没有 。
温 血 肴 椎 动物 的 基因 组 是 灸 挫 式 的 ,这 一 发 现 与 染色 体 分 带 研究 的 结果 是 一 致 的 。 温 血 肴 椎 动物
的 中 期 染色 体 , 当 用 莉 光 染料 ` 蛋白酶 水 解 , 或 有 差别 的 变性 条 件 处 理 时 ,将 显现 出 清晰 的 吉姆 萨
(CGiemsa) 暗 带 (G 一 带 ) 和 亮 带 (R 一 带 ) 。 与 之 成 对 照 的 是 ,冷血 糊 椎 动物 的 中 期 染色 体 则 只 显 出 很 少
的 分 带 ,或 完全 不 分 带 。 因 此 , 曾 有 建议 认为 , 少 GC 和 富 GC 同 质 段 大致 上 分 别 对 应 于 G 一 带 和 民 三
带 (Comings,1978;Cuny 等 ,1981) 。 关 于 基因 的 复制 时 序 的 研究 表明 ,位 于 富 GC 同 质 段 (R 一 带 ) 中 的
基因 在 细胞 周期 的 早期 复制 , 而 位 于 少 GC 同 质 段 (G 一 oo se 等 ,
1984; Bernardi 等 ,1985;Bernardi,1989 ) 。
同 质 段 中 基因 的 位 置
很 多 来 自 人 和 其 他 温 血 肴 椎 动物 的 基因 组 中 的 基因 , 曾 用 与 适当 的 探 针 杂交 的 方法 而 被 定位 在
这 类 组 成 上 的 同 质 段 上 (Bernardi 等 ,1985)。 这 些 研究 指出 ,基因 在 整个 基因 组 中 的 分 布 是 明显 地 非
随机 的 ,大 多 数 基因 位 于 仅 占 基因 组 的 3 一 5 狼 的 最 重组 分 (H3) 中 。
在 大 多 数 情况 下 ,基因 是 处 在 有 与 其 自身 类 似 的 GC 含量 的 DNA 片段 中 。 这 一 发 现 为 同 质 段 的
存在 提供 了 独立 的 证 据 , 风骨 天生 人 国生 术 人 的 全 于 和 这 省 。 事实 上 ,因为 构成 DNA
制备 物 的 这 些 片段 是 经 随机 降解 而 产生 的 ,所 以 ,这 些 带 有 基因 的 片段 在 组 成 上 处 于 较 狭 窗 的 范围 中
的 现象 表明 ,它们 在 约 两 倍 于 这 些 片段 自身 大 小 的 区 域内 ( 即 高 到 200kb), 有 着 非常 同 质 的 碱 基 组
。134,。
ree
a oa en
m 全
by O jg
占 基因 组 的 分 量 (% )
占 基因 组 的 分 量 (% )
a
L, 2
= H, 人
iy
0
1.700 1.705 1700 1705 A
FH 8 BE (g/cm?)
(b)
: IT DNA 分 子
MA | | | HI
Lae (tei, Hy Gy | Hy
主要 DNA 成 分
图 8 一 7 (AA RRA,.RKA Cyprinus car pio( 4) fe Xenopus Laevis( 爪 歇 )( 左 图 ) 和 来 自 鸡 、 小 筷 与 人 ( 右 图 ) 的 主
要 DNA FRR HH ES HF HER. DAR MHA LK DNA 的 镶 风 组 织 化 的 模式 图 。 当 这 些 同 质 段 在
DNA 制备 期 间 随机 断裂 时 ,4 种 较 大 的 具 不 同 GC 含量 的 分 子 家 族 即 产生 了 .还 有 几 种 较 小 的 杂种 家 族 产生 。 自
Bernardi 等 (1985) 。
成 。 8
DNA 序列 数据 分 析 已 揭示 出 ,在 基因 、 外 显 子 和 内 含 子 的 GC 水 平 , 与 它们 处 于 其 中 的 大 段
DNA 区 域 的 GC 水 平 间 存 在 正 相 关 (Bernardi 和 Bernardi,1985;Bernardi 等 ,1985;Ikemura,1985;Ao-
ta 和 Ikemura,1986) .图 8 一 8 将 人 类 中 的 % 一 和 有 一 珠 蛋 日 驴 进 行 了 对 比 .B 和 类 有 昌 珠 蛋白 基因 是 低 GC
含量 的 , 且 它 们 处 在 低 GC KM RZ. 和 类 w 珠 蛋 白 基 因 是 富 含 GC 的 , 则 它们 处 在 富 含 GC 的 区
域 中 。 同 样 的 情形 也 曾 在 免 、. 山 羊 和 小 鼠 中 发 现 。 在 鸡 中 ,B 一 和 一 珠 蛋 白 基 因 都 是 富 含 GC 的 ,而 且
两 者 都 处 在 富 GC 的 区 域 中 。 相 比 之 下 ,Xenopaus( 爪 蟾 ) 中 的 一 和 8 一 珠 蛋 白 基 因 则 是 少 GC 的 ,并
且 两 者 都 处 在 少 GC 的 区 域 中 。
在 绝 大 多 数 情 况 下 ,编码 区 中 的 GC 含量 有 高 于 侧 区 中 含量 的 倾向 (图 8 一 9)。 我 们 还 看 到 ,第 三
密码 子 位 置 上 的 GC 水 平 , 平 均 下 来 高 于 内 含 子 中 的 水 平 , 而 后 者 则 又 比 5 和 3' 侧 区 域 中 的 水 平 高 。5/
侧 区 中 的 GC 水 平 又 高 于 3' 侧 区 中 的 ,这 或 许 是 因为 启动 子 及 其 周围 区 域 倾向 于 富 含 GC 的 缘故 。
e 全 局 入
(a) 人 及 珠 蛋白 复合 物 (b) 人 w- 珠 蛋白 复合 物
100
GC 含量 (%)、
位 置 (Kb)
图 8 一 8 GC 含量 活 人 的 珠 蛋 白 DNA 顺序 的 分 布 :(a)B 一 珠 蛋 白 基 因 徐 ;(b)a 一 珠 蛋 白 基 因 族 (不 完全 )。 这 些 基因
( 粗 线 ) 以 与 图 6 一 7 中 同样 的 次 序 排 列 。 这 些 基 因 的 名 称 显 示 在 该 图 的 底部 ;区 域 1 是 5 和 居 之 间 的 基因 间 区 。 在 尼
一 珠 蛋 白 签 和 履 盖 qdl 一 和 a2 一 珠 有 蛋白 基因 的 区 域 中 ,每 一 点 代表 围绕 该 点 的 2001 个 核 音 酸 的 GC 组 成 的 平均 值 ,
而 其 他 区 域 中 的 每 一 点 则 代表 1401 个 核 苦 酸 的 平均 值 。. 水 平 的 虚线 表示 整个 人 的 基因 组 的 GC 含量 (40% ) 。 自 站 e-
mura 和 Aota(1988) 修 改 而 成 。
#
* of
4a
&
个
40
x
0 ee
GC 含量 (% ) GC 含量 (% ) )
第 三 密码 子 位 置 ion 第 三 密码 子 位 置
& 5
aw) oe
Fa és
io &
ix] x
= i
= =
及 =
wn Va)
GC & #(%) GC 含量 (% )
第 三 密码 子 位 置 内 含 子
四 5
= is
8 加
bx! a
= 忌
= 尽
cm
00 50 100 0 50 100
GC 含量 (% ) GC 含量 (% )
内 含 子 5 侧 序列 区
图 8 一 9 基因 的 各 个 区 域 中 的 GC 百分比 含量 间 的 关系 。(a) 第 三 密码 子 位 置 与 5 侧 区 。(b) 第 三 密码 子 位 置 与 内 会
子 。(c) 第 三 密码 子 位 置 与 3' 侧 区 。(d) 内 仿 子 与 5 侧 区 。(e) 内 例子 与 3` 侧 区 。(f)5' 侧 区 与 3 侧 区 。 自 Aota 和 Ikemura
(1986).
° 136°
同 质 段 的 起 源 一 如 其 被 争论 的 那样 神秘 莫 测 .注意 , 问 题 在 于 DNA 的 长 区 段 (30kb 或 更 长 一
些 ), 它 的 普遍 趋势 是 或 者 是 富 GC 的 或 者 是 少 GC 的 ,而 不 是 在 GC 含量 上 发 生 局 部 变异 一 象 我 们 在
基因 的 各 不 同 区 域 中 所 看 到 的 那样 。 贝 尔 纳 迪 等 (Bernardi 等 ,1985;1988) 提 出 , 同 质 段 是 因 功 能 上
的 ( 即 选择 上 的 ?优势 而 产生 的 。 他 们 的 主要 论据 是 ,在 温 血 生物 中 ,GC 含量 上 的 增加 可 以 保护 DNA、
RNA 和 和 蛋白 质 免 受热 的 降解 ( 见 下 面 ) ,因为 G 一 C 键 是 比 A 一 T 键 强 的 化 学 键 (第 一 章 )。 我 们 称 这
个 观点 为 选择 论 者 的 假说 (selectionist hypothesis) 。
沃 尔 夫 等 (Wolfe 等 ,1989a) 提 出 , 同 质 段 是 种 系 DNA 复制 期 间 , 由 于 前 体 核 苷 酸 库 中 的 组 成 变
化 而 造成 的 突变 倾斜 所 引起 的 。 富 含 GC 的 同 质 段 由 在 种 系 细 胞 周期 的 早期 复制 的 DNA 区 域 所 扒
带 , 而 在 那 一 期 间 前 体 库 有 较 高 的 GC 含量 ,因而 就 有 一 种 突变 成 GC 的 偏向 。 反 之 , 富 含 AT 的 同 质
段 在 细胞 周期 的 晚期 复制 , 那 时 前 体 库 有 较 高 的 AT 含量 ,故而 有 一 种 突变 成 AT 的 倾向 。 我 们 称 它
为 突变 论 者 的 假说 (mutationist hypothesis) 。 此 假说 是 根据 这 样 的 观察 而 作出 的 : 核 苷 酸 前 体 库 的 组
成 在 细胞 周期 内 会 发 生变 化 ,而 这 些 变化 事实 上 能 导致 新 合成 的 DNA 中 碱 基 比 改变 (Leeds 等 ,
1985 )。 必 须 清 楚 , 哺 乳 动物 基因 组 的 复制 是 一 个 相当 漫长 的 过 程 , 要 花 8 小 时 或 者 更 多 时 间
(Holmquist , 1987).
一 个 支持 选择 论 者 假说 的 理由 是 ,第 一 和 第 二 密码 子 位 置 上 GC 含量 的 增加 可 给 予 蛋 白质 以 热
稳定 性 ,而 内 含 子 , 第 三 密码 子 位 置 和 不 翻译 区 中 GC 含量 的 增加 , 则 既 能 增加 原始 mRNA 转录 本 的
热 稳 定性 ,又 能 稳定 染色 体 的 结构 ,后 者 或 许 是 通过 影响 DNA 一 蛋白 质 的 相互 作用 而 实现 的 。 事 实
上 , 嗜 热 细菌 强烈 地 倾向 于 采用 富 GC 密码 子 的 情况 已 有 报导 ( 见 第 131 页 )。 然 而 , 温 血 肴 椎 动物 的 体
温 要 比 嗜 热 细 菌 所 经 受 的 温度 低 得 多 ,所 以 ,对 关 椎 动物 的 蛋白 质 和 DNA 序列 的 进化 来 说 ,温度 可
能 并 不 是 一 个 非常 重要 的 因素 。
选择 论 者 假说 所 面临 的 一 个 困难 是 ,大 部 分 哺乳 动物 和 鸟 类 的 基因 是 低 GC 含量 的 这 样 一 个 事
实 。 此 假说 也 不 能 解释 为 什么 有 些 重 复 基 因 有 着 相反 的 GC 含量 。 例 如 ,在 哺乳 类 中 ,8 一 珠 蛋 白 簇 是
低 GC 的 ,而 一 珠 蛋 白 簇 则 是 语 GC 的 (图 8 一 8) ,尽管 这 两 类 珠 蛋 白 基 因 是 在 同一 细胞 内 、 同 一 时 间
里 表达 的 , 且 有 着 同样 的 功能 .类 似 地 ,有 些 免 疫 球 蛋 白 基 因 位 于 富 GC 区 ,而 另 一 些 则 位 于 富 AT 区
(KL Aota 和 Ikemura, 1986) .贝尔 纳 迪 等 (Bernardi 等 ,1985,1988) 的 解释 是 , 同 质 段 代 表 选 择 的 单
位 ,而 哺乳 动物 中 的 o RE KD BIT BGC E.G ER A EK GC 同 质 段 中 。 根 据 这 一 理由 ,
鸡 中 的 和 8B 复 应 该 都 被 易 位 到 富 GC 同 质 段 了 。 然 而 ,这 一 理由 却 引 出 了 一 个 富 GC 同 质 段 的 功能
优势 问题 .如 果 这 一 优势 不 是 来 自 它 所 含有 的 基因 ,那么 它 来 自 何方 呢 ?
突变 论 者 的 假说 能 解释 哺乳 类 基因 组 中 一 和 8 一 珠 蛋 白 簇 间 GC 含量 上 有 较 大 差异 的 成 因 , 即
假定 它们 分 别 位 于 早期 和 晚期 复制 的 区 域内 。 不 过 , 它 也 面临 着 一 些 困 难 (Bernardi 等 ,1988) 。 例 如 ,
结构 异 染 色 质 ,如 卫星 DNA ,大 多 数 是 富 GC 的 ;而 功能 异 染 色 质 ,如 非 活 性 的 X 染色体, 在 细胞 周期
的 尾声 阶段 复制 ;在 这 些 情 况 下 , 核 苷 酸 库 和 DNA 组 成 上 的 变化 间 看 不 到 有 什么 联系 。
结论 是 , 现 有 的 资料 看 来 还 不 足以 对 这 两 种 假说 加 以 评判 .也 有 可 能 突变 压力 和 自然 选择 两 者 ,
都 在 形成 温 血 肴 椎 动物 基因 组 的 组 成 上 的 组 织 化 中 起 着 作用 。
习题
1、 表 8 一 5 列 出 了 4 种 原生 动物 的 基因 数 , 平 均 基 因 大 小 的 大 致 估 值 和 C 值 .(a) 假 定 基 因 组 的 基
因 部 分 仅 由 为 蛋白 质 编码 的 基因 构成 ,那么 ,每 一 种 生物 中 非 基 因 DNA 的 比例 是 多 少 ?(b) 基 因 组 大
小 和 非 基 因 DNA 的 比例 间 存 在 某 种 关系 吗 ?( 注 意 C 值 以 pg 一 微微 克 为 单位 )。
表 8 一 5 4 种 原生 动物 的 前 体 mRNA 的 平均 大 小 和 数目 的 大 致 估 值 和 C 值
物种 基因 组 大 小 (pg) 基因 大 小 ( 核 苷 酸 ) 基因 数
Physarum polycephalum 0. 57 1500 20000
Oxytricha nova 0.4 2200 24000
Euplotes aediculatus 0. 3 1800 40000
Dictyostelium discoideum 0. 036 1500 6500
资料 取 自 Cavalier-Smith(1985) 。
2、 表 8 一 6 列 出 了 4 种 生物 的 前 体 mRNA 和 成 熟 mRNA 的 平均 大 小 的 大 致 估 值 和 C 值 .C AEN
差异 ,能 用 这 些 生 物 的 基因 间 在 非 编 码 区 的 大 小 上 存在 差异 来 加 以 解释 吗 ?( 注 意 C AW pg 为 单位
给 出 )。
表 8 一 6 4 种 动物 的 平均 基因 大 小 和 mRNA 大 小 的 大 致 估 值 和 C 值
属 基因 组 大 小 (pg) 前 体 mRNA 大 小 ( 核 苷 酸 ) mRNA 大 小 ( 核 苷 酸 )
Drosophila( # #8 ) 0.18 4200 2100
Aedes ( 8X ¥ ) 0. 837 8400 2100
Strong ylocentrotus (3% fA) 0. 89 8800 2100
Homo(\) 3. 50 10000 2100
资料 取 自 Cavalier-Smith(1985) 。
a\ 不 同 物种 平均 后 得 到 的 值 。
3 假定 在 某 一 生物 中 ,整个 基因 组 都 是 由 为 蛋白 质 编码 的 基因 所 构成 ,20 种 氮 基 酸 以 相等 的 频率
使 用 ,(a) 如 果 同 义 密码 子 的 选取 由 尽 可 能 导 至 最 高 GC 含量 的 选择 所 决定 ,那么 这 种 生物 的 GC 含
量 将 是 多 少 ?(b) 如 果 同 义 密码 子 的 选取 由 尽 可 能 导致 最 低 GC 含量 的 选择 所 决定 ,那么 这 种 生物 的
GC 含量 又 是 多 少 。
4、 假 定 在 某 一 DNA 序列 中 ,每 核 背 位 点 每 世代 的 替换 速率 从 G 或 C 到 工 或 A 为 则 从 A 或 工
到 G 或 C 为 v。 设 Pt 是 世代 t+ 时 G 和 C 核 苷 酸 在 该 序列 中 的 比例 .那么 ,GC 在 下 一 世代 中 的 比例 为
下
根据 这 一 等 式 , 证 明 平 衡 点 GC 比例 由 等 式 8. 1 给 出 。
5、 如 果 某 一 序列 的 起 始 GC 会 量 为 Po, 则 可 证 明 世 代 t 时 的 GC 比例 由 下 式 给 出 :
ern A
tara gee ort ore ut+uv
(AE u=3X10°°, v=5X10*, A P,)=0. 20,18 t=10° HA Pt A. EXHAH PE GCCSBENBEK
是 一 个 缓慢 过 程 还 是 一 个 快速 过 程 ?
后 继 阅 读 文献
Ca (u+v)t
Bernardi, G., B. Olofsson, J. Filipski, M. Zerial, J. Salinas, G. Cuny, M. Meunier-Rotival and F.
Rodier. 1985. The Mosaic genome of warm-blooded vertebrates. Science 228: 953—958.
Blake. R. D. and S. Early. 1986. Distribution and Evolution of sequence characteristics in the E. coli
genome. J. Biomol. Struct. Dynamics 4: 291—307.
Britten. R. J.and D. E. Kohne. 1968. Repeated sequences in DNA. Science 161:529—540.
Brutlag. D. L. 1980. Molecular arrangement and evolution of heterochromatic DNA. Annu. Rev.
Genet. 14:121— 144.
Cavalier-Smith. T. (ed). 1985. The Evolution of Genome Size. Wiley. New york.
Cold Spring Habor Symposia on Quantitative Biology. 1986. Moleculur Biology of Homo sapiens.
Vol. 51. Cold Spring Habor Laboratory. Cold Spring Habor, NY.
Deininger. P. L. and G. R. Daniels. 1986. The recent evolution of mammalian repetitive DNA ele-
ments. Trends Genet. 2: 76—80
« Tae
Dover. G. A. and R. B. Flavell (eds. ) . 1982. Genome Evolution. Academic Press, New York.
Jelinek. W. R. and C. W. Schmid. 1982. Repetitive sequences in eukaryotic DNA and their expres-
sion. Annu. Rer. Biochem. 51: 813—844.
John, B. and G. Miklos. 1988. The Eukaryotic Genome in Development and Evolution. Allen & Un-
win, London.
Singer. M. F. 1982. Highly repeated sequences in mammalian genomes. Int. Rev. Cytol. 76: 67 —
112.
—
- 139°
第 二 章
2g (Woe Wy)
和 a” Gat ee
4. @)P,=9. 776 X10 *; (bP. —0, 2467 .—9. 778 X10"
5. N./N=8/9
6. N.=59. 701
7.P=s17e9 X10‘
8. (a) 1-s A 2-s 19 aS KS Al, A 2; =2/3,2,=1/3, A m= 1. 729X10 *; (-b)x=3. 891K 10-3
第 三 章
6. (a) P,=0. 615; (b) Pa=0. 244,
9. 4r=4N,(a)K=0. 061 f(b) K=0. 056
“4 r=6 WY,(a)K=0. 041 #l(b)K =0. 037
#
2. fi K, =0.012,K, =0. 048 #l Ky =0. 295 HH
3. (a) LH K = 0.076 PH; (b) HLA K = 0.075 替换 。
4. 小 鼠 序列 的 进化 比 大 鼠 序列 的 快 1.63 倍 。
5. (a) BEF BEAL Pinas = 0.057 FR; (Cb) BF BLE nin = 0.004 FR,
* 140 *
(b)
(c) 5 (b) FA fA .
Ca)
(a) (d) (c) (b) (e) (f)
TES Pi} 8
《c) 和 (d) 不 形成 一 个 进化 枝 。
\b) 得 到 两 个 同样 节省 的 树 :
上 II
(a) (e) (b) (c) (f) (b) (c) (e) (a) (f)
PY HP Te) Hy Bb). Cc) A (Ce) HG R— THE LK I EG Balle Jp Ee - i
Ba
ik
2. (ad 47 个 非 简 并 位 点 和 13 个 四 重 简 并 位 点 ;(b)70 个 非 简 并 位 点 且 无 四 重 简 并 位 点 ;(c) 所 有
° 141°
72 个 位 点 都 是 非 简 并 的 。
3.(a)5;(b)6,
4. (b)17. 24X10 4,
第 八 章
1. (a) Physarum polycephalum ,5. 37% ;Oxytricha 7ova,13. 46% ; Euplotes aediculatus, 24. 48% ;
Dictyostelium discoideum ,27. 637% ; (b) 3é A 4A K7) 5 ESE DNA 所 占 比 例 之 间 存 在 着 负 相 关 。
3. (a)56.76%;(b)30. 00%
5. P,=0. 43 “
° 142°
ao
<—_eor
A(1)#E DNA K RNA ARE RH, DERARAA AR.
acceptor site 受 体 部 位 。 内 含 子 的 3) tig.
active site 活性 部 位 。 一 种 蛋白 质 , 通 常 为 一 种 酶 中 的 部 位 ,其 结构 完整 性 为 行使 功能 (例如 基质
结合 ) 时 所 必 不 可 少 的 。
additive tree 加 性 的 树 。 一 种 系统 树 ,其 中 任何 两 个 终端 节点 间 的 距离 等 于 将 它们 联结 起 来 的 枝
长 之 和 。
advantageous mntation 有 利 突 变 。 一 种 能 增加 其 携带 者 的 适合 度 的 突变 。
alignment 线性 排比 。 为 了 找 出 缺失 和 插入 的 位 置 而 将 两 同 源 序 列 进行 配 比 似 的 排列 。
allele(allelomorph) 等 位 基因 (等 位 基因 型 )。 一 个 基因 座位 上 可 供 选择 的 基因 形式 。
allele frequency (gene frequency) 等 位 基因 频率 (基因 频率 )。 和 群体 中 某 一 给 定 基 因 座 位 上 某 一 等 位
基因 拷贝 所 占 的 百分比 。
allozyme(allelozyme) 异 型 酶 (等 位 酶 )。 一 种 酶 的 某 种 等 位 形式 。
alternative splicing 选择 性 拼接 。 通 过 采用 不 同 的 受 体 和 给 体 部 位 ,而 从 一 种 前 体 一 mRNA 序列
产生 出 两 种 或 多 种 mRNA 分 子 。
amino acid 氨基 酸 。 一 种 具有 通 式 R-CHCNH;)COOH 的 有 机 分 子 , 既 有 碱 性 基 团 (NH,) 又 有 酸性
基 团 (COOH) ,还 有 为 各 种 氨基 酸 所 特有 的 侧 链 基 团 (R)。 蛋 白质 的 亚 单位 和 结构 砖 块 。
amino terminal(N-terminal) 氨基 末端 CN 一 末端)。 一 个 多 肽 的 NH2: 端 。
amplification 扩 增 。 某 一 基因 或 DNA 序列 的 拷贝 数 的 大 幅度 增加 ,增加 量 超 出 了 作为 该 生物 单
倍 体 基 因 组 的 特征 所 具有 的 量 。
analogy 类 似 。 由 趋同 进化 、 而 不 是 由 共同 的 进化 祖先 所 导致 的 相似 。
aneuploidy (chromosomal duplication ) 非 整数 倍 重复 (染色 体重 复 )。 存 在 着 额外 染色 体 , 以 至 一 个
细胞 的 染色 体 组 成 不 是 单 倍 体 组 的 整数 倍 。
anticodon 反 密 码 子 。tRNA 分 子 中 的 核 苷 酸 三 联 体 ,在 翻译 期 间 通 过 互补 碱 基 配 对 而 与 mRNA
中 的 特定 密码 子 结合 ,从 而 在 翻译 期 间 确定 某 一 具体 氨基 酸 的 位 置 。
antiparallel 反 向 平行 。DNA 双 螺 旋 的 两 条 互补 链 的 相反 取 回 。
apoprotein 脱 辅 基 蛋 白 。 一 种 没有 为 其 功能 所 必需 的 辅酶 、 辅 因子 和 辅 基 的 蛋白 质 ( 例 如 载 脂 蛋
A).
archaebacteria 古 细菌 。 细 胞 壁 中 不 含 胞 壁 酸 的 原核 生物 , 是 一 个 高 度 多 样 化 的 类 群 ,包括 产 甲烷
细菌 , 嗜 热 、. 嗜 酸 的 菌 和 嗜 盐 ( 在 高 盐 浓 度 中 生活 ) 菌 , 据 推 测 是 生物 界 3 个 原始 的 后 代 品 系 之 一 。
arithmetic mean 算术 平均 。n 项 之 和 用 mn 来 除 。
asymmetrical exon 不 对 称 外 显 子 。 两 侧 由 不 同 相 位 类 型 的 内 含 子 所 夹 拥 的 外 显 子 。
autosome 常 染色 体 。 除 性 染色 体外 的 任何 一 种 染色 体 。
back (backward) mutation 回复 突变 。 使 某 一 核 苷 酸 位 点 回复 到 以 前 状态 的 突变 。
bacteriaphage( 缩 写 为 phage) 叭 菌 体 。 寄 生 于 细菌 中 的 病毒 。
balanced polymorphism 平衡 多 态 。 一 种 长 时 期 内 稳定 而 由 平衡 选择 来 维持 的 多 态 。
balancing selection 平衡 选择 。 其 结果 造成 群体 中 某 一 基因 座位 上 维持 着 两 个 或 多 个 等 位 基因 的
选择 体制 (例如 超 显 性 )。
banding 分 带 。 染 色 体 上 明和 暗 地 染 色 区 域 。
base( 见 nucleotide) 碱 基 。
base pair 碱 基 对 。(1) 某 一 核酸 中 一 条 链 上 的 核 苷 酸 , 按 嗓 叭 与 喀 啶 间 的 配对 规则 与 另 一 条 链 上
的 核 苷 酸 形成 氢 键 。(2) 度 量 双 链 DNA 长 度 的 单位 。
biased codon usage( 见 unequal codon usage) 倾 向 性 的 密码 子 应 用 。
bifurcation (dichotomy) 两 分 又 (两 分 枝 )。 系 统 树 中 一 次 物种 形成 的 进化 事件 的 图 形 表 示 ,和 藉 此 一
个 祖先 分 类 单位 分 裂 为 二 。
bottleneck 瓶颈 。 和 群体 大 小 上 的 锐 减 。
box 块 ( 框 )。 邻 近 或 位 于 某 一 基因 内 的 短 DNA 序列 ,起 着 某 种 调控 作用 (例如 TATA #).
branch 分 枝 。 系 统 树 中 某 种 进化 关系 的 图 形 表 示 。
C (1) 在 DNA 或 RNA 中 为 胞 喀 啶 核 苷 ,(2) 在 蛋白 质 中 为 半 胱 氨 酸 。
C 一 terminal( 见 carboxy terminal) C 一 末端 。
C value(genome size)C 值 ( 基 因 组 大 小 ) 。 某 一 物种 的 单 倍 体 基 因 组 所 具有 的 特征 性 DNA 的 量 。
C 一 value paradox C- 值 矛盾 (C- 值 悖 论 ) 。C 一 值 和 形态 学 复杂 性 水 平 间 明 显 地 缺乏 相关 性 的 现
象 。
capping 戴 帽子 。 真 核 生 物 中 前 体 mRNA 的 5' 端 的 修饰 过 程 ,在 此 过 程 中 GTP 经 5-5' 三 磷酸 刍
而 加 入 到 该 分 子 之 中 。
cap site(transcription initiation site) 帽 子 部 位 (转录 起 始 部 位 )。 在 DNA 中 是 转录 开始 的 部 位 ,在
RNA 中 是 mRNA 成 熟 过 程 期 间 被 加 上 帽子 的 部 位 。
carboxy terminal(C-tenninal) 羧 基 末 端 (C 一 未 端 )。 一 个 多 肽 的 COOH 端 。
carrying capacity 负载 力 、 容 纳 量 。 在 一 个 有 限 的 栖息 地 中 , 某 一 给 定 物 种 所 能 维持 的 最 大 个 体
数 。
catalyst 催化 剂 。 一 种 能 降低 某 一 化 学 反应 所 需要 的 活化 能 , 却 不 被 该 反应 所 消耗 或 改变 的 化 合
物 。
cDNA( 见 complementary DNA)
census population size( 见 papulation size) 统 计 记 录 的 群体 大 小 。
central dogma 中 心 法 则 。 以 DNA 为 遗传 物质 的 生物 中 、 信 息 流 动 的 路 线 CDNA->~RNA 一 蛋白
质 ) 。
chimeric protein( 见 mosaic protein) # @ & A Jit .
chloroplast 叶绿体 。 一 种 含 叶 绿 素 的 .由 膜 包 被 的 细胞 器 , 它 是 植物 和 某 些 原生 生物 的 细胞 中 进
行 光合 作用 的 场所 。
chromatid 染色 单 体 。(1) 由 染色 体 复 制 而 产生 的 两 个 拷贝 之 一 。(2) 构 成 该 染色 体 的 两 个 双 链
DNA 分 子 之 一 。
chromosomal duplication( 见 aneuploidy ) 4 f& fA HZ 。
chromosome 染色 体 。 在 原核 生物 中 指 包含 基因 组 的 DNA 分 子 。 在 真 核 生 物 中 , 指 线性 DNA 分
子 与 蛋白 质 复 合 而 形成 的 含有 遗传 信息 的 线 状 结构 。
cis 顺 。 两 个 序列 或 基因 位 于 同一 染色 体 上 的 排列 。
clade 进化 枝 。(1) 按 严格 定义 , 即 由 一 个 物种 及 其 所 有 代表 着 进化 树 上 的 一 个 单 系 分 枝 的 后 代 所
构成 的 某 一 分 类 单位 。(2) 若 较 不 严格 地 应 用 , 则 在 前 面 的 范围 中 可 将 不 代表 该 分 枝 的 后 代 除 外 。
(3) 关 于 现存 生物 , 即 指 在 所 考虑 的 一 大 群生 物 中 ,一 个 有 共同 祖先 的 亚 群 ,该 共同 祖先 不 是 此 群 中 其
他 生物 的 祖先 。
cladogenesis( 见 speciation ) 分 枝 进 化 、 系 统 发 生 。
cladogram 进化 分 枝 图 、 进 化 树 。 描 绘 或 力图 描绘 一 些 群 体 、 物 种 ,或 更 高 的 分 类 单位 间 的 进化 关
系 的 图 形 表示 。
classification( 见 taxonomy) 分 类 。
coding region 编码 区 ( 域 ) 。 一 个 为 蛋白 质 编码 的 基因 中 ,最 终 将 被 翻译 的 所 有 外 显 子 部 分 。
。 144»
codominance(genic selection) ) 共 显 性 (基因 选择 )。 二 倍 体 基因 组 中 某 一 基因 座位 上 的 两 个 等 位 基
因 对 适合 度 有 等 同 的 贡献 。
codon 密码 子 。mRNA 中 相 邻 核 苷 酸 构成 的 三 联 体 ,为 由 某 一 特定 tRNA 携带 的 氨基 酸 编码 ,或
者 确定 翻译 过 程 的 终止 。
codon family 密码 子 族 。 所 有 为 同一 氨基 酸 编码 的 密码 子 , 它 们 相互 间 仅 在 第 三 密码 子 位 置 上 有
差异 (例如 ,为 亮 氨 酸 编码 的 6 个 密码 子 中 ,UUA 和 UUG 组 成 一 个 族 ,CUU、CUC、CUA 和 CUG 则
组 成 另 一 族 ) 。
codon usage 密码 子 应 用 。 一 个 密码 子 族 中 的 成 员 在 为 蛋白 质 编码 的 基因 中 被 使 用 的 频率 。
coenzyme 辅酶 。 一 种 不 与 酶 结合 ,但 作为 一 种 电子 、 原 子 或 原子 基 团 的 中 间 载 体 而 为 该 酶 的 功能
所 必需 的 非 蛋 白质 有 机 分 子 。
cofactor 辅 因 子 。 为 某 种 酶 行使 功能 所 必需 的 无 机 分 子 。
coincidental evolution( 见 concerted evolution ) 并 发 进化 。
coincidental substitution 并 发 蔡 换 。 两 同 源 序列 中 的 同一 核 苷 酸 位 点 上 发 生 的 两 个 替换 。
colinearity 线性 对 应 。 无 内 含 子 基 因 的 DNA 顺序 和 其 所 编码 蛋白 质 的 氨基 酸 顺 序 间 的 精确 对
complementarity 互补 (性 )。 双 链 DNA、 双 链 RNA 或 DNA 一 RNA 双 链 中 核 苷 酸 的 反 向 平行 配
complementary DNA(CcCDNA) 互 补 DNA。 以 RNA 为 模板 由 反 转 录 酶 合成 的 DNA。
complex(composite)transposon 复合 (合成 ) 转 座 子 。 两 侧 由 两 个 完整 而 独立 的 可 转 座 插 人 序列 夹
拥 的 转 座 子 。
compositional assimilation 组 成 同化 。 假 基因 中 由 于 点 突变 的 积累 最 终 抹 掉 了 它 与 产生 它 的 功能
基因 间 的 顺序 相似 性 ,从 而 使 其 核 苷 酸 组 成 与 其 邻近 DNA 序列 的 相似 。
‘concerted evolution (horizontal evolution ,coincidental evolution ) 协 同 进 化 (水 平 进 化 、 并 发 进化 )。
一 个 物种 中 某 一 基因 家 族 的 成 员 间 核 苷 酸 序列 的 同 质 性 的 维持 ,尽管 核 苷 酸 序列 随 着 时 间 而 改变 。
conditional fixation time 条 件 固定 时 间 。 一 个 最 终 将 会 在 群体 中 固定 的 突变 型 等 位 基因 达到 固定
的 时 间 。
consensus sequence 共同 顺序 。 在 许多 同 源 序列 中 ,每 一 个 位 点 上 都 代表 了 占 绝 大 多 数 的 核 苷 酸
或 氨基 酸 的 那 种 顺序 。
conservative substitution 保守 替换 。 某 一 氨基 酸 被 另 一 个 有 相似 的 化 学 性 质 的 氨基 酸 蔡 换 。
conservative transposition 保守 (型 ) 转 座 。 可 转 座 因子 不 复制 而 从 一 个 基因 组 位 置 移 到 另 一 个 位
置 的 运行 。
constant site or constant region 恒定 位 点 (不 变 位 点 ) 或 恒定 区 。 在 所 有 被 比较 的 同 源 序列 中 ,
DNA 内 由 同样 的 核 苷 酸 占据 的 位 点 或 区 域 。
convergence 趋同 。 相 似 的 遗传 或 表 型 性 状 的 独立 进化 。
convergence substitution 趋同 替换 。 在 两 同 源 序列 中 的 同一 核 苷 酸 位 点 上 ,两 个 不 同 的 核 苷 酸 由
同一 核 苷 酸 所 替换 。
crossing-over 交换 。 两 同 源 染 色 体 间 导 致 连锁 基因 重组 的 遗传 物质 交换 的 过 程 。 假定 该 过 程 是 两
染色 体 先 在 同 源 位 点 处 断裂 ,然后 交换 、 接 着 重新 连结 而 完成 。
cyanobacteria 蓝 细菌 。 具 有 光合 作用 能 力 的 一 类 光合 真 细 菌 。 以 往 称 蓝 绿 藻 。
D 天 冬 氨 酸 。
Darwinian fitness( 见 fitness) 达 尔 文 适合 度 。
decoding( 见 translation) 解 码 。
degenerate code 简 并 密码 。 一 种 遗传 密码 ,其 中 有 意义 密码 子 的 数目 大 于 氨基 酸 总 数 , 结 果 有 些
氨基 酸 将 由 一 个 以 上 的 密码 子 来 确定 。 所 有 已 知 的 遗传 密码 都 是 简 并 的 。
degenerate site 简 并 位 点 。 一 个 密码 子 中 能 由 一 个 以 上 的 核 代 酸 占据 而 仍 为 同样 的 氨基 酸 编码 的
. 145 。
AB RPK RL.
degree of divergence 岐 化 程度 。 两 同 源 序 列 相 互 间 的 差异 程度 。
deleterious mutation 有 害 突变 。 降 低 其 携带 者 的 适合 度 的 突变 。
deletion 缺失 。 从 某 一 DNA 序列 中 移 去 了 一 个 或 多 个 碱 基 。
denaturation 变性 。 和 蛋白 质 的 三 级 结构 的 丧失 。 有 时 被 用 作 DNA 熔 解 的 同义词 。
deoxyribonucleic acidCDNA) 脱 氧 核糖 核酸 。 核 苷 酸 连 结 而 成 的 一 种 大 分 子 聚 合 物 ,其 中 糖 基 为 脱
氧 核糖 。 通 常 是 双 链 的 。 在 所 有 真 核 生 物 和 原核 生物 中 ,以 及 许多 病毒 中 , 它 是 遗传 信息 的 携带 者 。
deterministic process 决定 性 过 程 。 其 结果 能 从 有 关 起 始 条 件 的 知识 来 精确 地 预测 的 过 程 。
diagnostic position ( 见 informative site) 判 定位 置 。
dichotomy( 见 bifurcation ) 两 分 枝 。
digestion 消化 ` 水 解 。 双 链 DNA 被 某 一 限制 性 内 切 核酸 酶 所 切割 。
diploid 两 倍 体 。 一 套 染 色 体 ,其 中 每 种 染色 体 都 有 两 个 拷贝 。
directional selection 定向 选择 。 按 一 种 特别 的 方向 ,或 者 走向 固定 或 者 走向 灭绝 ,来 改变 某 种 等 位 F
基因 的 频率 的 选择 体制 。 4
disjunction 去 联结 。 减 数 分 裂 期 间 同 源 染 色 体 的 分 离 ,或 有 丝 分 裂 期 间 互补 的 染色 单 体 的 分 裂 。 4
distance( I, genetic distance) FE BS 。
distance matrix 距离 矩阵 。 被 研究 的 类 群 中 各 分 类 单位 间 的 遗传 距离 值 组 成 的 矩阵 。
divergence 分 岐 。 一 个 分 类 学 单位 分 成 两 个 的 分 梳 。( 还 可 见 sequence divergence)
DNA( 见 deoxyribonucleic acid )
DNA-DNA hybridization DNA-DNA 杂交 。 形 成 异 源 的 DNA 双 链 。
domain ( Ji, functional domain ) 域 。
dominance 显 性 。 在 杂 合 子 中 某 一 等 位 基因 显示 其 完全 的 表 型 效应 的 性 质
donor site 供 体 部 位 。 一 个 内 含 子 的 5 Site
dose repetition 剂量 重复 。 某 一 DNA 序列 存在 着 多 重 拷贝 ,这 可 由 某 基 因 产 物 以 相对 于 单 拷贝 序
列 而 言 呈 增加 量 的 形式 产生 来 表明 。
dot matrix 点 (和 矩 ) 阵 。 一 种 序列 的 线性 排比 方法 , 其 中 两 序列 分 别 写成 矩阵 的 首 列 和 首 行 、 而 点
WAT AAR MO BAT BoP.
downstream 下 游 。 一 个 核酸 上 的 某 一 参考 点 的 ITE. BRENT.
drift( 见 random genetic drift) 2% .
duplex 双 链 、 双 螺旋 。 一 个 双 链 DNA BK IL HE RNA ,或 一 个 由 单 链 DNA 与 RNA 分 子 互补 配对 而
形成 的 双 螺 旋 。
duplication 重复 ,复制 。 基 因 组 中 某 一 DNA 片段 的 两 个 拷贝 存在 或 产生 。
duplicative transposition( 见 replicative transposition ) 复 制 型 转 座 。
E#aAR.
effective population size 有 效 群 体 大 小 。 与 随机 遗传 漂 变 有 关 的 群体 大 小 。 群 体 中 从 事 生殖 的 实际
个 体 数 。
electromorph 电泳 型 。 由 电泳 移动 性 差异 检 出 的 蛋白 质变 异型 ( 同 功 酶 或 异型 酶 ) 。
electrophoresis 电泳 。 将 浴 解 的 或 胶体 的 颗粒 在 由 场 下 根据 它们 的 移动 性 分 离 的 技术 。 电 泳 移 动
性 有 赖 于 该 颗粒 的 大 小 .三维 几 何 形状 和 电 和 荷 。
endosymbiosis 内 共生 。 两 种 生物 间 的 互利 关系 ,其 中 一 种 生物 .内 共生 者 (endosymbiont) ,生活 在
另 一 种 和 生物、 宿主 Chost) 的 组 织 或 细胞 内 。
endosymbiotic theory 内 共生 学 说 。 该 学 说 认为 ,自我 复制 的 细胞 器 ,如 线粒体 和 叶绿体 ,原初 本 是
自由 生活 的 生物 ,后 来 进入 有 核 的 细胞 并 与 之 建立 了 共生 关系 ,进而 失去 了 独立 生存 的 能 力 。
enzyme 酶 。 能 催化 特异 化 学 反应 的 蛋白 质 或 蛋白 质 复合 物 。
eubacteria 真 细 菌 。 细 胞 壁 中 挫 人 了 胞 壁 酸 的 原核 生物 。 即 除 古 细菌 外 的 所 有 细菌 。 生 物 界 中 三
* 146°
WaS aa
o —_
个 原始 祖先 品系 之 一 。
eukaryote 真 核 生物 。 具 有 一 个 真正 的 细胞 核 和 一 些 由 膜 包 被 的 细胞 器 的 生物 。 生 物 界 中 三 个 原
始祖 先 品 系 之 一 。
exon 外 显 子 。 基 因 的 一 个 DNA 片段 ,其 转录 本 在 成 熟 的 RNA 分 子 中 出 现 。
exon duplication 外 显 子 重复 。 一 个 基因 内 的 某 一 外 显 子 的 重复 拷贝 的 产生 。
exon insertion 外 显 子 插入。 一 个 或 多 个 外 显 子 从 一 个 基因 挫 人 到 另 一 个 基因 子 。
exon shuffling 外 显 子 混 义 。 严 格 地 讲 指 外 显 子 重复 和 外 显 子 插 入 。 常 常 与 外 显 子 插入 同 义 地 应
expected heterozygosity( 见 heterozygosity, gene diversity) 期 望 杂 合 度 、 预 期 杂 合 度 。
extinction 灭绝 。 一 个 进化 谱系 的 终止 。
FARA AR.
fecundity 生殖 力 。 一 种 适合 度 分 量 。 某 一 给 定 基因 型 每 个 体 的 生育 数 或 产 卵 量 。
fertility 能 育 性 。 一 种 适合 度 分量 。 某 一 给 定 基因 型 每 个 体 的 成 活 后 代数 。
fitness (Darwinian fitness) 适 合 度 (达尔 文 适 合 度 ) 。 某 一 个 体 或 某 一 基因 型 的 生存 和 繁殖 上 的 相
对 成 就 的 测度 。 某 一 个 体 或 某 一 基因 型 对 将 来 世代 的 相对 贡献 。
fixation 固定 。 当 某 一 等 位 基因 在 群体 中 的 频率 达到 100% 时 所 出 现 的 情况 。 一 个 两 倍 体 群 体 中
的 所 有 成 员 对 同一 等 位 基因 而 言 都 是 纯 合 的 时 的 情况 。
fixation probability 固定 概率 。 某 一 特定 等 位 基因 将 在 群体 中 固定 的 可 能 性 。
fixation time 固定 时 间 。 某 一 突变 型 等 位 基因 在 群体 中 达到 固定 所 花 的 时 间 。
flanking sequence 侧 ( 区 ) 序 列 。 被 转录 基因 的 5' 和 3' 端 处 的 不 转录 序列 。
foldback DNA 8 Sif # DNA。 含 有 完美 或 接近 完美 回 文 的 DNA , 当 其 为 单 链 时 可 通过 自身 折 回
而 形成 发 夹 状 的 结构 。
fourfold degenerate site 四 重 简 并 位 点 。 密 码 子 中 的 一 个 核 苷 酸 位 点 ,在 该 位 点 上 一 切 可 能 的 替换
都 是 同 义 的 。
frameshift mutation 阅读 框架 移动 突变 。 一 种 扰乱 了 为 蛋白 质 编码 基因 的 阅读 框架 的 突变 。 一 个
DNA 片段 的 缺失 或 插入 , 当 该 片段 的 长 度 不 是 3 或 3 的 倍数 个 核 苷 酸 时 , 即 可 造成 这 类 突变 。
frameshifted protein 阅读 框架 移动 后 的 蛋白 质 ,由 于 阅读 框架 变 得 与 基因 的 原初 或 主要 阅读 框
架 不 同 ,而 编码 出 一 种 完全 或 部 分 地 不 同 的 蛋白 质 。
functional constraint (selective constraint) 功 能 限制 (选择 限制 )。 一 个 位 点 或 一 个 基因 座位 对 核 苷
酸 蔡 换 所 具有 的 特征 性 忍受 程度 。
functional domain(domain) 功 能 域 ( 域 ) 。 蛋 白质 内 的 一 个 界限 明确 的 区 域 ,能 行使 某 一 特殊 的 功
能 。 它 可 能 不 是 由 连续 的 氨基 酸 段 所 构成 ,虽然 就 所 涉及 的 蛋白 质 的 三 级 结构 而 言 , 它 几乎 总 是 由 那
些 相互 邻近 的 氨基 酸 所 构成 。
GD 在 DNA 或 RNA 中 为 鸟 味 叭 ,(2) 在 蛋白 质 中 为 甘氨酸 。
gamete 配子 。 具 单 倍 体 数 染 色 体 的 生殖 细胞 。
gap 裂 篷 。 一 段 插入 或 缺失 。 在 序列 线性 排比 中 则 为 一 个 含有 空缺 碱 基 的 对 子 。
gap penalty 裂 颖 处 罚 。 与 点 替换 发 生 的 频率 相 比 裂缝 事件 在 进化 中 发 生 的 频 度 如 何 ? 对 此 问题 作
出 的 估价 即 裂 矣 处 罚 。 在 线性 排比 算法 上 ,或 者 用 一 个 因子 来 乘 以 裂 锋 的 总 长 度 , 或 者 将 某 一 给 定 长
度 有 裂 矣 的 数目 乘 以 一 个 函数 ,应 用 这 些 值 才 有 可 能 对 裂 锋 和 替换 加 以 比较 。
gene 基因 。 基 因 组 DNA 或 RNA 中 的 一 个 序列 , 它 是 某 一 特别 功能 的 根本 。
gene conversion 基因 转变 。 一 种 非 相 互 重组 过 程 , 结 果 是 一 个 序列 变 得 与 另 一 序列 等 同 。
gene duplication 基因 重复 。 广义 地 , 指 一 个 DNA 序列 的 两 个 拷贝 产生 。 狭义 而 言 , 指 一 个 完整 的
基因 序列 的 重复 。
gene family( 见 multigene family) 基 因 家 族 。
gene frequency( 见 allele frequency) 基 因 频 率 。
gene pool 基因 库 。 一 个 有 性 生殖 的 群体 中 的 所 有 基因 。
gene sharing 基因 分 享 。 一 个 基因 在 不 重复 且 失 去 其 原始 功能 的 前 提 下 ,获得 并 维持 第 二 种 功能
的 现象 。
gene substitution 基因 替换。 一 种 过 程 , 厌 此 一 个 新 的 突变 型 等 位 基因 在 群体 中 达到 固定 。
gene tree 一 种 由 来 各 每 物种 的 一 个 或 几 个 基因 构成 的 系统 树 。
generation time 世代 时 间 。 两 个 连续 世代 之 间 的 平均 时 间 间 隔 。 有 时 定义 成 双亲 在 生产 其 顺序 处
在 中 间 的 孩子 时 ,所 具有 的 平均 年 龄 。
genetic code 遗传 密码 。 一 组 将 密码 子 翻译 成 氨基 酸 的 规则 。
genetic distance(distance) 遗 传 距 离 (距离 )。 广 义 地 , 指 个 体 、 群 体 , 或 物种 间 遗 传 差 异 程度 的 几 种
测度 中 的 任何 一 种 。 对 分 子 进 化 而 言 , 则 是 两 同 源 DNA 序列 自分 岐 以 来 ,它们 间 累 积 的 每 核 苷 酸 位
点 的 核 苷 酸 蔡 换 数 的 测度 。
genetic drift( 见 random genetic drift) 遗 传 漂 变 。
genetic polymorphism( 见 polymorphism) ) 遗 传 多 态 性 现象 。
genetic DNA 基因 (的 )DNA。 基 因 组 中 含 基 因 的 部 分 。
genetic selection (J, codominance) 基 因 选 择 。
genome 基因 组 。 由 一 个 细胞 或 个 体 所 携带 的 整套 遗传 物质 。
genome doubling( 见 polyploidy) 基 因 组 加 倍 。
genome duplication( 见 polyploidy) 基 因 组 重复 。
genome size( 见 value) 基 因 组 大 小 。
genomic compartmentalization 基因 组 的 区 域 化 。 指 细胞 中 独立 地 复制 的 基因 组 的 存在 。 通 常 , 指
细胞 需 的 基因 组 。
genotype 基因 型 。 某 一 生物 的 特别 的 等 位 基因 组 成 ,包括 那些 不 在 表 型 水 平 上 表现 出 来 的 等 位 基
因 。 常 常 指 被 研究 的 一 个 或 少数 几 个 基因 的 等 位 基因 组 成 。
geometric mean 几何 平均 ( 值 )。n 个 项 相 乘 以 后 开 mn 次 方 所 得 到 的 根 。
germ-line cell 种 系 细 胞 ,生殖 细胞 。 精 细胞 或 卵细胞 ,或 一 个 它们 的 前 身 细胞 。
HAAR.
haploid 单 倍 体 。 具 有 一 套 不 成 对 的 染色 体 的 细胞 或 生物 。
haploid set 单 倍 体 组 。 一 个 单 倍 体 细 胞 或 生物 中 的 染色 体 。
haplotype 单 倍 型 。 一 条 染色 体 的 特别 的 等 位 基因 组 成 。 和 常常 指 被 研究 的 一 个 或 几 个 连锁 基因 的
等 位 基因 组 成 。
Hardy-Weinberg equilibrium 哈 迪 一 温 伯 格 平衡 。 一 个 两 倍 体 群 体 中 基因 型 的 频率 等 于 有 关 等 位
基因 的 频率 之 积 的 局 面 。
heteroduplex 异 源 双 链 。 两 条 链 各 来 自 不 同 个 体 的 双 链 核酸 分 子 。
heterogeneous nuclear RNA (heterogeneous RNA. heteronuclear RNA, hnRNA) & WW A #-RNA
(FR RNA, 5H RNA hnRNA), 4K PH RNA 转录 本 ,表示 rRNA .mRNA Al tRNA 的 前 体 和
经 加 工 的 中 间 产 物 ,以 及 成 熟 但 未 传送 到 细胞 质 中 的 RNA 转录 本 。
heterosis( 见 overdominance) Ay Ff ft # .
heterozygosity 杂 合 度 、 杂 合 性 。 对 群体 中 遗传 变异 的 一 种 测度 ,可 用 杂 合 子 对 所 有 基因 座位 的 平
均 频 率 算出 (观察 杂 合 度 ,observed heterozygosity) ,或 者 用 杂 合 子 在 一 个 处 于 哈 迪 一 温 伯 格 平衡 的 群
体 中 预期 的 平均 频率 算出 (期 望 杂 合 度 ,expected heterozygosity, Kt A Bt .gene diversity),
heterozygote 杂 人 合子。 在 被 研究 的 基因 座位 上 有 不 同等 位 基因 的 两 倍 体 个 体 。
heterozygote advantage (hl, overdominance) 48 4 -F tit #* .
higher taxon 高 级 分 类 单位 。 种 以 上 水 平 的 分 类 单位 。
highly repetitive DNA 高 度 重复 的 DNA.。 由 平均 重复 成 百 上 千 次 的 序列 构成 的 基因 组 DNA 的 部
° 148
和 ee OE ese ee
I — SS
- ae
highly repetitire genes 高 度 重 复 的 基因 。 在 单 倍 体 基 因 组 中 出 现 许 多 拷贝 的 有 功能 基因 。
homoduplex 同 源 双 链 。 一 种 双 链 DNA ,其 两 条 互补 的 链 来 自 同 一 个 体 。
homology 同 源 (性 )。 因 有 共同 祖先 或 遗传 相关 而 类 似 。
homozygote 纯 合 子 。 在 一 个 或 多 个 基因 座位 上 有 相同 的 等 位 基因 的 两 倍 体 个 体 。
horizontal evolution( 见 concerted evolution ) 水 平 进化
horizontal gene transfer 水 平 基 因 转 移 , 横 向 基因 转移 。 遗 传 信 息 从 一 个 基因 组 向 另 一 个 基因 组 的
转移 ,特别 是 不 同 物种 间 的 转移 。
hotspot of mutation 突变 (的 ) 热 点 .基因 组 DNA 的 一 个 片段 ,对 自发 的 或 某 种 特别 诱 变 剂 作 用 下
的 突变 表现 出 较 高 的 倾向 性 。
hybrid dysgenesis 杂种 劣势 。 一 组 相关 的 异常 症状 ,在 某 种 相互 作用 的 果 蝇 品系 间 的 一 种 类 型 的
杂种 中 能 自发 地 诱 生 、 但 在 相反 类 型 的 杂种 中 则 不 出 现 。
hybrid vigor( 见 overdominance ) AY FH fit # , AR FH YM HE
hydrogen bond 氧 键 。 氢 原子 和 一 个 电 负 性 的 原子 .如 氧 、 之 间 的 弱 的 、 非 共 价 键 。
hypervariable site or hypervariable region 高 可 变 部 位 或 高 可 变 区 域 。 展 示 出 超过 了 种 间 变 异性 的
一 段 DNA 或 蛋白 质 。 如 此 大 的 变异 性 的 维持 ,通常 需要 该 基因 座位 经 受 某 种 形式 的 平衡 选择 ,如 超
显 性 选择 。
LEAR.
independent assortment (Mendel’s second law) 独 立 分 配 ( 备 德尔 第 二 定律 ) 。 在 非 连锁 的 基因 座位
中 ,一 个 座位 上 的 等 位 基因 的 分 离 与 另 一 个 座位 上 的 分 离 无 关 。
inferred tree 推测 树 .推论 树 。 根 据 属于 现存 分 类 单位 的 经 验资 料 作出 的 系统 树 。
informative site(diagnositic position ) 信 息 位 点 (判定 位 置 )。 用 于 从 所 有 可 能 的 系统 树 中 选取 最 节
省 树 的 位 点 。 在 分 子 进化 中 ,是 其 中 至 少 有 两 种 不 同类 型 的 核 苷 酸 或 氨基 酸 , 且 它们 中 的 每 一 种 至 少
在 两 个 序列 中 出 现 的 位 点 。
initiation codon 起 始 密码 子 。 为 蛋白 质 编码 基因 的 阅读 框架 中 的 第 一 个 密码 子 ;: 通 常 , 在 真 核 生 物
中 是 ATG 编码 的 甲 硫 氢 酸 ,在 原核 生物 中 则 编码 甲 酰 甲 硫 氮 酸 。
in-phase overlapping 相位 内 重 肆 。 两 个 或 多 个 蛋白 质 按 同一 阅读 框架 翻译 的 现象 :
insertion 插 人 。 一 个 或 多 个 核 苷 酸 揪 入 一 个 DNA 序列 中 的 突变 。
insertion sequence 捅 和 人 序列。 一 种 除 带 有 转 座 所 必需 的 片段 外 不 带 任 何 遗传 信息 的 可 转 座 因 子 。
internal gene duplication (partial gene duplication) 基 因 内 重复 (部 分 基因 重复 )。 基 因 内 的 重复 序
列 , 由 比 整 个 基因 序列 小 的 有 关 重 复 所 派生 而 来 。
internal node 内 部 节点 。 系 统 树 中 代表 某 一 祖先 生物 或 基因 的 图 形 。
interon (intervening sequence) 内 含 子 ( 间 隔 序列 )。 一 种 可 转录 基因 的 DNA 片段 ,其 转录 本 在
RNA 成 熟 的 过 程 中 被 除去 ,因而 不 出 现在 成 熟 的 RNA 分 子 中 。 它 位 于 外 显 子 之 间 。
invariant repetition 不 变 重复 。 在 顺序 上 相互 等 同 或 几 近 等 同 的 重复 DNA 片段 的 存在 。
inversion 倒 位 。 造 成 某 一 DNA 片段 极 性 颠倒 的 突变 。
isoaccepting tRNA 同 受 体 tRNA, 同 功 tRNA。 人 能 携带 同样 氨基 酸 的 不 同类 型 tRNA.
isochore 同 质 段 。 在 碱 基 组 成 上 同 质 的 基因 组 DNA Jr Be.
isozyme(isoenzyme) 同 功 酶 。 有 相同 或 接近 相同 的 化 学 性 质 ,但 由 不 同 基因 座位 所 编码 的 一 些 不
同型 式 的 酶 。
junk DNA 废物 DNA。 基 因 组 DNA 中 的 无 功能 部 分 。
K i AR.
L 3AM.
lagging strand 后 随 链 。 以 不 连续 方式 ,从 5 到 3' 沿 背离 复制 叉 的 方向 合成 的 DNA 链 。
leading strand 前 导 链 。 以 连续 的 方式 ,从 5' 到 3' 沿 朝向 复制 叉 的 方向 合成 的 DNA 链 。
length abridgment 长 度 缩短 。 假 基因 在 进化 期 间 由 于 缺失 超过 插 人 而 造成 的 逐渐 缩短 。
ee 149 «
lethal mutation 致死 突变 。 造 成 其 纯 合 携带 者 死亡 或 不 育 的 突变 。
ligation 连接 。 将 双 链 DNA 中 由 缺口 分 开 的 两 个 相 邻 碱 基 联 接 、` 而 形成 的 磷酸 二 酯 键 。 用 于 联接
的 粘性 未 端 由 限制 性 内 切 核 酸 酶 水 解 产 生 。 连接 过 程 由 连接 酶 (ligase) 催 化 。
LINE (Long INterspersed Element 的 首 字 母 缩 略 ) 长 散在 因子 。 一 种 散在 的 重复 序列 ,典型 的
LINE 长 5000 碱 基 对 以 上 ,在 多 细胞 真 核 生物 的 基因 组 中 其 拷贝 数 为 10' 或 超过 10*。 又 称 长 的 散在
重复 序列 。
linkage 连锁 。 两 个 或 多 个 非 等 位 的 基因 位 于 相互 很 接近 的 位 置 处 ,并 倾向 于 一 起 遗传 的 现象 。
localized repeated sequences 区 域 性 重复 序列 。 串 接 排 列 的 重复 序列 , 通 篆 由 短 的 单纯 重复 单位 所
构成 (例如 卫星 DNA).
locus( 复 数 loci) 基 因 座 位 。 染 色 体 上 某 一 特定 基因 或 DNA 片段 所 处 的 位 置 。
lowly repetitive genes 低 度 重复 基因 。 在 单 倍 体 基 因 组 中 仅 以 几 个 拷贝 存在 的 基因 。
M HAR.
match 匹配 。 在 序列 排列 时 ,两 序列 的 同 源 位 置 上 存在 同样 的 碱 基 的 现象 。
maturation KA, May mRNA 形成 mRNA。
maximum parsimony(parsimony) 最 节省 (节省 )。 从 所 有 可 能 的 系统 树 中 选 出 所 需 蔡 换 数 最 少 的
那 种 系统 树 , 以 它 作为 真实 系统 树 。
meiosis (reduction division ) 减 数 分 裂 。 在 从 两 倍 体 细胞 产生 单 倍 体 配子 时 采用 的 真 核 细 胞 分 裂 过
程 。 减 数 分 裂 的 特征 是 分 裂 后 染色 体 数 目 减 半 ,以 保证 每 个 配子 有 各 对 常 染 色 的 一 个 代表 和 一 半 性 染
色 体 。
meiotic drive( 见 segregation distortion ) 减 数 分 裂 驱 动 。
melting fff. OEM ARR. WHR MA BHM KR.
Mendelian segregation (Mendel's first law ,segregation ) ) 孟 德尔 ( 式 ) 分 离 ( 备 德尔 第 一 定律 、 分 离 )。
杂 合 子 中 某 一 基因 对 的 两 个 不 同等 位 基因 在 减 数 分 裂 中 分 离 , 以 同样 比例 产生 两 类 配子 ,每 类 配子 各
带 一 个 不 同 的 等 位 基因 。
Mendelian second law( 见 independent assortment) 备 德尔 第 二 定律 。
一 mer 表示 和 蛋白质 中 亚 基 数 的 后 缀 .前 缀 表示 亚 基 的 数目 (例如 , monomer, dimer, tetramer ,mul-
timer ) ,或 单元 间 的 相似 性 (例如 ,homomer,heteromer) ,或 既 表 示 单 元 数目 又 表示 单元 的 类 型 (例如 ,
homotrimer ,heteromultimer ) 。
messenger RNACmRNA) 信 使 RNA。 从 某 种 初级 RNA 转录 本 加 工 而 成 RNA 分 子 , 用 于 合成 由
氨基 酸 组 成 的 多 肽 的 翻译 中 。
middle-repetitive DNA 中 (等 程 ) 度 重复 DNA。 基 因 组 DNA 中 ,长 度 相 对 较 长 .重复 数 平均 在 几
十 次 到 几 百 次 之 间 的 那 一 部 分 序列 。
migration 迁移 。 指 群体 遗传 学 中 个 体 或 基因 在 各 群体 间 的 移动 。
mismatch 匹配 错误 。 在 顺序 的 线性 排比 中 ,两 序列 的 某 一 同 源 位 置 上 有 不 同 碱 基 的 现象 。
missense mnutation( 见 nonsynonymous mnutation ) 误 义 突 变 。
mitochondrion (复数 mitochondria) 线 粒 体 . 真 核 细胞 中 一 种 含 DNA 的 细胞 器 , 它 用 一 种 需 氧 的
电子 传递 系统 ,把 由 食物 分 子 分 解 所 得 到 的 化 学 能 转换 成 ATP 储 能 。
mitosis 有 丝 分 裂 。 真 核 细 胞 的 分 裂 模式 ,通过 这 种 分 裂 能 产生 两 个 具有 与 亲本 细胞 同样 染色 体
套 的 子 细胞 。
mobile element (J, transposable element) 可 ( 移 ) 动 因子 。
moderately repetitive genes 适度 重复 基因 。 单 倍 体 基 因 组 中 具有 适度 拷贝 数 的 基因 。
module(struclural domain) 组 件 ( 结 构 域 ) 。 球 状 蛋白 质 中 的 、 某 个 结构 上 独立 的 .稳定 的 \ 且 紧密
的 室 间 单位 。 该 单位 能 与 其 他 部 分 相 区 别 ,通常 是 由 一 段 连续 的 氨基 酸 段 所 组 成 。
molecular clock 分 子 ( 时 ) 钟 。(1) 指 突变 在 某 一 给 定 基因 组 片段 中 积累 的 速率 。(2) 指 假说 , 即 就
在 一 给 定 基 因 或 DNA 序列 而 言 , 突 变 在 所 有 进化 谱系 中 以 接近 恒定 的 速率 积累 ,只 要 该 基因 或 该
° 150 »
DNA 序列 保留 其 原初 功能 。 将 该 时 钟 用 于 所 有 基因 和 所 有 生物 的 推广 尚 有 争议 。
monomorphic 单 态 (性 ) 的 。 一 个 群体 中 所 有 个 体 在 某 一 基因 座位 上 实际 上 有 同样 的 等 位 基因 , 则
称 是 单 态 的 。
monophyletic 单 源 的 。 享 有 一 个 共同 祖先 的 现象 。
mortality 死亡 率 。 适 合 度 的 一 个 分 量 。 某 一 给 定 基因 型 的 个 体 在 达到 某 一 年 龄 之 前 死亡 的 平均 概
率 ( 例 如 ,到 平均 生育 年 龄 的 死亡 率 ) 。
mosaic protein (chimeric protein ) 镶 舱 蛋 白质 ( 嵌 合 蛋白 质 ) 。 由 一 个 有 来 自 不 同 基因 的 区 域 的 基因
编码 的 蛋白 质 。 也 指 通过 遗传 工程 而 得 到 的 人 工 蛋 白质 。
.mRNA( 见 messenger RNA) ff ff RNA.
multifurcation 多 ( 重 ) 分 又 。 包 括 3 个 以 上 的 分 类 学 单位 的 系统 树 中 ,等 级 不 明 的 分 枝 的 图 象 表
示 。 偶 尔 , 也 是 同时 产生 两 个 以 上 物种 的 物种 形成 事件 的 图 象 表示 。
~ multigene family(Cgene family) 多 基因 家 族 ( 基 因 家 族 )。 由 某 一 祖先 基因 重复 而 产生 的 一 套 基因 ,
它们 间 的 相似 度 大 于 50% 。 它 们 相互 间 常 常 紧密 连锁 ,具有 相似 或 重 释 的 功能 。
multiple substitution 多 重 替 换 。 在 某 一 DNA 序列 的 同一 核 苷 酸 位 点 上 相继 发 生 两 次 或 多 次 替
换 。
mutagen 诱 变 剂 。 使 突变 率 增加 的 物理 学 或 化 学 实体 。
mutant 突变 型 。 某 一 些 基 因 的 一 种 新 变异 型 。
mutation 突变 。 使 某 一 DNA 序列 变 成 不 同 于 其 原来 状态 的 改变 。
mutation rate 突变 率 。 某 一 个 体 中 ,每 单位 时 间 里 每 核 苷 酸 位 点 或 每 基因 产生 的 突变 数 。
mutational bias 突变 偏 斜 。 四 种 核 苷 酸 表 现 出 有 不 同 的 突变 倾向 ,或 者 产生 某 一 核 苷 酸 多 于 其 他
核 苷 酸 这 样 结果 的 突变 模式 。 常 常 是 由 各 核 苷 酸 不 均等 地 积累 所 造成 的 。
N (1) 在 DNA 或 RNA 中 ,表示 某 一 未 知 的 核 苷 酸 。(2) 在 蛋白 质 中 表示 天 冬 酰 胺 。
”natural selection (selection ) 自然 选择 (选择 )。 由 于 各 个 体 或 各 基因 型 间 适 合 度 上 的 变异 性 ,造成
某 一 物种 的 不 同 成 员 的 生殖 差异 ,从 而 导致 了 等 位 基因 频率 随 着 时 间 的 改变 而 改变 。
negative selection 负 选 择 ( 见 purifying selection )
neighboring taxa 近邻 分 类 学 单位 ( 见 sister taxa).
neutral mutation 中 性 突变 。 不 改变 该 生物 的 适合 度 的 突变 。
neutral theory (neutral-mutation theory 或 neutral-mutation hypothesis) 中 性 学 说 (中 性 突变 学 或 中
性 突变 假说 )。 认 为 分 子 水 平 上 的 进化 主要 是 由 突变 输入 和 随机 遗传 漂 变 所 决定 ,而 不 是 由 自然 选择
所 决定 。
node 节点 。 系 统 树 中 某 一 现存 的 或 祖先 的 OTU 的 图 象 表示 。
nondegenerate site 非 简 并 位 点 。 编 码 区 中 所 有 替换 都 是 非 同 义 蔡 换 的 核 苷 酸 位 点 。
nondisjunction 不 分 离 。 减 数 分 裂 期 间 同 源 染 色 体 的 分 离 失 败 。
nonfunctionalization (silencing) 无 功能 化 (沉默 )。 继 丧失 功能 的 突变 之 后 ,功能 基因 变 成 假 基 因 的
转变 。
nongenic DNA 非 基 因 DNA。 基 因 组 中 不 含 基因 的 部 分 。
nonsense codon 无 意义 密码 子 ( 见 termination codon) 。
nonsense mutation 无 ( 意 ) 义 突变 。 使 有 意义 密码 子 变 成 终止 密码 子 的 突变 。
nonsense strand 无 义 链 。 基 因 的 一 条 链 转 录 产 生 RNA, 另 一 条 不 产生 RNA 的 链 即 无 义 链 , 其 转
录 本 的 顺序 与 RNA 的 互补 。
nonsynonymous substitution (missense substitution ) 非 同 义 替 换 ( 误 义 替 换 )。 使 某 一 密码 子 变 成 为
另 一 氨基 酸 编 码 的 密码 子 的 替换 。
N-terminal N-( 末 ) 端 ( 见 amino terminal)
nucleic acid KRM. DNA Bk RNA.
nucleotide (base ) % #f B (HRAE) . HH — 4 A HE. — KE. A — ERE RA 2. PK
« bow «
酸 的 基本 建筑 砖 块 。
nucleotide diversity 核 苷 酸 多 样 度 。 用 于 测度 核酸 序列 的 多 态 性 的 尺度 。 从 某 一 群体 随机 选取 的
任何 两 个 序列 间 的 每 位 点 平均 核 苷 酸 差异 数 。
nucleotide substitution 核 苷 酸 蔡 换 。 发 生 了 一 个 核 苷 酸 被 另 一 核 苷 酸 蔡 换 的 一 种 突变 。 在 进化 中
指 一 个 核 苷 酸 被 另 一 个 将 在 群体 中 固定 的 核 苷 酸 蔡 换 。
nucleotypic 核 类 型 的 。 指 DNA 序列 的 除 作 为 遗传 信息 的 携带 者 以 外 的 某 种 功能 (例如 ,起 作为 细
胞 核 骨 架 的 作用 )。
nucleus( 复 数 nuclei) 细 胞 核 。 真 核 生物 中 ,一 个 由 膜 包 被 而 含有 染色 体 的 细胞 器 。
observed heterozygosity 观察 到 的 杂 合 度 ( 见 heterozygosity ) 。
ontogeny 个 体 发 育 、 个 体 发 生 。 生 物 从 合子 到 成 体 的 发 育 中 的 事件 序列 。
open reading frame(CORF) 开 读 框 架 。 具 有 可 翻译 成 蛋白 质 潜力 的 DNA 序列 。
operational taxonomic unit(OTU ) 操 作 中 的 分 类 单位 。 任 一 被 研究 的 现存 分 类 学 单位 。
operon 操纵 子 。 一 种 遗传 学 单位 或 由 一 个 或 多 个 基因 构成 的 基因 复 , 这 些 基因 作为 一 个 单位 而 被
转录 ,而 且 以 协调 的 方式 表达 。
ORF (Ji open reading frame) 。
organelle 细胞 器 。 严 格 地 说 指 真 核 生物 细胞 内 由 功能 膜 包 被 的 结构 (例如 ,细胞 核 ,线粒体 , 叶 绿
体 )。 通 常 都 把 细胞 核 排 除 在 外 。
orthology 垂直 相关 。 作 为 物种 形成 事件 的 结果 而 产生 的 顺序 相似 。
OTU Cl operational taxonomic unit) 。
outgroup 组 外 单位 。 在 一 群 物种 中 ,与 其 他 物种 亲缘 关系 最 疏远 的 一 个 或 一 组 物种 。 该 分 类 单位
在 其 他 分 类 单位 相互 分 岐 之 前 ,已 从 这 群 分 类 单位 中 分 岐 出 来 了 。
out-of-phase overlapping 4b} HB. [A]— DNA 序列 中 以 不 同 读 码 框架 为 两 个 或 多 个 蛋白 质 编
码 。
overdominance(heterosis ,heterozygote advantage,hybrid vigor) 超 显 性 (杂种 优势 、 杂 合子 优势 、 杂
种 优势 )。 由 杂 合 子 比 两 种 纯 合 子 有 更 高 适合 度 而 产生 的 选择 形式 。
P fi AR .
palindromic sequence 回 文 顺 序 。 对 两 条 互补 链 读 出 相同 结果 的 DNA 或 RNA 顺序 (如 AATG-
CATT)。 表 现 出 关于 某 一 中 心 轴 点 对 称 的 DNA 或 RNA 顺序 。
parallel substitution 平行 替换 。 在 两 个 或 更 多 谱系 中 独立 地 发 生 位 于 同一 核 苷 酸 位 点 上 的 相同 突
变 。
paralogy 平行 相关 。 重 复 的 祖先 基因 的 后 代 间 的 顺序 相似 。
pararetrovirus 拟 反 录 病 毒 。 含有 一 个 为 反 转 录 酶 编码 的 基因 ,但 自身 不 能 插 和 人 宿主 染色 体 的 病
parsimony 节省 。 从 字面 上 解释 , 即 以 最 少 的 操作 而 达到 目的 。( 见 maximum parsimony)
partial gene duplication( 见 internal gene duplication ) 部 分 基因 重复 。
pattern of mutation 突变 的 模式 。 指 相对 频率 ,一 种 核 苷 酸 以 这 种 频率 突变 成 另 一 种 核 背 酸 。
pattern of substitution Csubstitution scheme ) 替 换 的 模式 (替换 方式 )。 指 相对 频率 ,在 进化 过 程 中
一 种 核 苷 酸 或 氨基 酸 以 该 频率 变 成 为 另 一 种 。
PCR( 见 polymerase chain reaction )
phage( 见 bacteriophage ) Mit Pa TK
phase class 相位 类 型 。 内 含 子 所 处 的 位 置 ,相对 于 两 邻近 的 为 蛋白 质 编码 的 外 显 子 的 阅读 框架 的
类 型 。
phase -0 intron 相位 -0 内 含 子 . 位 于 两 密码 子 之 间 的 内 含 子 。
phase-1 intron 相位 一 1 内 含 子 。 位 于 某 一 密码 子 的 第 一 和 第 二 核 苷 酸 之 间 的 内 含 子 。
phase—2 intron 相位 一 2 内 含 子 。 位 于 某 一 密码 子 的 第 二 和 第 三 核 苷 酸 之 间 的 内 含 子 。
下
é |
phenogram 表 型 关系 图 。 根 据 一 些 个 体 、 物 种 、 或 更 高 级 的 分 类 单位 之 间 的 所 有 相似 性 ,以 描绘
或 试图 描绘 它们 间 的 分 类 学 关系 的 一 种 图 形 表示 。
phenotype 表 型 。 某 种 遗传 控制 性 状 的 可 观察 特征 。
phylogenetic tre 系统 (发 育 ) 树 。 表 示 一 群 分 类 单位 或 一 群 基 因 的 系统 发 育 的 图 形 。
phylogenetics 系统 发 育 学 。 重 建 一 群 分 类 单位 或 一 群 基因 的 进化 史 的 科学 。
phylogeny 系统 发 育 。 一 群 分 类 单位 或 一 群 基因 及 其 祖先 的 进化 史 。
plasmid 质粒 。 一 种 自治 且 自 我 复制 的 染色 体外 环 状 DNA。
point mutation 点 突变 。 仅 涉及 一 个 核 苷 酸 位 点 的 突变 。 通 常 为 一 次 核 苷 酸 蔡 换 。
polarity 极 性 。 核 酸 从 5 到 3 “方向 被 阅读 的 性 质 ,其 结果 与 按 相 反方 向 阅读 的 不 同 。
polyadenylation signal 多 聚 腺 苷 酸化 信号 。 大 多 数 真 核 生 物 mRNA 分 子 上 都 有 的 一 个 区 块 ,决定
多 聚 腺 苷 酸 位 点 的 定位 。
polyadenylation site(poly(A)-addition site) 多 聚 腺 苷 酸化 位 点 (多 聚 (A) 添 加 位 点 )。 真 核 生物 中
大 多 数 mRNA 分 子 的 3 端 部 位 。 在 该 位 点 处 将 被 添上 一 个 多 聚 A BE.
polygamy 多 配偶 制 。 一 种 交配 体制 ,在 这 种 体制 中 或 者 一 个 雄性 与 一 个 以 上 的 肉 性 交配 (一 夫 多
妻 制 妨 或 者 一 个 雌性 与 一 个 以 上 的 雄性 交配 (一 妻 多 夫 制 ) 。
polymerase chain reaction(PCR ) 多 聚 酶 链 式 反 应 。 从 未 纯化 的 混合 物 中 选 定 DNA 序列 加 以 扩 增
的 方法 。
polymorphism (genetic polymorphism) 多 态 性 (遗传 多 态 性 )。 某 一 基因 座位 上 两 个 或 多 个 等 位 基
因 共 存 的 现象 。
polypeptide 多 肽 。 由 氨基 酸 通过 肽 键 而 相互 共 价 连接 而 成 的 分 子 。 通 常 , 它 用 来 指 某 一 蛋白 质 的
功能 性 三 维 构 型 确定 前 的 氨基 酸 链 。
polyphyletic 多 源 (发 生 ) 的 。 从 不 同 祖先 传 下 来 的 。
polyploidy (genome doubling ,genome duplication ) 多 倍 体 , 多 倍 性 重复 (基因 组 加 们 ,基因组 重复 ) 。
一 个 细胞 或 一 个 个 体 中 存在 多 于 两 个 单 倍 染色 体 组 的 现象 (例如 ,四 倍 体 . 六 倍 体 ) 。
polyprotein 多 和 蛋白。 一 种 翻译 后 分 裂 成 两 个 或 多 个 蛋白 质 的 多 肽 。
population 群体 。 某 一 物种 中 共有 一 个 基因 库 的 一 群 个 体 。
population size(census population size) 群 体 大 小 (统计 群体 大 小 )。 一 个 群体 的 个 体 数 。
positive selection 正 选 择 。 对 某 一 有 利 突变 等 位 基因 的 选择 。
pre-messenger RNA(pre-mRNA) 前 体 信 使 RNA。 某 一 为 蛋白 质 编 码 基因 的 初级 转录 本 ,处 于 成
熟 前 状态 。
preproprotein 前 蛋白 原 。 处 于 任何 翻译 后 变化 发 生 之 前 的 初级 翻译 产物 。
pretermination codon 前 终止 密码 子 。 只 需 一 次 突变 即 可 变 成 终止 密码 子 的 密码 子 。
primary amino acid 基本 氨基 酸 。 由 普 适 遗传 密码 决定 的 20 种 氨基 酸 中 的 任何 一 种 。
primary structure 一 级 结构 。 多 肽 链 中 氨基 酸 的 顺序 。DNA 或 RNA 分 子 中 核 背 酸 的 顺序 。
processed gene( 见 retrogene) 加 工 后 基因 。
processed pseudogene( 见 retropseudogene) 加 工 后 假 基 因 。
processed sequence( 见 retrosequence) 加 工 后 序列 。
prokaryote(bacterium) 原核 生物 (细菌 )。 一 种 缺乏 核 膜 . 与 DNA 结合 的 组 蛋白 .和 细胞 器 的 生
物 。 包 括 真 细菌 和 十 细菌 。
proprotein 蛋白 原 。 一 种 信号 肽 被 去 除 而 附加 的 翻译 后 修饰 还 未 进行 的 翻译 产物 。
“prosthetic group 辅 基 。 与 脱 辅 基 蛋 白 结合 以 满足 功能 性 要 求 的 非 蛋白 分 子 (例如 血红 蛋白 中 的 血
红 素 ) 。
protein 蛋白 质 。 由 一 条 或 多 条 多 肽 链 组 成 的 分 子 。 可 含有 也 可 不 含有 辅 基 。
protein-coding gene 为 蛋白 质 编码 的 基因 。 包 含 一 个 阅 渎 框架 的 基因 ,其 mRNA 将 被 翻译 成 蛋白
质 。
一
«153 ¢
provirus 前 病毒 。 整 合 进 宿 主 细胞 基因 组 中 的 病毒 基因 组 。
pseudogene 假 基 因 。 在 顺序 上 与 某 一 功能 基因 同 源 、 但 无 功能 的 DNA 片段 。 某 一 基因 家 族 中 的
非 功 能 性 成 员 。
purifying selection (negative selection ) 纯 洁 化 选择 ( 负 选 择 )。 造 成 使 某 一 等 位 基因 从 群体 中 去 除
这 样 的 结果 的 选择 体制 。
purine 味 叭 。 一 类 存在 于 核 苷 酸 中 的 含 氮 碱 基 , 由 两 个 联 在 一 起 的 环 式 结 构 组 成 ,一 个 为 五 员 环 、
另 一 个 为 六 员 环 。DNA Al RNA AY ER DE A RR A SRK,
pyrimidine 喀 啶 。 存 在 于 核 苷 酸 中 的 一 种 含 氮 碱 基 类 型 ,由 一 个 六 员 环 组 成 。DNA 中 的 喀 啶 碱 基
是 胞 喀 喧 和 胸腺 喀 啶 。RNA 中 的 喀 喧 碱 基 为 胞 喀 啶 和 尿 喀 啶 。
Q FABRE.
quaternary structure 四 级 结构 。 具 有 两 个 或 多 个 亚 基 的 和 蛋白质 分 子 中 ,两 个 或 多 个 多 肽 链 间 相互
作用 的 类 型 和 方式 , 即 代表 了 该 蛋白 质 的 四 级 结构 。
R HAR.
radical substitution 激进 的 替换 。 某 一 氨基 酸 被 另 一 化 学 性 质 明 显 不 同 的 氨基 酸 所 替换 。
random genetic drift(Cdrift,genetic drift) 随 机 遗传 漂 变 ( 漂 变 、 遗 传 漂 变 )。 因 偶然 事件 ,例如 配子
的 取样 ,而 造成 的 等 位 基因 频率 随 世 代 的 波动 。
rate of gene substitution 基因 替换 的 速率 。 每 单位 时 间 每 基因 座位 的 基因 替换 数 。
rate of mutation 突变 率 。 每 单位 时 间 ( 通 常 以 每 世代 时 间 ) 每 基因 座位 或 每 核 苷 酸 位 点 的 突变 数 。
rate of nucleotide substitution 核 苷 酸 替 换 速 率 。 每 单位 时 间 每 核 苷 酸 位 点 的 核 背 酸 蔡 换 数 。
reading frame 阅读 框架 , 读 码 框架 。 一 个 以 起 始 密码 子 开头 以 终止 密码 子 结束 的 为 蛋白 质 编码 基
因 中 ,密码 子 的 直线 顺序 。
recessiveness 隐 性 。 杂 合子 中 某 一 等 位 基因 不 表现 出 来 的 现象 。
recognition sequence 识别 顺序 。 被 某 一 限制 性 内 切 核 酸 酶 识别 的 顺序 。 在 很 多 情况 下 是 一 个 短 的
回 文 顺序 。
recombination 重组 。 染 色 体 交叉 后 产生 的 结果 ,可 看 到 顺 反 子 中 等 位 基因 的 新 组 合 。
recombinator gene 重组 子 基 因 。 一 种 给 重组 酶 提供 识别 位 点 的 调节 基因 。
reduction division( 见 meiosis) 减 数 分 裂 。
regional duplication 区 域 性 重复 。 重 复 量 小 于 全 基因 组 的 重复 都 称 区 域 性 重复 。
regulatory gene 调节 基因 。 一 种 非 转录 基因 。 有 时 用 来 指 调节 其 他 基因 的 表达 的 结构 基因 。
relative - rate test 相对 速率 测验 。 一 种 无 需 标 度 的 测验 。 以 检验 不 同 谱系 在 其 进化 过 程 中 核 苷 酸
替换 速率 的 恒定 性 ,从 而 确定 分 子 钟 在 不 同 谱系 中 是 否 以 同样 的 速率 运转 。
repetitive DNA 重复 DNA。 以 许多 拷贝 存在 于 单 倍 基因 组 中 的 DNA 序列 。
replacement 替代 、 取 代 。 在 蛋白 质 水 平 上 一 次 非 同 义 替 换 所 造成 的 结果 。
replication 复制 。DNA 在 某 一 DNA 模板 上 合成 的 过 程 。
replication slippage 复制 滑脱 。DNA 复制 期 间 , 某 一 DNA 序列 作为 模板 不 止 一 次 地 连续 起 作用 ,
从 而 在 新 合成 的 DNA 上 产生 了 一 段 串 接 重复 的 序列 ,这 样 的 过 程 称 复制 滑脱 。
replicative transposition (duplicative transposition ) 复制 (型 ) 转 座 。 可 转 座 因子 的 一 个 拷贝 插 人 新 的
染色 体位 置 ,而 该 因子 自身 仍 留 在 原初 位 置 的 现象 。
replicator gene 复制 子 基 因 。 一 种 指定 DNA 复制 的 起 始 和 终止 位 点 的 调节 基因 。
replicon 复制 子 。 一 个 染色 体 区 域 , 它 含 有 为 DNA 复制 所 必需 的 DNA 序列 ,并 且 它 作为 一 个 单
位 而 被 复制 。
reproductive barrier(reproductive isolation) 生 殖 障 碍 (生殖 隔离 )。 阻 止 群体 间 基 因 交 换 的 几 种 生
物 学 的 、 或 环境 的 机 制 中 的 任何 一 种 。
restriction endonuclease(restriction enzyme) 限 制 性 内 切 核 酸 酶 (限制 酶 )。 水 解 DNA 的 内 部 磷酸
二 酯 键 的 酶 。
© 154°
EP See OE ID ie PS a
wag
So Te < Say ere, Se ee ep 6 eee _ eee ee See ee
7 -
restriction-fragment pattern 限制 片段 模式 。 某 一 DNA 序列 被 限制 性 内 切 核酸 酶 消化 后 , 它 所 产
生 的 限制 片段 的 数目 和 大 小 的 情况 。
restriction site 限制 位 点 。 限 制 性 内 切 核酸 酶 水 解 (切割 )DNA 的 某 一 内 部 磷酸 二 酯 键 时 的 作用
点 。 位 置 可 能 非常 接近 识别 序列 ,也 可 能 不 接近 识别 位 点 。
VV restriction-site map 限制 位 点 图 谱 。 显 示 限 制 位 点 所 处 位 置 的 DNA 序列 的 图 形 。
retroelement 反 录 因子 。 具 有 产生 反 转 录 酶 能 力 的 DNA 或 RNA 序列 。
retrofection 反 录 感染 (传染 )。RNA 分 子 通过 反 录 病毒 粒子 (RNA 被 包 在 里 面 ) 而 从 一 个 细胞 向
另 一 个 细胞 (特别 是 种 系 细胞 ) 转 移 , 然 后 RNA 被 反 转 录 并 整合 进 宿 主 细胞 ,这 样 的 过 程 称 反 杂 感
染 。 即 通过 反 录 病毒 而 转 导 。
retrogene (processed gene) 反 录 基 因 ( 加 工 后 基因 )。 一 种 有 功能 的 反 录 序列 , 它 产 生 的 蛋白 质 与
mRNA 原来 的 基因 所 产生 的 蛋白 质 等 同 或 接近 等 同 。
retron 反 录 子 。 一 种 有 反 转 录 酶 密码 信息 但 缺乏 转 座 能 力 的 基因 组 序列 。
retroposition 反 录 转 座 。 一 种 由 RNA 中 介 的 转 座 模式 。
retroposon 反 录 座 子 ,又 译 “ 反 转录 子 ”。 一 种 既 不 构成 病毒 子粒 子 , 又 无 两 侧 末 端 完 余 序列 的 可
转 座 反 录 因子 。
retropseudogene (processed pseudogene) 反 录 假 基因 (加 工 后 假 基 因 )。 一 种 由 RNA 分 子 反 转录 而
来 ,其 后 的 cDNA 整合 进 基因 组 而 出 现 的 假 基因 。 判 定 反 录 假 基 因 的 标志 有 :缺乏 内 含 子 .多 聚 腺 苷
酸 尾 巴 ,两 侧重 复 ; 表 现 出 截 尾 等 转录 后 修饰 迹象 ;以 及 与 该 基因 家 族 的 有 功能 成 员 或 非 加 工 后 的 无
功能 成 员 都 无 连锁 关系 (无 位 置 上 的 关联 )。
retrosequence(retrotranscript, processed sequence) 反 录 序 列 ( 反 录 本 ,加 工 后 序列 ) 一 种 由 RNA
反 转 录 而 来 的 基因 组 序列 ,但 仅 靠 它 自身 则 缺乏 产生 反 转 录 酶 的 能 力 。 反 录 基 因 和 反 录 假 基 因 都 是 反
录 序 列 。
retrotransposon 反 录 转 座 子 。 一 种 不 构成 病毒 子粒 子 而 两 侧 有 末端 宛 余 序列 的 可 转 座 反 录 因 子 。
retrovirus 反 录 病毒 。 一 类 有 反 转 录 酶 密码 信息 的 小 单 链 RNA 病毒 。
reverse transcriptase 反 转 录 酶 。 催 化 逆向 转录 的 酶 。
reverse transcription 反 转 录 。 以 RNA 为 模板 而 进行 的 单 链 DNA 分 子 的 合成 。
ribonucleic acidCRNA) 核 糖 核酸 。 由 核 苷 酸 连接 而 成 的 大 分 子 多 聚 物 ,其 中 糖 基 为 核糖 。 通 常 ,
RNA 呈 单 链 。
ribosomal RNACRNA) 核 糖 体 RNA。 作 为 核糖 体 中 的 结构 成 份 的 RNA 分 子 。
ribosome 核糖 体 。 由 rRNA 和 和 蛋白质 组 成 的 一 种 细胞 内 颗粒 ,为 mRNA 的 翻译 提供 场所 。
RNA( 见 ribonucleic acid)
RNA-specifying gene 编码 RNA 的 基因 。 可 转录 但 产生 的 RNA 不 被 翻译 的 基因 。 其 RNA 转录
本 是 有 功能 者 的 基因 。
rollimg-circle replication 滚 环 复制 。 一 种 扩 增 模式 , 按 此 模式 某 一 DNA 序列 的 环 状 染色 体外 拷贝
产生 、 并 以 连续 方式 复制 。
\ | root 根 。 在 有 根 树 中 ,所 有 被 研究 的 分 类 单位 的 共同 祖先 。
”root tree 有 根 树 。 一 种 指明 祖先 和 后 代 物 种 ,从 而 指出 了 进化 途径 的 方向 的 系统 树 。
ITRNA( 见 ribosomal RNA)
S 丝氨酸 。
secondary structure 二 级 结构 。 在 蛋白 质 和 核酸 中 ,分 别 由 氨基 酸 之 间或 核 苷 酸 之 间 形 成 氢 键 而
导致 的 结构 。 对 蛋白 质 而 言 , 是 多 肽 链 中 的 区 域 性 结构 (例如 一 螺旋 、B 一 片 状 、 转 折 )。 对 单 链 DNA
或 RNA 来 说 , 则 为 区 域 性 双 链 结构 (例如 发 卡 )。
segregation( 见 Mendelian segregation) 分离 。
segregation distortion(meiotic drive) 分 离 偏 斜 ( 减 数 分 裂 驱 动 )。 在 杂 合 子 的 配子 间 出 现 的 分 离 比
偏离 。
«155
seqregator gene 分 离子 基因 。 一 种 在 减 数 分 裂 和 有 丝 分 裂 期 间 为 分 离 机 构 提供 染色 体 附 着 部 位
的 调节 基因 。
selection( 见 natural selection) 选择 。
selection coefficient 选择 系数 。 某 种 基因 型 与 群体 中 最 适 基 因 型 相 比 , 其 适合 度 降 低 的 定量 测度 。
一 种 对 选择 不 利 性 的 测度 。
selection intensity (stringency of selection ) 选 择 强度 (选择 的 严峻 程度 )。 和 群体 中 各 种 基因 型 间 适 合
度 值 上 的 差异 。
selective constraint( 见 functional constraint) 选 择 限 制 。
selfish DNA 自私 DNA。 一 种 对 其 携带 者 (或 宿主 ) 可 能 无 任何 好 处 ,而 仅 关 心 其 自身 传播 的
DNA 片段 。 可 转 座 因子 被 认为 是 自私 DNA。
self-splicing intron 自 ( 我 ) 拼 接 内 含 子 。 一 种 无 需 外 来 催化 剂 帮助 而 能 从 前 mRNA 中 分 裂 出 来 的
内 含 子 。
sense codon 有 义 密 码 子 。 确 定 某 种 氨基 酸 的 密码 子 。
sense strand 有 义 链 。 基 因 的 非 转录 链 , 该 链 的 DNA 顺序 与 RNA 转录 本 的 等 同 。
sequence divergence(divergence) 序 列 分 岐 ( 分 岐 )。 两 同 源 序列 由 于 各 自在 其 谱系 中 独立 地 积累 遗
传 变化 ,而 出 现 的 相互 间 的 差异 。
sex-linkage 性 连锁 。 位 于 性 染色 体 上 的 基因 所 处 的 处 境 。 该 术语 常 限于 指 x 一 染色 体 上 的 基因 。
sibling species 姐妹 种 ,同胞 种 。 形 态 上 不 可 区 分 但 生殖 上 出 现 隔离 的 物种 。
signal peptide 信和 号 肽 。 在 多 肽 合成 后 且 在 该 蛋白 质 确定 其 正确 的 三 级 结构 之 前 ,而 从 多 肽 中 分 裂
出 来 的 领头 肽 。
silencing( 见 nonfunctionalization ) 沉 默 ( 化 )。
silent substitution 沉默 替换 。 不 改变 其 携带 者 的 表 型 的 替换 。 包 括 非 基因 DNA 中 的 替换 和 同 义
替换 。
simple transposon 简单 转 座 子 。 不 含 插 入 序列 的 转 座 子 。
SINE(Short Interspersed Element 的 首 字 母 缩 略 ) 短 散在 因子 。 多 细胞 真 核 生物 的 基因 组 中 ,长 度
短 于 500 碱 基 对 、 拷 贝 数 为 10: 或 更 多 的 散在 重复 序列 ,都 可 称 为 SINE( 短 散在 因子 )。
single-copy DNA( 见 unique DNA) 单 拷贝 DNA,
sister taxa(neighboring taxa) 姐 妹 分 类 单位 (近邻 分 类 单位 )。 一 般 用 来 指 一 群 物种 中 相互 在 进化
程度 上 最 接近 的 物种 对 。 在 系统 树 中 , 即 两 个 仅 通 过 一 个 内 部 节点 联系 起 来 的 分 类 单位 。
somatic cell 体 细 胞 。 注 定 不 会 变 成 配子 的 细胞 。
somatic mutation 体 细 胞 突变 。 体 细胞 中 发 生 的 突变 。
spacer DNA 间隔 DNA。 处 于 两 个 基因 之 间 的 DNA。 可 以 被 转录 也 可 以 不 被 转录 。
speciation (cladogenesis) 物 种 形成 (分 枝 进化 ) 。 一 个 群体 分 裂 成 两 个 或 多 个 生殖 隔离 的 群体 的 过
程 。 新 物种 通过 此 过 程 产生 。
species 物种 .分 类 中 的 一 个 基本 范畴 ,对 此 有 一 些 不 同 的 定义 :(1) 一 群 真实 的 或 潜在 的 可 相互 杂
交 的 个 体 , 它 们 与 别 的 这 样 的 类 群生 殖 隔 离 ( 生 物 学 物种 概念 );(2) 一 个 与 别 的 谱系 在 进化 上 分 离 的
谱系 (进化 论 物 种 概念 ); (3) 一 群 彼此 相似 的 生物 ,它们 间 的 相似 远 胜 于 与 群 外 生物 的 相似 (分 类 学 物
种 概念 ) 。
species tree 物种 树 。 表 示 一 群 物种 间 的 进化 关系 的 系统 树 。
splicing 拼接 。 在 RNA 走向 成 熟 的 加 工 中 ,去 除 内 含 子 的 过 程 。
splicing site or junction 拼接 位 点 或 拼接 点 。 外 显 子 和 内 例子 间 的 界 点 。
split gene 断裂 基因 。 含 有 内 含 子 的 基因 。
standard nucleotide 标准 核 苷 酸 。 即 腺 味 叭 核 苷 酸 (A)、 胞 喀 啶 核 苷 酸 (C)、 乌 味 叭 核 苷 酸 (G)、 胸
Fie Wa Wie AK EF RCT), BK, ae ME FF PR CU).
sticky ends 粘性 未 端 。 从 双 螺 旋 DNA 相对 的 两 端 伸 出 的 DNA 单 链 。 通 常 是 双 链 DNA 被 某 种
“6
Coe” eee aa ere eee
限制 酶 错开 式 地 切割 而 产生 的 。
stochastic process 随机 过 程 . 结 果 不 能 从 初始 条 件 知识 而 精确 地 预测 到 的 过 程 即 随机 过 程 。. 不 过 ,
根据 给 定 的 初始 条 件 ,对 该 过 程 的 每 一 可 能 出 现 的 结果 可 得 出 一 定 的 概率 。
stop( 见 termination codon) 终 止 ,休止 符 。
stringency of selection( 见 selection intensity) 选 择 的 严峻 程度 。
strong bond 强 键 。 与 双 键 的 核酸 或 片段 (例如 密码 子 一 反 密 码 子 相互 作用 ) 有 关 的 、 存 在 于 C 和
G 间 的 三 个 氢 键 。 强 键 能 增加 稳定 性 ,提高 熔 解 温度 。
structural domain( 见 module) 结 构 域 。
structural gene 结构 基因 。 一 段 为 蛋白 质 编码 或 确定 一 种 RNA 分 子 的 DNA 序列 。 另 一 些 作 者 则
仅 把 为 蛋白 质 编 码 的 基因 当 作 结构 基因 。
subspecies 亚 种 。 某 一 物种 中 的 一 个 地 理学 上 或 形态 学 上 有 区 别 的 群体 。
substitution (i, gene substitution 和 nucleotide substitution) 替换 。
substitution matrix 替换 矩阵 。 以 矩阵 的 形式 表示 的 替换 模式 ,其 中 的 元 则 表示 某 两 个 核 苷 酸 间
的 相对 替换 速率 。
substitution scheme( 见 pattern of substitution ) 蔡 换 方 式 。
superfamily 超 家 族 。. 相 互 间 有 一 定 程度 分 岐 的 一 些 基 因 的 集合 ,把 基因 重复 的 一 切 产物 都 包括 在
内 〈 对 为 蛋白 质 编码 的 基因 来 说 ,通常 氨基 酸 水 平 上 的 相似 性 小 于 50%% )。
symbiosis 共生 。 两 个 或 多 个 生物 以 互利 关系 共存 。
symmetrical exon 对 称 外 显 子 。 位 于 两 个 同 相 位 内 含 子 之 间 的 外 显 子 。
synonymous substitution (silent substitution ) 同 义 替 换 ( 沉 默 替 换 )。 核 苷 酸 蔡 换 后 的 密码 子 确定 的
氨基 酸 与 以 前 的 相同 ,这样 的 蔡 换 称 同 义 蔡 换 。
systematics 系统 学 。 即 分 类 学 和 系统 发 育 学
T(1) 在 DNA PRA wR MER. DEBRA RA HAR.
tandem duplication 串 接 重复 。 重 复 产 物 位 于 染色 体 上 相互 紧 挨 在 一 起 处 的 重复 形式 。
taxon( 复 数 taxa) 分 类 单位 、 分 类 群 。 指 任何 等 级 的 分 类 学 群 ( 例 如 种 、 属 ` 界 ), sa ial 28
标准 而 被 归于 各 和 群 之 中 。
taxonomy (classification ) 分 类 学 (分 类 )。 指 将 物种 命名 并 归于 分 类 学 群 中 的 原则 和 程序 。
terminal node 末端 节点 。 系统 树 中 表示 一 个 现存 分 类 单位 的 图 形 。
termination codon (nonsense codon ,stop) 终 止 密码 子 (无 意义 密码 子 、 休止 符 ) 。 一 种 不 存在 与 其 对
应 的 正常 tRNA 的 密码 子 , 其 出 现 可 终止 翻译 过 程 。 普 适 遗 传 密码 中 的 三 个 终止 密码 子 为 UAG、
UAA 和 UGA。
tertiary structure 三 级 结构 。 在 蛋白 质 和 核酸 中 ,由 其 自身 的 折 和 大 而 导致 的 分 子 的 三 维 结构 即 三
级 结构 。
thermal stability 热 稳 定性 。 表 示 抗 变性 或 抗 熔 解 程度 的 一 种 性 质 。
Tm 双 螺 旋 DNA 熔 解 时 的 中 间 温 度 。
AT 同 源 双 螺旋 DNA 与 异 源 双 螺旋 DNA 的 中 间 熔 解 温度 之 间 的 差 。
topology 拓扑 学 .拓扑 图 。 系 统 树 的 分 梳 模 式 。
trans 反 式 。 两 个 序列 或 基因 排列 在 不 同 染色体 上 。
transcription 转录 。 在 DNA 模板 上 合成 RNA 分 子 。
transcription-initiation site( 见 cap site) 转 录 起 始 部 位 。
transcription-termination site 转录 终止 部 位 。RNA 转录 终止 所 在 的 位 点 。 与 被 多 聚 腺 苷 化 了 的
RNA 对 照 ,该 部 位 可 能 与 多 聚 腺 苷 酸 部 位 等 同 , 也 可 能 不 同 。
transduction 转 导 。 宿 主 的 遗传 信息 通过 病毒 从 一 个 细胞 癌 另 一 个 细胞 的 转移 。
transfer RNACtRNA) 转 移 RNA。 一 种 小 分 子 核酸 , 带 有 一 个 反 密 码 子 ,一 个 与 特异 氨基 酸 结 侣
的 位 点 ,以 及 与 核糖 体 和 酶 相互 作用 的 识别 位 点 。 这 里 的 酶 起 着 将 tRNA 与 特异 氨基 酸 连 结 的 作用 。
° 157°
transition 转换 。 哇 叭 被 味 叭 或 喀 啶 被 喀 啶 替换 。
translation (decoding) 翻 译 、 转 译 ( 解 码 )。 经 tRNA 中 介 而 从 mRNA 分 子 的 核 苷 酸 顺 序 得 到 多 肽
的 氨基 酸 顺 序 的 过 程 , 此 过 程 是 在 与 核糖 体 结 合 中 发 生 的 。
transposable element (mobile element) 可 转 座 因 子 ( 可 移动 因子 )。 一 种 能 在 某 种 生物 的 基因 组 中
到 处 移动 的 序列 。
transposition 转 座 。 遗 传 物质 从 一 个 基因 组 位 置 向 另 一 个 位 置 的 移动 。
transposon 转 座 子 。 除 了 携带 与 转 座 功能 有 关 的 基因 外 还 带 有 附加 基因 的 可 转 座 因 子 。
transversion 颠 换 。 味 叭 被 喀 啶 替换 ,或 相反 情形 的 替换 。
trisomy 三 体 。 在 别 的 染色 体 为 两 倍 体 的 细胞 中 , 某 一 染色 体 存 在 三 个 拷贝 的 现象 。
tRNA CK transfer RNA).
true tree 真实 树 。 代 表 了 一 群 分 类 单位 的 真实 进化 史 的 系统 树 。
twofold degenerate site 二 重 简 并 位 点 。 编 码 区 中 的 某 一 核 苷 酸 位 点 , 若 三 种 可 能 的 核 背 酸 改 变 中
有 一 种 是 同 义 的 ,而 另 两 种 是 非 同 义 的 , 则 该 位 点 即 为 二 重 简 并 位 点 。
U 尿 喀 喧 核 背 。
unequal codon usage(biased codon usage) 密 码 子 的 不 等 价 应 用 (偏向 性 密码 子 应 用 )。 在 为 蛋白 质
编码 的 基因 里 , 某 一 密码 子 ( 家 ) 族 中 的 一 个 或 多 个 密码 子 被 不 成 比例 地 应 用 。
unequal crossing-over 不 等 价 交换 。 两 同 源 序列 在 不 同 染色 体 位 置 处 交换 ,新 产生 的 染色 体 出 现
某 些 区 域 的 拷贝 数 不 相 同 的 现象 。 |
unidentified reading frameCURF) 未 定 阅 读 框 架 。 一 种 其 产物 未 知 的 ORF.
unique DNA (single-copy DNA) 单 一 DNA( 单 拷贝 DNA). 在 单 倍 基因 组 中 仅 以 一 个 拷贝 存在 的
DNA 序列 。
universal genetic code 普 适 (通用 ) 遗 传 密码 。 左 右 绝 大 多 数 基因 组 的 翻译 的 遗传 密码 。
unprocessed pseudogene 未 加 工 的 假 基 因 。 通 过 基因 重复 得 到 ,而 随后 其 中 一 个 拷贝 无 功能 化 或
沉默 化 ,这 样 产生 的 假 基 因 即 未 加 工 的 假 基 因 。
unrooted tree 无 根 树 。 一 种 既 未 确定 根 , 也 未 指出 进化 途径 的 方向 的 进化 树 。
untranscribed sequence( 见 flanking sequence) 不 转录 序列 。
upstream 上 游 。 核 酸 上 某 一 参考 点 的 5 方向 (与 转录 方向 相反 )。
URE( 见 unidentified reading frame) 。
V RAR.
variable site or region 可 变 位 点 或 可 变 区 域 。(1) 在 被 比较 的 DNA 序列 中 ,由 不 同 核 苷 酸 占据 的
位 点 或 区 域 。(2) 严 格 地 说 , 指 DNA 中 能 随时 间 而 变 的 位 点 或 区 域 。
variant repetition 变异 的 重复 。 自 重复 事件 发 生 以 来 ,基因 重复 的 产物 相互 分 岐 ,而 出 现 略 有 差异
的 重复 。
viability 生活 力 。 一 种 适合 度 成 份 。 某 一 给 定 基因 型 的 个 体 从 妊娠 活 至 生殖 年 龄 的 概率 。
virion 病毒 子 。 一 种 病毒 颗粒 。
virus 病毒 。 一 种 微小 的 寄生 生物 ,依赖 宿主 细胞 复制 其 遗传 物质 和 合成 其 蛋白 质 。 其 基因 组 可 能
是 RNA 也 可 能 是 DNA, 可 以 是 单 链 的 也 可 以 是 双 链 的 。
W AR.
weak bond 弱 键 .与 双 链 核酸 (例如 密码 子 一 反 密 码 子 相互 作用 ) 有 关 的 存在 于 A MT RA MU
之 间 的 二 个 氢 键 。 弱 键 使 热 稳定 性 和 熔 解 温度 降低 。
wild type 野生 型 。 群 体 中 某 一 基因 座位 上 最 常见 的 等 位 基因 ,只 要 这 样 的 等 位 基因 存在 。
wobble pairing 摇摆 配对 。 某 些 tRNA 通过 反 密 码 子 第 一 位 与 密码 子 第 三 位 之 间 的 非 标准 配对
(例如 , 反 密 码 子 中 的 U 与 密码 子 中 的 G 配 对 ), 而 能 识别 一 个 以 上 的 密码 子 , 这 样 的 配对 称 摇摆 配
at).
x-linkage( I, sex-linkage)x 一 连锁 。
° 158
xenology 宿主 学 。 作 为 某 一 水 平 基因 转移 事件 的 后 果 的 序列 相似 性 。
Y BAR.
zygote 合子 。 由 单 倍 体 配 子 细胞 核 融 合 产生 的 两 倍 体 细 胞 。
4 下
+ 题
A
#4 EB (amino acids) , 另 见 蛋白 质 中 的 条 目 。
缩写 (abbreviations)10
遗传 信息 翻译 (translation of genetic information into)
9-11
氨基 酸 顺 序 (amino acid sequences)
线性 排比 (Calignment)34-37
乳牛 与 叶 猴 溶菌 酶 中 的 (in cow and langur lysozymes)
47-48
氨基 酸 蔡 代 (amino acid replacements)25, 另 见 非 同 义 蔡
换
AK Al WA 4 36 (Australian marsupials) , 分 子 古 生物 学
Hie
B
& % & Z (paromomycin)77
AA (albumin), Rime A
白细胞 中 介 素 1 2EA interleukin | gene)43-44
白血病 (leukemia) , ## 110
半 加 工 反 录 基因 (semiprocessed retrogene)111
Hid HE WE (cytosine) 6,7
保守 (型 ) 转 座 (conservative transposition) 105-107
倍 性 基因 (doublesex (Csz) gene)97-98
被 子 植物 (angiosperms) ,C 值 125
编码 区 (coding regions) ,42-44 另 见 为 蛋白 质 编 码 基 因
变通 的 拼接 (alternative splicing)97-98
变形 距离 法 (transformed distance method), 用 于 系统 树
构建 的 65-66,68,81
变异 的 重复 (variant repeats)87
表皮 生长 因子 (epidermal growth factor,EGF)94
表 型 关系 图 (phenogram)68
表 型 学 (phenetics), 与 进化 枝 学 对 应 68-69
保护 生物 学 (conservation biology)77-81
丙酮 酸 激 酶 (pyruvate kinase), 同 功 酶 88
并 发 进化 (coincidental evolution)99 , 另 见 协同 进化
病毒 基因 (virogenes)120
从 独 独 向 猫 的 水 平 转移 (horizontal transfer from ba-
boons to cats)120-121
病毒 子 Cvirion)108-109
哺乳 动物 的 C 值 Cmammalian C values)125
* 160°
索 Sl
哺乳 动物 线粒体 的 遗传 密码 (mammalian mitochondria ge- os,
netic code) 10-11,34
哺乳 动物 线粒体 基因 组 (mammalian mitochondria
genome )52-53, 87-88
AR AE BE ZF (invariant repeats) 87,88
不 等 价 交换 (Cunequal crossing-over) 12-13,127
协同 进化 与 (concerted evolution and)92, 99-103
基因 组 大 小 与 (genome size and)88
低 密 度 脂 蛋白 受 体 基 因 (low-density-lipoprotein recep-
tor gene)116
不 翻译 区 (untranslated region)7
中 的 核 苷 酸 蔡 换 速 率 (rates of nucleotide substitutions
in)28,30-31 42 ¢
不 加 权 算 术 平 均 组 对 法 (unweighted pair group method
with arithmetic mean ,UPGMA)64-65,68-69,72-74,
78-81
不 完全 变态 昆虫 (hemimetabola)82
不 转录 间隔 (nontranscribed spacer,NTS) 99
«
让
+
+
C
操纵 基因 (operator)8
操纵 子 (operon )8-9
操作 中 的 分 类 单位 (operational taxonomic units,OTUs) 另
见 系 统 树
复合 的 (composite)111
侧 ( 区 ) 序 列 (flanking sequences)
为 蛋白 质 编码 基因 与 (protein-coding genes and)7-8, 25
中 的 核 苷 酸 替 换 速 率 (rates of nucleotide substitution
in)45,50-51
ff A (insertions) 11-14,34,116
4 A FF I (insertion sequences) 107,124
IS1 106,107
1S4 105
tk FF ez BL Chylobatidae) 73
长 度 缩短 Clength abridgment) 115
长 未 端 重复 (long terminal repeats, LTRs)109,116.128
长 期 有 效 群 体 大 小 (long-term effective population size)22
长 散在 的 重复 序列 (long interspersed repeated sequences) ,
同 LINEs128-129
超 家 族 (superfamily)88, 另 见 基因 家 族
珠 蛋 白 Cglobin)92
i
超 显 性 (overdominance )17,18-19,45
沉默 (化 )(silencing)55 另 见 无 功能 化
沉默 替换 (silent substitution )11
成 熟 酶 (maturase)97
i @ HH (overlapping genes)96-97
if & (duplication)
的 类 型 的 (types of )83
重复 基因 (duplicate genes) 另 见 基因 重复
无 功能 化 (nonfunctionalization )89-91
重复 型 转 座 (duplicative transposition)105-106 另 见 复制
型 转 座
重组 (recombination)16,100,117
重组 酶 (recombination enzyme)9
重组 子 基因 (recombinator gene)9
初 龙 亚 网 (archosauria)72
垂直 进化 (vertical evolution) ,与 水 平 进 化 对 应 99
垂直 相关 (orthology)90
纯 合 子 (homozygotes)
共 显 性 与 (codominance and)18
纯洁 化 选择 Cpurifying selection)17,45, 47-48, 52 HRA
害 突变
醇 脱 氢 酶 基因 座位 (alcohol dehydrogenase (Adh) gene)
核 苷 酸 多 样 度 Cnucleotide diversity)25-26
KRY BF CGnosine) , XH ALF 56
促 红 细胞 生成 素 基 因 (erythropoietin gene) 43
促 黄体 生成 激素 基因 (luteinizing hormone gene)43
促 甲 状 腺 激素 基因 (thyrotropin gene)43
促进 子 (promotors)7,9,79,115
促进 子 区 (promotor region)7
D
达尔 文 ,查尔斯 (Darwin ,Charles)72-73
达尔 文 主义 (Darwinism)26
大 鼠 (rats), 核 苷 酸 蔡 换 速 率 50
大 猩猩 亚 科 (gorillinae)73
单 倍 体 (haploid)16,17
单 拷贝 DNA(Csingle-copy DNA)798-99,126-127
单一 DNA(Cunique DNA)126-127,129
单子 叶 植 物 (monocotyledons)53-54,129
AB [Al 8 (cholesterol) 116
蛋白 酶 抑制 因子 (protease inhibitors)
内 部 域 重复 86-87
蛋白 质 (protein(s))
基因 家 族 (gene families)87-89
球状 的 (globular)84-85
中 的 内 部 域 重 复 (internal domain duplications in)85-87
由 内 含 子 编码 的 (intorn-encoded)97-98
#E ik AY (mosaic) 93-94
& A Jit C(protein c)93
蛋白 质 域 (protein domain) ) , 见 域
倒 位 (inversions)11-12,116
等 位 基因 (allele(s))16,25
共 显 性 的 (codominant)18-19
有 害 的 (deletious)11-14,34-35,52,114,116
的 固定 (fixation of)20-21,22-25,28
的 丢失 (loss of)20-21
中 性 的 Cneutral)22-23, 另 见 中 性 突变
野生 型 (wild type)22
等 位 基因 频率 (allele frequencies)16,17-19
fy Yk Bh (fluctuations in)18-20
2% 5 (polymorphism and) 24-26
低 密 度 脂 蛋白 受 体 基因 (low-density-lipoprotein receptor
gene) ,不 等 价 交 换 116
低 水 平 表达 的 基因 (lowly expressed genes)56-57
颠 换 (transversions)11-12,30-32,33-34
点 突变 (point mutations)11
模式 (pattern)53,55
点 阵 法 (dot matrix method) ,顺序 线性 排列 中 的 35,36,41
电泳 型 等 位 基因 (electrophoretic alleles)25-26
定向 选择 (directional selection )18
豆 血 红 和 蛋白 (leghemoglobin) ,内 含 子 84-85
端 粒 (telomere)125-126
短 散 在 重复 序列 (short interspersed repeated sequences) ,
同 SINEs128-129
断裂 基因 (split genes)83
多 倍 体 (polyploidy)83,129 另 见 基 因 组 重复
多 次 “ 击 中 ”(multiple“hits”)31-32
多 基因 家 族 Cmultigene families)88, 另 见 基 因 家 族
协同 进化 (concerted evolution)98-103, 另 见 协同 进化
多 聚 酶 链 式 反 应 (polymerase chain reaction, PCR)78-80
多 聚 (A) 添 加 部 位 (poly(A)-addition site)6-7
多 聚 腺 苷 化 信号 (polyadenylation signal)7-8,90
多 拷贝 单 链 DNA(Cmulticopy singlestranded DNA, ms
DNA)109-110
多 配偶 制 物种 (polygamous species) ,的 有 效 群 体 大 小 21
多 态 ( 性 .现象 )(polymorphism)20-21,24-26
基因 转变 与 (gene conversion and)127
新 达尔 文 主义 与 (neo-Darwinism and)26
中 性 学 说 与 (neutral theory and)26-27
E
二 重 简 并 核 苷 酸 位 点 (twofold degenerate nucleotide sites)
34-35 ,44-45
二 氧 叶酸 还 原 酶 基因 (dihydrofolate reductase gene)113
二 色 性 (dichromatism7)89-90
— I st eh KM (binomial probability function )19-20
Tol *
F
翻译 (translation)7 ,9-10,77
翻译 效率 (translational efficiency) ,
密码 子 应 用 模式 与 55-57
反 录 病毒 (retroviruses)107-110,115-116
反 录 病毒 的 序列 (retroviral sequences) ,内 源 的 120
反 录 感 ( 传 ) 染 (retrofection)111
反 录 基因 (retrogenes)111-112,122 另 见 反 录 序 列
半 加 工 的 (semiprocessed)111
反 录 假 基因 (retropseudogene)111,112-116
另 见 反 录 序 列
进化 (Cevolution)115-116 :
反 录 序列 (retrosequences) 108-109, 110-111, 121-122, 128-
129, 另 见 反 录 基 因 , 反 录 假 基因
判定 特征 (diagnostic features)111
类 型 (types)111
反 录 因子 (retroelements)107-110,121-122
分 类 (classification ) 108-109
可 能 的 进化 途径
110
反 录 转 座 (retroposition)103,105-107,107-108,129
对 宿主 基因 组 的 影响 (effects on host genome)115-116
反 录 转 座 子 (retrotransposons)107,108-110,129
copia 108-109
DIRS-108-109
JZ F (retrons) 108-110
JQ 3% HE F (retroposons) 108-110,128-129
cin 4 AF (cin 4 factor)128
D 因子 (CD factor)128
F 因子 CE factor)128
G 因子 (G factor)128
G3A 108-109
I AF C1 factor) 128
Ingil28
L1 128-129
的 假 基 因 (pseudogenes of )128
R2 因子 (R2 factor)128
反 密 码 子 (anticodon)56-57
反 转 录 示 (retrotranseiipts) 见 反 录 序列
反 转 录 酶 (reverse transcriptase)108-109,111,128
放 线 菌 酮 (cycloheximide), 即 (成 二 酰 ) 亚 胺 环 已 酮 77-79
“ 非 病 毒 的 反 录 座 子 ”(“nonviral retroposons2”) 见 反 录 序列
非 肌 的 原 肌 球 和 蛋白 基因 (Cnonmuscle tropomyosin gene)113
非 基 因 DNA (nongenic DNA)129
C (A t#ié 455 (c-value paradox and)125-127
的 维持 Cmaintenance of )131
4E fai FF AK FB 7A (nondegenerate nucleotide sites)34-35,
44-46
4£ [a] 2 #& (nonsynonymoussubstitution)11-13,91 另 见 核
° 162°
(possible evolutionary pathway ) 109-
苷 酸 蔡 换
速率 (rates)42-45,52-54
选择 强度 与 (selection intensity and)45-47
与 同 义 蔡 换 对 应
46
两 为 蛋白 质 编码 序列 间 的 (between two protein-coding
sequences)33 ,34
非 同 义 位 点 Cnonsynonymous site)46, 另 见 非 简 并 位 点 ,二
重 简 并 位 点
非 整 数 倍 重复 (aneuploidy)83,129 另 见 染 色 体 重复
废物 DNA Gunk DNA)127-128,131
Bb Hb (baboons) , 77 BF 3k Al [ey] A BY) 7K FB 120-122
分 类 学 单位 (taxonomic units), 操 作 中 的 , 见 操作 中 的 分
类 学 单位
分 离 偏 斜 (segregation distortion )117
分 离子 基因 (segregator gene)9-10
分 岐 (divergence )
协同 进化 与 (concerted evolution and)102
核 苷 酸 序列 间 的 (between nucleotide sequences) 31-32,
32-34,44-45
分 岐 时 间 (divergence time)42
的 估计 (人 (estimation of)70-71
人 与 猿 的 (of humans and apes)49,72-73
分 子 的 系统 发 育 (molecular phylogeny) 见 系统 发 育
分 子 古 生物 学 (molecular paleontology)77-80
分 子 进 化 (molecular evolution ) ,定义 5
分 子 进 化 的 中 性 学 说 (Cneutral theory of molecular evolu-
tion)26-27 ,46
分 子 驱 动 (molecular drive)101-102
分 子 生 物 学 (molecular biology)5
分 子 ( 时 ) 钟 (molecular clock(s)48-52
对 假说 的 挑战 (challenges to hypothesis)49
人 与 猴 中 的 比较 (comparison in humans and monkeys)
50-51
小 鼠 与 大 鼠 中 的 比较 (comparison in mice and rats)50
路 齿 类 与 灵 长 类 中 的 比较 (comparison in rodents and
primates)51-52
相对 速率 测验 与 (relative-rate test and)49-50
谱系 间 的 变异 (variation among lineages)50-52,71
分 枝 进 化 (cladogenesis), 转 座 与 118-119
负 选 择 Cnegativeselection)17, 另 见 有 害 突变
附着 位 点 (Cattachment site)9-10
复合 转 座 子 (complex transposons)107
复制 滑脱 (replication slippage)12-13,14,101-102,131
复制 (型 ) 转 座 (replication transposition)105-107,128
复制 子 基因 (replicator genes)9-10,125-126
(synonymous substitutions versus) 45-
G
5 GE 48 {4 (calcium-binding module) ,依赖 维生素 开 的
Te
94
钙 调 素 基 因 (calmodulin gene) 111
钙 依 赖 性 调节 蛋白 (calcium-dependent regulator protein) ,
内 部 域 重 复 85-87
概率 (probability)
二 项 式 的 (binomial)19-20
固定 (fixation)22-23
干扰 素 基 因 (interferon genes)42-43
甘油 醛 -3- 磷 酸 脱 氢 酶 基因 (glyceraldehyde-3-phosphate
dehydrogenase gene)113
rh AY RK FF RE HR BE HK (rate of nucleotide substitutions
in) 43-44
高 胆固醇 血 症 (hypercholesterolemia)116
高 度 重复 的 DNA(highly repetitive DNA 126-127
散在 序列 (dispersed sequences)127-129
区 域 性 序列 (localized sequences 126-128
高 水 平 表 达 的 基因 (highly expressed gene)56-57
划 兰 氏 阳 性 菌 (Gram-positive bacteria)123 ,124-125,132
革 兰 氏 阴 性 菌 (Gram-negative bacteria, 123,132
给 ( 供 ) 体 部 位 (donor site)8,116
功能 限制 (functional constraints)
进化 速率 与 45-47
功能 域 (functional domain) 83
共同 顺序 (consensus sequence)25
共 显 性 (codominance)18-19
构建 系统 树 的 距离 矩阵 法 (distance matrix methods for
tree reconstruction ) 64-67 , 68-69
用 于 人 与 猿 的 (for humans and apes) 74-75
古生物 学 (paleotology) ,分 子 的 77,80
古 细 菌 (archaebacteria)123
定 (fixation)16,19-21,22-25,26
等 位 基因 (allele)20-21,22-25,28
协同 进化 与 (concerted evolution and)101-102
定 概 率 (fixation probability)20-21,22-23,24-25,45
定时 间 (fixation time)22,23-24
条 件 的 (conditional)23
光合 细菌 (photosynthetic cyanobacteria)76-77
滚 环 复 制 (rolling-circle replication)130-131
H
哈 迪 - 温 伯 格 平衡 (Hardy-Weinberg equilibrium) 17
¥ 4A (sponges) ,C 值 125
i HE FE (seaside sparrow )80-81
4 i #8 HF (composite transposons) 107
K $F RB (nucleotides)
#8 A& (composition) 131
4 FF YE (diversity ) 25-27
DNA 序列 中 的 (in DNA sequences) 6
4E th HE (nonstandard )7
RNA 序列 中 的 (in RNA sequences)7
标准 (standard)7
核 苷 酸 顺 序 (nucleotide sequences)28-37
线性 排比 (Calignment)34-37
#a 5 HE (dissimilarity ) 36
分 岐 (divergence) 31-32 ,32-35,42
rRNA 77-78
#A {DL HE (similarity ) 36
K AF WRF MR (nucleotide substitutions) 11-13, 28-35, 42-59,
64,91-92
回复 (backward) 32
速率 变异 的 原因 (causes of rate variations) 45-47
并 发 的 (coincidental)32
趋同 的 (convergent)32
人 和 猿 与 (humans and apes and)74
朱 克 斯 和 坎 托 的 一 参数 模型 (Jukes and Cantor's one-
parameter model)28-31,32-34,41
木村 的 两 参数 模型 (Kimura's two-parameter model)30-
32,33-34
FL 4+ 45 Ot AY YS BA BBP A Cin lysozymes of cows and
langurs)48
哺乳 动物 线粒体 中 的 (in mammalian mitochondria )52-
53
分 子 时 钟 假 说 (molecular clock hypothesis)48-52
多 重 (multiple)31-32
同 义 密码 子 的 非 随 机 应 用 与 (nonrandom usage of syn-
onymous codons and)55-59
两 DNA 序列 间 的 数目 Cnumber between two DNA se-
quences) 31-35
两 非 编 码 序列 间 的 数目 (number between two noncod-
ing sequences) 32-34
两 为 蛋白 质 编 码 序列 间 的 数目 (number between two
protein-coding sequences)34
平行 的 (parallel)32 ,48
假 基 因 中 的 模式 (pattern in pseudogenes)53-55
植物 核 基因 组 中 的 (in plant nuclear genomes)53
速率 (rates) 42
细胞 器 DNA 中 的 速率 (rates in organelle DNA)52-53
速率 变异 (rate variations)45-47
沉默 的 (silent)11-12
物种 比较 (species comparisons)49=52
物种 分 岐 时 间 估 计 与 (Species-divergence time estima-
tions and)71
同 义 的 (synonymous)11=3
核 苷 酸 蔡 换 的 两 参数 模型 (two-parameter modelof nu-
cleotide substitution ) 31-34
核 苷 酸 蔡 换 的 一 参数 模型 (one-parameter model of nu-
cleotide substitution ) 28-30, 32-34 ,
核 苷 酸 替 换 速 率 (rate of nucleotide substitution ) 24-25,
*. 163 ¢
28,30-31542
RK FF RL A (nucleotide sites) , 另 见 信息 位 点
简 并 类 型 (degeneracy classes)34-35
核 骨 架 Cnucleoskeleton)181
核 类 型 的 DNA(CnucleotypBic DNAJ)131
核 仁 素 Cnucleolin)59
核糖 (ribose)6
核糖 核酸 (ribonucleic acid) 见 RNA
核糖 体 (ribosome)9-10,77
核糖 体 蛋 白 17 基因 (ribosomal protein L7 gene)113
核糖 体 蛋白 L30 基因 113
核糖 体 蛋白 L32 基因 113
核糖 体 RNA(Cribosomal RNA) WL rRNA
核 小 体 Cnucleosome)47,131
颌 下 腺 型 蛋白 酶 抑制 因子 (submandibular-gland type pro-
tease inhibitor) 内 部 域 重 复 86-87
黑猩猩 (chimpanzees)72-76
红 霉 素 (erythromycin)107
红色 素 基 因 (red-pigment gene)89
#& (monkeys) , KF BF HHH 50-51
& #h DNA (complementary DNA) WL cDNA
a fbi St iB Bc (slipped-strand-mispairing ) 12-14, 101-102,
131 另 见 复制 滑脱
环节 动物 (Cannelids),c 值 125
环 状 DNA 病毒 (circular DNA viruses)109-110
回 交 (backcrosses)79
回 文 (palinodromes)126-127
中 的 突变 (mutations in)14
识别 顺序 与 (recognition sequences and)37-38
J
PL] AR AB A HE (mechanical incompatibility) , 物种 形成 与
119
肌 动 蛋白 基因 (actin genes) 43
肌 动 蛋白 (actin «)43,50
肌 动 蛋白 BCactin B)43,50,113
肌 红 蛋白 基因 (myoglobin;gene)84-85,88,92 另 见 珠 蛋 白
基因 li
中 的 核 苷 酸 蔡 换 速 率 (rates of nucleotide substitutions
in)43
肌 球 蛋白 轻 链 基 因 (Cmyosin light chain gene) 113
AL YK BiH (creatine kinase), 同 功 酶 88
肌 酸 激酶 M 基因 (creatine kinase M gene)43,44
基因 (gene(s)), 另 见 特异 基因 或 基因 类 型
编码 区 (coding regions)7-8
“ 死 的 ?>(“dead”) , 见 假 基因
定义 (Cdefined)7
外 源 性 的 (exogenous)106-107
侧 区 ( 域 ) (flanking regions)8
。164。
高 度 重复 的 (highly repetitive)88
水 平 转移 (horizontal transfer)119-122
低 度 重复 的 (lowly repetitive)88
不 转录 区 ( 域 )Cnontranscribed regions)8
垂直 相关 的 (orthologous)90-91
Hi ® (overlapping ) 95-97
XE 47 AX AW (paralogous) 90-91
til JG (processed) 111-112
重复 的 (repeated)87
的 沉默 Csilencing of)55 另 见 无 功能 化
断裂 (split)83
间 的 替换 速率 变异 (substitution rate variations among)
47
内 的 替换 速率 变异 (substitution rate variations within)
46
BY 4% $ AY (transcribed )8-10,129
可 转录 区 ( 域 )(transcribed regions)8
类 型 (types)7
不 翻译 区 ( 域 ) Cuntranslated regions)7-8
基因 表达 (gene expression) ,可 转 座 因子 与 116
基因 重复 (gene duplication) 38-39,83
AL DNA 重复 , 域 重 复 , 外 显 子 重复
完全 的 (complete)83
年 代 估 计 (estimation of date)90-=92
内 部 的 (internal)83
无 功能 化 与 Cnonfunctionalization and)89-91
部 分 的 (partial)83
基因 (的 ) 延 长 (gene elongation)85-87
基因 多 样 性 (gene diversity)24-25
基因 分 化 (gene splitting), 和 群体 分 化 与 63
基因 分 享 (gene sharing)97-99
基因 家 族 (Cgene families)87-89
th fal BEAK (concerted evolution)98-103 另 见 协同 进化
3k E A (globins) 92-93
基因 结构 (gene structure)7-10
为 蛋白 质 编码 基因 (protein-coding genes)7-9
调节 基因 (regulatory genes)9-10
确定 RNA 的 基因 (RNA-specifying genes)9
基因 频率 (gene-frequencies) 见 等 位 基因 频率
St A Mf (gene tree)63
基因 替换 (gene substitution) 22-25, 31-32
的 固定 概率 (fixation probability of )22-23
的 固定 时 间 (fixation time of)23-25
新 达尔 文 主义 与 (neo-Darwinism and)26
中 性 学 说 与 (neutral theory and)26-27
的 速率 (rate of)24-25
基因 型 (genotypes) 适 合 度 17-18
基因 选择 (genic selection)18-19 另 见 共 显 性
固定 概率 (fixation probability)22-23
基因 转变 (gene conversion ) 127
协同 进化 与 (concerted evolution and)100-102
方向 (Cdirection)101
非 等 位 基因 的 Cnonallelic)101
基因 组 (genome(s))123-138 另 见 具 体 类 型 ,如 线粒体 基
因 组
C 值 Cc values)123 另 见 基因 组 大 小
真 核 生物 的 结构 (eukaryotic structure)126-129
细菌 中 的 GC 含量 与 (GC content in bacteria and)131-
SS
遗传 重 排 (genetic resetting)118-119
非 基 因 DNA 与 Cnongenic DNA and)131
细胞 器 (organelle)52-54
对 一 的 转 座 影响 (transposition effects on)115-116
#$ HE DP A AAA 4k (vertebrate organization) 132-138
基因 组 重复 (genome duplication) 83,129
基因 组 大 小 (genome size)88
DNA 重复 与 (CDNA duplication and)83
真 核 生物 的 (of eukaryotes)125-126
在 细菌 中 的 进化 evolution in bacteria)123-125
增加 机 制 (mechanisms for increasing)129-131
区 域 性 增加 (regional increase)130-131
基因 组 的 重 排 Cgenomic rearrangements) , 受 可 转 座 因子
促进 的 116
基因 组 加 倍 (Cgenome doubling) 见 基因 组 重复
基因 组 假说 (genome hypothesis)55-56
基因 座位 (loci)16
上 的 基因 多 样 性 (gene diversity at)24-25
多 态 的 (polymorphic)24-25 另 见 多 态 性
激素 基因 (hormone gene)43
吉姆 萨 分 带 (Giemsa banding)134
4 HE oh ® 2 4A (vertebrate genome),
组 成 上 的 组 织 化 132-138
RX 26 (echinoderms) ,c 值 125
剂量 重复 (dose repetitions) 87
加 工 后 基因 (processed genes),111-112
另 见 反 录 基因
加 工 后 假 基因 (processed pseudogenes)111,112-116
的 进化 Cevolution of)115-116
加 工 后 序列 (processed sequences)111
另 见 反 录 序列
甲 基 化 (methylation)55
甲壳 类 (crustaceans),c 值 125
FA iit 2 AR (methionine) 10
FA ig FA iit 2 AB (formylmethionine) 10,77
甲状 旁 腺 激素 基因 (parathyroid hormone gene)43,44
FAR AR ER EA BCthyroglobulin 8)50
{fi 3£ FA (pseudogenes ) 44-45, 50-51, 75-76, 87, 90, 92-93,
102-103,122,128
fy) FF WR AF HB AA SK (pattern of nucleotide substitutions)
53-55
tn JG & (processed )89,111-116,122
另 见 反 录 假 基 因
AY K FF OR FF PR GE HK Crates of nucleotide substitutions in)
44-46
通过 基因 转变 复活 (resurrection by gene conversion) 102
未 加 工 的 (unprocessed)89-91,122
间隔 序列 (intervening sequences) , 见 内 含 子
简 并 类 型 (degeneracy classes) , 核 苷 酸 位 点 34
减 数 分 裂 (meiosis)9-10,100-101,125-126,131
交换 (crossing-over), 不 等 价 , 见 不 等 价 交换
酵母 (yeast) 另 见 saccharomyces cerevisiae
同 义 密码 子 的 非 随机 应 用 Cnonrandom usage of synony-
mous codons)55-57
rRNA 基因 (rRNA gene)88
可 转 座 因子 (transposable elements)116
结构 基因 (structure genes)7 另 见 为 蛋白 质 编码 的 基因 ,
确定 RNA 的 基因
植物 线粒体 中 的 (in plant mitochondria)52
原核 生物 中 的 (in prokaryotes)8-9
在 细菌 中 的 转录 (transcription in Easyg 和
结构 组 件 (structural module(s)83 , 另 见 域
截 尾 (truncation), 加 工 后 假 基 因 112-113
金属 琉 基 组 氨 酸 三 甲 ( 基 ) 内 盐 工 基因 (metallothionein 1
gene)44
进化 的 维 苏 威 模式 (Vesuvian mode of evolution)114-116
进化 的 综合 学 说 (synthetic theory of evolution )26-27
支 序 图 (cladogram ) ,又 译 进化 树 68,72
进化 速率 (evolutionary rate) ,功能 限制 与 ,45-47
支 序 (clades)71-72
A. 53 (humans and apes)73
支 序 系统 学 (cladistics) ,与 表 型 学 对 应 68-69
近邻 结合 法 (neighbor-joining method), 用 于 系统 树 构 建
的 67
精 氨基) 琥珀 酸 合成 酶 基因 (argininosuccinate synthetase
gene)113
精 氨基) 琥珀 酸 裂解 酶 (argininosuccinate lyase)98-99
距离 法 (distance methods) 69
距离 指数 (distance index), 线 性 排列 中 的 36-37
决定 互补 性 的 区 域 (complementarity determining regions,
CDRs)45-46
决 ( 确 ) 定 性 模型 (deterministic models)16
绝对 适合 度 (Cabsolute fitness)17
蕨 类 (pteridophytes),C 值 125
K
开 读 框架 (open reading frames, ORFs) 52,107,109-110,
128
* 165°
可 ( 移 ) 动 因子 (mobile elements) JL hy JE AT
可 转录 因子 (transcribed genes), # AA tu B 129
可 转 座 因子 (transposable elements) 106-110, 119-120,123-
124,129-130
f€ X (defined) 105
供 体 部 位 (donor site) 106-107
拷贝 数 的 进化 动力 学 (evolutionary dynamics of 0
number)119-120
基因 表达 与 (gene expression and)115-116
插入 序列 (insertion sequences)106-107,123-124
P-M 劣势 与 (P-M dysgenesis and)117-118
J & AF retroelements) 107-110
#P 3B fiz (target site) 106
#& WE F-(transposons) 106-108 .
空缺 碱 基 Cnull base) ,线性 排列 中 的 34-36
框架 移动 突变 (frame:shift mutation)14,89-90
昆虫 (insects)c 值 125
L
蓝 色 素 基 因 (blue-pigment gene) 89
蓝 细 菌 (cyanobacteria)77-78,123,124-125
类 人 猿 科 (hominoidea) 系 统 发 育 72-76
相似 性 指数 (similarity index) 线 性 排比 中 的 36
#8 (Cyprinus car pio) ,C 值 134-135
All #8 7 (rifampicin )77
if $8 BH (ligase) 37
ke RF (streptomycin) 77
BA 1% 1K (diploid) 17,19
PA A 2E (amphibian) ,C {@ 124-125
¥ H# (dysgenesis) ,杂种 116-119
33 4% (gap(s))14,34-36
最 小 化 (minimization )35-36
末端 的 (terminal)35-36
裂缝 处 罚 (gap penalty)36-37
磷酸 丙 糖 异 构 酶 基因 (triosephosphate isomerase gene)113
磷酸 二 酯 键 (phosphodiester bonds)6-7
磷酸 甘油 酸 激 酶 多 (基因 ) 家 族 (phosphoglycerate kinase
(PGK) multifamily)111, 113
ig $4 A (lepidoptera) 81-82
RKA (primates) , KH BF RH 51-52
绿色 素 基因 (green-pigment gene)89
绿色 菠 类 (gree algae)77-78
毛 霉 素 (chloramphenicol)77
卵 类 粘 蛋 白 基 因 (ovomucoid gene) , 域 重 复 与 85-87
裸子 植物 (gymnosperms),C 值 125
M
Hi (cats), 来 自 独 独 的 病毒 基因 水 平 转移 120-122
猪 白 血 病 反 录 病毒 (feline leukemia retrovirus)109-110
¢ ge 。
Hi Bt (felidae) 120-122
帽子 部 位 (cap site)7-8,111
酶 (enzymes)
异型 酶 (allozymes)88
同 功 酶 (isozymes)88-89
限制 酶 restriction ) 见 限制 性 内 切 核 酸 酶
备 德 尔 式 分 离 (Mendelian segregation)19
备 德 尔 主 义 (Mendelism)26
喀 啶 (pyrimidines)6,11-12
密码 子 (codon)9-10
中 的 核 苷 酸 替 换 (nucleotide substitution in)11-13
同 义 的 (synonymous) 见 , 同 义 密码 子 类 型 10
应 用 模式 (usage pattern)55-59
密码 子 一 反 密 码 子 配对 (codon-anticodon pairing)56-57
密码 子 族 (codon family)10
免疫 球 蛋 白 基 因 (immunoglobulin genes)43
高 可 变 区 (hypervariable regions)45-46
内 部 域 重 复 (internal domain duplications)85-87
中 的 非 同 义 与 同 义 替 换 对 应
synonymous substitutions in )45-46
中 的 核 苷 酸 蔡 换 速率 (rates of nucleotide substitutions
in)43
灭绝 (Cextinction ) ,等 位 基因 20-21
膜 翅 目 (hymenoptera)129
木村 的 两 参数 模型 (Kimura's two-parameter model) 30-
32,33-34,41
(nonsynonymous versus
N
Pa dE Bt FP (quagga) 80
南 4 4 4 (south American marsupials), RAA| WAR
4 5 80-81
内 部 重复 (internal repeats)83,114
内 共生 学 说 (endosympbiotic theory)77-78
内 & Ff (intron (s)7-8,25,52,58-59,83,85-87 ,93-94,103
a14a97-98 .
4b ft 4 A (exon insertion into)
的 丧失 (loss of )84-85
的 数目 (number of )8-9
的 相位 (phases of )95-96
内 含 子 编码 的 蛋白 质 (intron-eacoded iti 变通 的 拼
接 与 97-98
内 切 核酸 酶 (endonucleases)97
内 源 性 反 录 病毒 序列 (endogehous retroviral sequences)
120-122
内 转录 间隔 (internal transcribed spacer)99
拟 反 录 病 毒 (pararetroviruses)108-110
“粘性 末端”(“sticky ends”)37
鸟 类 (bird),C 值 125
鸟 味 叭
外 显 子 混 匀
(Cguanine)6-7
尿 激 酶 Curokinase)93-94
尿 激 酶 原 (prourokinase)94
尿 激 酶 一 血 纤 蛋白 溶 酶 原 活化 因子 基因 (urokinase-plas-
minogen activator gene)43
BR BE ME Curacil)7
mie Py AE (rodents )
KE BE HK HF (nucleotide substitutionrates)50,51-52
反 录 假 基 因 (retropsendogenes) 113
凝血 酶 (thrombin)87
凝血 酶 原 (prothrombin)93-94
纽 结 杆 状 组 件 (Kringle module)93-94
P
N@ 4 2K (reptiles) ,72
C {fi (c values) 125
Ac F (gametes) ,随机 取样 20-21
配子 的 随机 取样 (random sampling of gametes)19-20
匹配 碱 基 (Cmatched bases) ,对 子 34-36
1 (purines) 6, 11-12
HH (splicing), 438 A) 97
拼接 功能 Csplicing function) 见 拼接 位 点
拼接 位 点 Csplicing sites)8,37,85,97-98
平衡 选择 (balancing selection)18-19,20-21,26
平行 相关 (paralogy)90-91
瓶颈 (battleneck)22 ,27
普 里 伯劳 块 (Pribnow box)8-9
普 适 遗传 密码 (universal genetic code)10,34-35
Q
期 望 杂 合 度 (expected heterozygosity)24-25
起 始 密码 子 (initiation codon)
迁移 (migration)16,20
前 病毒 (provirus)108-109
前 mRNA (pre-mRNA)7-8,111
前 生物 进化 (prebiotic evolution) 5
前 胰岛 素 原 I 基因 (preproinsulin I gene)103,111-112
前 胰岛 素 原 工 基 因 (preproinsulin I gene)103,111-112
Fe Bi RS BERK HE EH & BS A Chydroxanthine phos-
phoribosyltransferase gene) 43
强化 因子 (enchancers)115-116
强 键 (strong bond)6
切 离 修 复 (excisionrepair)14
@ # (hydrogen bonds) ,形成 互补 碱 基 配 对 6
区 域 性 重复 (regional duplication )83
区 域 性 重复 序列 (localized repeated sequences)125-128
趋同 进化 (convergent evolution)80
取样 (sampling) ,随机 19-20
醛 缩 酶 (aldolase) , 同 功 酶 88
醛 缩 酶 A 基因 (aldolase A gene)43-44,50
缺失 (deletions)11-14,34-35,52,114,116
确定 RNA 的 基因 (RNA-specifying genes)7,8-10,88,125-
126 另 见 结构 基因
群体 大 小 (population size)19-20
有 效 (Ceffective)20-22
[Al = #44 45 fixation probability and)22-23
随机 遗传 漂 变 与 (random genetic drift and)20-21
群体 分 化 (population splitting) ,基因 分 化 与 63
群体 遗传 学 (population genetics)5,16
等 位 基因 频率 变化 (allele frequency changes)16-17
有 效 群 体 大 小 (effective population size)20-22
基因 替换 (gene substitution) 22-25
自然 选择 Cnatural selection)17-19
新 达尔 文学 说 (Cneo-Darwinian theory)26-27
中 性 突变 假说 Cneutral mutation hypothesis) 26-27 _
4 4 tt (polymorphism) 24-26
随机 遗传 漂 变 (random genetic drift) 18-20
R
Ye f4 8 {AK (chromatid )110-101
Ye f4 {K (chromosome) 83
基因 转变 与 (gene conversion and) 100-102
机 制 不 相 容 性 (mechanical incompatibility)83
不 等 价 交 换 与 (unequal crossing-over and)69,71
染色 体重 复 (chromosomal duplication)83 ,129-130
部 分 的 (partial)83
热 冲 击 蛋白 质 (heat-shock proteins)98-99
人 -大 猩猩 -黑猩猩 三 分 又 (human-gorilla-chimpanzee)73-
76
人 的 基因 (human genes)
密码 子 应 用 模式 (codon-usage patterns)56-58
RK TF ORF HR EK (nucleotide substitution rates)51
反 录 假 基 因 (retropseudogenes) 113
人 科 (hominidae)72-73
人 类 的 系统 发 育 (human phylogeny)72-76
YS Fa BH (lysozyme) 87
中 的 正 选 择 (positive selection in)48
肉 足 类 (原生 动物 )(Csarcodina)C 值 125
¥L + (cows) ,中 的 溶菌 酶 48-49
乳 清 蛋白 (lactalbumin787
乳酸 脱氧 酶 (lactate dehydrogenase)103
同 功 酶 (isozymes)88-89
乳酸 脱 氢 酶 A 基因 (lactate dehydrogenase A gene)43-44,
50
乳酸 脱 氢 酶 B 基 因 98-99
软体 动物 (mollusks),C 值 125-126
弱 键 (weak bond)6
- 16s
萨 塔 斯 和 特 韦 尔 斯 基 法 (Sattath and Tversky’s method )
见 近邻 关系 法
三 色 性 (trichromotism)89-90
三 体 (trisomies)129-130
散在 重复 序列 (dispersed repeated sequence)127-129
色 敏 感 色素 蛋白 (color-sensitive pigment proteins)89
色素 蛋白 (pigment protein) ), 色 人 敏 威 的 89
¥% (sharks) ,C 值 125-126
上 游 方向 (Cupstream direction) ,DNA 序列 1
YE 4, Ys HE E (dusky seaside sparrow)80-81
生命 的 起 源 (origin of life)5
生长 激素 基因 (growth hormone gene)43-44,50
生长 激素 释放 抑制 因子 -28 基因 (somatostatin-28 gene)43
生长 因子 组 件 (growth-factor module)94
生殖 (reproduction), 有 差别 的 , 见 自然 选择
识别 顺序 (recognition sequences) 37 ,39
世代 时 间 效 应 (generation-time effect)51-52
适合 度 (fitness)17-19,127-128 另 见 自然 选择
绝对 (absolute)17
相对 (relative)17
嗜 热 细菌 (thermophilic bacteria)131,137
We BA AK Mu(bacteriophage Mu)105,107-108
WE PA AK Dx174 96
噬菌体 , 转 座 107-108
收缩 系统 蛋白 基因 (contractile system protein gene)43
受 体 部 位 (acceptor site)8, 116
双 翅 目 (diptera)81-82
W# DNA (double -stranded DNA)
反问 平行 结构 (antiparallel structure) 6-7
DNA-DNA 杂交 与 CDNA-DNA hybridization and)40
后 随 链 (lagging strand)55
前 导 链 (leading strand)55
热 稳 定性 (thermal stability)40
双子 叶 植 物 (dicotyledons)53
水 平 基 因 转 移 (horizontal gene transfer)119,119-122
水 平 进化 (horizontal evolution ) 另 见 协同 进化
顺 向 重复 (direct repeats)105
顺序 -线性 排比 距离 法 (sequence-alignment ) , ,顺序 线性 排
比 中 的 35-37
点 阵 法 (dot matrix method)35-36
顺序 -距离 法 (sequence-distance method) 顺序 线性 排比 中
的 35-37
“ 死 基 因 ”(“dead genes”) 见 假 基 因
四 重 简 并 核 苷 酸 位 点 (fourfold degenerate nucleotide sites)
34-35 ,44-45
点 条 件 four-point codition) 66-67
4- Bit. FR MB WE AK $F (4-thiouridine) 56-57
松 驰 肽 基因 (relaxin gene) 43
速率 恒定 假定 (rate-constancy assumption)48-49,91
° 168 »
随机 交配 (random mating) 17
随机 模型 (Sltochastic models) 16
中 性 学 说 与 Cneutral theory and)26
随机 遗传 漂 变 (random genetic drift)16-17,18-21,48-49
梭 状 芽孢 杆菌 (clostridia)132
T
糖 蛋白 激素 « WE (glycoprotein hormone a subunit)51
唐 氏 综合 性 (Down's syndrome) 129
特征 状态 法 (character-state methods)69
体 细 胞 突变 (somatic mutations)11
替换 (Csubstitution ) 见 基因 替换 , 核 苷 酸 蔡 换
条 件 固 定时 间 (conditional fixation time)23-24
调节 基因 (regulatory gene)7,9-10,125-126
铁 氧 还 蛋白 (ferredoxin) ,内 部 域 重 复 85-87
同 功 酶 (isozymes)88-89
同 义 密码 子 (Synonymous codons)10
非 随机 应 用 (Cnonrandom usage)55-59
同 义 替 换 (synonymous substitutions)11-13,55-59, 91, 97
另 见 核 苷 酸 蔡 换
与 非 同 义 替 换 对 应 (nonsynonymous substitutions
versus)45-46
速率 (rates)42-45,52-54
两 为 蛋白 质 编 码 序 列 间 的 (between two protein-coding
sequences ) 33-34
基因 间 的 变异 (variations among genes) 47
fr) SZ fiz A (synonymous sites)46-47 另 见 四 重 简 并 位 点
同 源 双 链 DNA Chomoduplex DNA)40
同 源 序列 (homologous sequences) ,分 岐 42
同 质 段 (isochores)47,134
中 的 基因 位 置 (gene location within)134,136
起 源 (origin)136-138
突变 (mutation(s)11-14,16,20-21 另 见 核 苷 酸 替 换
有 利 的 (advantageous) 见 有 利 突 变
定义 (defined)11
fit (deletions) 12-14
HE 48 & Bh (frameshift) 14
细菌 中 的 GC 含量 与 (GC content in bacteria and)132-
133
热点 (hotspot)14
插入 (insertions)12-14
中 性 的 Cneutral) 见 中 性 突变
点 (point)11,53-54
体 细胞 的 (somatic)11
空间 分 布 (Sspatial distribution )14
自发 的 (Spontaneous)53-55
同 义 的 (synonymous) , 见 同 义 密 码 子 ,
同 义 替 换
类 型 (types)11
突变 的 热点 (hotspots of mutation) 14
突变 率 (rate of mutation) 23-25,45,46-48
突变 论 者 的 假说 (mutationist hypothesis) 137-138
突变 模式 (mutation pattern)53-55
推论 的 系统 树 (inferred phylogenetic trees)62-63 另 见 系
统 树
脱氧 核糖 (deoxyribose) 6
脱氧 核糖 核酸 (deoxyribonucleic acid), 见 DNA
拓扑 图 (学 )(topology), 见 系统 树
WV
外 膜 蛋白 工 基因 (outer memberane protein I gene,omp
A)56
db Sit F (exon (s)8,25,83,93-94,97
AB Xt #K A (asymmetrical) 95,103
2 HW (classes) 95
dX 5 (domains and) 83-85
25 |B] 4} 7G (spatial distribution ) 8-9
Xt HF AY (symmetrical) 95,103
外 显 子 插入 (exon insertion) 92-93 ,95
外 显 子 重复 (exon duplication)84-86,92-94, 另 见 DNA 重
WER
外 显 子 混 匀 (exon shuffling) 83,92-96
8 tk HA J 45 (mosaic proteins and) 93-94
相位 限制 (phase limitations) 93-96
外 源 性 基因 (exogenous genes)106-107
外 转录 间隔 (external transcribed spacers)99
完全 变态 昆虫 (hemimetabola)81
为 蛋白 质 编码 的 基因 (protein-coding genes)7-9,102,123-
124 另 见 结构 基因
叶绿体 中 的 (in chloroplasts)52
真 细 菌 中 的 (in eubacteria)8-9
哺乳 动物 线粒体 中 的 (in mammalian mitochondria)52
FF RE HR (nucleotide substitution)11-14,32,34
植物 线粒体 中 的 (in plant mitochondria) 52
替换 速率 (substitution rates)42-45
在 真 核 生 物 中 的 转录 (transcription in eukaryotes)8
在 原核 生物 中 的 转录 (transcription in prokaryotes)8-9
卫星 DNA (satellite DNA)127,129-130,131
稳定 化 选择 (stabilizing selection)18-19
无 根系 统 树 Cunrooted phylogenetic trees)61-62,69
寻根 (rooting) ,70-71
Fe i f4 FE (agnathes) 91-92
C {BH (c values) 125
FE % #3 F (nonsense codon) ) 见 终止 密码 子
Zi & % 4 (nonsense mutations) 11-13
物种 分 岐 时 间 (species-divergence times)
估计 (estimation)70-71
X. 54g Chuman and ape)72-76
1) FH AY (species trees) 62-63
物种 形成 (speciation ) , #% AE 4118-119
TR SL 38 AE (missense mutations) 11-13
xX
KGAA (phylogeny)5,49,60-81
特征 状态 法 (character-state methods) 69
支 序 (clades)69-70
保护 生物 学 与 (conservation biology and)80-81
距离 法 (distance approaches)69
在 基因 重复 事件 的 年 代 测 定 中 (in gene-duplication
event dating)90-92
A. 538 Chumans and apes)72-76
分 子 数据 的 影响 (impact of molecular data) 60
线粒体 与 叶绿体 (mitochondria and chloroplast)77
分 子 古 生物 学 (molecular paleontology )77,80
物种 分 岐 时 间 估 计 (species-divergence time estimation)
71
¥% 4M (phylogenetic tree(s) )60-72
tn tE AY (additive) 61-62
两 分 叉 节 点 (bifurcating nodes) 61-62
分 枝 (branches)61
分 枝 模 式 (branching pattern)61, 另 见 拓扑 图
枝 长 (branch length)61,69-70
定义 (Cdefined)61
外 部 节点 (external nodes)61
基因 (gene)63
水 平 基因 转移 与 (horizontal gene transfer and)121
推论 的 (Cinferred)62-63 ,69
内 部 节点 (internal nodes)61
最 节省 (maximum parsimony)67
多 分 叉 节点 Cmnultifurcating nodes)62
节点 (Cnodes)61
fj YE (reconstruction methods)64-68 , 另 见 系统 树 构 建
用 于 相对 速率 测验 的 (for relative-rate test)49-50
有 根 的 (rooted)61-62
寻找 无 根 树 的 根 (rooting unrooted trees)70-71
有 尺度 的 分 枝 (scaled branches)61
物种 (Species)63
拓扑 图 (topology)61-66 另 见 系 统 树 构建
无 根 的 (unrooted)61-62,67-68,70,76-77
无 尺度 的 分 枝 (unscaled branches)61
细胞 角 和 蛋白 内 A 基因 (cytokeratin endo A gene)113
细胞 器 DNA (organelle DNA) ,中 的 替换 速率 ,52-54, 另 见
线粒体 . 叶绿体
细胞 色素 CCcytochrome C)48-49
细胞 色素 C 基因 (cytochrome C gene)48-49,113
细胞 型 (cytotype)117
细菌 (bacteria )
*" 169%
GC 含量 (GC content)131-134
中 的 基因 组 大 小 的 进化 (genome size evolution in)123-
124
细菌 转 座 子 (bacteria transposons)107-108,115-116
下 游 方向 (downstream direction) ,DNA 序列 6
纤毛 虫 (Cciliophora) ,C 值 125
纤毛 虫 类 (ciliates)77-78
纤维 糖 素 (fibronectin)93-94 胃
限制 片段 模式 (restriction-fragment patterns) 37, 38-40,
79-81
限制 图 谱 (restriction map)37-39,38-40,41
限制 位 点 (restriction sites)37,99-101
限制 性 内 切 核酸 酶 (restriction endonucleases)37-40
Bam 1 38-39
Bbv 1 37-39
Bgl 1101
EcoR | 37,39,100
Hae 1 37-39
Hind 1 37,100
Hind I 38-39
Hinf | 37-39
H pa 1 99-100
Nei | 37-39
Not 1 37-39
Pvu 1101
识别 顺序 (recognition sequences) 37-39
拼接 位 点 (Csplicing site)37
粘性 未 端 Csticky ends)37
线粒体 DNA (mitochondrial DNA)79-81
线粒体 基因 组 (mitochondrial genomes) 10, 95-96
的 内 共生 起 源 (endosymbiotic origin of )77
哺乳 动物 的 (mammalian)52-53
植物 (plant)52-53
线粒体 遗传 密码 (mitochondria genetic code) ,哺乳 动物 的
10-11
线性 排比 (Calignment)34-37
点 阵 法 (dot matrix method)35-36
顺序 -距离 法 (sequence-distance method)35-37
Wie GR (adenine) 6-7
相对 适合 度 (relative fitness) 17
相对 速率 测验 (relative-rate test) 49-50
人 对 猴 的 (for humans versus monkeys) 50-51
小 鼠 对 大 鼠 的 (for mice versus rates)50
ii Py FE XT 52 4 AE AY Cfor rodents versus primates)51-52
aE tte FE Sit (mosaic proteins) 93-94
/\\ BE A (parvalbumin) ) ,内 部 域 重 复 86-87
小 分 子 细 胞 核 RNA(small nuclear RNA), AL snRNA 基因
小 分 子 细胞 质 RNA (small cytoplasmic RNA) , 见 sRNA
基因
° 170°
/\y BA (mice ) , 核 苷 酸 蔡 换 速 率 50
协同 进化 (concerted evolution)92-93 ,98-103
进化 论 含意 (evolutionary implications)101-103
机 制 (mechanisms)100-102
心房 钠 泵 因子 (atrial natriuretic factor)50
新 达尔 文学 说 (neo-Darwinian theory)26-27
信使 RNA (messenger RNA) , 见 mRNA
信息 位 点 (informative sites)67-68,75-76,81
猩猩 科 (pongidae)73
猩猩 亚 科 (ponginae)73
性 别 决 定 (sex determination) ) ,变通 的 拼接 与 ,97-98
性 致死 基因 (sexlethal(szz)gene)97-98
胸腺 喀 啶 (thymine)6-7
选择 (selection), 见 自然 选择
选择 论 者 的 假说 (selectionist hypothesis)136-137
选择 强度 (selection intensity) , 核 苷 酸 蔡 换 速率 与 ,47
选择 优势 (selective advantage) 见 有 利 突 变
定 概率 与 (fixation probability and)22-24
定时 间 与 (fixation time and)23-24
选择 中 性 (selective neutrality)55 另 见 中 性 突变
下 的 核 苷 酸 替 换 模式 (pattern of nucleotide substitution
under)53-54
i #F = MX (selectionism) 26
与 中 性 主义 对 应 (neutralism versus) 27
血红 和 蛋白 (hemoglobin)48-49
恒 春 (Constant Spring)85 |
Tearia85
血红 蛋白 基因 (hemoglobin genes)92, 另 见 珠 蛋 白 基因
中 的 核 苷 酸 蔡 换 速 率 (rate of nucleotide substitutions
in)43
血清 白 蛋白 (serum albumin) 43, 85-86
内 部 域 重 复 (internal domain duplication)85-86
i A & A Cfibrin) 93
血 纤 蛋白 溶解 作用 (fibrinolysis)92
i 4 & A YH Bi JR (plasminogen) 93-94
内 部 域 重复 (internal domain duplication) 85-86
血 纤 蛋白 原 (fibrinogen794
r 基 因 (r gene)43
血液 凝固 (blood coagulation)93-95
Y
鸦片 黑 素 皮质 激素 原 基 因 (proopiomelanocortin gene) 50,
113
WW 2& FA 4 HH AY DNA (subgenomic circular DNA)52
W. ## (subspecies ) 80
KEE BE HZ AR OE WS — 4% $F MB (nicotinamide adenine dinucleotide
(NAD* )89
AR 4 38 Ceuglenozoa), C {#125
(AR) da 4 3 & (crystallins) ,基因 分 享 97-99
摇摆 Cwobbling)56-57
野生 型 等 位 基因 (wild-type allele),
突变 型 等 位 基因 替代 22-25
叶 猴 (Clangurs) ,的 溶菌 酶 48-49
叶绿体 基因 组 (chloroplast genomes)10
的 内 共生 起 源 Cendosymbiotic origin of)77-78
替换 速率 (substitution rates)52-54
4K i DNA 的 RNA & 3 fi (DNA-dependent RNA poly-
merase), KL RNA 4 RB
依赖 S- 腺 苷 甲 硫 氢 酸 的 甲 基 化 酶 (s-adenosylmethiomine-
dependent methylase)107
依赖 Vk 的 钙 结合 组 件 (CvitaminK-dependent calcium-bind-
ing module)93-94
胰 蛋 白 酶 (trypsin)85,87,93-94
胰岛 素 基 因 (insulin gene) ,中 的 核 苷 酸 蔡 换 速 率 43-44
A 和 B 链 (A and B chains)46-47
C- 肽 基因 (C-peptide gene)46-47
胰岛 素 样 生 长 因子 工 基因 (insulin-like growth factor I
gene)43,50
胰岛 素 原 基因 (proinsulin gene), 替换 的 速率 46-47
遗传 重 排 (genetic resetting)119
遗传 多 态 性 (genetic polymorphism) I & A HE
遗传 密码 (genetic code)9-11
的 简 并 (degeneracy of)10,55
哺乳 动物 线粒体 的 (mammalian mitochondrial) 10-11,
34-35
普 适 的 (universal)10,34-35
乙肝 病毒 (hepatitis B virus)109-110
乙酰 胆 碱 受 体 r 亚 基 基因 (acetylcholine receptor r subunit
gene)43
蜡染 色 质 (heterochromatin)129-130
异型 酶 Callozymes)88 ,89
异 源 双 链 DNA(heteroduplex DNAJ)40
易 位 (translocation)116
Fl --IX 基因 (factor-IX gene)93-94
外 显 子 定位 (exon localization ) 8-9
应 答 者 基 JE 位 (Responder locus), HA CD.
melanogaster) 127-128
用 于 系统 树 构 建 的 近邻 关系 法 Cneighbor relation methods
for tree reconstruction ) 66-67 ,68,81
A. 45 3g 5 (for humans and apes)75
有 差别 的 生殖 (differential reproduction) ), 见 自然 选择
#4828 (marsupials), 4>- 4 +A W480
有 根 的 系统 树 (rooted phylogenetic tree )61-62
有 功能 基因 (functional gene) ,与 加 工 后 假 基 因 对 应 112-
ES
AI & ®R 7K (deleterious mutation )
定 概 率 (fixation probability ) 23
固定 时 间 (fixation time) 17,23-24,45-46,87
Aj Fil 3 4E (advantageous mutation (s) 16-18, 26-27, 45-46,
48-49 另 见 正 选 择
的 固定 概率 (fixation probability of)22-23
的 固定 时 间 (fixation time of)23-24
基因 替换 的 速率 (rate of gene substitution )24
有 利 选 择 (advantageous selection)17,45-46 另 见 正 选 择
有 丝 分 裂 (mitosis)9-10,100-101,125-126,131
有 效 群体 大 小 (effective population size)20-23 ,27
长 期 (long-term)22
有 意义 密码 子 (sense codons)10,85
中 的 核 苷 酸 蔡 换 (Cnucleotide substitution in)11-13
诱 变 剂 (mutagens)52-53,131
鱼 类 (fishes) ,C 值 125
Sa (domain(s)
xe XL (defined )83
Sb fit F 45 (exons and)83-85 另 见 外 显 子 中 的 条 目
功能 的 (functional)46,83
结构 的 (structural)46,83, 另 见 组 件
域 重 复 (domain duplication )84-87
卵 类 粘 蛋 白 基 因 与 (ovomucoid gene and)85-87
的 普遍 性 (prevalence of )85-87
原核 生物 (prokaryotes)
内 共生 学 说 与 (endosymbiotic theory and)77-78
中 的 结构 基因 (structural genes in)8-9
原 肌 球 蛋白 (tropomyosin) , 非 肌 的 113
原 肌 球 蛋白 a 链 (tropomyosin a chain)
内 部 域 重 复 85-87
原生 生物 (protists)77-78
猿 类 (apes), 的 系统 发 育 72-76
阅读 框架 (reading frame)9-10
Z
42 & fF (heterozygotes)
tt ff + 5 (codominance and) 18-19
超 显 性 与 Coverdominance and)18-19
配子 的 随机 取样 与 (random sampling of gametes and)19
杂种 DNA (hybrid DNAJ) 见 异 源 双 链 DNA
杂种 劣势 (hybrid dysgenesis)116-118
物种 形成 与 (speciation and)118-119
载 脂 蛋 白 基 因 (apolipoprotein genes)43-44,46-47
载 脂 蛋白 A- I 43,50-51
载 脂 蛋白 A- N 43-44
# 9G EG E 43-44,50
MK (algae) .C 14.125
沼泽 地 人 (bog people) 80
真 骨 鱼 (bony fishes) ,C 值 125
真 核 生 物 (eukaryotes)
内 共生 学 说 与 (endosymbiotic theory and)77-78
基因 结构 (gene structure)6 ,84-85
° 171°
基因 组 重复 (genome duplication )129
基因 组 大 小 (genome size)124-127
为 蛋白 质 编 码 基 因 的 结构 (protein-coding gene struc-
ture)7-9
重复 基因 组 结构 (repetitive genome structure)125-129
真菌 (fungi)77-78
真实 系统 树 (true phylogenetic trees)62-63, 另 见 系 统 树 构
建
真 细 菌 (eubacteria)77-78
C 值 (C values)123-124
中 的 GC 含量 (GC content in)131-133
中 的 为 蛋白 质 编码 基因 (protein-coding gene in)8-9
正 选 择 (positive selection)17,45-46, 另 见 有 利 突变
乳牛 和 叶 猴 的 溶菌 酶 中 的 (in lysozymes of cow and jan-
gurs)48-49
支原体 (mycoplasmas)123-124,132
rRNA 基因 (rRNA.genes)88
枝 长 估计 (branch length estimations)69-70
直 翅 目 (orthoptera)81-82
指 状 组 件 (finger module)93-94
植物 基因 组 (plant genomes) ,替换 速率 52-54
植物 线粒体 基因 组 (plant mitochondrial genome)52-54,77
替换 速率 (substitution rates)52-53
质粒 (plasmids)107-108
A) DNA 起 源 (DNAoriginating 记 )123-124
质 体 (plastids), 见 叶绿体
中 度 重 复 DNA (middle-repetitive DNA)125-127
中 性 突变 Cneutral mutation)17,45-46, 另 见 选 择 中 性
的 固定 概率 (fixation probability of)22-23
的 固定 时 间 (fixation time of)23-24
基因 替换 的 速率 (rate of gene substitution)24-25 ,45-46
终止 密码 子 (stop codons, termination codons)8,9-11,85,
89-90 ,97-98
框架 移动 突变 与 (frameshift mutation and)14
肿瘤 抗原 P53 基 因 (tumor antigen P53 gene)113
种 系 细胞 (germ-line cells), 中 的 突变 , 见 突变
朱 克 斯 和 坎 托 的 一 参数 模型 (Jukes and Cantor's one-pa-
rameter model) 28-31 ,32-34,41
朱 克 斯 和 坎 托 公 式 (Jukes and Cantor's formula) 34 —
珠 蛋 白 基 因 (globin gene) 另 见 某 些 具体 类 型 , 如 肌 红 和 蛋
白
染色 体位 置 (chromosomal location)92
进化 史 (evolutionary history)92-93
家 族 (families)88 ,92-93
GC 含量 (GC content)134-137
进化 中 的 内 含 子 丧失 (intron loss during evolution )84-
85
超 家 族 (superfamily)88 , 92-93
1
珠 蛋 白 假 基因 (globin pseudogenes) ,缺陷 89-91
主 组 织 相 容 复合 体 基 因 (major histocompatibility complex
genes)102-103
中 的 非 同 义 对 同 义 蔡 换 (nonsynonymous versus api
mous substitution in)45-46
转化 基因 (transformer (tra) gene)97-98
转换 (transition)11-12,30-32,34-35
转录 (transcription)7-8,77,111,129
转录 起 始 部 位 (transcription initiation site)7-8,102
转录 终止 部 位 (transcription termination site)7-8
转移 RNA (transfer RNA) 见 tRNA
转 座 (transposition)101-102,105-122,129-130
保守 (型 ) (conservative)105-107
定义 (defined)105
重复 型 ty 105-107
对 宿主 基因 组 的 效应 (effects on host genome)115-116
水 平 基 因 转 移 (horizontal gene transfer)119-122
杂种 劣势 与 (hybrid dysgenesis and)117-118
复制 型 (replicative)105-107,128
反 录 序列 与 (retrosequences and)110-116
物种 形成 与 (speciation and)118-119
可 转 座 因子 拷贝 数 与 (transposable-element copy num-
ber and)119-120
可 转 座 因子 与 (transposable elements and) 106-110
类 型 (types)105
转 座 酶 (transposase)106-107
PE WE IME BA (AK (transposing bacteriophages)107-108
& i F (transposons) 106-108
58 & (complex) 107
& i& (composite ) 107
对 宿主 基因 组 的 效应 (effects on host genome) 115-116
TOY
Tn9 107
Tnl10 105,116
Tn21 107-108
Tn554 107-108
Tn107-108
“tee me Ff 4” (“transposon yeast”), Ty 因子 着 丝 粒
紫 ( 色 ) 细 菌 (purple bacteria) ,a 分 枝 77-78
自发 突变 (Spontaneous mutation ) ,模式 53-55
自然 选择 Cnatural selection)16-19,131
有 利 的 (advantageous) 17
共 显 性 的 (codominant)18-19
定义 (defined)17
固定 概率 与 (fixation probability and)22-23
固定 时 间 与 (fixation time and)23-24
负 的 (negative) 17
新 达尔 文 主义 (neo-Darwinism and) 26-27
超 显 性 的 (overdominant)17,18-19
as 一-
正 的 (positive)17, 在 寻找 无 根 树 的 根 中 的 (in rooting unrooted trees)70-
纯洁 化 (purifying)17 71,74-75
自身 折 回 DNA ColdbackDNA ) 125-127 变形 距离 法 中 的 (in transformed distance method) 66
“8 #, DNA” (“selfish DNA”)115-116,131 组 织 血 红 和 蛋白 溶 酶 原 激 活 剂 (tissue plasminogen activa-
BA 3 4 (repressor )8 tor, TPA)93-94
组 成 同化 (compositional assimilation) , {fi 3 A 45 115-116 最 大 简约 法 (maximum parsimony methods), 64, 67-69,
组 蛋白 基因 (histone genes)8-9,87 79,82
中 的 核 苷 酸 蔡 换 速 率 (rate of nucleotide substitutions) 用 于 人 与 猿 的 (for humans and apes)75-76
42-44,46-47 FA + A 4824 & Cor marsupials) 80
48 44 (module(s) 83,75 It Sh
组 外 单位 Coutgroup), 另 见 系 统 树
“和 光环
缩写 词 和 种 名 索引
AATAA 块 (AATAA box),, 见 多 聚 腺 苷 酸化 信号
Acheta comzesticxs( 蝗 虫 )82
Achole plasma laidlawii (Fé fib {§ JRE) 132
Ach yrthosi phon magnoliae 4F #8 )82
ACTH 基因 (ACTH gene) 44
Actinobacteria iit & FA) »132
Adh, 3 8? Whi A i
Aedes (fF 8% J& 137-138
Aegilops bicornis (VA ffi Li = FE ) 38-39
Aegilops sharonensis (Vb & 1 FE ) 38-39
AIDS (XG FH )58,108
Allium cepa( 洋 葱 ),C 18126
Alu F¥ i) CAlu sequences), 低 密度 脂 蛋 白 受 体 基 因 中 的 (in
low-density-lipoprotein receptor gene)116
Ammodramus maritimus (¥¢ WE € ) 80-81
Amoeba dubia( Ket & I 8), C 18125
Amoeba proteus(K 4 #), C 18125
Am phiuma means ($48), C 18125
Anthrobacter luteus 132 :
Artemia salina(— # A #5 Bh 81-82
BIR (B1 family)114, 5 W Alu 序列
Bacillus brevis i ¥F Bi) 132
B-# £4 {& (B-chromosomes) 129
Bacillus subtilis i Ft FF 132
Boa constrictor (#€) »C {4125
Bombyx mori( RR # ) 82,128
Bowman-Birk 型 蛋白 酶 抑制 因子 (Bowman-Birk type pro-
tease inhibitor) ,内 部 域 重 复 86-87
CAAT (CAAT box)7-8
Carcarias obscurus &_) ,C {#125
cDNA (4. #} DNA)60,105,107-109,111
CDRs( 决 定 互补 性 的 区 域 )45-46
Clostridium innocuum AK F 44 FF RZ —)132
Clostridium pasteurianum (EF # 7a RA), A af dt me
85-87
Clostridium per fringens J" &\ 3 AB ) 132
Coscinodiscus asterom phalus ( 5 Ht (Al Si BE . HEME) «C 18125
cox | 3£ A (cox I gene) 97-98
Cu/Zn 超 氧 化 物 岐 化 酶 基因 (Cu/Zn superoxide dismutase
gene)112-113
C 型 病毒 基因 (type-C virogene) ,水 平 转移 120-122
C 值 (CC value(s)123, 另 见 基 因 组 大 小 细菌 (bacteria)123
° 174°
HOKE W (eukaryotes) 124-127
C {A t¥ i (C-value paradox )124-127,131
Cyprinus car pio (##) 134-135
C {8 (C values)125
Dasyurus maculatus (FE FE 4S Wh) 80
Dictyostelium discoideum (网 柱 菌 属 之 一 )137-138
反 录 转 座 子 (retrotransposons)108-110
Dipodomys ordii il fi —#P)125-127
DNA 另 见 核 苷 酸 中 的 条 目
互补 Ccomplementary), 见 cDNA
双 链 的 (double-stranded)6-7,40
自身 折 回 (foldback)125-127
高 度 重 复 (highly repetitive)125-127
废物 (junk)131
中 度 重 复 (middle-repetitive)125-127,129-130
线粒体 (mitochondrial)79-81
非 基因 (Cnongenic)126-127,131
核 类 型 的 (nucleotypic)131
细胞 器 (organelle)52-54
在 质粒 中 的 起 源 (originating in plasmids)123-124
重复 (repetitive)126-129
Ti # (satellite)127,129-130,131
“8 #.” (“selfish”) 115-116,131
*% #% Ml (single-copy) 126-129
FA — (unique) 126-129
DNA -DNA 4¢2€ (DNA-DNA hybridization) 37 , 39-40
KX. 5548 Al (humans and apes and)40,76
DNA & (DNA duplication) 114,116,127-128, 5 Wb &
子
DNA & & fi (DNA polymerase)14,131
DNA #° 4% (DNA amplification) 79,130-131
DNA 复制 (CDNA replication) 9-10,129
DNA 修复 (CDNA repair)51-53,106-107,111
DNA 序列 (CDNA sequence) 6
KK FF RF M (nucleotide substitution ) 28-35
PCR 扩 增 (PCR amplification )77-80
4 AS HE RE (polymorphism measurement) 25-26
限制 位 点 (restriction site) 37-39
DNA 顺序 资料 CDNA sequence data) ,对 分 子 系统 发 育 的
影响 60
DNA 中 介 的 转 座 CDNA-mediated transposition) ) , 见 转 座
Drosophila( R: #8) 129-130,137-138,15,101,113-114,128
尸 因 子 在 物种 间 的 水 平 转移 (horizontal transfer of P el-
ements between Species)121-122
杂种 劣势 (hybrid dysgenesis) 116-118
反 录 转 座 子 (retrotransposons)109-110
Drosophila mauritania( F # — FH) 121-122
Drosophila melanogaster (FR HB) 82, 106-107, 116-119, 121-
122
醇 脱 氢 酶 核 苷 酸 多 样 度 (Calcohol dehydrogenase nu-
cleotide diversity)25-26
变通 的 拼接 与 (alternative splicing and)97-98
C 值 Cc value)125
同 义 密码 子 的 非 随 机 应 用 Cnonrandom usage of synony-
mous codons)56-57
rRNA 基因 (rRNA genes)88
Rsp 基因 座位 (Rsp locus)127-128
可 转 座 因子 (transposable elements)105,107-108,119-
120
tRNA 基因 (tRNA genes)88
Drosophila nasutoides ( 5 #8 JR — FP), i RE HS DNA127-
128
Drosophila saltans (5% #8 JR — FP) 121-122
Drosophila sechellia (FR #8 J — FF) 121-122
Drosophila simulans (5% #8 J — FP) 118-119,121-122
Drosophila willistoni (5 #8 J — FP) 121-122
Drosophila yakuba (FR #) 121-122
Echymipera 80
EGF (epidermal growth factor ,表皮 生长 因子 )93-94
Erysiphe cichoracearum(— ## A) .C 18125
Escherichia coli (XK Mi ¥¥ )37-39,59,76-77,123-124,132-
133
插 人 序列 (insertion sequences) 106-107
同 义 密码 子 的 非 随 机 应 用 Cnonrandom usage of synony-
mous codons)55-57
rRNA 基因 (rRNA genes)88
可 转 座 因子 (transposable elements)105-107,116
Euplotes aedzczlatxs( 小 腔 游 仆 虫 属 )137-138
GT-AG 规则 (GT-AG rule)8,90
GC 含量 (GC content)57-58
细菌 中 的 (in bacteria)131-134
同 质 段 与 (isochores and)134-137
GC 块 (GC box)7-8
GC 突变 的 压力 (GC mutational pressure)132-133
Gallus domzestiziczs( 鸡 ),C 值 125
Gal ycine maz( 大 豆 )84-85
Gorilla gortla( 大 猩猩 )72-76
Haemophilus aegyptixs( 哮 血 杆 菌 属 之 一 )37-39
Haemophilus zxuenzae( 流 感 嗜 血 杆 菌 )37-39
Lactobacillus viridescens (F1, 1 FF A JZ — ) 132
Lac Z 4 (A (Lac Z gene) 105-106
Lam preta planeri(-E {§ #8), C {#125
LDH, 见 乳酸 脱氧 酶
Lilium formosanum (台湾 百合 ),C 值 125
LINEs (long interspersed elements 的 首 字 母 缩 略 , 长 散在
因子 )128-129
Micrococcus Lutexs( 小 球菌 属 之 一 )132-133
mRNA
变通 的 拼接 与 (alternative splicing and)97
编码 区 (coding regions)7-8
M ycobacterium tuberculosis (4 %K FF fA ) 132-133
M ycoplasma(#X J J 132
M ycoplasma ca pricolum (fX Jip VE JR Z— 132-133
M yxococcus xanthus fi ER A RZ) » IR EF 110
Na, K-ATP fi B 3£ fA (Na, K-ATPase B gene) 44
Navicula pelliculosa( ft Fe & J&Z — Ct $C 18125
Neisseria cinerea ( Ae 3 KK FA RZ — 37-39
Nicotiana tabacum (Kl # )
叶绿体 基因 组 (chloroplast genome) 52
C 值 (C values)125-126
Nocardia otitidis-caviarum i F K AJR Z — ) 37-39
Ophioglossum petiolatum(— # RE) »C {4125
ORFs, WH i€ te
OTUs, 见 操 作 中 的 分 类 单位
Oxytricha xzov&( 尖 毛虫 属 之 一 )137-138
Pan paniscus 3& 38 FH 40
Pan troglod ytes (3 92 )72-76
Papio anubis U5 Bi Bb) 57-58
Papio cynoce phalus Pe Bi Z — FP) 121-122
Papio hamadr yas GR & Be Be) 121-122
Papio papio Hp # ) 121-122
Paramecium aurelia( 3K & i Bh) .C (4124-126
Paramecium caudatum (Fe & J 4), C {4124-126
Parascaris equorum (4 #3|) »C {2125-126
PCR , 见 多 聚 酶 链 式 反应
PGK 多 家 族 ( 磷 酸 甘 油 酸 激酶 多 家 族 )111,112
Phalanger 80
Phaseolus vulgaris (3% FZ )84-85
Philander opossum andersoni RK #k fi FR.) 80
Philosamia cynthia ricini(— #P #R) 82
Physarum polycephalum (9X 38 FA J&Z —)137-138
Pinus resinosa(¥ ) ,C {8125
P-M 系统 (P-M system), 116-118
Pongo pygmaeus ( 4 BE)
Proteus vulgaris ¥% ii 48 ¥F A) 132-133
Protopterus aethiopicus (iii £4) »C 18125
Pseudomonas fluorescens Fe He {BF fd FA) 125
P AF (P elements) 105-106, 107-108,116-119, 5 WL a #%
座 因子
果 蝇 种 间 的 水 平 转移 (horizontal transfer between
“ee
Drosophila specles)121-122
RNA
信使 (messenger) , 见 mRNA
转录 后 的 修饰 (modification following transcription ) 9-
10,111
前 信使 (pre-messenger) , 见 前 -mRNA
核糖 体 的 (ribosomal) , 见 rRNA
小 核 的 (small nuclear) , 见 snRNA
转录 的 (transcribed ) ,7-8
转移 (transfer), WL tRNA
RNA & & fi (RNA polymerase) ,7-8
RNA & & Bf 1 ,7
协同 进化 与 (concerted evolution and)102
RNA 序列 CRNA sequences)6-7
RNA & & fi I 7-8
RNA #74) & 4 B (RNA-mediated transposition), 5
转 座
RNA 转录 本 (RNA transcript)
变通 的 拼接 (alternative splicing)97
反 录 序列 与 Cretrosequences and)109-110
RNA-DNA 杂交 (RNA-DNA hybridization)
rRNA 基因 (rRNA genes)81-82,87-88,101-102,123,130
叶绿体 中 的 (in chloroplasts)52
协同 进化 与 (concerted evolution and)98-99
内 共生 学 说 与 (endosymbiotic theory and)77-78
外 部 可 转录 间隔 (external transcribed spacer)99-100
内 部 可 转录 间隔 (internal transcribed spacer)99-100
哺乳 动物 线粒体 中 的 (in mammalian mitochondria)52
不 转录 间隔 (Cnontranscribed spacer)99-100
植物 线粒体 中 的 (in plant mitochondria)52
转录 (transcription)7,99
不 等 价 交 换 (Cunequal crossing-over)100-101
Rs 基因 座位 CRsza locus), 见 应 答 者 基因 座位
Rattus norvegicus (#4 HR FR) .C 值 125
Saccharomyces cerevisiae (BB 15 W & 124-125
同 义 密 码 子 的 非 随 机 应 用 Cnonrandom usage of synony-
mous codons)55-57
rRNA 基因 (rRNA genes)88
可 转 座 因子 (transposable elements)116
Salmonella typhimurium ( fi (5 % VW 1) FR A) 119-120
Sarcophilus harrisii (48 3€ )80
Schistocerca gregaria( 44% #1) ,.C (#125
scRNA 基因 (scRNA genes) ,转录 7
Shigella dysenteria( Hil Fe EH EK BA ) » 8 A FR 106-107
SINEs (short interspersed elements 的 首 字 母 缩 略 , 短 散 在
因子 )128-129
snRNA 基因 (snRNA gene) ,转录 7-8
Staphylococcus atrexs( 金 黄色 酿 浓 葡萄 球菌 )107,132
Streptococcus faecals( 粪 链球 菌 )132
° 176°
Streptomyces griseus $# 3% A J&Z — )132
Strong ylocentrotus (ER ¥8 AA J&R ) 137-138
TACTAAC & (TACTAAC box) 9-10
TATA (TATA box)7-8,90
Tetrahymena (VU fi 8 J) 10
Theropithecus gelada( it Fe 9 — FP) 121-122
Thy-1tit AC(Thy-1 antigen) 50
Thylacinus cynoce phalus (48 Ft ) 80
Trichosurus (a FE 4 58 JB) 80
tRNA 9-10
丰 度 与 同 义 密码 子 的 非 随 机 应 用 (Cabundance and non-
random usage of synonymous codons)55-57
来 自 一 的 加 工 后 假 基因 (processed pseudogenes derived
from)112-113
tRNA 基因 (tRNA genes) ,9-10,87-88,95-96,123-124
叶绿体 中 的 (in chloroplasts)52
哺乳 动物 线粒体 中 的 (in mammalian mitochondria)52
植物 线粒体 中 的 (in plant mitochondria)52
转录 (transcription )7
Trypanosoma brucei (Ap FR #é PE 128
Ty AF (Ty elements)116
U6 A (U6 gene) ,转录 7-8
Vicia faba( # @)84-85
Xenopus (J 8 114
协同 进化 (concerted evolution) 98-99
Xenopus borealis M ¥8 Z — ) 98-99
Xenopus laevis NW Z — )98-99, 134-135
C {fi (c values) 125
rRNA 基因 (rRNA genes) 88
Xenopus mulleri MM 8 Z— )98-99
Zea mays( XK )77-78
a-ff 4 A 4E A (a-fetoprotein gene) 48a 微 管 蛋白 (Ca
tubulin) 44
a- fii BF Bit (a-enolase) MVE -磷酸 丙酮 酸 水 合 酶 ,98-99
ao- 珠 蛋 白 基 因 (a-globin gene)84-85,88,91,103,113,134-
137
al 92-93
a2 92-93
密码 子 应 用 模式 (codon-usage patterns) 57-59
家 族 (family ) 92-93
中 的 核 苷 酸 蔡 换 速率 (rates of nucleotide substitution
in)43,44,49
al- 抗 胰 和 蛋白 酶 (al-antitrypsin)50-51
BY — de FP Pe HK i. CHE ) (8* 一 thalassemia)97-98
B- kt fF 3 A EA (B-tubulin gene) 113
B- 珠 蛋白 基因 (B-globin gene) 84-85, 88, 91-93, 102-103,
134,136-137
密码 子 应 用 模式 (codon-usage patterns)57-59
家 族 (family)92-93
中 的 核 苷 酸 蔡 换 速率 (rates of nucleotide substitution 5- 珠 蛋白 基因 (5-globin gene)92-93
in)43,44-45,47,49,50-51 b1- 珠 蛋白 基因 (61-globin gene)58-59, 92-93
7- 珠 蛋白 基因 (7-globin gene)44-45,92-93,100
6- 珠 蛋 白 基 因 (6-globin gene)50-51,92-93,102-103
《陈建华 译 , 张 亚 平 、 吴 春花 和 李 海 觅 校 )
人
Molecular Variation and Ecological Problems
AFRADTESS las
JR (E:T. Burke, W. Reiney 和 T. J. White
. 技术 与 术语 pp (182)
.4DNA 指纹 分 析 po (189)
7 系统 学 ee (188)
OCS NS JE SS OES
分 子 变 异 与 生态 学 问题
1 4 a
分 子 遗传 学 的 新 进展 为 生态 学 提供 了 许多 新 的 并 且 具 有 很 高 价值 的 技术 。 就 象 这 些 技 术 似 乎 是
解决 生态 遗传 学 和 进化 生态 学 问题 的 基础 一 样 , 它 们 也 开始 为 其 他 生态 学 领域 提供 了 有 用 的 研究 工
具 。 现 在 有 一 种 倾向 , 批评 许多 生态 学 家 喜好 和 应 用 这 些 新 技术 是 一 种 潮流 ,或 可 能 是 生态 学 中 的 最
it “AY fe” (Abrahamson 等 1989) ,但 我 们 认为 这 是 生态 学 家 们 的 积极 响应 ,因为 这 种 新 的 可 能 性 实际
上 会 引发 一 次 关键 性 的 技术 飞 跃 。
这 些 技术 直接 的 重要 作用 是 有 效 地 检测 生物 个 体 间 的 差别 DNA. 组 成 所 有 DNA 分 子 的 四 种 核
苷 酸 的 显然 很 简单 的 线性 排列 与 表现 在 以 下 几 个 方面 巨大 而 复杂 的 异 质 性 是 很 不 相符 合 的 ,这 些 方
面包 括 进化 速率 、 差 异 很 大 的 序列 结构 、 突 变速 率 ` 固 定 速率 以 及 选择 压力 等 (图 1).。 许 多 生物 体 的 一
快 慢
蛋白 质 编码 DNA
es 第 三 位 置 Be AM 第 二 位 置 ” 蛋白 质 次 级
BER 核 昔 酸 序列 wr /四 级 结构
不 转录 区 内 转录 区 KE 卜 亚 基 pe
] JW
四 级 结构
其 他 不 编码 DNA
小 卫星 微 卫 星 卫星 序列
图 1 DNA 序列 进化 的 相对 速率
些 基 因 组 具有 不 同 的 遗传 方式 和 序列 进化 率 ( 见 图 2) ,对 于 它们 的 比较 可 以 得 到 有 价值 的 认识 。 另 .
外 ,可 用 的 各 种 分 子 技 术 本 身 提 供 了 不 同 的 敏感 程度 。 这 样 就 使 从 近 缘 的 各 种 个 体 到 在 古代 就 已 趋
异 的 物种 之 间 的 每 一 种 亲缘 关系 程度 , 最近 已 可 能 在 目标 DNA 分 级 与 适合 作 定量 遗传 差异 (或 相
似 ) 的 分 子 方法 间 选 择 到 一 种 结合 。
了 isi
线粒体 Re. Michie.
质 体 L Tel aba es
| eat REAR ee 植物 真菌 oY
原生 生物 原生 生物
图 2 不 同类 群 中 可 用 作 分 析 的 基因 组
长 期 以 来 ,对 表 型 变异 与 保持 感 兴趣 的 生态 学 家 们 ,通过 分 离 等 位 变异 涉及 表 型 的 基因 ,能 够 直
接 分 离 和 研究 其 遗传 构成 。 这 将 与 在 商业 上 具 重 要 价值 的 动 . 植 物 物种 早已 开展 分 子 遗 传 研究 一 样 ,
是 一 种 自然 的 进步。
在 这 个 综述 中 ,我 们 主要 集中 于 DNA 变异 的 分 析 , 而 不 是 特异 序列 功能 或 特定 位 点 选择 过 程 的
研究 。 我 们 通过 有 关 生 态 学 问题 的 实例 来 曾 明 其 应 用 的 范围 。 附 表 中 ,我们 总 结 了 迄今 为 止 运用 各 种
分 子 方法 解决 的 生态 学 问题 。 我 们 顺序 介绍 其 应 用 领域 ,并 努力 强调 在 每 个 领域 中 ,现在 看 来 最 合适
- 181°
的 方法 。 由 于 大 多 数 的 技术 可 用 于 处 理 种 种 问题 ,为 避免 重复 ,首先 我 们 来 简单 描述 一 下 主要 的 新 技
术 。
2 技术 与 术语
这 一 节 论 述 了 所 用 到 的 不 同 技术 的 一 个 概貌 。 与 生态 学 家 的 需要 特别 有 关 的 两 本 手册 分 别 是 由
Heolzel(1992) 和 Hillis 与 Moritz(1990) 编 著 的 。 本 章 所 描述 的 已 建立 的 主要 方法 在 上 述 两 本 书 上 有 详
AM BGR AEE; 其 它 的 文献 在 需要 的 地 方 给 出 。
2.1 材料 来 源
实际 上 ,任何 细胞 组 织 都 是 合适 的 DNA 来 源 。 在 肴 椎 动物 研究 中 ,因为 血液 的 获得 是 非 破 坏 性
的 ,所 以 是 最 常用 的 材料 。DNA 所 需 的 量 依 所 用 的 技术 的 不 同 而 不 同 。 例 如 ,对 于 以 DNA 一 DNA 杂
交 为 基础 的 方法 ,如 多 位 点 DNA 指纹 ,每 次 样品 操作 需要 5ugDNA( 一 般 这 个 量 足 够 以 进行 若干 次
操作 ) 。 材 料 从 鸟 类 的 血液 ( 它 的 红细胞 是 具 核 的 ) 中 获得 只 需 1 一 2ul, 对 于 哺乳 动物 来 讲 , 只 有 白细胞
具 核 , 则 需要 lml 血液 .对 于 应 用 扩 增 技术 的 方法 来 讲 , 如 聚合 酶 链 式 反应 (PCR) ,虽然 由 于 存在 潜在
的 污染 问题 ,通常 都 避免 这 么 小 的 取样 ,但 是 在 理想 条 件 下 ,开始 于 一 单 倍 体 基 因 组 (haploid genome)
的 分 析 是 可 行 的 。
尽管 多 数 实 验 室 一 直 都 是 采用 冷冻 的 方法 保存 用 于 提取 DNA 的 组 织 , 但 已 经 证 明 各 种 化 学 混
合剂 (包括 促 溶 剂 , 丈 合 剂 ,乙醇 和 浓 盐 溶液 ) 能 够 在 环境 温度 下 保存 适用 于 大 多 数 分 析 方 法 的 相对 较
长 的 DNA 分 子 至 少 几 周 或 几 月 ( 见 Bruford 等 ,1992)。 例 如 ,从 酒精 中 保存 6 年 之 久 的 动物 组 织 中
提取 出 大 量 可 被 限制 性 核酸 内 切 酶 切断 的 DNA(Smith 等 1987) 。 但 是 另外 的 研究 则 报道 了 低 的 产
量 和 快速 降解 (Seutin 等 ,1990) 。 不 同 之 处 可 能 是 由 于 商业 酒精 的 污染 (lto,1992) 。
2.2 DNA—DNA 杂交
ASE Ti 1K BEF GO Fe BS 7 A EE dT) A A HE BK Gi) Ek EB» PAR.
的 简单 方法 是 点 印迹 (dot blot), 即 在 与 标记 了 的 探 针 杂交 前 ,将 等 分 试 样 的 DNA( 甚 至 血液 ) 点 到 滤
膜 上 并 固定 。 探 针 最 常用 的 是 放射 性 标记 了 的 ,但 是 非 放射 性 标记 的 方法 逐渐 发 展 并 普遍 起 来 。 通 过
各 种 合适 的 对 照 来 比较 其 杂交 强度 可 以 测定 目标 样品 中 探 针 序列 的 存在 。 杂 交 的 检测 可 以 通过 和 射
线 放射 自 显影 或 直接 在 膜 上 探 针 的 化 学 染色 。 当 研究 一 特异 性 序列 时 , 探 针 可 以 是 一 克隆 了 的 DNA
片段 或 一 非常 短 的 ,典型 的 是 20 一 30 个 碱 基 对 ,人 工 合成 的 守 核 苷 酸 序列 。 一旦 一 个 克隆 被 测序 后 ,
就 可 以 设计 寡 核 苷 酸 探 针 , 并 且 原 则 上 人 允许 相对 快速 而 方便 地 对 序列 变异 数据 的 收集 (如 Gardes 等
1991).
2.3 限制 性 片段 分 析
用 点 印迹 法 简单 地 检测 相似 序列 经 常 是 不 够 的 , 我 们 需要 更 详细 的 有 关 杂 交 的 目标 DNA 的 信
息 。 直 到 最 近 , 估 测 DNA 序列 变异 的 最 简单 方法 是 应 用 限制 性 片段 (或 限制 性 片段 长 度 多 态 性 ,
RFLP) 来 分 析 。 首 先 ,样品 DNA 被 许多 合用 的 限制 性 内 切 酶 之 一 种 切 成 一 定 的 片段 , 然 后 依 它们 的
长 度 将 这 些 片段 通过 电泳 分 离 。 限 制 性 片段 可 以 通过 电泳 凝 胶片 的 染色 观察 或 如 上 所 述 , 按 South-
ern 印迹 法 永久 地 转移 到 一 个 滤 膜 上 经 过 杂交 检测 。( 现在 有 些 方法 为 了 避免 印迹 这 一 步 , 而 是 把 片
段 在 凝 胶 上 于 燥 后 直接 杂交 凝 胶 , 如 Schafer 等 1988)。DNA 片段 的 存在 与 否 暗示 着 应 用 特定 限制 性
内 切 酶 来 识别 的 特异 性 目标 序列 的 变异 。
2.4 DNA 指纹 分 析
有 两 种 不 同 级 别 的 DNA 指纹 分 析 一 二 多 位 点 和 单位 点 指纹 。 对 于 后 者 ,通过 与 一 克隆 的 小 卫星
探 针 的 Southern 印迹 杂交 ,可 以 检测 在 一 个 单位 点 上 等 位 DNA 限制 性 片段 的 不 同 大 小 (Wong 等
* 182°
1987) 。 一 个 典型 的 小 卫星 DNA 序列 的 长 度 大 于 20,000 个 碱 基 对 , 它 包 括 一 个 短 的 10 一 60 碱 基 对
的 非 编 码 序 列 的 重复 拷贝 。 重 复 的 次 数 有 显著 的 差异 ,可 以 产生 易于 检测 的 不 同 长 度 的 限制 性 片段 ,
从 而 在 一 些小 卫星 位 点 得 到 了 很 高 水 平 的 多 态 性 ( 杂 合 率 达 100%%)。 小 卫星 位 点 是 “可 变数 量 的 串联
重复 (VNTR) ”位 点 的 例子 。
在 多 位 点 DNA 指纹 法 中 ,用 到 了 一 个 “多 核心 (poly-core)” 探 针 , 它 可 与 部 分 重复 单位 ( 即 “ 核
>”) BARS, 这 种 重复 单位 在 微 卫 星 的 很 多 分 离 的 位 点 上 是 很 普通 的 (Jeffrey 等 ,1985a,b)。 可 以
用 不 同 的 核心 探 针 来 检测 非 依赖 性 小 卫星 带 谱 (Kindependent minisatellite profiles) 。 多 位 点 指纹 法 的
一 个 主要 优点 是 核心 探 针 可 用 在 广泛 的 生物 体 中 (如 Burke 和 Bruford 1987, Dallas 1988,Taggart 和
Ferguson 1990,Carvalho 等 1991; 见 Burke 等 1991a 综述 )。 有 关 多 位 点 和 单位 点 小 卫星 DNA 指纹 法
的 详细 实验 室 操作 程序 见 Bruford 等 (1992) 的 文章 。
多 位 点 指纹 法 的 一 个 缺点 是 指纹 谱 复 杂 ,难以 比较 ,特别 是 在 不 同 的 凝 胶 上 得 到 的 谱 。 组 成 的
DNA 片段 也 不 能 归 因 于 特异 性 位 点 。 单 位 点 指纹 法 通过 允许 基因 型 归 因 于 常常 是 高 度 变 异 的 位 点 避
免 了 这 些 问 题 , 但 它 也 有 缺点 ,就 是 在 所 研究 的 每 一 个 物种 中 或 至 少 在 一 个 近 缘 种 中 都 得 找 出 一 种
标记 系统 (Hanotte 等 ,199la,b,1992)。 然 而 , 现 在 可 以 使 用 一 种 相对 有 效 的 分 离 这 种 位 点 的 方法
(Armour 等 1990,Hanotte 等 199la,b;Bruford 等 (1992) 的 操作 程序 ) 。
另外 一 种 级 别 的 VNTR 位 点 包括 了 简单 的 序列 ,或 微 卫 星 多 态 性 (Tautz1989) 。 微 卫星 (micro-
satellite) 包 含 不 同 数量 简单 而 短 的 串联 重复 ,如 (GT)n 或 (CAC)n。 小 卫星 和 微 卫 星 的 区 别 是 随意 的 ,
但 实际 的 区 别 是 微 卫 星 总 的 长 度 小 到 允许 应 用 PCR 技术 分 析 。 所 以 微 卫 星 的 变异 分 析 比 小 卫星 容易
得 多 ( 见 Rassmann 等 1991,Schiotterer 等 (1991) 的 方法 )。 特 异 位 点 微 卫星 系统 常 在 宽 范 围 的 近 缘 种
中 适用 (Schlotterer 等 ,1991), 在 一 定 程 度 上 比 小 卫星 探 针 更 有 用 。 由 于 这 里 数据 太 少 而 不 能 在 两 个
级 别 的 两 个 位 点 进行 典型 变异 的 细致 比较 。 高 水 平 的 多 态 性 很 可 能 在 小 卫星 位 点 上 得 到 , 但 微 卫 星
的 变异 似乎 适合 作 大 量 的 应 用 。
2.5 DNA 放大
*
一 个 相对 较 新 的 方法 应 用 于 大 多 数 DNA 样品 中 一 一 包括 相当 粗 提 的 总 DNA 一 一 这 个 方法 是
聚合 酶 链 式 反 应 (PCR) (Mullis 和 Faloona, Saiki 等 1988)。 这 种 技术 可 以 产生 足 量 的 确定 长 度 的
DNA ,适合 各 种 方法 的 进一步 分 析 , 如 RFLP 测序 和 与 特异 探 针 的 杂交 。 在 聚合 酶 链 式 反 应 中 ,应 用
二 耐 高 温 的 DNA 聚合 酶 循环 复制 相反 的 两 条 DNA 链 上 两 个 引物 部 位 之 间 的 序列 , 这 个 反应 需要
ATARHEBARIIDHEES DNA 上 的 这 些 部 位 互补 ,每 循环 一 次 ,产量 成 倍增 加 。 这 个 过 程
的 灵敏 度 使 得 它 可 以 对 极 少量 DNA 进行 分 析 , 例 如 这 些 DNA 可 来 自 单个 精子 细胞 (Amheim 等
1990) , 单 根 头 发 (Higuchi 等 ,1988) ,单个 羽毛 (Taberlet 和 Bouvet, 1991), Hh {0 HY & AK CHagelber,
1989) 或 博物 馆 中 的 标本 (Thomas 等 ,1989,1990) 。 由 于 所 研究 的 序列 只 需要 很 少 的 完整 拷贝 , 甚 至
固定 的 或 包 埋 了 的 组 织 都 适合 来 提取 DNA 作 PCR(Greer 等 1991) ,所 以 ,很 简单 的 野外 样品 保存 和
实验 室 提 取 的 操作 程序 都 会 令 人 满意 。
因为 扩 增 的 PCR 产品 有 足够 的 量 可 供 直接 在 电泳 凝 胶片 上 检测 ,所 以 PCR 为 杂交 方法 提供 了
另 一 个 很 好 的 选择 。 例 如 可 以 检测 引物 部 位 间 的 序列 长 度 变异 或 检测 在 一 个 引物 部 位 本 身 的 变异 。
PCR 产物 可 以 用 作 点 印迹 DNA 一 DNA 杂交 时 的 靶 材 料 , 也 可 用 作 限 制 性 分 析 。 它 们 和 其 它 技术 (下
文 ) 可 以 不 需要 广泛 地 测序 就 可 以 相对 方便 地 收集 有 用 的 基于 序列 的 标记 数据 。
2.6 DNA 测序
直到 最 近 ,得 到 一 个 序列 之 前 , 必须 先 从 所 研究 的 生物 体 中 克隆 一 个 序列 。 比 如 对 整个 基因 的
DNA 多 态 性 的 研究 , 需 要 分 别 地 从 每 个 个 体 克 隆基 因 〈 如 Kreitman 1983)。 一 且 一 特定 位 点 至 少
在 一 个 亲缘 生物 体 中 得 到 克隆 并 测 得 序列 (由 此 可 设计 出 寡 核 苷 酸 引物 ),PCR 的 优点 是 通常 可 以 绕
过 克隆 这 一 步 。 对 一 些 位 点 来 说 ,可 以 鉴定 两 侧 的 序列 段 (stretches of flanking sequence) ,它们 在 一 广
阔 范 围 的 类 群 中 是 高 度 保守 的 ,人 允许 设计 “通用 ”的 引物 (Kocher 等 1989,Hillis 和 Dixon 1991 ,Tabeer-
。183。
let 等 1991) 。 现 在 已 经 有 了 直接 对 PCR 产物 测序 的 很 好 的 操作 程序 (如 Winship 1989 ,Innis 1990,
Lee 1991) 。 一 些 工作 者 喜欢 在 测序 前 亚 克 隆 PCR 产物 ,但 是 这 就 意味 着 ,特别 是 当 多 序列 需要 排除
人 工 核 苷 酸 替 换 的 可 能 时 ,可 能 造成 相当 大 的 额外 工作 量 。
2.7 变性 梯度 凝 胶 电 泳
既 便 通 过 PCR 和 直接 测序 可 以 相对 比较 容易 地 获得 序列 数据 , 但 是 要 积累 起 适合 作 核 基因 等
位 基因 或 线粒体 单 膜 类 型 (haplotypes) 比 较 的 种 群 频率 数据 ,是 一 个 令 人 胆 尾 的 任务 。 虽 然 除 医学 遗
传 学 外 ,变性 梯度 凝 胶 电 泳 (DGGE) 尚未 被 广泛 应 用 ,DGGE 及 其 相近 的 方法 (如 温度 梯度 凝 胶 电 泳
(TGGE) (Riesner 等 1989) 和 PCR 一 单 链 构象 多 态 性 (SSCP) 分 析 (Hayashi 1991)) 能 够 提供 用 来 测序
数 十 个 样品 的 较 低 劳动 强度 的 方法 。Lessa(1992) 和 Myers 等 (1989) 提 供 了 DGGE 方法 详细 的 指导 ,
但 是 ,简单 地 说 ,这 种 方法 需要 为 所 研究 的 具有 长 G-C 尾 的 区 域 准 备 一 个 引物 .这 种 具有 抗 变性 的 G-
C 键 的 扩 增 产物 可 在 含有 脲 的 梯度 凝 胶 上 电泳 .不 同 序列 的 产物 在 不 同 的 腺 浓度 上 部 分 地 变性 ,对 长
度 小 于 500bp 的 产物 ,小 到 只 有 1 个 碱 基 对 替换 的 变化 能 够 通过 移动 距 离 的 不 同 而 分 辨 出 来 .频率 数
据 ( 包 括 杂 合子 的 辨别 ) 可 直接 由 凝 胶 上 得 到 .如果 有 要 求 的 话 ,代表 已 检测 了 迁移 等 级 的 谱 带 上 的 样
品 可 以 被 再 放大 并 测序 。 在 这 种 应 用 中 , DGGE 对 研究 DNA 片段 在 种 群 内 或 其 它 研究 单位 内 的 中 等
变异 是 最 有 用 的 (就 是 说 ,不 是 所 有 的 个 体 都 是 独特 的 ) 。 然 而 ,这 对 从 种 群 遗 传 或 系统 发 育 角 度 作 初
步 探索 可 能 有 同等 的 价值 , 即 在 被 选择 的 各 种 个 体 的 DNA 片段 测序 前 ,在 种 群 或 分 类 群 内 或 之 间 去
评估 最 初 放 大 的 DNA 片段 是 否 有 一 定 程 度 的 变异 。
2.8 随机 放大 多 态 性 DNA
人 们 现在 广泛 地 探索 随机 放大 多 态 性 DNA(CRAPD), 部 分 是 由 于 它 显 著 的 简单 性 。 它 依赖 由 被
研究 的 生物 体 中 提取 的 DNA( 有 时 来 自分 离 的 细胞 器 中 ), 应 用 几 组 短 的 单 链 随 机 序列 引物 来 测定
变异 (Williams 等 1990; Hardrys 等 1992) 。 经 过 琼脂 糖 电 泳 和 省 化 乙 锭 染色 后 ,比较 放大 产物 时 ,一
些 引物 将 产生 少许 分 离 的 带 , 它 们 的 一 部 分 在 种 群 内 或 种 群 间 是 多 态 的 。 当 检测 时 , 这 些 标记 通常 呈
现 显 著 的 孟 德 尔 遗 传 特性 (Williams 等 1990,Arnold 等 1991) 。 在 动 植物 中 ,这 些 标记 可 用 来 制作 基
因 连 锁 图 (Williams 等 1990) 。
假设 不 了 解 被 放大 的 区 域 ,并 且 有 关 的 书面 出 版 物 很 少 , 对 于 每 一 种 新 的 生物 必须 检验 从 不 同
个 体 中 多 次 分 别提 取 和 放大 ( 若 有 可 能 也 包括 遗传 力 ) 的 产物 模式 的 重复 能 力 。 应 用 得 好 ,这 种 方法
仅 需 要 DNA 分 离 、 放 大 和 琼脂 糖 凝 胶 电泳 过 程 , 就 可 提供 丰富 的 多 态 性 标记 数据 。 避 免 了 限制 性 酶
和 放射 性 标记 的 高 消耗 和 复杂 性 。
在 这 一 部 分 ,我 们 讨论 生态 学 家 感 兴趣 的 领域 .所 研究 不 同 范畴 的 问题 及 用 到 的 方法 的 实例 列 在
附 表 中 。 我 们 试 着 尽 可 能 地 选择 与 生态 学 家 有 关系 的 实例 并 尽 可 能 包括 有 代表 性 的 分 类 群 。 在 很 多
情况 下 ,虽然 一 个 新 而 有 前 途 的 技术 建立 了 ,但 仍 没 有 正式 发 表 的 应 用 实例 ,反映 了 这 一 领域 中 技术
发 展 的 步伐 还 不 快 。 阅 读 附 表 时 ,应 注意 这 种 可 能 性 。 就 象 在 附 表 中 所 列 的 一 样 ,读者 必须 明白 所 选
的 一 些 实例 并 不 代表 最 有 效 的 方法 。
3.1 性 别 鉴 定
Fisher(1930) 预 言 , 在 有 性 的 物种 中 ,一 种 亲本 应 该 在 它 的 每 一 性 别 的 后 代 中 有 均等 的 总 投入 。
Trivers 和 Willard (1973) 争辩 说 , 当 亲 本 的 投入 影响 到 一 个 后 代 以 后 的 生殖 成 功 (reproductive
success) 并 且 在 生殖 成 功 中 某 一 性 别 的 变异 较 大 时 ,那么 一 种 亲本 应 该 在 这 种 性 别 有 较 大 的 投入 。 对
于 许多 通常 的 生物 体 研 究 对 象 来 说 ,由 于 难于 在 幼年 期 作 性 别 鉴 定 (sexing juveniles), Aix Mae
的 试验 、 相 关 的 假设 以 及 一 般 性 的 生活 史 的 研究 受到 了 障碍 。 有 一 个 在 形态 上 可 区 别 性 别 的 例子 , 东
。184。
部 蓝 色 鸣 鸟 (Szalia szalzs) 的 雄性 亲本 在 它们 的 肉 性 后 代 中 有 较 多 的 投入 (Gowaty 和 Drage 1991)。 有
人 认为 ,这 个 物种 从 出 生 到 繁殖 扩散 之 所 以 很 低 是 因为 嗜 杀 父 (Phiopatric) 的 雄性 乌 可 以 为 了 雌性 而
要 与 它 的 亲生 父亲 竞争 ,所 以 肉 性 后 代 将 占 雄 性 适合 度 较 大 的 比例 。
性 别 是 由 遗传 决定 的 关键 是 至 少 在 一 种 性 别 的 本 身 具 某 些 特 异性 DNA。 原 则 上 这 种 情况 只 需 一
个 位 点 的 等 位 基因 的 差异 ,而 实际 上 差异 一 般 广 泛 得 多 ,常常 包括 了 具 性 别 特异 的 染色 体 。 在 这 些 情
况 下 细胞 学 的 性 别 鉴定 是 可 行 的 ,但 通常 要 求 作 大 样品 是 不 切实 际 的 ( 见 Parker 等 1991)。 用 分 子 标
记 去 鉴别 特殊 的 性 染色 体 的 序列 特征 ,已 有 了 一 些 实例 。 例如 ,Griffiths 和 Holland(1990) 使 用 一 种 减
法 克隆 (subtraction cloning) 技术 分 离 了 食 鲁 鱼 鸥 (Larzs argentatus) 1) W 染色 体 ( 肉 性 特异 的 ) 的 特
异性 探 针 。 遗 憾 的 是 ,就 象 其 它 类 似 的 探 针 一 样 ,这 个 探 针 只 对 很 少 一 些 近 缘 种 有 应 用 价值 。 也 偶尔
地 发 现 了 对 其 它 一些 物 种 的 伴 性 探 针 (如 Quinn 等 1990,Rabenold 等 ,1991) 。
长 期 以 来 ,鉴定 和 分 析 性 别 决定 基因 本 身 似乎 避免 了 这 个 问题 .最 近 分 离 了 在 了 一 染色 体 上 的 性
别 决 定 区 (CSRY) 的 基因 ,并 认为 它 对 人 类 来 说 是 性 别 决定 位 点 (Sinclair 等 1990, Gubbay 1990).
它 能 够 作为 一 个 探 针 用 印迹 分 析 来 确定 一 系列 哺乳 动物 的 性 别 (Sinclair 等 1990). BRIER E FF HE BH
物 分 类 群 中 , 它 好 象 可 能 具有 一 个 相同 功能 的 同 源 物 , 但 首次 在 鸟 类 寻找 这 样 一 个 同 源 基 因 并 不 成
功 (CGriffiths 1991) 。 一 有 旦 得 到 了 合适 的 序列 数据 , 至 少 就 可 以 设计 和 合成 在 大 范围 的 哺乳 动物 物种
中 有 用 的 寡 核 背 酸 探 针 ,或 至 少 可 以 设计 窒 核 苷 酸 引物 应 用 于 PCR 。
3.2 交配 制度
进化 生态 学 家 对 交配 制度 特别 感 兴趣 ,他 们 希望 能 够 度量 个 体 在 自然 条 件 下 的 生殖 成 功 情况 。 或
者 ,也 需要 测量 互助 个 体 间 的 亲缘 关系 。 在 实践 中 , 父 本 和 母 本 的 检验 是 测量 亲缘 关系 的 一 种 特殊 情
况 ( 如 Birkhead 等 1990) 。 为 这 个 目的 ,应 用 分 子 方法 一 一 特别 是 多 位 点 DNA 指纹 和 随机 RFLP 分
析 一 一 进行 研究 ,可见 Burke 1989 WR. RI ,单位 点 指纹 分 析 发 展 迅 速 , 现在 已 成 为 可 选用 的 方
法 (Burke 等 1991b) 。
多 位 点 分 析 已 应 用 于 一 些 完 全 在 野外 进行 的 繁殖 系统 研究 上 ,现在 几乎 已 经 成 为 常规 方法 。 迄
今 多 数 的 研究 集中 在 鸟 类 上 , 反映 了 鸟 类 作为 行为 生态 学 研究 对 象 的 普遍 性 , 并且 涉及 到 基本 上 是
单 配 制度 中 确定 是 父 性 或 是 母性 ( 见 Burke 等 1991b ,Birkhead 和 Moller 1992) 或 者 关注 互助 繁殖 群
成 员 之 间 的 血统 分 布 以 及 亲缘 关系 的 程度 ( Burke 等 1989,Rabenold 等 1990 ,Jones 等 1991, Pacher
等 1991,Davies 等 1992) 。
第 一 类 研究 范畴 是 关于 交 苦 交配 对 策 (alternative mating strategies) 的 发 生 , 例 如 ,用 排除 分 析
(exclusion analyses) 发 现 子 代 基 因 型 与 它们 的 推断 亲本 不 一 致 ,以 此 来 检测 额外 配对 (extra- pair) 交
配 或 种 内 繁殖 寄生 现象 (brood parasitism ) 。 例 如 , FE A fal FEI MT HEAL NG & (Taeniopygia guttata) 的 交
配 行为 的 研究 导致 期 望 额外 配对 的 父 本 可 以 在 自然 种 群 中 出 现 . 在 对 一 野外 种 群 指纹 的 推断 研究 中 ,
由 行为 指定 (behaviourally-assigned) 的 双亲 本 是 完全 的 ,并 且 经 过 排除 分 析 , 确 认 额 外 配对 的 父 本 以
较 低 的 频率 发 生 (82 个 后 代 中 有 2 个 ) , 而 种 内 繁殖 寄生 现象 则 意外 地 较 显 著 〈 80 个 后 代 中 有 9
4+) (Birkhead 等 1990) 。
例如 , E—-P ADEA RKRAW HRP. KA MAB (Prunella modularis) — RH ZB tt Si
繁殖 ,2 个 或 更 多 的 雄性 共同 拥有 一 个 峻 性 。 这 些 雄 性 一 般 互 相 没 有 亲缘 关系 ,但 有 一 种 显 性 的 关系 ,
可 能 其 中 一 个 或 两 个 雄性 一 起 去 帮助 雌性 喂养 雏 鸟 .虽然 这 些 雄 性 对 它们 的 后 代 没 有 明显 的 偏爱 ,但
应 用 多 位 点 指纹 的 分 析 表 明 如 果 它 们 存在 某 些 家 系 关系 ,它们 就 会 倾向 于 喂养 同 窝 的 雏 鸟 (Burke 等
1987) 。 如 果 观 察 到 一 只 雄 鸟 在 雌 鸟 已 受精 还 未 产 卵 前 一 段 时 期 内 排外 性 地 去 接近 肉 性 ,那么 它 就 更
倾向 于 帮助 喂养 , 而且 由 雄性 喂养 的 程度 与 排外 性 地 接近 肉 乌 的 程度 显著 相关 。 指 纹 分 析 的 数据 表
明 ,用 观察 接近 的 途径 是 一 个 好 的 家 系 指 示 , 所 以 这 就 意味 着 雄性 岩 岗 就 是 用 它们 接近 肉 鸟 的 程度 来
决定 是 否 喂 养 雏 鸟 .随后 在 一 系列 的 去 除 (removal) 实 验 中 , 通过 人 工 操作 使 雄性 个 体 交 配 成 功 ( 通 过
DNA 指纹 来 确认 ), 以 上 观点 被 实验 所 证 实 (Davis 等 1992)。
就 象 在 岩 岗 的 研究 中 的 情况 一 样 ,在 只 有 少数 的 雄性 候选 者 的 情况 下 , 应 用 多 位 点 指纹 分 析 能
。185。
有 效 地 指示 家 系 , 但 是 这 经 常 需 要 对 许多 潜在 的 双亲 作 检 验 。 在 这 种 情况 下 ,应 用 一 个 单位 点 指纹 分
析 的 系统 是 更 有 效 的 , 它 能 在 一 系列 高 度 多 态 位 点 上 指示 个 体 的 基因 型 Gibbs 等 (1990) 将 多 位 点 和
单位 点 指纹 分 析 结 合 起 来 ,鉴别 了 28%% 第 3 代 红 翅 乌 和 鹊 幼 鸟 的 几乎 所 有 父 本 ,这 些 幼 鸟 不 是 由 拥有
它们 出 生地 的 雄性 所 生 的 。 这 就 说 明了 在 一 个 雄性 的 领地 上 产生 的 后 代数 和 它 的 实际 生殖 成 功 之 间
没有 显著 的 相关 ,而 且 在 它们 自己 领地 上 生育 较 大 比例 后 代 的 这 些 雄 性 也 进行 了 较 多 的 额外 交配 的
受精 。Gibbs 及 其 合作 者 所 用 的 单位 点 探 针 是 一 个 鼠 的 组 织 相 容 性 (histocompatibility) 位 点 cDNA , 它
的 用 途 是 通过 与 一 包含 限制 性 片段 的 小 卫星 的 偶然 杂交 而 发 现 的 ;但 是 没有 发 现 它 普遍 能 用 于 其 它
的 鸟 类 (Gibbs, 私 人 通信 )。 分 别 获 得 高 多 态 性 的 小 卫星 或 微 卫 星 位 点 的 特异 性 探 针 或 引物 的 一 般 性
的 方法 都 是 可 行 的 ( 见 前 文 ) ,而且 这 样 一 些 位 点 结合 使 得 多 位 点 指纹 法 变 得 过 时 (Wong 等 1987,
Hanotte 等 1991a) 。 其 它 的 分 子 方法 偶而 也 用 到 .。 Quinn 及 其 合作 者 们 发 现 由 雪 雁 中 随机 克隆 的 一 系
列 RFLP 有 可 观 的 变异 ,并 且 可 用 来 进行 这 个 种 的 家 系 分 析 (Quinn 和 White,1987,Quinn 等 1987) 。
Williams 和 Strobeck(1986) 确 认 了 果 蝇 了 染色 体 的 核糖 体 基 因 的 特异 性 RFLPs, 由 此 我 们 能 够 揭示
在 野外 种 群 中 雌性 果 蝇 发 生 过 多 次 交配 .本 领域 更 详细 的 论述 已 超出 本 文 的 范围 ,读者 可 参考 一 些 已
发 表 的 综述 (Burke 1989,Burke 等 1991b 和 Burke 等 1991a 中 的 其 它 论文 )。
3.3 种 群 结构
种 群 结构 是 广义 的 话题 ,包括 从 社 群 (social groups) 内 到 种 群 间 在 各 种 水 平 上 研究 亲缘 关系 与 遗
传 分 化 。 在 前 面 一 节 内 ,我 们 单独 讨论 了 近 缘 家 族 关 系 的 分 析 。
除 等 位 酶 不 属于 本 评述 的 范围 外 ,线粒体 DNACmtDNA) 是 用 于 许多 种 群 分 化 研究 的 大 分 子
(Avise 等 综述 1987)。 例 如 ,84 只 座 头 鲸 (humpback whale) 的 mtDNA( 由 皮肤 活体 解放 得到) 的
RFLP 分 析 证 明 ,在 亚 种 群 之 间 , 以 及 来 自 北 大 西洋 和 北 太 平 洋 的 种 群 之 间 有 明显 的 单 模 标本 (haplo-
types) 的 分 离 (Baker 等 1990) 。 单 模 标本 的 地 理 分 布 与 先前 报道 的 夏季 取 食 地 与 冬季 繁殖 地 之 间 的 迁
移 模 式 有 惊人 的 一 致 。 研 究 者 认为 ,这 种 遗传 分 离 反 映 了 迁移 目的 的 母系 习性 (materal traditions in
migratory destination)”, 揭示 了 要 考虑 到 行为 模式 在 种 群 结 构 分 析 中 的 重要 性 。 在 植物 中 ,质粒 DNA
也 提供 了 很 多 类 似 mtDNA 同样 的 进展 ,并 已 在 少数 的 种 群 结构 研究 中 得 到 应 用 (如 Goff 和 Coleman
1988).
从 总 基因 组 文库 中 分 离 的 随机 克隆 已 在 种 群 水 平 上 用 于 RFLP 的 研究 。Mecdonald 和 Martinez
(1990) 研究 了 从 一 块 麦 地 得 到 的 一 种 真菌 病原 体 Mycosphaerella graminicola 的 种 群 结 构 。 他 们 发 现
了 高 程度 的 遗传 变异 ,包括 一 片 叶 子 上 不 同 的 侵蚀 斑 (lesions) 之 间 。 他 们 的 研究 强调 了 在 确认 从 不 同
地 理 位 置 取得 的 少量 样品 是 否 代表 种 群 水 平 的 变异 之 前 ,评估 空间 尺度 变异 的 重要 性 。
也 偶尔 使 用 另外 一 些 DNA 标记 类 型 ,如 核糖 体 DNA( 如 Learn 和 Schaal 1987)。 尽 管 一 般 记 为 小
卫星 进化 太 快 而 不 能 用 于 种 群 水 平 的 分 析 ,Gilbert 等 ( 1990) 发 现在 讨论 南 加 利 福 尼 亚 的 海峡 岛
(channel islands) | &/}\ MI (dwarf foxes) 小 的 分 离 种 群 的 系统 发 育 , 以 及 分 离 种 群 间 遗 传 变异 的 相关
水 平时 , 指 纹 模 式 能 提供 有 益 的 信息 。 在 大 部 分 分 离 的 岛 上 ,他 们 发 现在 取样 的 狐 之 间 没 有 指纹 变
异 , 一 个 指纹 模式 甚至 在 自 交 的 实验 室 小 鼠 群 中 也 未 发 现 过 。 多 位 点 指纹 在 鉴别 自然 种 群 内 无 性 系 成
员 方 面 也 可 有 重要 价值 CNybom 和 Schaal 1990,Turner 等 1990,Carvalho 等 1991 ,Brookfield 1992) 。
PCR 使 得 在 种 群 研究 中 收集 实际 的 DNA 序列 是 可 行 的 ,而 且 它 也 允许 用 收藏 在 博物 馆 中 的 标
本 作 实 验 。Thomas 等 (1990) 利 用 这 种 有 利 条 件 ,发 现 78 年 间 3 40K Ckangaroo rat) 种 群 的 种 群 结 构
没有 明显 的 变化 。
3.4 迁移 和 基因 流
当然 ,迁移 是 种 群 结构 的 一 个 重要 成 分 ,所 以 ,同样 的 方法 学 上 的 各 种 途径 是 有 用 的 。 在 这 个 前 提
下 ,我们 列举 了 一 些 实例 来 着 重 强调 应 用 分 子 的 方法 有 时 可 以 推断 迁移 模式 。
例如 ,在 现代 人 的 地 理 起 源 这 个 有 争议 的 问题 上 , 通过 从 多 类 人 种 和 黑猩猩 取样 的 mtDNA 替
位 环 区 (displacement loop region) 的 序列 比较 , 确 认 了 人 类 mtDNA 进化 树 的 非洲 起 源 ( Vigilant 等
。 186。
1991; 例外 见 Templeton 1992) 。 Hagelberg 等 (1989) 在 研究 人 类 的 人 口 迁 移 时 ,扩展 了 PCR MAR.
证 明了 扩 增 5450 年 以 上 的 人 骨 的 mtDNA 的 可 行 性 。 在 一 系列 研究 上 ,无 疑 地 ,对 在 形态 学 上 无 症状
的 骨头 片段 作 了 鉴定 。
将 RFLP 分 析 与 等 位 酶 相 结 合 ,mtDNA 也 被 用 在 遗传 学 上 研究 和 确认 蝶 晨 两 个 种 之 间 的 历史
上 描绘 的 杂种 地 带 (hybrid zone) 的 变迁 〈 Arntzen 和 Wallis 1991). 40 SA ESC BER CT riturus
marmoratus ) FH # HY A ef A BY RMR CT. crzstatxs) 种 群 的 特征 是 存在 一 种 低 的 但 可 辨认 的 渐 渗 的 mar-
moratus 等 位 基因 频率 。
Culex pipiens 蚊 通 过 非特 异性 过 量 的 产生 多 种 酯 酶 来 抗 有 机 磷酸 酯 杀 虫 剂 。 这 些 酯 酶 中 有 一 个
在 B 位 点 上 用 电泳 可 察觉 到 的 扩 增 了 的 BB, 等 位 基因 。 来 自 非 洲 、 亚 洲 和 北美 洲 样品 的 B, 酯 酶 结构 基
因 序 列 的 限制 位 点 分 析 显 示 其 高 度 的 同 源 性 。 这 就 指出 了 OB, 等 位 基因 是 由 单 突 变 发 展 而 来 ,并 通过
对 杀 虫 剂 诱导 选择 的 有 利 性 ,在 世界 范围 种 群 之 间 快 速 扩散 。
3.5 渐 渗 现 象 与 杂交 地 带
适用 于 种 群 结构 分 析 的 技术 也 适 于 特殊 情况 的 杂交 地 带 。 分 析 沿 着 杂交 地 带 的 基因 渐 渗 ,mtD-
NA 特别 有 价值 CHarrison 1989 SiR). BRA DNA 也 应 用 于 某 种 程度 的 研究 中 (如 Baker 等 1989) 。
Arnold 等 (1991) 用 一 种 选择 叶绿体 基因 的 PCR 和 RAPD 来 研究 路 易 斯 安 那 营 尾 杂 交 种 的 形
成 。 物 种 专 有 的 RAPD 标记 的 地 理 分 布 支持 这 样 一 个 假设 :7Tzrzs fulva Al I. hexagona 通过 基因 流 导 致
了 定位 的 和 扩散 的 渐 渗 .一 个 扩 增 的 叶绿体 基因 片段 (携带 在 峻 性 细胞 质 中 ) 的 RFLP 分 析 , 说 明 是 由
于 传粉 而 不 是 种 子 散布 导致 了 基因 流 。
这 个 领域 提供 了 某 些 成 功 应 用 DGGE 的 首 例 。Lessa(1992) 应 用 DGGE 研究 了 一 种 地 鼠 的 杂交
地 带 。
为 了 了 解 在 形态 上 还 识别 不 了 有 杂种 存在 的 地 区 ,在 有 杂交 潜 势 的 白 标 物种 间 基 因 交 换 的 程度 ,
Whittemore 和 Schaal(1991) 观 察 了 用 来 自 狼 牵 牛 叶绿体 和 大 豆 细胞 核 核糖 体重 复 (ribosomal repeat )
的 克隆 探 针 消化 的 基因 组 DNA 限制 片段 印迹 。 他 们 发 现 , 虽 然 叶 绿 体 基因 型 有 某 些 大 尺度 的 地 理 变
异 , 在 同一 地 点 一 起 生长 的 物种 (包括 常 绿 的 和 落叶 的 ) 却 经 常 地 具有 相同 的 叶绿体 基因 型 。 一 个 种
在 不 同 的 地 点 具有 不 同 的 叶绿体 基因 型 ,而 细胞 核 核 糖 体 的 标记 则 显示 了 一 种 分 布 格局 与 所 期 望 的
物种 界线 (boundaries) 是 一 致 的 。 他 们 在 叶绿体 核 DNA 中 观察 到 的 地 理 变 异 和 明显 的 基因 流 的 极 明
显 的 悬殊 差别 的 格局 , 强调 了 在 依据 由 细胞 器 得 来 的 数据 解释 种 群 或 类 群 界 线 时 要 特别 谨慎 ( Pami-
lo #l Nei, 1988).
3.6 物种 的 鉴定
总 DNA 的 提取 物 间 杂交 的 程度 已 被 广泛 地 作为 一 种 方法 用 来 估 测 物种 间 的 亲缘 关系 。 特 别 是
在 原核 生物 之 间 , 当 一 些 生 物 具 90% 或 以 上 的 杂交 值 时 ,这 种 方法 就 用 来 把 它们 粗 粗 定 为 物种
(Woese 1987)。 然 而 ,这 种 方法 的 分 辨 率 和 分 类 学 范围 经 常 是 低 的 ,需要 作 比 较 就 要 求 有 大 量 的
DNA,
物种 特异 性 探 针 在 研究 宿主 一 媒介 (vector) 一 寄生 物 系统 中 特别 有 用 。Kukla 等 (1987) 使 用 包含
有 重复 序列 的 放射 活性 标记 的 限制 片段 克隆 , 鉴定 了 采 采 蝇 组 织 中 锥 虫 的 种 和 亚 种 。 他 们 发 展 了 一
种 应 用 于 野外 的 方法 ,将 分 离 的 蝇 腹 部 整个 地 放 在 尼龙 膜 上 与 标记 的 探 针 杂交 ,就 能 确认 和 鉴定 肠 锥
虫 . 通 过 筛选 _ 个 基因 文库 ,Harnett 等 (1989) 发 现 并 测定 了 一 朝 核 背 酸 探 针 的 序列 , 它 能 区 别 引起 人
类 河 盲 症 (river blindness) 的 一 种 线虫 Onchocerca volvulus 和 形态 上 相似 但 不 是 病原 体 的 另外 一 个
Onchocerca Ff , E, {1148 # ZE [Fl FE AY HA Cblackfly ) #E dP _E 。
Persing 等 (1990) 应 用 包 柔 氏 螺 旋 体 (Boela) 特 异性 引物 和 PCR & DEF TED Te BE tr ASE HP AY
症状 DNA 片段 ,表明 Lyme 疾病 的 临床 发 现 至 少 30 年 前 就 已 经 在 美国 存在 了 。.Lyme 病原 体 Borrelia
burgdorferi 另外 一 随机 克隆 的 序列 分 析 , 能 够 帮助 设计 PCR 引物 ,以 此 把 北美 类 型 与 欧洲 和 亚洲 隔
。187。
离 类 型 分 辩 开 (Rosa 等 1991 ) 。
Goff 等 (1988) 应 用 探 针 研 究 Anaplasma marginde 表面 蛋白 基因 ,检测 了 峰 与 牛 被 传染 的 频率 。
由 此 可 监测 宿主 携带 状态 、 疾 病 传 染 方式 和 地 方 性 兽 病 区 蝗 传 染 的 流行 。Rowan 和 Powers(1991) 测
定 了 由 22 个 海洋 动物 宿主 类 群 上 取得 的 131 个 个 体 隔 离 群 的 单 细 胞 藻类 共生 体 的 rDNA A) WBE
段 序 列 。 系 统 发 育 上 远 缘 的 宿主 上 发 现 了 近 缘 的 藻类 。 这 种 折 囊 的 和 如 此 广 的 分 布 区 对 营 类 共生 体
来 说 ,是 一 种 结合 的 群 聚 模式 , 这 种 模式 与 某 些 动物 寄生 物 的 分 化 历史 有 时 同 宿主 一 致 的 情况 是 十
分 不 一 样 的 (Page 1990).
DNA 分 析 可 以 进行 血液 寄生 节肢 动物 的 寄主 的 分 类 。 为 更 好 地 说 明 这 种 方法 的 潜力 ,Coulson 等
《1990) 应 用 单位 点 小 卫星 指纹 分 析 蚊 子 的 肠子 内 含 物 ,得 到 了 被 这 种 蚊 叮 过 的 人 的 基因 型 。
7 和 区 地
生态 学 家 之 所 以 对 系统 学 感 兴趣 ,是 考虑 到 去 识别 特殊 的 物种 以 及 对 物种 间 进 化 关系 的 理解 。 分
子 技术 可 广泛 地 应 用 于 系统 学 的 研究 ,这 个 领域 已 广泛 地 评述 过 了 (Hillis 和 Moritz 1990,Hewitt 等
1991; 表 中 的 实例 )。 实 际 上 , 任何 客观 的 .基于 遗传 的 特性 都 具有 可 为 分 类 学 提供 资料 的 意义 ,不 同
方法 的 价值 将 按 所 研究 的 群体 内 遗传 多 样 性 的 大 小 而 不 同 。 尽 管 由 DNA 一 DNA 杂交 提供 的 表 型 性
的 方法 成 功 地 应 用 着 (特别 是 在 鸟 类 中 ;Sibley 和 Ahlquist 1990);DNA 序列 的 系统 发 育 分 析 被 看 好 ,
而 且 现 在 由 于 PCR 的 发 明 而 使 之 变 得 更 加 可 行 。 在 这 之 前 ,只 有 核糖 体 RNA 基因 能 测序 到 值得 注
意 的 程度 (Woese 1987 ,Hillis 和 Dixon 1991).
应 用 PCR 的 首次 研究 为 测定 mtDNA 序列 而 研究 了 通用 引物 的 特性 (Kocher 等 1989)。 例 如 ,
Richman 和 Price(1992) 应 用 这 样 的 引物 ,从 8 个 Phylloscopus 鸣 禽 同 地 种 ,得 到 了 具有 910 个 碱 基于
的 线粒体 细胞 色素 b 序列 , 建立 了 这 些 群 体 的 系统 发 育 。 支 持 这 些 物种 的 形态 学 、 取 食 行为 和 生态
学 适应 解释 的 一 个 比较 分 析 中 ,系统 发 育 被 用 来 核实 共同 祖先 的 影响 。
物种 的 分 类 与 保护 特别 有 关系 ,这 一 点 已 被 一 系列 mtDNA 变异 的 研究 结果 所 强调 过 ,在 设想 是
分 离 的 小 地 鼠 (Learn 等 1982) 和 海滨 麻雀 (Avise 和 Nelson 1989) 的 物种 或 亚 种 间 , 在 可 能 是 杂种 起
源 的 红 狼 (Wayne 和 Jenks 1991) 以 及 被 外 源 基 因 渐 渗 的 濒危 的 美洲 独 和 灰 狼 种 群 ( 见 O'Brien 和
Mayr 1991) 中 ,都 见 不 到 有 mtDNA 明显 的 分 化 。 通 过 使 用 PCR 对 红 狼 标本 的 分 析 ,排除 了 杂交 是 最
近 发 生 的 可 能 性 .分 子 系统 学 也 用 来 揭示 这 样 的 事例 一 一 不 同 的 分 类 群 可 被 归并 为 一 个 种 ,特别 是 在
形态 上 保守 的 谱系 中 (Daugherty 等 1990) 。
3.8 群落 多 样 性
多 个 rDNA 小 亚 基 序 列 的 同时 扩 增 提供 了 一 个 检测 微生物 自然 多 样 性 的 有 用 方法 。Giovannoni
等 (1990) 把 从 浮游 细菌 的 自然 种 群 得 到 的 16s rRNA 基因 扩 增 部 分 的 克隆 测 了 序 。 经 过 培养 ,增加 了
可 检测 的 多 样 性 ,一 些 以 前 未 知 的 分 类 群 既 在 系统 发 育 上 是 分 离 的 ,又 是 微生物 群落 中 在 数量 上 重
要 的 成 员 。
Ward 等 (1990) 简 单 地 检测 了 一 陆地 温泉 中 蓝藻 细菌 从 中 微生物 物种 的 组 成 。 用 一 保守 的 寡 核
苷 酸 引 物 ,他 们 通过 从 环境 样品 中 取得 的 16s rRNA 合成 了 DNA。 经 过 克隆 和 测序 ,并 与 来 自 相 似 生
境 培养 的 有 机 体 的 16s rRNA 序列 相 比较 后 发 现 ,所 检测 的 8 个 序列 类 型 没有 一 个 同 这 一 地 点 以 前
CAN 14 种 生物 相 一 致 。 这 清楚 地 表明 ,分 子 工 具 可 以 揭示 出 微生物 群落 中 从 前 未 检测 出 的 多 样 性 ,
而 且 新 生物 体 的 检测 并 不 限于 稀有 类 和 群 。
DNA 水 平 变 异 的 程度 和 类 型 ,特别 是 在 物种 内 ,只 是 最 近 才 为 人 所 知 。 新 技术 特别 是 PCR 的 发
明 ,使 得 检测 这 类 变异 变 得 容易 起 来 。 一 般 来 讲 , 以 PCR 为 基础 的 方法 已 经 成 为 并 且 将 来 仍 是 我 们 所
选择 的 研究 方法 。
- 188 °
出 于 对 一 些 有 利 因素 的 考虑 ,mtDNA 已 经 成 为 在 DNA( 限 制 片段 ) 水 平 上 研究 不 同 种 群 的 通用
信息 源 ( 见 Hillis 和 Moritz 1990) 。 这 延伸 了 由 了 PCR 获得 序列 数据 的 情况 ,原因 可 能 是 由 于 mtDNA 分
子 具 有 比 核 DNA FIBA HN BER BR; Mt mtDNA 一 些 区 域 的 了 解 和 高 度 不 同 的 进化 速率 ;
“通用 ?引物 的 可 用 性 (Kocher 等 1989) 以 及 线粒体 基因 组 的 单 倍 性 。 最 后 一 点 避免 了 在 双 倍 体 核 基因
组 中 潜在 的 问题 ,也 避免 了 测定 单 模 标本 的 序列 (Kreitman 1991)。 通 常 核 标记 也 是 可 行 的 (Pamilo 和
Nei 1988) ,虽然 在 这 里 经 常用 到 “等 位 酶 ,而 DNA 标记 在 确定 变异 程度 时 能 提供 更 大 的 灵活 性 。 由
于 物种 内 典型 的 核 苷 酸 多 态 性 水 平 是 1% 或 更 小 (Kreitman 1991) ,对 生态 学 家 来 说 ,样品 的 大 量 序列
分 析 一 般 不 是 最 适合 的 方法 .于 是 ,我 们 转向 更 简捷 的 方法 ,例如 ,应 用 DGGE , 寡 核 苷 酸 探 针 ,限制 性
酶 切片 段 ,或 者 对 已 测序 的 多 态 区 中 的 PCR 产物 的 简单 的 大 小 测度 。
虽然 这 些 技 术 变 的 易于 掌握 ,但 它们 的 成 功 应 用 仍 需要 很 多 的 脑力 劳动 , 而 且 生 态 学 家 要 注意 ,
不 要 陷 人 只 把 实验 室 工 作 看 作 简单 技术 活动 的 错误 之 中 。 最 后 ,分 子 方 法 在 生态 学 过 程 研究 中 的 应
用 ,将 是 由 不 辞 辛劳 ,互相 了 解 对 方 优 缺 点 的 科学 家 们 将 野外 和 实验 室 工作 巧妙 结合 的 结果 。
参考 文献
Abrahamson, W.G. ,Whitham, T.G. & Price, P. W. ( 1989) . Fads inccology. BioScience, 39,321—325.
Armour, J. A. L. ,Povey,S. ,Jeremiah, S. & Jeffreys, A. J. (1990). Systematic cloning of human minisatellites from ordered array charo-
mid libraries. Genomics, 8, 501—502.
Arnheim,N. , Li ,H. & Cui, X. (1990). PCR analysis of DNA sequences in single cells ; single sperm gene mapping and genetic disease di-
agnosis. Genomics, 8, 415—419.
Arnold, M. L. , Buckner, C. M. & Robinson, J. J. ( 1991) . Pollen mediated introgression and hybrid speciation in Louisiana irises. Pro-
ceedings of the National Academy of Sciences, USA, 88, 1398—1402
Arntzen, J. W. &. Wallis, G. P. (1991). Restricted gene flow in a moving hybrid zone of the newts Triturus cristatus and T. marmoratus in
western France. Evolution, 45 ,805— 826.
Avise,J. C & Nelson, W. S(1989). Molecular relationships of the extinct dusky scaside sparrow. Science , 243 ,646—648.
Avise, J.C. ,Arnold, R. M. ,Ball,E. , Bermingham, T. , Lamb, G.E. , Neigel, C. A. , Reeb, C. A. & Saunders, N. C. (1987). In-
traspecific phylogeography: the mitochondrial bridge betwwen population genetics and systematics. Annual Review of Ecology and Sys-
tematics, 18, 489—522
Baker, C. S. , Palumbi, S. R, , Lambertsen, R. H. , Weinrich, M. T. , Calambokidis, J. & O’Brien, S. J. (1990) . Influence of seasonal
migration on geographical distribution of mitochondrial DNA haplotypes in humpback whales. Nature, 344, 238—240.
Baker, R. J. , Davis , S. K. , Bradley, R.D,. Hamilton, M. J. & Van Den Bussche, R. A. (1989) . Ribosomal-DNA, mitochondrial-
DNA, chromosomal, and allozymic studies on a contact zone in the pocket gopher, Geomys. Evolution, 43, 63—75.
Balazs, I. , Neuweiler, J. , Gunn, P. , Kidd, K. K. , Kuhl, J. & Mingjun, L. (1992). Human population genetic studies using hypervari-
able loci. Genetics, 131, 191—198.
Birkhead, T. R. & Moller, A. P. ( 1992) . Sperm Competition in Birds. Academic Press, London, UK.
Birkhead, T.R. , Burke , T. , Zann, R. , Hunter, F.M. & Krupa, A. P. (1990). Extra-pair paternity and intraspecific brood parasitism
in wild zebra finches, Taeniopygia guttata, revealed by DNA fingerprinting. Behavioural Ecology and Sociobiology, 27, 315—324.
Brookfield, J. F. Y. ( 1992) . DNA fingerprinting in clonal organisms. Molecular Ecology, 1,21—26.
Bruford , M. W. , Hanotte, O. , Brookfield, J. F. Y. & Burke, T. (1992) . Single locus and multilocus DNA fingerprinting. Molecular
Genetic Analysis of Populations: A Practical Approach (Ed. by A. R. Hocelzel), pp. 225—269. IRL Press, Oxford, UK.
Bruns, T.D. , White, T. J. & Taylor, J. W. (1991). Fungal molecular systematics. Annual Review of Ecology and Systematics, 22,
525—564
Burke, T. (1989). DNA fingerprinting and other methods for the study of mating success. Trends in Ecology and Evolution, 4, 139—
144,
Burke, T. & Bruford, M. W. (1987). DNA fingerprinting in birds. Nature, 327, 149—152.
Burke, T. . Davies, N. B. , Bruford, M. W. & Hatchwell, B. J. (1989) . Parental care and mating behaviour of polyandrous dunnocks
Prunella modularis related to paternity by DNA fingerprinting. Nature, 338, 249—251.
Burke, T. , Dolf, G. , Jeffreys, A.J. & Wolff, R. ( Eds) ( 199la) . DNA Fingerprinting: Approaches and Applications. Birkhauser,
Basel, Switzerland.
Burke, T. , Hanotte, O. , Bruford, M. W. & Cairns, E. ( 1991b) . Multilocus and single locus minisatellite analysis in population bio-
logical studies. DNA Fingerprinting: Approaches and Applications (Ed. by T. Burke,G. Dolf, A. J. Jeffreys & R. Wolff), pp. 154—
。 189 «
168. Birkhauser, Basel, Switzerland.
Carvalho, G. R. , Maclean, N. , Wratton, S.D., Carter, R. E. & Thurston, J. P. (1991). Differentiation of aphid clones using DNA
fingerprinting from individual aphids. Proceedings of the Royal Society of London, B. 243, 109—114.
Coulson , R.M. R., Curtis, C.F. , Ready, P. D., Hill, N. & Smith, D. (1990). Amplification and analysis of human DNA present in
mosquito bloodmeals. Medical and Veterinary Entomology, 4, 357—366.
Dallas, J. F. (1988). Detection of DNA fingerprints of cultivated rice by hybridization with a human minisatellite probe. Proceedings of the
National Academy of Sciences, USA, 85, 6831—6835.
Daugherty, C.H. , Cree, A. , Hay, J. M. & Thompson, A. M. B. (1990) . Neglected taxonomy and continuing extinctions of tuatara
(Sphenodon). Nature, 347,177—179.
Davies ,N B. , Hatachwell, B. J. , Robson, T. & Burke, T. (1992). Paternity and parental effort in dunnocks Prunella modularis: how
good are male chick-feeding rules? Animal Behaviour, 43, 729—745.
Fisher, R. A. (1930). The Genetical Theory of Natural Selection. Clarendon Press, Oxford, UK.
Gardes, M. , White, T. J. , Fortin, J. A. Bruns, T. D.& Taylor, J. W. (1991).. Identification of indigenous and introduced symbiotic
fungi in ectomycorrhizae by amplification of nuclear and mitochondrial ribosomal DNA. Canadian Journal of Botany, 69, 180—190.
Gibbs, H. L. , Weatherhead, P. J. , Boag, P. T. , White, B. N. , Tabak, L.M. & Hoysak, D. J. ( 1990) . Realized RS success
of polygynous red-winged blackbirds revealed by DNA markers. Science,250, 1394—1397.
Gilbert, D. A. , Lehman, N., O'Brien, S.J. & Wayne, R. K. (1990). Genetic fingerprinting reflects population differeneiias in the
California Channel Island fox. Nature ,344,764—767. _
RS J. ,Britschgi, T. B. ,Moyer,C. L. & Field, K. G. (1990). Genetic diversity in Sargasso Sea bacterioplankton. Nature, 345,
60—63. 证。
Goff, L. J. & Coleman, A. W. (1988). The use of plastid DNA restriction endonuclease patterns in delineating red algal species and pop-
ulations. Journal of Phycology, 24,357—368. a
Goff, W. , Barbet, A., Stiller, D., Palmer, G. , Knowles, D. , Kocan, K., Gorham,J. & Meguire, T. ( 1988) . Detection of ,
Anaplasma marginale-infected tick vectors by using a cloned DNA probe. Proceedings of the National Academy of Sciences, USA, 85,
919923. '
Gowaty , P. A. & Droge, D. L. (1991). Sex ratio confiliet and the evolution of sex-biased provisioning in birds. Acta XX Congressus In-
ternationalis Ornithologici, I1,932—945.
Greer, C. E., Lund, J. K. & Manos, M. M. (1991). PCR amplification of paraffinembedded tissues: recommendations on fixatives for
long term storage and prospective studies. PCR Methods and Applications, I, 46—50. '
Griffiths, R. ( 1991) . The isolation of conserved DNA sequences related to the human sexdetermining region Y gene from the lesser
black-backed gull( Larus fuscus) . Proceedings of the Royal Society of London, B, 244,123—128. -
Griffiths, R. & Holland, P. (1990). A novel avian W chromosome DNA repeat sequenee in the lesser black-backed gull(Larus fuscus).
Chromosoma, 99, 243—250.
Gubbay, J. , Collignon, J. , Koopman, P. , Capel, B. , Economou, A. , Munsterberg, A. , Vivian, N. , Goodfellow, P. & Lovell-
Badge, R> (1990). A gene mapping to the sexdetermining regions of the mouse Y chromosome is a member of a novel family of em-
bryonically expressed genes. Nature, 346, 245—250.
Hadrys, H. , Ballick, M. & Schierwater, B. ( 1992). Applications of random amplified polymorphic DNA in molecular ecology. Molecu-
lar Ecology , I, 55—63.
Hagelberg, E. , Sykes, B. & Hedges, R. (1989). Ancient bone Dna amplified. Nature, 342—485.
Hanotte,O. ,Burke,T. ,Armour,J. A. L. & Jeffreys, A. J. (1991b). 外 and evolution of Indian peafowl Pavo crista-
tus minisatellite loci. DNA Fingerprinting: Approaches and Applications (Ed. by T. Burke,G. Dolf,A. J. Jeffreys & R. Wolff) ,pp. 193—
216. Birkhauser , Basel , Switzerland.
Hanotte, O., Burke, T., Armour, J. A. L. & Jeffreys, A. J. (1991a). Hypervariable minisatellite DNA sequences in the Indian
peafowl Pavo cristatus. Genomics, 9, 587—597.
Hanotte, O. , Cairns, E., Robson, T., Double, M. & Burke, T. (1992) . Cross-species hybridization of a single locus minisatellite
probe in passerine birds. Molecular Ecology, I, 127—130.
Harnett, W., Chambers, A. E., Renz, A. & Parkhouse, R. M. E. (1989). An oligonucleotide specific for Onchocerca volvulus.
Molecular and Biochemical Parasitology, 28, 77—84.
Harrison, R. G. (1989). Animal mitochondrial DNA as a genetic marker in population and evolutionary biology. Trends in Ecology and
Evolution, 4, 6—11.
Hayashi, K. (1991) . PCR-SSCP: A simple and sensitive method for detection of mutations in the genomic DNA. PCR Methods and Ap-
plications, 1, 34—38.
Helm-Bychowski, K. M. & Wilson, A. C. ( 1986) . Rates of nuclear DNA evolution in pheasant-like birds; evidence from restriction
e150
maps. Proceedings of the National Academy of Sciences, USA,83, 688—692.
Hewitt, G. M., Johnston, A. W. B. & Young, J. P. W. ( Eds) ( 1991) . Molecular Techniques in Taxonomy. Springer Verlag,
Berlin, Germany.
Higuchi, R. , von Beroldingen, C. H. , Sensabaugh, G. F. & Erlich, H. A. (1988). DNA typing from single hairs. Nature, 332, 543
— 546.
Hillis, D. M. & Dixon, M. T. (1991) . Ribosomal DNA; molecular evolution and phylogenetic inference. Quarterly Review of Biolo-
gy, 66, 411—453.
Hillis , D. M. & Moritz, C. (Eds)( 1990) . Molecular Systematics. Sinauer, Sunderland, MA, USA.
Hoelzel, A. R. (Ed. ) (1992) . Molecular Genetic Analysis of Populations; A Practical Approach. IRL Press, Oxford, UK.
Innis, M. A. , Gelfand, D. H. , Sninsky, J. J. & White, T. J. (Eds) ( 1990) . PCR Protocols: A Guide to Methods and Applications. A-
cademic Press, New York, NY, USA.
Ito K. (1992). Nearly complete loss of nucleic acids by commercially available highly purified ethanol. Biotechniques 12, 69—70.
Jeffreys, A.J. , Wilson, V. & Thein, S.L. ( 1985a) . Hypervariable 'minisatellite’ regions in human DNA. Nature, 314, 67—73.
Jeffreys, A.J. ,Wilson, V. & Thein, S. L. (1985b). Individual-specific ‘fingerprints’ of human DNA. Nature, 316, 76—79.
Jones, C.S. , Lessells, C.M. & Krebs, J. R. (1991). Helpers-at-the-nest in European beecaters (Merops apiaster) a genefic analysis,
DNA Fingerprinting; Approaches and Applications ( Ed. by T. Burke, G. Dolf, A.J. Jeffreys & R. Wolff),pp. 169—192. Birkha
“user, Basel, Switzerland.
Kocher, T. D. , Thomas, W. K. , Meyer, A. , Edwards, S. V. , Paabo,S. , Villablanca, F. X. & Wilson, A. C. (1989) . Dynamics of
mitochondrial evolution in animals; amplification and sequencing with conserved primers. Proceedings of the National Academy of Sci-
ences, USA, 86, 6196—6200.
Kreitman, M. ( 1983) . Nucleotide polymorphism at the alcohol dehydrogenase locus of Drosophila melanogaster. Nature, 304, 412—
417. \
Kreitman, M. (1991). Variation at the DNA level: something for everyone. Molecular Techniques in Taxonomy (Ed. by G. M. Hewitt,
A. W. B. Johnston & J. P. W. Young) , pp. 15—32. Springer Verlag, Berlin, Germany.
Kukla, B. A. , Majiwa, P. A. O. , Young,J.R. ,Moloo, S. K. & ole-Moiyoi, O. (1987). Uses of species-specific DNA probes for de-
tection and identification of trypanosome infection in tsetse flies. Parasitology, 95, 1—16.
Laerm, J., Avise, J. C., Patton, J. C. & Lansman, R. A. (1982). Genetic determination of the status of an endangered specics of
pocket gopher in Georgia. Journal of Wildlife Management, 46, 513—518.
Learn, Jr. G. H. & Schaal, B. A. ( 1987) . Population subdivision for ribosomal repeat variants in Clematis fremontii, Evolution, 41,
433—438.
Lee, J. S. (1991). Alternative dideoxy sequencing of double-stranded DNA by cyclic reactions using Taq polymerase. DNA and Cell Biolo-
gy, 10, 67—73.
Lessa, E. P. ( 1992). 有 of DNA sequence variation at the population level by PCR and denaturing gradient gel electrophoresis.
Methods in Enzymology (in press).
Lucchini, G. M. & Altwegg, M. (1992). Ribosomal-RNA gene restriction patterns as taxonomic tools for the genus Aeromonas. Inter-
national Journal of Systematic Bacteriology, 42, 384—389.
McDonald,B. A. & Martinez,J. P. (1990). DNA restriction fragment leugth polymorphisms among Mycosphaerella graminicola isolates col-
lected from a single wheat field. Phytopathology ,80,1368— 1373.
Moritz, C. , Dowling, T. E. & Brown, W. M. (1987). Evolution of animal mitochondrial DNA; relevance for population biology and ,
" systematics. Annual Review of Ecology and Systematics,18, 269—292.
Mullis, K. B. &. Faloona, F. A. (1987). Specific synthesis of DNA in vitro via a polymerase catalysed chain reaction. Methods in Enzy-
mology, 55, 335—350.
Myers, R. M., Sheffield, V. C. & Cox, D. R. (1989). Mutation detection by PCR, GC-clamps and denaturing gradient gel elec-
trophoresis. PCR Technology: Principles and Applications for DNA Amplification(Ed. by H. A. Erlich), pp. 71—88. Stockton
Press, New York, NY, USA.
Nybom, H. & Schaal, B. A. (1990). DNA'fingerprints’ reveal genotypic distributions in natural populations of blackberries and raspber-
ries(Rubus, Rosaceae) American Jouranl of Botany, 77, 883—888.
O’Brien, S.J. & Mayr, E. ( 1991) . Bureaucratic mischief: recognizing endangered species and subspecies. Science, 251, 1187—1188.
Olson, R. R. , Runstadler, J. A. & Kocher, T. D. ( 1991) . Whose larvae? Nature, 351.
Packer, C. , Gilbert, D. A. , Pusey, A. E. & O’Brien, S. J. (1991). A molecular genetic analysis of kinship and cooperation in African
lions. Nature, 352, 562—565.
Page, R. D. M. (1990). Temporal congruence and cladistic analysis of biogeography and cospeciation. Systematic Zoology, 39, 205—
226.
* For
Palmer, J. D. (1987). Chloroplast DNA evolution and biosystematic uses of chloroplast DNA variation. American Naturalist, 140, S6—
S29.
Pamilo, P. & Nei, M. (1988). Relationships between gene trees and species trees. Molecular Biology and Evolution, 5, 568—583.
. Parker, J. S., Birkhead, T. R. , Joshua, S.K., Taylor, S. & Clark,M. S. (1991). Sex ratio in a population of guillemots Uria aalge de-
termined by chromosome analysis. Ibis,133,423—424.
Persing, D. H. , Telford, I S.R. ,Rys,P. N. ,Dodge,D. E. ,White, T. J. , Malawista, S. E. & Spielman, A. (1990). Detection of Borre-
lia burgdorferi DNA in museum specimens of Ixodes dammini ticks. Science, 249, 1420—1423.
Quinn, T. W. & White, B. N. (1987). Identification of restriction-fragment length polymorphisms in genomic DNA of the lesser snow
goose( Anser caerulescens) . Molecular Biology and Evolution, 4, 126—143.
Quinn, T. W. , Cooke, F. & White, B. N. (1990). Molecular sexing of geese using a cloned Z chromosomal sequence with homology to
the W chromosome. Auk, 107, 199—202
Quinn, T. W. , Quinn ,J.S. , Cooke, F. & White, B. N. (1987) . DNAmarker analysis detects multiple maternity and paternity in sin-
gle broods of the lesser snow goose(Anser caerulescens). Nature, 326, 392—394.
Rabenold, P. P. , Piper , W.H., Decker, M. D. & Minchella, D. J. ( 1991) . Polymorphic minisatellite amplified on avian W chromo-
some. Genome, 34, 489—493.
Rabenold, P. P. , Rabenold, K. N. , Piper, W. H. , Haydock, J. & Zack, S. W. (1990). Shared paternity revealed by genetic analysis in
cooperatively breeding tropical wrens. Nature, 348, 538—540.
Rassmann, K. , Schlutterer , C. & Tautz, D. (1991). Isolation of simple sequence loci for use in polymerase chain reaction-based DNA
fingerprinting. Electrophoresis, 12, 113—118. ,
Raymond, M., Callaghan, A., Fort, P. & Pasteur, N. ( 1991) . Worldwide migration of amplified insecticide resistance genes in
mosquitoes. Nature, 350, 151—153. ;
Richman, A.D. & Price, T. ( 1992) . Evolution of ecological differences in the Old World leaf warblers ; roles of history and adaptation.
Nature, 355, 817—821.
Riesner, D. , Steger, R. , Zimmat, R. , Owens, R. A. , Wagenhofer, M. , Hillen, W. , Vollbach, S. & Henco, K. ( 1989). Tem-
perature- gradient gel electrophoresis of nucleic acids; Analysis of conformational transitions, sequence variations and protein-nucleic acid
interactions. Electrophoresis, IO, 377—389.
Rogstad, S. H. Surveying plant genomes for VNTR loci. Molecular Evolution; Producing the Biochemical Data( Ed. by E. A. Zimmer,
T.J. White, R.L. Cann, & A. C. Wilson). Academic Press, San Diego, CA, USA (in press).
Rosa, P. A. , Hogan, D. & Schwan, T. G. (1991). Polymerase chain reaction analyses identify two distinct classes of Borrelia burgdor-
feri. Journal of Clinical Microbiology, 29, 524—532.
Rowan, R. & Powers, D. ( 1991) . A molecular genetic classification of zooxanthellae and the evolution of animal algal symbioses. Sci-
ence, 251, 1348—1351.
Saiki, R. K. , Gelfand, D. H. , Stoffel, S., Scharf, S. J. Higuchi, R., Horn, G. T., Mullis, K. B. & Erlich, H. A. (1988).
Primer-directed enzymatic amplification of DNA with a thermostable DNA polymerase. Science, 239, 487—491.
Schafer, R. , Zischler, H. , Birsner, U. , Becker, A. & Epplen, J. T. (1988). Optimized oligonucleotide probes for DNA fingerprinting.
Electrophoresis, 9, 369—374. '
Schlotterer, C. , Amos, B. & Tautz, D. (1991) . Conservation of polymorphic simple sequcnce date in ceacean species. Nature, 354, 63
—65-
Seutin, G. , White, B. N. & Boag, P. T. (1990) . Preservation of avian blood and tissues for DNA analyses. Canadian Journal of Zoolo-
gy. 69, 82—90.
Sibley, C. J. & Ahlquist, J. E. (1990) . Phylogeny and Classification of Birds; A study in Molecular Evolution. Yale University Press,
New Haven, CT, USA.
Sinclair, A. H., Berta, P. , Palmer , M. S., Hawkins, J. R., Griffiths, B. , Smith, M.J., Foster, J. W. ,Frischauf, A. M.,
Lovell-Badge, R. , Goodfellow, P. N. (1990). A gene from the human sex-determining regions encodes a protein with homology to a
conserved DNA-binding motif. Nature, 346, 240—244.
Smith, L. J. , Braylan, R.C. , Nutkis, J. E. , Edmundsen, K. B. , Downing, J. R. & Wakeland , E. K. (1987). Extraction of cellu-
lar DNA from human cells and tissues fixed in ethanol. Analytical Biochemistry, 160, 135—138.
Soltis, P. S., Soltis, D: E. & Doyle, J. J. ( 1992) . Plant Molecular Systematics. Chapman &. Hall, London, UK.
Taberlet, P. & Bouvet, J. (1991). A single plucked feather as a source of DNA for bird genctic studies. Auk, 108, 959—960.
Taberlet, P. , Gielly, L. , Pautou, G. & Bouvet, J. (1991) . Universal primers for amplification of three non-coding regions of chloro-
plast DNA. Plant Molecular Biology, 17, 1105—1109.
Taggart, J. B. & Ferguson, A. (1990). Minisatellite DNA fingerprints of salmonid fishes . Animal Genetics, 21, 377—389.
Tautz, D. (1989). Hypervariability of simple sequences as a general source for polymorphic DNA markers. Nucleic Acids Research, 17,
« T9Z'*
6463 一 6471.
Templeton, A. R. (1992) . Human origins and analysis of mitochondrial DNA sequences. Science, 255,737.
Thomas, R. H. & Hunt, J. A. (1991). The molecular evolution of the alcohol dehydrogenase locus and the phylogeny of Hawaiian
Drosophila. Molecular Biology and Evolution, 8, 687—702.
Thomas, R. H. , Schaffner, W. , Wilson, A. C. & paabo, S. V. (1989). DNA phylogeny of the extinct marsupial wolf. Nature, 340,
465— 467.
Thomas, W. K. , Paabo, S. , Villablanca, F. X. & Wilson, A. C. (1990). Spatial and temporal continuity of kangaroo rat populations
shown by sequencing mitochondrial DNA from museum specimens. Journal of Molecular Evolution, 31,101—112.
Trivers,R. L. & Willard,D. E. (1973). Natural selection of parental ability to vary the sex ratio of offspring. Science, 179,90—92.
Turner, B. J. ,Elder,J. F. Jr, Laughlin, T. F. & Davis, W. P. (1990) Genetic variation in clonal vertebrates detected by simple-sequence
DNAfingerprinting. Proceedings of the National Academy of Sciences. USA, 87, 5653—5657.
Vigilant, L. , Stoneking, M. , Harpending, H. , Hawkes, K. & Wilson, A. C. (1991) . African populations and the evolution of hu-
man mitochondrial DNA. Science, 253, 1503—1507.
Ward, D. M., Weller, R. & Bateson, M. M. (1990). 16S rRNA sequences reveal numerous uncultured mieroorganism in a natural
community. Nature, 345, 63—65.
Wayne, R. k. & Jenks, S. M. (1991). Mitochondrial DNA analysis implying extensive hybridization of the endangered red wolf Canis
rufus. Nature,351, 565—568.
Welsh, J. , Pretzman, C. , Postic, D. , Saint Girons, I. , Baranton, G. & McClelland, M. (1992). Genomic fingerprinting by arbitrar-
ily primed polymerase chain reaction resolves Borrelia burgdorferi into three distinet phylogenetic groups. International Journal of Sys-
tematic Bacteriology, 42, 370—377.
Whittemore, A. T. & Schaal, B. A. (1991). Interspecific gene flow in sympatric oaks. Proceedings of the National Academy of Sci-
ences, USA, 88, 2540—2544.
Williams, J. G. K. , Kubelik, A. R. , Livak, K. J. , Rafalski , J. A. & Tingey, S. V. (1990). DNA polymorphisms amplified by arbi-
trary primers are useful as genetic markers. Nucleic Acids Research, 18, 6531—6535.
Williams, S. M. & Strobeck, C. (1986). Measuring the multiple insemination frequency of Drosophila in nature: use of a Y-linked molec-
ular marker. Evolution, 40, 440—442.
Winship, P.R. ( 1989) . An improved method for directly sequencing PCR amplified material using dimethyl sulphoxide. Nucleic Acids
Research, 17, 1266.
Woese, C. (1987). Bacterial evolution. Microbiological Reviews, 51, 221—271.
Wong, Z. , Wilson, V., Patel, I. , Povey, S. , Jeffreys, A. J. ( 1987) . Characterization of highly variable minisatellites cloned from
human DNA. Annals of Human 人 51,269 一 288.
( 魏 伟 译 自 工 .Burke,W. E. Reiney and T. J. White, 1992, Molecular Variation and Ecological
Problems, in R. J. Berry, T. J. Crawford & G. M. IIewitt (eds. ) (Genes in Ecology) 229—254,
Oxford: Blackwell Scientific Publications 钱 迎 倩 校 )
* 193 =
* <)
To
77
a f Ad
, Loe egy v if
7 5 joula mar e
a ‘(be
‘wa wre
“ive 'W bhi
1 ii a
f 4,47 "
‘ * wy 4 a.
‘ iJ
4 | YI
rym pMSTOR?
9 , 7 . “ ni
ABT 4's
o 4 sw 是
wey 4 7
vi 7 Capa “sa
是 Et
ald 4
ro Stet aikis ‘
‘ ? ¥ q le iw
- istics "
th 2 aw 】
厅 是 WW
AVAL anata os
} ’ J
i ‘
=? )
本
人
dor
a
, Dj )
~~ unl
. * “1 出
7
‘ |
4
\
ep
2000 年 系统 学 议程 :制订 生物 圈 计 划
一 全 世界 物种 的 发 现 、 描 述 和 分 类 的 全 球 计划 技术 报告
美国 植物 分 类 学 家 学 会 .系统 生物 学 家 学 会 .Willi Hennig 学 会 和 系统 学 标本 馆 联 侣 会
组 成 的 联合 体
Systematics Agenda 2000 :Charting the Biosphere
A Global Initiative to Discovery ,Describe and Classify the World’ s Species
the American Society of Plant Taxonomists,the Society of Systematic Biologists and
the Willi Hennig Society in cooperation with the Association of Systematics Collections, 1994
人 类 健康 …
物种 经 济 学 …
林业 ………
渔业 … sees oe ee cee cee cen cee cen ces cence cesses ces ceesesseses
了 解 和 保护 地 球 的 生命 支持 系统 …
提高 日 常生 活 的 质量 …
加 强 科学 研究 …
2000 年 系统 学 议程 的 任务 … has nds kklaenoeeaiecce eee
第 一 项 任务 :全 球 物种 多 样 性 的 发 现 ,描述 和 编目 …
第 二 项 任务 :分 析 这 个 全 球 发 现 计 划 获 得 的 信息 ,并 将 其 融合 于
一 个 能 反映 生命 史 的 预测 性 分 类 系统 …
第 三 项 任务 :把 这 个 全 球 计划 获得 的 信息 整理 成 为 一 种 有 效 的 .可 查询 的 形式 ,
以 最 大 限度 地 满足 科学 和 社会 的 需求 …
迎接 挑战 :基础 设施 与 人 才 资 源 -
建立 和 加 强 系 统 学 研究 中 心 及 标本 收藏 站 pp
教育 .培训 及 人 才 资 源 开 发 .pe
216》
oo
ee soossesssseosssosoosssoosssoossosoooooovosoossoooeossossoesoosoooeoesossosoosoos sse sse C2185
* (220)
生物 多 样 性 项 目 … gue 机
a ce beet so icamiatatiddian iil
参考 文献
词汇 …
- £197)
- (198)
eee eee eee Pere Cree ere ere eter errerr err eter errr rte ree etre rer rere err ers (199)
2000 年 系统 学 议程 :制订 生物 圈 计 划 pp
系统 学 知识 及 生物 多 样 性 的 价值 .ee
《II0])
(201)
(201)
药物 .pe oo
农业
农业 和 遗传 资源 :ee
8 。 (205)
> (205)
> (206)
> (207)
… (208)
” (208)
** (208)
(202)
(203)
(204)
= (09)
- (Zire)
“+ (293)
~ (214)
(216)
(217)
2000 年 系统 学 议程 :制订 生物 圈 计 划
一 一 全 世界 物种 的 发 现 、 描 述 和 分 类 的 全 球 计划 技术 报告
前 言
.遐想 你 被 置身 于 一 个 陌生 但 又 美丽 的 星球 .四 周 景色 宜人 .漫步 沙滩 ,翻滚 的 波浪 拍打 着 海岸 ,
岸上 绿 草 悠悠 ,溪流 涛 涯 ,茂密 的 森林 衬托 着 远 处 白 拒 拒 的 雪山 .你 只 消 一 警 便 能 领悟 到 这 是 个 充满
生命 的 世界 一 一 种 类 如 此 之 多 令 人 感到 茫然 , 乍 看 约 或 令 人 发 闸 。
试想 会 有 多 少 东西 能 从 这 个 新 的 星球 了 解 到 ,而 这 些 知识 会 有 多 人 么 的 重要 。 有 些 植物 可 能 会 变 成
新 的 食物 ,哺育 饥饿 的 生灵 ,或许 化 作 新 的 药物 ,解除 疾病 的 痛苦 ;有 些 动物 也 许 能 有 效 坎 制 作物 害虫
的 危害 ;微生物 或 就 能 够 分 解 污染 物 ,或 就 能 够 维持 住 一 个 拥挤 世界 的 大 气 。 再 想 一 想 , 你 这 一 辈子 能
在 这 个 迷人 的 新 世界 里 的 寿命 是 如 此 之 短 , 因 此 你 只 能 在 这 短暂 的 时 窗 内 把 所 有 的 一 切 都 发 现 出 来 。
事实 上 你 无 需 穷 尽 你 的 想象 力 , 因 为 这 个 渺茫 的 星球 就 是 我 们 的 地 球 。 我 们 星球 上 的 生命 丰富 得
让 人 吃惊 , 它 造 福 人 类 的 潜能 同 我 们 约 想 到 的 任何 一 个 星球 一 样 可 观 , 更 不 用 说 我 们 今后 还 要 继续 求
索 。 短 暂 的 时 窗 也 同样 是 事实 。 我 们 地 球 的 表面 ,不 论 是 陆地 还 是 水 域 , 都 由 于 人 口 膨 胀 带 来 对 住房 、
食物 和 燃料 的 需求 而 面临 着 急骤 的 退化 。 今 后 一 代 或 两 代 人 口 的 迅猛 增长 加 之 资源 消耗 ,将 在 我 们 尚
有 机 会 发 现 更 不 用 说 仔细 研究 我 们 正在 失去 什么 之 前 ,大 量 生命 的 多 样 性 将 被 毁坏 。
当 得 知 地 球 上 数 百 万 计 的 物种 尚未 发 现 或 描述 后 ,许多 人 都 感到 惊奇 .实际 上 ,地 球 上 的 生命 是
如 此 之 丰富 ,对 某 些 生物 类 群 的 研究 是 如 此 之 肤浅 ,我 们 仍 不 清楚 地 球 上 到 底 生 活 有 多 少 物种 。 假 如
地 球 上 有 一 千 万 或 五 千 万 个 物种 ,几乎 任何 一 个 生物 学 家 都 不 会 感到 吃惊 。
然而 ,我 们 确实 知道 生命 多 样 性 过 去 对 我 们 有 多 人 么 重要 ,将 来 对 我 们 会 有 多 人 么 重要 。 我 们 也 知道 ,
研究 这 种 多 样 性 可 以 告诉 我 们 这 个 星球 的 生命 史 是 什么 ,这些 研 究 怎样 来 帮助 我 们 解决 进入 二 十 一
世纪 后 世界 面临 的 最 紧迫 的 难题 。 我 们 目前 正面 对 一 个 前 所 未 有 的 机 遇 ,一 个 在 我 们 失败 后 子孙 后 代
不 再 会 有 的 机 遇 。
系统 学 是 生物 学 的 一 个 分 支 科 学 , 它 的 任务 是 掌握 生命 的 多 样 性 .系统 学 家 把 掌握 的 知识 划分 到
分 类 系统 ,以 此 表示 我 们 对 现存 物种 或 过 去 年 代 物 种 的 了 解 ,进而 准确 推测 尚未 了 解 的 物种 .世界 系
统 生 物 学 家 被 迫切 地 要 求 加 紧 对 地 球 生 命 的 探索 ,以 便 为 全 社会 提供 必 不 可 少 的 背景 知识 ,发 现 和 利
用 新 的 生物 资源 ,并 制定 保护 地 球 生 物 多 样 性 的 有 效 决 策 。
美国 植物 分 类 学 家 学 会 .系统 生物 学 家 学 会 .Wili Hennig 学 会 及 系统 学 标本 馆 联合 会 组 成 的 联
合体
1994 年
人
内 容 提 要
地 球 上 的 物种 ,包括 人 ,共同 构成 了 一 块 精美 的 纺织 品 。 这 块 纺 织品 塑造 了 对 维持 生命 至 关 重 要
的 大 气 气候、 土壤 .水 及 地 球 的 其 他 生态 学 特性 。 构 成 纺织 品 的 一 百 多 万 根 丝线 (物种 ) 为 系统 生物 学
家 , 即 探索 地 球 生物 多 样 性 的 科学 家 所 发 现 和 描述 . 反 过 来 ,物种 描述 又 为 其 他 各 项 研究 的 开展 打下
基础 ,例如 物种 间 关 系 的 研究 以 及 告诉 我 们 生命 多 样 性 组 成 及 其 历史 的 分 类 研究 .物种 的 分 类 犹如 强
大 的 理论 工具 ,能 帮助 我 们 了 解 、 维 持 并 合理 利用 我 们 继承 下 来 的 丰富 的 生物 财富 。
系统 生物 学 研究 在 过 去 两 百 多 年 中 取得 了 重大 的 成 就 ,尽管 如 此 ,我 们 对 生命 的 了 解 还 远 远 不
够 , 数 千 万 计 的 物种 仍 有 待 我 们 去 探索 ,去 认识 .这 些 物 种 中 可 能 有 维持 复杂 的 生态 平衡 的 物种 ,可 能
有 增加 和 扩大 农业 生产 的 物种 ,也 可 能 有 会 成 为 消灭 人 类 健康 之 敌 的 新 药 和 特效 药 的 物种 。 令 人 欣慰
的 是 ,近期 系统 学 的 发 展 适 时 提出 了 制订 生物 圈 计 划 的 艰巨 任务 ,其 目的 就 是 在 于 掌握 物种 多 样 性 的
巨大 的 范围 。
对 人 类 今后 的 生存 和 幸福 来 说 ,当前 迎接 这 一 挑战 比 以 往 任 何 时 候 都 要 重要 。 当 今世 界 逐 步 面临
多 样 性 减少 和 栖息 地 消失 的 境况 ,人 类 对 珍贵 生物 资源 的 需求 也 在 不 断 提 高 .为 此 ,物种 多 样 性 的 基
础 系统 学 研究 势 在 必 行 .世界 上 的 自然 资源 管理 者 ,药物 开发 者 .保护 生 物 学 家 、 生 态 学 家 及 其 他 有 关
人 十 只 有 共同 努力 ,才能 付 之 于 实现 。
对 地 球 生物 多 样 性 了 解 得 越 多 ,人 类 保护 陆地 和 海洋 自然 生境 的 能 力 就 越 强 。 如 果 想 让 子孙 后 代
享有 我 们 所 依赖 的 地 球 生 命 的 多 样 性 ,我们 就 必须 求 得 这 些 知 识 。
国际 系统 生物 学 界 倡议 的 2000 年 系统 学 议程 旨 在 实现 世界 各 国 所 追求 的 一 个 科学 目标 , 即 发 现 、
描述 和 分 类 地 球 上 的 物种 。 实 现 这 个 目标 要 求 国际 社会 努力 完成 三 个 彼此 关联 的 科学 任务 。
第 一 项 任务 :全 球 物种 多 样 性 的 发 现 、 描 述 和 编目 ;
第 二 项 任务 :分 析 这 个 全 球 发 现 计 划 获 得 的 信息 ,并 将 其 融合 于 一 个 能 体现 生命 史 的 预测 性 分 类
系统 ;
第 三 项 任务 :把 这 个 全 球 计 划 获 得 的 信息 整理 成 为 一 种 有 效 的 、 可 查询 的 形式 ,以 最 大 限度 地 满
足 科 学 和 社会 的 需求 。
它 对 科学 和 社会 的 作用 巨大 ,具体 表现 在 :
1. 新 发 现 的 物种 将 扩充 社会 有 用 资源 的 编目 ;
2. 新 的 系统 学 数据 将 会 用 维持 和 利用 各 国 物 种 多 样 性 所 必需 的 知识 把 保护 学 家 政策 制定 者 及
生物 资源 管理 者 武装 起 来 。
3. 物种 多 样 性 知识 将 有 助 于 新 产品 的 发 现 , 并 将 指导 农作物 和 药物 的 新 品种 和 改良 品种 的 选择 。
4. 基底 数据 将 随 之 产生 ,并 用 于 监测 全 球 气候 及 生态 系统 的 变化 ,其 中 包括 物种 灭绝 速度 .生态
系统 退化 以 及 外 来 的 .引起 病害 和 虫害 生物 体 的 传播 等 。
ol
各
Ill
“ 浪费、 破坏 我 们 的 自然 资源 ,....….. ,将 会 损害 子孙 后 代 真 正 的 繁荣 昌盛 ,按理 说 我 们 应 把 繁荣 昌盛
传 给 他 们 并 发 扬 光 大 ”
一 西 奥 多 .罗斯 福
1907 年 12 月 3 日 提交 国会 的 咨文
我 们 与 其 他 数 百 万 物种 共同 占有 地 球 .这些 物 种 形态 多 样 ,关系 奥秘 ,是 三 十 多 亿 年 进化 的 结果 。
地 球 上 的 物种 ,包括 我 们 本 身 , 被 汇 织 在 一 个 精美 的 生态 结构 中 。 这 个 结构 塑造 了 大 气 、 气 侯 及 地 球 的
地 理 特 性 ,并 奠定 了 生命 本 身 的 基础 。
人 类 依赖 于 难以 数 计 的 其 他 物种 .换言之 ,人 类 生活 的 好 坏 与 全 球 生态 网 络 的 状况 有 着 直接 的 关
系 。 成 千 上 万 的 物种 被 人 类 用 于 食物 、 住 房 , 衣 物 药品、 商业 或 其 他 目的 .对 其 他 生命 型 的 利用 推动 了
世界 经 济 的 发 展 ,使 我 们 每 个 人 的 生活 更 富裕 、 更 美好 。
人 类 能 有 效 利用 其 他 物种 的 本 领 来 自 对 这 些 物种 知识 的 了 解 . 这 种 知识 从 认识 它们 是 什么 种 类 、
它们 在 哪儿 、 它 们 会 有 什么 特征 、 它 们 与 别 的 物种 有 什么 关系 开始 地 球 上 的 生命 形式 极其 丰富 多 样 。
迄今 为 止 ,已 描述 的 物种 大 概 不 足 150 万 种 ,但 据 专 家 估计 与 我 们 一 道 栖 居 地 球 的 物种 很 可 能 有 几 千
万 。 记 录 和 了 解 物 种 多 样 性 对 人 类 今后 的 发 展 至 关 重要 .了解 这 些 基 本 知识 是 系统 学 这 门 科学 的 主要
任务 。
系统 生物 学 家 致力 于 地 球 物 种 的 发 现 \ 描 述 和 了 解 .他 们 根据 获得 的 信息 对 物种 进行 分 类 ,在 此
基础 上 再 整理 有 关 这 些 物 种 的 所 有 生物 学 知识 ,并 制订 出 一 个 框架 ,预测 已 知 的 或 未 知 的 生活 型 的 特
征 . 尽 管 我 们 掌握 地 球 物 种 的 知识 还 不 够 全 面 , 但 新 的 系统 分 析 方法 .生物 遗传 物质 CDNA) 的 直接 利
用 、 尖 端的 信息 处 理 技术 .自然 历史 标本 收藏 的 增加 及 其 数据 库 的 建立 等 手段 ,都 为 了 解 全 球 生物 多
样 性 铺 平 了 道路 。
未 加 控制 的 人 类 活动 使 我 们 目前 正 处 于 一 个 重大 的 生物 灭绝 时 期 ,因此 目前 认识 生物 多 样 性 比
以 往 任何 时 期 更 具有 迫切 性 据 美国 国家 研究 理事 会 的 一 份 报告 称 , 到 2100 年 很 可 能 一 半 以 上 的 现 有
物种 都 将 灭绝 CNRC 1980) .但 就 目前 生态 系统 的 退化 速度 来 看 ,这 项 推测 可 能 还 有 些 保守 ;按照 哈佛
大 学 著名 的 生物 学 家 下 . O. Wilson 博士 的 谨慎 估计 ,地 球 上 每 年 导致 绝 灭 的 物种 有 将 近 2 万 7 千 种
(Wilson 1992). 人 口 的 膨胀 .贫穷 的 增长 全 球 的 冲突 及 自然 资源 的 过 度 利用 造成 了 环境 质量 严重 的
下 降 和 物种 多 样 性 不 可 挽回 的 损失 。
多 样 性 的 减少 伴随 着 生物 学 知识 的 损失 降低 了 各 国人 民 改 善 经 济 状况 和 提高 生活 水 平 的 能 力 。
物种 灭绝 的 悲剧 向 国际 社会 发 出 了 严峻 的 挑战 一 一 在 人 类 生物 遗产 永久 地 失去 之 前 发现、 保存 和 认
识 其 多 样 性 生物圈 的 未 来 尚 有 赖 于 各 国政 府 在 今后 几 十 年 内 的 共同 努力 .近期 在 里 约 热 内 卢 召 开 的
联合 国 环境 与 发 展 大 会 (UNCED) 已 经 认识 到 这 一 点 .大 会 上 国际 社会 认识 到 ,在 保持 经 济 持续 发 展
的 同时 有 必要 维持 生物 圈 的 完整 性 .各 国 通过 全 球 行动 计划 “二 十 一 世纪 议程 也 呼吁 要 加 强 对 地 球
生物 多 样 性 的 了 解 程度 。 |
在 发 展 经 济 的 同时 兼顾 持续 利用 取决 于 综合 的 政治 决策 和 经 济 决策 .成 功 的 决策 必须 以 各 种 准
确 的 地 球 物种 科学 库 的 信息 为 依据 。 为 迎接 掌握 生命 多 样 性 重任 的 挑战 ,国际 系统 学 界 提出 了 一 项 控
索 和 研究 计划 一 一 2000 年 系统 学 议程 :绘制 生物 圈 图 谱 。 有 了 全 社会 的 共同 决心 和 一 致 支持 ,全 世界
的 系统 学 家 们 提出 了 一 项 加 速 研 究 的 计划 ,以 期 在 今后 25 年 中 解答 下 列 问题 :
. 地球 上 的 物种 是 什么 ?
2. 它们 分 布 在 什么 地 方 ?
3. 它们 具有 什么 样 的 特性 ?
.它们 之 间 的 关系 如 何 ?
本 项 研究 获得 的 知识 将 被 整理 成 为 预测 性 的 分 类 系统 和 数据 库 ,使 其 成 为 认识 、 维 持 和 永 续 利 用
人 入
—
~
-一
人 类 继承 的 巨大 的 生物 财富 的 有 效 工 具 。
系统 学 是 建立 在 以 下 工作 之 上 的 科学 :
DEF:
发 现 、 描 述 和 划分 物种 或 物种 类 群 ( 合 称 分 类 单元 ) 的 科学
系统 发 育 分 析 :
发 现 生 物种 类 群 间 的 进化 关系
RE:
按照 进化 关系 将 物种 最 终归 为 不 同 的 类 群
* 200
2000 年 系统 学 议程 :制订 生物 圈 计 划
世界 系统 学 界 通过 2000 年 系统 学 议程 果断 地 提出 了 一 项 迎合 社会 需求 ,有 明确 科学 目标 的 计划 :
发 现 、 描 述 和 划分 全 世界 的 物种 。
迎接 生物 多 样 性 危机 的 挑战 和 成 功 地 完成 这 项 议程 要 求 国际 上 的 广泛 参与 。 议 程 确 定 了 三 项 彼
此 关联 的 研究 任务 :
1. 全 球 物 种 多 样 性 的 发 现 、 描 述 和 编目 ;
2. 分 析 这 个 全 球 发 现 计 划 获 得 的 信息 ,并 将 其 融合 于 一 个 能 体现 生命 史 的 预测 性 分 类 系统 ;
3. 把 这 个 全 球 计 划 获 得 的 信息 整理 成 为 一 种 有 效 的 、 可 查询 的 形式 ,以 最 大 限度 地 满足 科学 和 社
会 的 需求 。
系统 学 知识 及 生物 多 样 性 的 价值
“每 一 个 国家 都 有 三 种 财富 , 即 物 质 财富 、 文 化 财富 和 生物 财富 .前 两 者 我 们 基本 了 解 ,因为 它们
是 目 常 生活 的 组 成 部 分 .生物 多 样 性 问题 的 实质 是 没有 给 予 生物 财富 以 足够 的 重视 。 这 是 一 个 重大
的 战略 性 失误 . 随 着 时 间 的 推移 ,这 次 失误 越 来 越 会 让 人 们 感到 居 异 ”
—E.O. Wilson,1992 年 , 第 311 页
尽管 人 们 依赖 数 以 万 计 的 物种 获取 食物 、 住 房 、 药 品 及 其 他 必 不 可 少 的 物质 ,但 据 科 学 预示 生物
畔 的 未 知 部 分 还 蕴藏 着 更 大 的 潜力 。 在 全 球 环境 面临 各 种 不 利 改变 的 当今 ,掌握 更 多 的 物种 多 样 性 知
识 尤为 重要 。 这 些 知识 大 部 分 来 自 系 统 学 基础 研究 , 即 发 现 和 描述 新 物种 ,确定 物种 的 特征 及 与 其 他
物种 的 关系 ,按照 这 些 数据 进行 分 类 并 建立 预测 性 的 信息 查询 系统 。 由 此 可 见 , 对 于 试图 了 解 生命 多
样 性 .为 子孙 后 代 保 护 和 管理 生命 多 样 性 的 基础 科学 和 应 用 科学 研究 人 员 来 说 ,系统 学 知识 万 基础 之
基础 。
人 类 健康
世界 上 有 几 亿 人 在 蒙受 生物 引发 的 疾病 带 来 的 痛苦 .为 了 解除 这 些 疾 病 对 人 类 的 折磨 ,全 世界 每
年 投入 的 经 费 高 达 几 十 亿美 元 。 纵 观 世 界 上 所 有 的 疾病 ,目前 最 让 人 深恶痛绝 的 有 三 类 寄生 虫 ,它们
是 导致 痉 疾 的 原生 动物 .引发 日 本 血吸虫 病 的 血液 时 虫 及 造成 爱滋病 的 HIV 病毒 .此 外 ,世界 上 25%5
的 人 在 肠 内 寄生 有 影响 儿童 身体 和 智力 发 育 的 帼 虫 。 自 1979 年 以 来 ,细菌 中 有 270 个 新 属 和 大 约 1100
个 新 种 被 相继 描述 。 现 已 认识 的 病原 或 兼 性 病原 属 、 种 的 数量 在 不 断 增 加 。
没有 系统 学 这 门 科学 ,就 不 可 能 取得 对 付 这 些 疾病 的 进展 .系统 学 家 能 够 认识 .区 分 并 说 明 影响
人 类 健康 的 非 病 原 体 及 病原 体 的 特征 .这 些 生物 有 数 十 万 个 种 和 上 百 万 个 品系 ,其 中 包括 细菌 、 病 毒 、
真菌 .酵母 菌 、 原 生动 物 、 线 虫 .由 虫 . 扁 虫 . 丝 虫 .昆虫 . 昌 、 螨 、 蜂 蛛 、 蝎 .蜗牛 等 .仅仅 了 解 可 能 引发 疾
病 的 生物 这 还 不 够 ,我 们 还 要 把 一 个 类 群 中 的 所 有 已 知 物种 区 别 开 来 ,以 便 加 强 对 新 发 现 物种 的 了
解 ,确定 某 个 已 知 的 品系 或 物种 本 为 非 病 原 体 是 否 已 转变 成 病原 体 ( 见 专栏 1)。
掌握 致 病 生 物 的 进化 关系 对 提高 人 类 健康 水 平 同样 起 着 关键 的 作用 .通过 研究 疾病 载体 及 相关
的 非 疾病 载体 的 相似 性 , 便 能 预测 致 病 生 物 的 变化 趋势 和 发 现 新 的 病原 型 。 由 于 爱滋病 导致 的 免疫 率
乱 患者 人 数 不 断 增加 ,而 人 类 又 能 够 移植 器 官 、 医 治 重度 烧伤 和 延长 老人 及 瘤 症 患者 的 生命 ,因而 , 即
使 是 最 无 毒 的 细菌 和 病毒 也 有 可 能 危及 生命 的 安全 .尽管 人 们 有 抗生素 疫苗、 良好 的 卫生 条 件 和 安
全 的 食品 ,但 是 许多 传统 的 疾病 正在 复活 ,一 些 前 所 未 有 的 疾病 正在 出 现 。 大 量 曾 一 度 被 认为 是 非 病
原 体 的 物种 ,目前 已 经 从 人 类 病例 中 被 分 离 出 来 .事实 证 明 , 掌 握 全 部 生物 类 和 群 的 进化 关系 及 地 理 分
布 知识 ,对 于 了 解 病原 体 由 动物 转 至 人 类 的 过 程 和 发 现 某 些 病原 种 比 其 他 种 毒性 更 强 的 原因 起 着 关
键 的 作用 。
*。201。
“如 果 认 为 我 们 必须 在 服侍 人 类 和 服侍 环境 之 间作 出 选择 的 话 , 那 我 们 就 犯 了 一 个 危险 的 错误 。
两 个 目标 的 统一 必须 当 作 一 个 首要 问题 来 对 待 , 二 者 不 能 也 绝对 不 能 分 离开 来 。”
—Orville Freeman,
美国 前 农业 部 长 ,1989 年
物种 的 利用 给 全 球 经 济 带 来 了 价值 数 万 亿美 元 的 效益 。 随 着 越 来 越 多 的 国家 编目 、 研 究 并 提出 对
本 国境 内 多 样 性 的 权利 时 ,关于 物种 的 利用 和 管理 的 国际 协议 和 条 约 逐 渐 在 受到 重视 。 发 现 和 描述 的 .
物种 越 多 ,对 其 分 布 及 与 别 的 物种 间 的 关系 了 解 得 越 详尽 ,那么 这 些 物 种 对 一 个 国家 的 经 济 能 作出 的
贡献 就 越 大 ,这 些 物 种 能 给 后 代 保 存 下 来 的 就 越 多 .2000 年 系统 学 议程 所 确定 的 研究 任务 已 经 为 获得
这 些 重要 的 知识 制订 了 计划 。
历史 表明 ,新 种 的 发 现 以 及 随后 的 特性 研究 ,往往 会 带 来 重大 的 经 济 效益 .系统 学 分 析 ,包括 物种
间 已 研究 认识 的 特性 的 比较 ,从 而 能 够 推测 新 种 的 特性 : 反 过 来 ,这 些 推测 又 能 更 有 效 、 更 可 靠 地 评定
这 些 新 种 的 潜在 经 济 价值 。
By 物
据 世 界 卫生 组 织 统计 ,人 类 为 药 用 目的 而 利用 的 植物 有 两 万 多 种 .事实 上 ,发 展 中 国家 有 80%% 的
人 仍然 依靠 传统 药物 作为 主要 的 疾病 治疗 (手段 ) 这些 药物 大 部 分 来 自 野 外 采集 的 植物 ,给 这 些 物 种
的 很 多 野生 种 群 带 来 了 很 大 的 压力 。
专栏 1
疙 疾 与 系统 学 : 既 救 命 又 省 钱
没有 遵循 寄生 虫 及 其 传播 媒介 的 准确 的 系统 学 知识 而 制定 的 疾病 控制 措施 ,只 会 造成 时 间 和 人 金
钱 的 浪费 。 闪 疾 就 是 一 例 。
JE PR HE Plasmodium 属 的 寄生 原生 动物 引起 的 。 在 该 属 四 个 会 侵 染 人 体 的 物种 中 ,PlLaszzodzzzz
falciparum 造成 死亡 或 病态 的 危害 最 大 , 它 通过 蚊子 叮咬 而 传染 给 兰 椎 动物 。 能 携带 寄生 虫 的 蚊子 |
的 种 类 很 多 ,但 它们 的 分 布 和 传播 能 力 各 不 相同 。 据 世界 卫生 组 织 估计 ,全 世界 并 疾 患者 每 年 有 2 一 3
亿 例 ,大 约 一 百 万 例 患 者 因 病 死亡 ,其 中 多 数 为 儿童 。
六 十 年 代 , 许 多 科学 家 都 在 从 事 Anopheles gambiae 这 种 分 布 于 非洲 的 主要 传播 媒介 的 杀 虫 剂
抗 性 研究 . 几 十 个 品系 被 送 到 伦敦 进行 杀 虫 剂 和 杂交 试验 ,以 确定 其 抗 性 遗传 模式 。 大 量 的 杂交 种 不
能 再 生育 .在 研究 过 程 中 ,系统 学 家 发 现 一 个 被 认为 是 4. gambiae 的 种 实际 上 是 六 个 不 同 的 种 ,其
生物 学 特性 和 闪 疾 传播 能 力 显 然 各 不 相同 。 类 似 情 况 在 蚊子 中 还 重复 出 现 过 。 美 国 的 Anopheles
quadrimaculatus, E\ FEW A. culicifacies 和 泰国 的 A. dirus 均 被 证 明 是 种 的 复合 体 ( 即 不 仅仅 是 一 个
物种 ) ,它们 传播 洗 疾 的 能 力 各 不 相同 。
“美国 药店 开 出 的 所 有 药方 中 ,四 分 之 一 是 从 植物 中 提取 的 物质 ,13% 来 自 微生物 ,另外 3 儿 强 来
自动 物 .也 就 是 说 ,40 儿 以 上 的 药 来 源 于 生物 .然而 ,这 些 药物 只 不 过 占 众 多 可 利用 中 的 极 小 部 分 。
—E. O. Wilson, ,1992 年 ,第 283 一 285 页
实践 证 明 ,在 筛选 有 药 效 的 成 分 时 ,如 果 选 用 传统 药物 所 利用 的 物种 ,其 成 功 机 遇 比 选用 同一 地
区 中 植物 随机 抽样 要 大 得 多 。 人 类 利用 动物 和 植物 的 能 力 , 是 各 地 人 民 与 自然 界 密切 相处 ,在 长 期 的
实践 .失败 过 程 中 经 过 不 断 总 结 形成 的 。 专 长 于 民族 生物 学 , 即 研究 人 们 利用 土生 土 长 动 植 物 的 系统
学 家 对 这 些 重 要 经 济 物种 的 描述 和 研究 起 着 主要 作用 .开展 人 类 利用 的 动物 .植物 和 微生物 的 民族 生
物 学 综合 调查 迫在眉睫 .记载 传统 人 类 社会 与 为 其 所 用 的 动 植 物 间 的 关系 ,包括 种 质保 护 , 是 系统 民
族 生 物 学 的 一 个 重要 研究 领域 。
分 类 系统 的 创造 是 系统 民族 生物 学 的 一 个 最 重要 的 贡献 .系统 民族 生物 学 的 民族 生物 区 系 遗 传
“OZ
,有
多 样 性 的 大 部 分 科研 工作 ,如 保存 .保护 .育种 .有 用 基因 的 探索 .生物 技术 等 ,都 随 着 近 缘 关系 的 决定
而 定 的 。 研 究 成 果 多 以 分 类 、 分 类 学 专著 或 系统 发 育 分 析 的 形式 在 科学 界 交流 。 这 些 研 究 可 提供 基础
的 生物 学 信息 ,如 物种 分 布 、 结 构 变 异 等 , 它们 对 驯化 种 和 野生 近 缘 种 的 研究 有 者 关键 的 作用 。 许多 发
现 新 药 的 例子 也 可 以 说 明 系 统 民族 生物 学 的 重要 性 ( 见 专栏 2)。
世界 上 用 有 花 植物 制造 的 药物 产值 达 数 十 亿美 元 。 然 而 这 项 财富 大 多 数 仅 来 自 一 小 部 分 物种 .与
25 万 种 有 花 植物 相 比 ,微生物 具有 更 大 的 多 样 性 ,它们 很 可 能 是 药物 和 其 他 生物 技术 产品 的 重要 来 源
(Bull 等 ,1992) 。 微 生物 药 中 最 著名 的 例子 是 由 Penazczllizzxz notatum 生产 的 盘 尼 西林 , 它 给 治疗 传染 病
的 药物 带 来 了 一 场 革命 。
寻找 微生物 来 源 新 药 的 工作 才刚 开展 。 微 生物 的 系统 发 育 和 分 类 能 促进 对 它们 相互 间 关 系 的 认
识 , 这 为 筛选 自然 界 的 大 量 物种 提供 了 可 预测 的 线路 图 .因此 ,系统 学 知识 对 微生物 新 药 的 发 现 具有
不 可 估量 的 作用 .遗憾 的 是 ,人 们 对 微生物 尤其 是 病毒 .细菌 和 真菌 的 系统 学 了 解 甚 少 , 上 百 万 的 物种
仍 有 待 发现 和 描述 ,多 数 类 群 间 的 关系 仍 有 竺 分析. 此 外 ,研究 许多 微生物 类 群 的 系统 学 家 也 不 断 减
少 。 这 种 状况 如 不 改变 ,人 类 便 会 失去 发 展 经 济 和 技术 的 许多 良机 (Hawksworth 和 Ritchie 1993),
RE
系统 民族 生物 学 与 新 药 的 发 现 :马达 加 斯 加 的 几 个 例子
马达 加 斯 加 这 个 陆地 岛屿 上 有 1 万 3 千 多 种 植物 . 令 人 人 惊奇 的 是 ,这 个 岛屿 上 80%% 的 植物 都 是 特
有 种 。 通 过 研究 这 些 特 有 种 及 其 在 当地 医疗 体系 中 的 作用 而 开发 的 新 药 不 胜 枚 举 。
K # 4€ (Catharanthus rosexs) 是 其 中 最 著名 的 一 个 例子 .不 久 以 前 , 它 还 仅仅 是 人 们 花园 中 的 一
种 观赏 植物 .当地 不 少 人 把 它 当 作 一 种 民间 草药 来 治疗 糖尿 病 , 于 是 人 们 对 它 进一步 研究 ,以 期 从 中
找到 口服 胰岛 素 的 代用 品 。 虽 然 玫 瑰 红 草 长 春花 在 治疗 糖尿 病 方面 的 效用 尚未 得 到 证 实 , 但 它 的 提
取 物 却 发 现 具有 大 幅度 减少 实验 动物 白血球 计数 和 抑制 骨髓 活动 的 功效 。 根 据 上 述 观 察 结 果 , 类 们
终于 分 离 出 两 种 化 学 成 份 , 即 能 够 有 效 治 疗 白血病 的 长 春 碱 和 长 春 新 碱 . 自 从 这 种 药物 首次 进入 市
场 以 来 ,儿童 白血病 的 治愈 率 由 过 去 的 10%% 提 高 到 现在 的 95% 。
3e 7K JB (Rauwol fia) PA Bi FP, BY RE HB AR CR. serpentina) Al R. zoomzztorza ,它们 的 根 是 提取 几 种
生物 碱 或 制作 根 粉 的 原材料 .这 些 产 品 的 药物 制剂 可 用 来 治疗 高 血压 ,也 可 用 作 治疗 精神 紊乱 的 镇
静 剂 。
cio 问题 是 灭绝 的 速度 上 升 得 如 此 之 快 ,以 至 于 如 果 人 们 找到 一 种 具有 特殊 生物 活性 的 植物 ,
很 可 能 当 你 去 时 已 发 现 其 生境 全 然 无 存 。 这 是 一 场 时 间 战 争 .”
Michael Balick
纽约 植物 园 经 济 植物 研 究 所 所 长
农 业
”世界 农业 的 发 展 有 赖 于 农业 研究 带 来 的 技术 进步 。 从 世界 范围 看 ,发 达 的 农业 体系 正 朝 着 减少 杀
虫 剂 、 化 肥 和 除草 剂 的 施用 量 ,加 强生 物 防 治 、 害 虫 综合 管 理 和 持续 性 农业 的 方向 发 展 *。 以 上 技术 强烈
依赖 于 有 关 害 虫 类 群 、 害 虫 的 植物 寄主 及 害虫 天 敌 的 系统 学 知识 .系统 学 信息 是 农业 管理 的 语言 和 预
测 基础 ,由 于 系统 学 信息 的 不 足 而 造成 搁浅 或 失败 的 项 目 多 不 胜 数 ( 见 专栏 3)。
随 着 对 非 杀 虫 剂 防 治 策略 的 作用 的 不 断 重 视 , 需 要 了 解 在 农业 生态 系统 中 起 重要 作用 的 各 种 各
样 的 生物 越 来 越 成 为 关键 问题 。 据 估计 ,有 用 的 生物 防治 因子 可 能 有 数 千 种 ,但 它们 均 未 被 科学 所 揭
示 。 因 此 ,要 发 挥 它们 的 经 济 作用 ,就 必须 首先 发 现 和 描述 这 些 生物 ,并 把 它们 纳入 分 类 系统 和 信息 系
统 。 如 果 有 一 些 生 物 , 它 们 在 农业 生态 系统 中 既 能 使 产量 提高 并 又 有 一 个 健康 的 环境 ,但 人 们 却 对 它
们 尚未 认识 ,或 与 别 的 生物 混淆 不 清 , 或 与 其 他 物种 的 关系 不 明 ,农业 发 展 势 必 会 受到 极 大 的 阻碍 。
es。 203 。
系统 学 研究 节省 数 十 亿美 元 : 几 个 生物 防治 事例
FE + Au tht 26 AR BA. HB Wt (cottony-cushion scale) 严 重 影响 了 加 利 福 尼 亚 的 柑 桔 产业 。 根 据 一 位 系
统 学 家 提供 的 信息 ,在 澳大利亚 进行 国外 考察 ,结果 发 现 并 引进 了 一 种 以 吹 棉 晶 为 食 的 球 虫 ,从 而 控
制 了 这 种 蛤 虫 的 危害 ,拯救 了 加 利 福 尼 亚 的 柑 桔 业 。
许多 年 来 ,生物 防治 专家 一 直 没 有 找到 对 加 利 福 尼 亚 红 介壳 虫 有 效 的 天 敌 。 一 位 介壳 虫 专家 应
邀 研究 这 种 昆虫 ,结果 发 现 它 实 际 上 是 三 个 不 同 的 相似 种 , 即 加 利 福 尼 亚 红 介壳 虫 、. 黄 蛤 和 紫 杉 明 。
其 后 ,研究 寄生 蜂 的 系统 学 家 发 现 , 正 是 因为 鉴定 失误 才 难 以 找到 红 介 壳 虫 的 天 敌 。 不 久 , 各 种 成 功
的 生物 防治 因子 相继 被 引入 。
了 解 有 害 种 的 原 产地 往往 会 给 寻找 有 效 生 物 防 治 因 子 提 供 很 大 的 帮助 。 甜 菜 叶 蝉 CCzrculzyer
tenellus) 早先 被 认为 是 Eutettix 属 的 一 个 种 , 原 产 南美 洲 。 遗 憾 的 是 ,人 们 在 南美 洲 不 仅 没 有 发 现 防
治 因 子 ,还 浪费 了 大 量 的 时 间 和 精力 。 最 后 系统 学 家 发 现 该 种 其 实 属于 东 半 球 的 Circulifer 属 , 于 是
便 在 地 中 海地 区 找到 了 几 种 有 效 的 天 敌 , 并 引入 加 利 福 尼 亚 。
1974 年 , 扎 伊 尔 发 现 了 一 种 引进 的 粉 明 科 介壳 虫 。 这 种 害虫 每 年 给 西非 的 木薯 种 植 业 造成 近 14
亿美 元 的 损失 。 这 种 介壳 虫 被 描述 为 物种 Phenacoccus maazhoi ,于 是 人 们 开始 在 南美 北部 寻找 它 的
生物 防治 因子 。 在 没有 找到 任何 有 效 的 寄生 虫 后 ,一 位 粉 内 科 系统 学 家 又 重新 研究 ,结果 找到 了 一 个
与 上 述 种 非常 相近 的 种 Pherrexz ,主要 见于 南美 北部 ,而 P. manihoti 实际 上 分 布 在 较 南 部 .有 了 这
一 发 现 ,有 效 的 寄生 虫 便 很 快 被 找到 并 引入 非 洲 灾区 。
外 来 害虫 的 侵入 对 世界 农业 生产 最 具 破坏 力 。 不 幸 的 是 ,国际 贸易 量 的 增长 和 交通 网 络 的 飞速 发
展 增加 了 引入 新 害虫 的 可 能 性 大 多 数 国家 都 要 查验 人 境 的 商品 ,搜查 任何 外 来 的 传染 物 , 并 制定 相
应 的 入 境 管理 规定 .这些 措施 基本 上 依赖 于 系统 学 家 提供 的 信息 ,因为 任何 一 个 国家 都 不 可 能 有 完整
的 所 有 物种 的 编目 ,也 不 可 能 完全 了 解 某 种 被 查获 的 生物 是 否 分 布 于 本 国 。 再 者 ,多 数 重要 的 农业 类
群 大 都 确 乏 详尽 的 鉴定 材料 .缺乏 某 一 害虫 类 群 的 系统 学 信息 有 时 还 会 产生 一 些 特殊 问题 ,例如 , 烟
草 菠 蠕 虫 (budworm) 往 往 见于 来 自 中 美和 南美 的 查获 商品 。 芽 蠕虫 一 直 被 认为 只 有 三 个 种 ,但 近期 专
项 研究 表明 ,其 复合 体 由 十 二 个 不 同 的 型 组 成 。
各 个 国家 也 必须 制定 若干 规定 ,以 限制 从 某 些 国家 进口 某 些 特殊 的 农业 产品 .这 些 规定 都 必须 以
系统 学 知识 为 依据 ,同时 也 要 依靠 本 国 对 原 产 国 商品 中 出 现 的 所 有 植 食性 生物 .它们 是 否 有 害虫 的 潜
势 以 及 世界 分 布 的 了 解 程度 ( 见 专栏 4) 。
由 于 缺乏 足够 的 系统 学 知识 ,尤其 是 关于 有 害 物种 的 系统 学 知识 ,制定 这 些 重要 规定 的 科学 依据
往往 不 足 。
系统 学 信息 与 农产品 贸易
从 某 种 情况 上 讲 ,掌握 有 潜在 危害 的 生物 的 系统 学 知识 可 为 增加 商品 的 出 口 量 和 避免 严重 国际
贸易 事件 发 生 铺 平 道 路 .举例 说 明 ,加 拿 大 从 美国 进口 的 小 麦 中 带 有 一 种 黑 粉 菌 , 这 种 菌 最 初 被 鉴定
为 Neovossia indica , 一 种 极其 危险 的 外 来 病原 体 。 为 此 ,加 拿 大 作出 禁止 从 美国 进 口 小 麦 的 禁令 。 经
二 位 系统 学 家 研究 这 种 病菌 ,最 终 认 定 是 一 种 常见 于 大 米 的 物种 Tilleiia parclayaxa, 并 且 早 在 小 麦
运 到 同一 仓库 之 前 就 已 存在 , 正 是 由 于 这 项 极 小 的 系统 学 发 现 ,一 场 可 能 造成 重大 经 济 损失 的 国际
事件 才 得 以 平息 。
在 过 去 ,农业 项 目 提 倡 使 用 杀 虫 剂 和 化 肥 ,常常 给 环境 带 来 不 利 影响 .而 在 当今 , 随 着 害虫 管理 和
生物 防治 等 低 环 境 影响 策略 的 出 台 , 作 物种 质 需要 重新 发 掘 。 这 项 工作 要 求 详 细 地 了 解 世 界 珍贵 的 农
“204。
4 ee
My A Oy BK FR 5 BBE UN th PRE ESE HAS $8 hill SG RE KO A RS UB PS TE AE SF fp AE
物 的 基因 移植 到 另 一 种 生物 ,因此 ,保持 物种 多 样 性 变 得 尤其 重要 ,因为 任何 生物 的 遗传 材料 都 可 能
有 益 于 农业 体系 。 系 统 学 知识 则 能 使 科学 家 更 好 地 了 解 作 物 的 抗 病情 况 ,从 而 在 特定 情况 下 选用 最 佳
的 遗传 原 种 ( 见 专栏 5)。
专栏 5
系统 学 发 现 与 作物 改良 :两 个 事例
玉米
1977 年 ,一 位 叫 Rafael Guzman 的 墨西哥 植物 系统 学 家 重新 发 现 了 (在 两 块 玉米 大 田间 的 水 渠
HAG AM Zea perexzzs ,一 种 珍贵 的 多 年 生 玉 米 草 , 即 野 玉 米 。Zea perennis 是 人 类 三 种 最 主要 农
作物 (其 他 两 种 为 水 稻 和 小 麦 ) 之 一 的 玉米 (Zea mays) 的 一 个 近 缘 种 .不 久 以 后 ,Guzman 又 在 附近 山
区 的 云雾 林 中 发 现 了 这 种 多 年 生 玉 米 草 的 另外 一 个 种 ,并 把 种 籽 送 给 玉米 系统 学 家 Hugh lltis 和
John Doebley 研究 .这 些 种 籽 所 产生 的 植物 结果 是 一 个 鲜 为 人 知 的 种 Z. diploperennis, 5 Z. peren-
nis 不 同 的 是 ,这 种 玉米 的 染色 体 数目 与 家 种 玉米 恰好 相同 ,很 容易 与 家 种 玉米 杂交 。 更 令 人 感到 惊
奇 的 是 ,Z._ diploperennis 可 以 抵抗 家 种 玉米 (Z. mays) 常 见 的 七 种 病毒 病 , 同 时 某 些 对 病毒 的 抗 性
目前 可 以 移植 到 家 种 玉米 .迄今 为 止 , 已 经 有 四 个 抗 病毒 玉米 品种 进行 了 商业 性 种 植 . 世 界 玉米 的 年
产值 近 600 亿 美元 ,这 项 发 现 的 潜在 经 济 价值 可 见 一 斑 。
上 述 事例 的 另 一 方面 也 值得 引起 人 们 的 重视 。 这 个 新 种 发 现 于 生物 多 样 性 丰富 的 墨西哥 西南 部
地 区 ,但 是 森林 砍伐 、 牧 业 和 农业 正在 迅速 破坏 着 这 个 地 区 的 森林 。 如 果 不 是 Sierra de Manantlan #%
个 山区 被 确定 为 生物 圈 保 护 区 ,这 种 珍贵 植物 所 剩 的 几 个 种 群 现在 可 能 已 经 绝 灭 .还 有 ,新 种 的 发 现
者 如 果 不 是 一 位 杰出 的 草本 植物 系统 学 家 ,或 者 他 没有 把 种 籽 送 给 分 类 困难 的 Zea 属 方面 的 专家 ,
这 一 珍稀 物种 或 许 就 会 为 人 们 所 忽略 .以 上 事实 进一步 说 明了 培养 一 大 批 优 秀 的 系统 学 家 ,增强 探
索 、 记 录 和 保存 世界 上 现存 生物 区 系 多 样 性 力量 的 重要 作用 。
著 匣
1962 年 ,Hugh Iltis 和 Don Ugent 在 安第斯 山 探险 时 采集 到 一 千 多 号 植物 标本 ,包括 一 个 野生 番
茄 新 种 的 种 籽 。 新 种 与 家 种 番茄 杂交 后 ,可 增加 杂种 果实 的 可 溶性 固体 含量 .这 项 成 果 每 年 可 为 番茄
种 植 业 创造 800 万 美元 的 效益 。
林 业
美国 的 林地 面积 有 230 万 英亩 。 虽 然 木 材 产品 的 产值 高 达 1360 亿 美元 ,与 其 相 比 , 林 副 产品 及 娱
乐 ` 水 资源 等 非 商品 利用 所 创造 的 价值 则 要 更 大 些 。 随 着 人 们 对 森林 价值 认识 的 转变 ,森林 管理 出 现
了 重大 的 变革 。 新 型 的 管理 哲学 促使 人 们 去 保护 老龄 林 , 并 寄 更 大 希望 于 非 木 材 物 种 。 与 传统 的 森林
管理 方式 相 比 ,森林 的 长 期 管理 面临 着 一 连 串 的 问题 .尽管 大 多 数 森林 管理 者 能 够 测定 森林 物理 和 化
学 性 状 ,监测 动 植物 区 系 变化 ,但 他 们 仍然 缺乏 衡量 森林 系统 生物 多 样 性 的 专门 知识 .有 限 的 无 脊椎
动物 及 微生物 系统 学 知识 使 森林 濒临 险 境 ,在 控制 引进 的 有 害 节肢 动物 和 病原 体 方面 尤其 如 此 。 例
如 ,1992 年 不 列 颠 哥伦比亚 发 现 了 一 种 奇异 的 昆虫 。 由 于 没有 这 方面 的 专家 ,等 鉴定 出 这 种 可 怕 的 外
来 甲虫 Bu ptestis hemmoradialis 时 已 经 过 了 一 年 的 时 间 。 在 此 期 间 , 这 种 昆虫 已 经 过 了 两 个 生长 季节 。
这 么 一 来 ,本 来 可 以 在 小 范围 内 采取 的 灭 杀 措施 ,只 好 扩展 到 大 范围 内 进行 。 像 这 样 的 时 间 耽 搁 不 仅
降低 了 灭 虫 效果 ,而且 还 增加 了 灭 虫 的 经 费 开 支 。
渔 业
渔业 产品 是 世界 上 和 蛋白质 的 主要 来 源 (Norse 1993) .因此 ,区 分 普通 鱼 类 和 具 商 业 价 值 的 海味 对
自然 资源 管理 和 为 水 产 养 殖 物 种 的 选择 有 着 重要 的 作用 ( 见 专栏 6)。 此 外 系统 学 信息 在 国内 法 及 国际
法 规 , 条 约 和 公约 的 执行 等 政策 问题 上 也 同等 重要 。
“OO
非 本 地 种 的 引进 极 有 可 能 给 水 生生 境 带 来 严重 的 危害 .人们 往往 认为 一 些 外 来 种 有 益 而 故意 将
其 引入 ,不 料 后 果 最 为 严重 。 不 少 水 生物 种 通过 栖 居 船体 或 水 舱 而 无 意 被 引入 .这些 引进 的 物种 大 部
分 会 在 经 济 上 给 土生 种 带 来 严重 的 损失 .再 则 ,引进 种 还 会 携带 许多 寄生 虫 和 病原 体系 统 学 的 研究
对 准确 鉴定 引进 种 及 其 寄生 虫 和 病原 体 有 着 不 可 磨灭 的 贡献 ,是 制定 有 效 管理 策略 的 理论 基础 。
系统 学 研究 提高 渔业 产量 :两 个 事例
正确 鉴定 目标 物种 把 系统 学 与 渔业 也 联系 到 了 一 起 .太平 洋 东 北部 的 狭 鳃 (T7Heragra
chnalcosgrazz7z4) 捕 捞 业 是 世界 上 最 大 、 创 造 经 济 价值 最 高 的 捕捞 对 象 之 一 .至 二 十 世纪 八 十 年 代 , 狭
鳃 已 经 成 为 世界 渔业 中 捕捞 量 最 大 的 鱼 种 .然而 , 狭 鳃 只 不 过 是 东北 太平 洋 地 区 几 种 近 缘 鱼 类 中 的
一 种 ,不 和 久 前 其 早期 生活 史 还 鲜 为 人 知 ,部 分 原因 在 于 其 幼体 的 野外 样品 难 与 其 他 鱼 类 难以 辨别 。 在
过 去 的 十 年 中 ,系统 学 的 研究 结果 突破 了 这 一 难关 ,能 够 准确 地 分 辨 出 不 同 的 幼体 ,使 得 通过 增加 幼
体 数量 提高 可 捕捞 鱼 类 产量 之 计划 得 以 实施 .系统 学 家 还 通过 随 船 服务 和 举办 管理 人 员 分 类 培训
班 ,为 这 项 捕 拓 业 提供 后 续 服 务 。
要 维持 和 扩大 鱼 类 可 捕捞 种 群 的 规模 ,准确 无 误 的 系统 学 信息 必 不 可 少 。 例 如 ,有 关 西 班 牙 铺 的
数据 都 以 巴西 种 群 为 根据 ,渔业 人 员 最 初 打算 利用 这 一 信息 来 管理 墨西哥 湾 和 美国 东海 岸 的 种 群 。
然而 系统 学 研究 证 明 , 巴 西 种 群 为 本 brasiliensis ,与 北美 种 群 ,Scoxzperomzozrzs maculatus 截
然 不 同 。 由 于 两 个 种 的 生物 学 特性 各 异 , 像 南方 种 那样 进行 管理 很 可 能 会 导致 失败 。
了 解 和 保护 地 球 的 生命 支持 系统
地 球 表面 的 环境 与 有 生命 的 生物 间 的 关系 十 分 密切 ,并 随时 间 的 推移 而 改变 。 地 球 上 数 百 万 的 物
种 不 仅 相互 关联 ,与 周围 的 环境 也 息息相关 ,最 终 形成 了 一 个 维持 生命 存在 的 错综复杂 的 生态 网 络 。
这 种 关系 的 产物 免费 为 我 们 提供 了 清洁 的 空气 .水 .肥沃 的 土壤 及 调节 地 球 的 地 球 化 学 循环 (基本 上
通过 微生物 作用 完成 ) 。 绿 色 植 物 能 吸收 太阳 的 能 量 , 并 把 能 量 转化 给 别 的 生物 .世界 上 的 植被 特别 是
热带 雨林 再 把 水 循环 到 大 气 , 从 而 控制 着 气候 的 变化 。
随 着 人 口 的 暴涨 及 全 球 变化 的 加 快 ,地 球 的 生命 支持 系统 日 益 受 到 威胁 .人 类 从 世界 自然 资源 获
取 食 物 、 住 房 \ 衣 物 和 燃料 的 同时 ,也 给 环境 带 来 了 严重 的 影响 , 像 森林 大 面积 砍伐 .空气 污染 \ 水 污
染 、 全 球 变 暖 等 。
系统 学 的 知识 在 监测 这 种 全 球 变化 方面 起 到 最 基本 的 作用 .收藏 的 标本 是 生物 群落 和 生态 系统
变更 的 见证 ,记载 着 长 时 间 内 环境 对 所 受 压 力 的 反应 。 同 样 是 这 些 标本 ,由 于 包含 不 同 的 物种 存在 和
鉴定 的 基本 科学 证 据 , 因 此 也 是 物种 灭绝 的 最 可 靠 记 载 . 对 下 个 世纪 物种 灭绝 的 推测 ,主要 依靠 森林
砍伐 和 生境 破坏 方面 的 综合 信息 .没有 物种 存在 和 分 布 的 有 完整 记录 的 科学 知识 ,就 没有 生态 变化 和
物种 灭绝 的 准确 评估 .只 有 系统 学 才能 可 靠 地 衡量 生物 多 样 性 的 危机 程度 。
另 一 方面 ,正确 鉴定 物种 对 监测 全 球 变化 也 十 分 重要 .所 有 的 生物 群落 都 包含 一 些 对 环境 变化 特
别 敏感 的 物种 。 比 如 , 某 些 蛙 类 对 空气 质量 的 变化 异常 敏感 ;在 水 生 群 落 中 , 某 些 鱼 类 对 水 纯度 变化 十
分 敏感 .为 此 ,科学 家 已 越 来 越 多 地 利用 这 些 指示 种 来 考察 全 球 变化 对 自然 群落 的 影响 ,从 而 实现 监
测 全 球 变化 的 目的 。 只 有 准确 鉴定 和 描述 这 些 物种 ,掌握 其 分 布 及 近 缘 种 的 知识 ,才能 够 开展 这 些 监
测 活动 。
世界 上 许多 生境 和 生态 系统 都 生活 着 成 千 上 万 的 有 着 极其 复杂 作用 关系 的 物种 .生态 学 家 和 资
源 管 理 人 员 进 行 这 些 相互 关系 的 动态 研究 时 ,由 于 对 即使 是 最 普通 物种 的 鉴定 和 分 布 的 认识 都 还 存
在 着 缺陷 ,这 些 生境 和 生态 系统 的 基本 描述 当然 不 可 能 全 面 。 这 就 要 求 开 展 深 入 的 系统 学 研究 ,描述
和 鉴定 地 球 众 多 生态 群落 中 生存 的 物种 .这些 信 息 对 提供 评定 环境 压力 所 依据 的 基 低 数据 至 关 重 要 。
系统 学 对 自然 资源 的 管理 和 保护 同样 有 重要 作用 。 保 护 区 生物 多 样 性 的 保护 管理 人 员 需 要 对 物
种 作 鉴 定 并 了 解 其 地 理 分 布 , 为 有 效 管 理 策略 的 制定 和 实施 提供 依据 .系统 学 则 为 物种 的 鉴定 多样
性 的 评价 以 及 需要 特别 保护 的 物种 的 确定 提供 了 理论 基础 .此 外 ,系统 学 信息 与 保护 区 和 开发 区 的 选
。206。
arta sede tinny sm
址 和 规划 .它们 与 地 方 和 国家 法 规 的 关系 的 评估 ,都 有 着 紧密 的 联系 。 有 效 管理 动 植物 国际 贸易 也 同
样 需要 精确 的 系统 学 资料 这些 资料 还 直接 有 利于 一 些 像 濒危 野生 动 植物 种 国际 贸易 公约 (CITES)
的 国际 性 条 约 和 公约 的 执行 和 实施 。
提高 日 常生 活 的 质量
生物 的 多 样 性 有 助 于 我 们 去 理解 人 类 意识 和 智力 的 某 些 方面 。 对 自然 环境 的 宁静 和 舒适 的 追求
是 人 类 的 共性 ,这 就 是 许多 宗教 道德 文化 为 什么 具有 保护 和 尊敬 自然 环境 信仰 的 原因 .人 类 能 够 使 其
他 物种 灭绝 ,而 在 伦理 道德 上 ,人 们 普遍 认为 应 肩负 起 阻止 这 种 悲剧 发 生 的 责任 。 这 正 像 Ehrlich 和
Ehrlich (1992 ,第 220 页 ) 指 出 的 那样 , 我 们 认为 ,如 果 大 多 数 人 没有 保护 生物 多 样 性 的 观念 ,那么 这 个
问题 就 不 可 能 得 到 解决 。
纵 观 人 类 历史 ,人 对 其 他 物种 显示 出 极度 的 好 奇 心 , 并 为 其 美学 价值 所 倾倒 。. 人 类 与 自然 的 这 种
联系 在 所 有 民族 中 普遍 存在 ,并 体现 于 对 其 他 物种 的 态度 ,尤其 是 园艺 业 、 宠 物 饲 养 .野生 动物 和 鸟 的
观赏 等 活动 之 中 。 对 其 它 物种 的 美学 和 情感 依托 的 同时 ,还 为 许多 人 创造 了 巨大 的 经 济 效益 ,尤其 在
自然 旅游 和 标本 贸易 这 两 个 方面 。
旅游 业 每 年 创造 的 价值 达 2500 亿 美元 。 如 果 把 观赏 其 他 物种 连带 的 旅行 活动 计 和 人 在 内 ,上 述 收益
中 有 将 近 20%% 来 源 于 生态 或 自然 旅游 .不 少 国家 国民 生产 总 值 的 大 部 分 或 部 分 来 自生 态 旅游 ,其 中 单
是 某 些 物种 就 创造 了 巨额 收入 .例如 在 东非 ,肯尼亚 Amboseli 公园 的 一 头 狮子 十 五 年 内 可 创汇 50 万
美元 ,所 有 的 非洲 象 每 年 创汇 60 万 美元 。 如 果 计 人 此 类 自然 区 域 各 项 配套 产业 的 盘 利 ,这 项 收入 在 全
世界 可 达 几 百 亿美 元 ( 见 专栏 7) 。
专栏 7
系统 学 与 生态 旅游
系统 学 研究 对 生态 旅游 业 的 贡献 重大 .系统 学 方面 的 出 版 物 ,例如 修订 版 .图解 专著 、 纺 目 、 标
本 等 ,为 野外 向 导 、 旅 行 向 导 、 电 影 、 录 像 、 录 音 及 其 他 宣传 手段 提供 了 科学 的 背景 材料 。
上 千年 来 ,人 类 不 论 生 存在 哪里 ,都 始终 和 其 他 物种 的 驯化 种 植 打 着 交道 .当今 驯养 和 栽培 的
动 植 物 已 有 几 万 种 ,其 繁殖 和 贸易 的 商业 价值 有 几 十 亿美 元 (CGroombridge 1992) 。 举 例 说 明 , 仅 英 国
就 栽培 有 3000 多 种 用 作 装 饰 的 植物 ;全 世界 有 贸易 记录 的 兰花 种 类 超过 5000 种 .从 国际 商业 范 栈 来
讲 , 像 鸟 类 、 疏 行 动物 、 蛙 类 、 热 带鱼 类 、 蝴 蝶 、 最 蛛 等 动物 的 出 口 每 年 可 创造 几 亿美 元 的 效益 。 系 统 学
对 监测 和 管理 世界 自然 资源 的 重大 作用 表现 在 它 提 供 了 准确 的 识别 材料 图解 以 及 物种 分 布 信息 。
世界 上 大 量 的 动 植物 贸易 对 其 自然 种 群 产 生 了 极 大 的 压力 ,尤其 是 从 野外 直接 猎取 。 由 于 许多 物种
形态 的 相似 ,因此 ,有 效 地 监测 物种 和 执行 法 律 必须 依靠 物种 的 准确 鉴别 。
加 强 科学 研究
系统 学 构 画 了 一 个 总 体 框架 ,使 生物 学 的 研究 成 果 在 这 个 框架 内 得 以 整理 和 交流 。 比 较 两 个 或 两
个 以 上 物种 的 生物 学 研究 ,或 针对 某 一 物种 但 其 研究 成 果 最 终 会 被 对 其 它 种 有 兴趣 的 生物 学 家 考虑
的 生物 学 研究 ,都 或 多 或 少 地 借鉴 系统 学 的 研究 结果 .系统 学 研究 的 结果 对 选择 研究 系统 和 评价 一 些
有 意义 的 生物 学 现象 的 普遍 性 也 有 重要 的 作用 。
通过 分 析 物 种 关系 而 产生 的 系统 发 育 树 包 含 着 对 血统 (共同 祖先 )、 长 期 的 特征 变化 及 地 理 分 布
(历史 生物 地 理学 ) 变 化 的 假设 .理论 上 讲 ,在 演化 世代 期 所 发 生 的 所 有 生物 学 变化 都 能 在 系统 发 育 树
中 体现 出 来 .近年 来 ,由 系统 学 家 提出 来 的 以 系统 发 育 假设 为 依据 的 严 廊 的 比较 研究 法 得 到 了 发 展 ,
用 来 研究 和 解释 一 系列 生物 学 现象 ,例如 寄生 物 及 寄主 的 生物 地 理学 和 协同 进化 ,生态 学 和 行为 学 的
历史 变迁 等 (Brooks 和 McClennan 1991) .与 此 同时 ,系统 发 育 假设 也 成 为 研究 适应 、 物 种 形成 、 灭 绝
等 基本 进化 过 程 的 理论 基础 。
2000 年 系统 学 议程 的 任务
2000 年 系统 学 议程
制订 生物 圈 计 划
系统 学 知识 的 基本 用 户 :
1. 物种 的 发 现 和 编目 =a . 医疗 和 保健
预测 性 分 类 和 数据 库
2 比较 物种 并 推测 LUTE SSA . 生物 技术
系统 发 育 史 ye . 农业 和 渔业
3. 利用 系统 发 育 及 由 . 林产 工业
此 产生 的 分 类 来 结 学 知识 | Le . 保护 及 资源 管理 者
合 基础 和 应 用 生物 学 . 生态 旅游
4. 提供 可 持续 利用 生物 . 基础 生物 科学
多 样 性 的 基本 数据
第 一 项 任务 :全球 物 种 多 样 性 的 发 现 . 描 述 和 编目
生物 圈 物 种 的 发 现 . 摘 述 和 编目 是 人 类 用 智慧 管理 生物 圈 的 一 个 重要 贡献 .由 于 许多 物种 过 于 微
小 ,其 研究 十 分 困难 ,造成 世界 各 地 生物 多 样 性 的 了 解 甚 少 。 璧 如 说 ,世界 上 任何 一 处 普通 庭院 都 生存
有 许多 物种 ,将 这 些 物 种 逐一 列 出 几乎 不 大 可 能 ,更 何况 比 它 复杂 得 多 的 生态 系统 。
迄今 为 止 , 系 统 学 家 大 约 已 经 描述 了 140 万 种 生物 ,其 中 大 部 分 是 昆虫 。 据 推测 ,尚未 发 现 和 描述
的 物种 仍 有 1 千 万 到 一 亿 种 ( 见 专栏 8)。 ,
有 待 了 解 的 物种 的 数量 多 得 如 此 令 人 吃惊 ,这 似乎 又 与 我 们 在 日 常生 活 中 所 接触 到 的 少数 树木 、
哺乳 动物 、 鸟 类 、 蝴 蝶 及 其 他 常见 物种 大 有 出 人。 那么 就 去 想象 一 下 大 片 的 雨林 ,那里 仅 在 一 棵 树 上 就
能 发 现 几 百 种 昆虫 ,在 一 小 块 森 林 就 生存 有 几 百 个 不 同 的 树种 , 仅 在 几 立 方 英尺 的 土壤 和 地 表 腐 叶 中
就 会 生活 着 上 千 种 微小 的 螨 、 线 虫 \ 真 菌 和 微生物 。
。208。
物种 数量 知 多 少 ? 几 个 事例
已 描述 物种 的 数量 《有 竺 发 现 物种 的 估量
ST 约 50 万
a 40— 30077
7A 100—150 Jr
4 万 10— 70%
4 万 20781 = TF
post 30— 5077
sp]
50—1004
204
1573
75—10037
8004 —14Z
5| A Groombridge(1992)
人 类 对 全 球 环境 造成 的 压力 ,迫切 要 求 尽快 掌握 世界 生物 多 样 性 的 知识 。 这 项 工作 要 求 我 们 加 大
探索 地 球 的 力度 ,汇集 这 些 物 种 的 样本 ,仔细 分 析 发 现 的 标本 ,以 准确 判断 它们 与 已 知 物 种 的 区 别 。 要
实现 此 项 目的 ,就 必须 支持 对 地 球 生境 开展 综合 性 的 考察 和 编目 以 及 对 收藏 标本 的 研究 工作 。 今 后 的
几 十 年 中 ,地 球 五 分 之 一 之 多 的 物种 行将 灭绝 ;但 目前 对 全 球 生物 资源 的 编目 远 远 不 够 ,难以 提供 物
种 多 样 性 的 信息 .物种 多 样 性 充满 活力 ,可 推动 世界 走向 一 个 可 持续 发 展 的 未 来 。
本 项 任务 中 ,应 优先 考虑 以 下 几 个 方面 的 工作 :
1. 调查 海洋 、 陆 地 和 淡水 生态 系统 ,获得 全 球 物种 多 样 性 的 综合 性 知识 ;
2. 确定 这 些 物种 的 地 理 分 布 和 时 间 分 布 ;
3. 发 现 、 描 述 和 编目 受 威胁 及 濒危 生态 系统 中 生存 的 物种 ;
4. 把 了 解 最 少 的 生物 类 群 作 为 目标 ;
5. 对 能 够 维持 全 世界 各 种 生态 系统 的 功能 及 完整 性 .促进 人 类 健康 .改善 人 类 食物 来 源 的 关键 类
群 进行 编目 。
全 球 物种 编目 的 作用
1. 能 推动 物种 的 发 现 和 分 类 ,综合 有 关 物 种 的 信息 并 编 和 人 数据库 ,便于 快速 查询 。
2. 能 获得 世界 上 很 多 生态 系统 内 物种 多 样 性 、 分 布 、 特 性 方面 的 信息 。
3. 能 进行 本 底 评估 ,对 全 球 变化 进行 长 期 监测 和 分 析 。
4. 能 发 现 新 的 生物 资源 。
基于 科学 、 经 济 和 伦理 上 的 原因 ,我们 必须 阐述 和 了 解 物 种 多 样 性 的 重要 性 ,以 免 为 之 过 晚 .本 项
任务 的 效益 远 远大 于 迎接 生物 多 样 性 危机 之 挑战 所 需要 的 投资 数额 .我 们 没有 比 这 更 大 的 科学 举措 ,
也 没有 比 这 更 好 的 机 会 。
第 二 项 任务 :分 析 这 个 全 球 发 现 计 划 获 得 的 信息 ,
并 将 其 融合 于 一 个 能 反映 生命 史 的 预测 性 分 类 系统
2000 年 系统 学 议程 的 第 一 项 研究 任务 包含 着 一 个 生物 多 样 性 最 基本 的 问题 :哪些 物种 与 我 们 共
同 栖 上 县 地 球 ? 除 此 之 外 ,系统 学 家 还 有 另外 一 个 研究 目标 ,这 就 是 记录 物种 的 特性 ,综合 生物 学 其 他 领
”209。
=
18°
14
10
a
13
11
各 种 生物 的 大 小 代表 其 主要 分 类 单元 已 描述 物种 的 数量 ,
单位 尺寸 :Dj= 约 1 千 个 已 描述 的 种
分 类 单元
1 原核 生物 界 ( 细 菌 、 蓝 绿 淋 ) (水 母 .珊瑚 、 梢 子 母 ) 14 非 昆虫 节肢 动物 门
2A 8 FG hl ( me & ) (8 HOH .甲壳 动物 等 )
3 RK 9 线形 动物 门 (线虫 ) 15 鱼 纲 ( 鱼 类 )
4 植物 界 (多 细胞 植物 ) 10 环节 动物 门 ( 虹 旭 等 ) 16 两 栖 岗 (两 栖 动物 )
5 原生 动物 门 11 软体 动物 门 ( 软 体 动物 ) 17 爬行 纲 ( 爬 行动 物 )
6 多 和 孔 动 物 门 (海绵 ) 12 RR Ath (i ZF) 18 f (4 #)
7 腔 肠 动物 门 13 昆虫 纲 19 哺乳 类 (哺乳 动物 )
插图 :Frances L. Faweett, 4 #:Q. D. Wheeler, 1990, 美国 昆虫 学 会 年 刊 83:1031- 1047.
物种 图 是 一 幅 想 象 的 景观 。 图 上 生物 的 大 小 与 其 代表 类 和 群 的 物种 数量 成 正比 。 这 些 数量 还 不 够 准确 ,许多 物种 尚未 被 发 现 或 描述 ,对 大 部 分 物种 的 系统 发 育 关 系 也 了 解 其
少 。 例 如 昆虫 (甲虫 ) 以 迄今 描述 的 95 万 种 为 准 ,但 据 昆 虫 学 家 估计 可 能 有 1 千 万 种 以 上 。 图 中 涉及 的 其 他 类 群 如 爬行 动物 和 许多 无 脊 椎 动物 的 分 类 单元 ,可 能 未 按 其 自然
类 群 组 合 , 也 就 是 说 它 门 可 能 不 具有 一 个 独特 的 共同 祖先 。 随 着 物种 的 描述 、 其 间 关系 的 穴 析 和 分 类 对 系统 发 育 的 反映 ,本 图 将 全 面 .形象 地 体现 生物 多 样 性 ,
域 的 数据 ,并 为 解释 生物 学 信息 提出 一 个 理论 框架 .仅仅 具 备 一 份 物种 的 名 录 并 不 能 得 到 整理 所 掌握
知识 的 一 个 预测 性 框架 。 永 续 利 用 地 球 的 生物 多 样 性 ,预测 的 准确 性 十 分 重要 .事实 上 ,系统 学 家 已 经
掌握 了 一 套 整 理 生 物 多 样 性 知识 的 科学 依据 ,其 中 包括 通过 了 解 物种 间 血 缘 关 系 或 系统 发 育 关 系 而
产生 的 分 类 系统 ( 见 专栏 9) 。
现 生 物种 是 进化 多 样 化 慢 长 历史 的 最 终 产 物 . 进 化 史上 共同 祖先 和 相关 性 之 独特 模式 是 建立 物
种 系统 发 育 的 基础 .按照 这 种 系统 发 育 遗 产 进行 的 分 类 称 为 自然 分 类 。
物种 的 知识 是 按照 生物 系统 发 育 分 类 进行 整理 的 。 获 得 这 些 知识 能 使 科学 家 们 推断 有 特殊 科学
价值 或 社会 价值 的 物种 及 其 特性 ,并 有 利于 创造 保存 这 些 知识 的 有 效 的 信息 系统 ( 见 专栏 10)。 这 些 知
识 还 将 推动 新 的 多 学 科研 究 .按照 自然 分 类 的 理论 框架 储存 和 查询 信息 ,能 够 更 有 效 更 经 济 地 利用 物
种 及 其 生境 的 知识 ( 见 专栏 11)。
专栏 9
系统 发 育 知识 使 基础 生物 学 与 应 用 生物 学 相 结 合
分 析 系 统 发 育 关系 是 一 项 综合 性 的 工作 ,可 把 它 比 作 是 汇集 各 研究 领域 数据 的 一 个 总 成 .这 些
研究 领域 包括 大 解剖 和 显 微 解剖 学 、 发 生生 物 学 、 遗 传 学 .分子 生 物 学 .比较 生理 学 .地质 学 .古生物
学 .生态 学 行为 学 以 及 生物 地 理学 .一 项 研究 中 最 后 采用 的 数据 取决 于 所 研究 生物 的 种 类 、 与 这 些
生物 有 关 的 知识 的 多 少 以 及 不 同类 型 的 数据 对 确定 种 间 关 系 所 起 作用 的 大 小 。
系统 学 家 把 各 种 生物 特征 的 相似 性 归结 到 等 级 模式 之 中 ,以 反映 生物 的 系统 发 育 史 。 这 样 , 猫 类
物种 具有 的 相似 性 在 能 类 物种 中 则 没有 ; 像 猫 类 和 能 类 的 食肉 动物 所 具备 的 相似 性 ,其 他 哺乳 动物
中 也 不 存在 。 更 广泛 一 些 , 所 有 哺乳 动物 具有 的 特征 ,如 毛皮 和 乳腺 等 ,其 他 肴 椎 动物 都 没有 , 依 此 类
推 , 直 到 包括 所 有 生命 类 群 .由 此 ,掌握 这 种 历史 等 级 使 系统 学 家 能 够 准确 地 预测 没有 仔细 研究 过 的
物种 的 特征 。 这 种 推测 有 着 重大 的 经 济 意 义 。 从 鲜 为 人 知 的 物种 中 寻找 新 的 活性 药物 化 合 物 就 是 其
中 一 例 ( 见 专栏 11)。
自然 分 类 如 何 进行 预测
正 像 物 种 特征 比较 研究 可 以 揭示 种 阅 进 化 关系 那样 ,进化 关系 也 可 用 所 谓 的 自然 分 类 清楚 地 表
示 出 来 .物种 间 的 关系 划 有 等 级 ,其 分 类 也 是 如 此 。 这 种 关系 按照 十 八 世纪 瑞典 分 类 学 家 卡尔 * 林 奈
的 姓名 命名 , 称 为 林 奈 等 级 ,包括 种 、 属 .科目 、 纲 . 门 和 界 . 照 此 分 类 ,所 有 哺乳 动物 都 属于 哺乳 纲 ,
其 中 包括 食肉 目 。 食 肉 目 又 包括 能 类 和 猫 类 ,分 别 属于 驴 科 和 猫 科 。 猫 类 被 划分 在 猫 科 猫 属 Panthera
( 注 : 仅 一 部 分 猫 类 划分 在 这 个 属 ) ,这 一 属 内 还 包括 虎 , 它 的 学 名 (拉丁 名 ) 为 Panthera tigris . 3X #£ Th
特 的 名 称 好 比 一 种 科学 的 语言 ,不 仅 便于 交流 ,而且 也 便于 储存 任何 生物 类 群 的 信息 。
由 此 可 想 而 知 ,按照 这 种 等 级 列 出 的 物种 名 单 比 按照 字母 顺序 列 出 的 名 单 更 能 预测 物种 的 特
征 . 因 此 ,一 种 了 解 甚 少 的 猫 科 动 物 可 以 预测 它 具 备 其 他 猫 科 动物 的 许多 特征 、 食 肉 动 物 的 一 些 特 征
和 所 有 哺乳 动物 的 部 分 特征 .按照 字母 顺序 列 出 的 名 单 ,或 没有 准确 反映 种 间 关 系 的 等 级 分 类 名 单 ,
则 不 具备 这 种 推测 功能 。
上 述 简单 事例 在 人 类 应 用 物种 知识 方面 具有 深远 的 意义 .假如 为 增强 对 物种 生物 学 特性 的 预测
能 力 , 把 这 种 知识 聚集 在 数据 库 内 ,从 此 便 能 更 有 效 、 更 经 济 地 利用 这 些 特性 的 话 ,我 们 就 会 在 自然
分 类 的 理论 框架 内 储存 和 查询 这 些 知 识 。 这 进一步 突出 了 发 现 所 有 物种 系统 发 育 关系 的 重要 性 。
分 类 的 预测 价值 :紫杉醇 与 癌症
天 然 产 品 紫杉醇 产 自 短 叶 紫 杉 (Tazrus brevifolia) 的 皮 , 经 证 实 是 一 种 治疗 卵巢 癌 和 乳腺 瘤 的 强
效 药 剂 .遗憾 的 是 ,从 三 棵 树 的 皮 中 提取 的 紫杉醇 才能 治疗 一 位 瘤 症 患者 ,而 且 事后 树 便 死 亡 。 漫 无
目的 地 去 寻找 含有 同样 产品 的 植物 可 能 会 花费 很 多 年 的 时 间 。 由 于 了 解 短 叶 紫 杉 的 进化 关系 ,人 们
便 着 手 审查 它 的 近 缘 种 .研究 发 现 ,少量 浆果 紫 杉 (Tazrzus baccata) 的 叶 也 能 够 提取 紫杉醇 ,而 且 既 经
济 又 不 会 给 紫 杉 树 带 来 危害 。
更 有 趣 的 是 ,发 现 一 种 生活 在 短 叶 紫 杉 皮 中 的 真菌 新 种 Tazomyces azdzreanae: 它 也 能 产生 紫 杉 |
醇 。 这 样 便 开 辟 了 生产 廉价 有 效 抗 瘤 药 的 可 能 性 。
过 去 的 二 十 年 极 大 地 推动 了 系统 学 理论 和 实践 的 快速 发 展 ,使 揭示 地 球 生命 的 多 样 性 和 系统 发
育成 为 一 个 可 以 实现 拘 目 标 。 电 子 显微镜 术 、 基 因 序列 分 析 等 新 的 数据 收集 方法 进一步 拓宽 了 信息 来
源 , 反 过 来 ,信息 又 协助 人 类 把 物种 划 入 等 级 分 类 ,使 信息 本 身 成 为 所 有 比较 生物 学 领域 内 整理 物种
多 样 性 知识 不 可 缺少 的 框架 。 新 型 计算 机 技术 能 够 进行 大 型 数据 库 的 处 理 , 和 否则 至 少 上 一 代 系 统 学 家
会 被 埋没 在 大 量 的 数据 之 中 。
本 项 任务 中 ,应 优先 考虑 以 下 几 个 方面 的 工作 :
1. 确定 主要 生物 类 群 的 系统 发 育 关 系 ,为 基础 生物 学 和 应 用 生物 学 提出 一 个 总 体 理 论 框架 ;
2. 发 现 对 应 用 生物 学 至 关 重 要 的 物种 类 群 的 系统 发 育 关 系 ,重点 放 在 对 人 类 健康 ,粮食 生产 、 全
世界 各 种 生态 系统 保护 等 有 重要 作用 的 物种 上
3. 发 现 对 基础 生物 科学 至 关 重 要 的 物种 类 群 的 系统 发 育 关 系 , 比 如 与 实验 科学 有 广泛 联系 的 学
科 ,或 者 对 维持 生态 系统 功能 及 完整 性 必 不 可 少 的 学 科 ;
4. 继续 探索 对 分 析 系 统 学 数据 更 有 效 的 技术 和 方法 。
生命 系统 发 育 分 类 的 作用 有 :
1. 建立 一 套 测 定 灭绝 速率 和 全 球 变化 模式 的 框架 ;
2. 为 寻找 基因 、 生 物产 品 \. 生 物 防 治 因子 和 潜在 作物 物种 提供 指导 ;
3. 为 生物 学 知识 的 管理 提供 一 套 预 测 性 框架 ,为 社会 和 科学 的 沟通 芮 定 基础 ;
4. 协助 保护 者 .资源 管理 者 和 政策 制定 者 确定 优先 项 目 ;
5
6
. 为 连结 所 有 生物 学 科 的 比较 研究 .连结 所 有 生物 类 群 的 多 学 科研 究 创造 基础 ;
.为 了 解 形成 当今 生命 多 样 性 的 物种 形成 .灭绝 .适应 等 过 程 提供 科学 基础 。
第 三 项 任务 :把 这 个 全 球 计 划 获 得 的 信息 整理 成 为 一 种 有 效 的 、. 可 查询 的 形式 ,
以 最 大 限度 地 满足 科学 和 社会 的 需求
掌握 世界 数 百 万 物种 的 大 量 知识 ,就 需要 新 型 的 配套 系统 的 支持 ,这 样 才 能 有 效 地 利用 和 查询 这
些 知 识 . 这 种 信息 系统 包括 系统 学 ` 地 质 学 和 生态 学 方面 的 数据 ,其 来 源 途 径 主 要 是 现 有 自然 历史 标
本 收藏 图 书馆 、 档 案 馆 以 及 不 断 发 展 着 的 调查 和 编目 。 随 着 新 种 的 发 现 . 系 统 发 育 关系 的 阐述 以 及 其
他 信息 的 积累 ,有 关 物 种 的 知识 也 需要 不 断 更 新 .电子 知识 在 全 世界 的 普及 使 所 有 国家 都 受益 菲 浅 。
数据 库 例如 分 子 遗传 学 数据 库 ,必须 通过 标准 的 物种 名 称 和 系统 发 育 分 类 与 其 他 生物 技术 数据 库 相
连接 。
系统 学 的 发 展 依靠 物种 信息 的 积累 和 交流 。 在 过 去 ,信息 是 通过 植物 志 、 动 物 志 、 专 著 ` 民 族 生物
学 研究 等 文字 印刷 方式 进行 积累 和 传播 的 。 除 此 之 外 ,还 有 几 亿 个 标本 和 与 标本 有 关 的 数据 散 存 在 世
界 各 地 的 系统 学 标本 存储 机 构 。 这 些 信息 必须 按照 科学 名 称 进 行 整理 ,同时 科学 名 称 要 遵循 以 种 间 关
系 为 依据 的 等 级 分 类 。
高 速 的 信息 处 理 技术 、 硬 件 以 及 建立 有 亲缘 关系 的 数据 库 等 现代 化 信息 手段 的 出 现 , 使 人 们 能 够
为 任何 意图 .以 任意 组 合 方式 提取 物种 信息 。 在 综合 其 他 数据 库 内 的 信息 后 ,将 为 提出 地 球 生 命 组 合
和 2 多
新 的 见解 提供 依据 。 另 一 方面 ,以 上 的 数据 库 还 能 避免 研究 和 管理 的 重复 ,节省 数 百 万 美元 的 经 费 。 然
而 ,由 于 各 种 来 源 的 欠缺 ,彻底 改革 系统 学 在 实际 应 用 上 的 作用 以 及 大 大 地 扩展 其 对 科学 和 社会 的 价
值 的 理想 还 没有 实现 。 要 发 挥 散 落 在 世界 各 地 的 物种 信息 的 优势 ,就 应 当 开 展 这 项 工作 。 事 实 上 ,保护
生物 学 家 、 资 源 管 理 者 及 其 他 自然 资源 利用 者 曾 多 次 要 求 获 得 这 些 信 息 。
本 项 任务 中 ,应 优先 考虑 以 下 几 个 方面 的 工作 :
1. 以 世界 自然 历史 标本 存储 机 构 收藏 的 标本 为 基础 ,建立 物种 信息 的 系统 学 \ 生 物 地 理学 和 生态
学 数据 库 。
2. 综合 系统 学 标本 存储 机 构 的 数据 和 地 理 信息 系统 (GIS) 数 据 库 的 信息 ,为 监测 过 去 和 现在 全
球 变化 对 物种 的 分 布 和 灭绝 造成 的 影响 提供 条 件 。
3. 建立 各 数据 库 间 的 联系 ,使 各 种 分 类 单元 及 其 分 布 区 所 有 有 用 的 信息 可 有 效 地 被 查询 。
4. 建立 和 采用 一 套 信息 系统 ,便于 国际 用 户 的 使 用 。
5. 编撰 所 有 系统 学 数据 库 必需 的 \ 包 括 分 类 名 称 ` 地 理 分 布 及 其 他 信息 内 容 的 数据 字典 。
6. 出 版 手册 、 图 解 、. 电 子 动 植物 志 、 专 著 等 数据 产品 。
7. 通过 持续 提供 软件 和 硬件 的 支持 ,以 建立 维持 和 更 新 数据 库 及 信息 网 络 的 机 制 。
有 效 的 系统 学 信息 系统 的 作用 有 :
” 工 .使 政策 制定 者 作出 更 全 面 的 资源 永 续 利用 决策 。
2. 更 详细 地 记载 物种 的 灭绝 及 其 分 布 的 变化 。
3. 系统 学 及 相关 信息 的 数据 库 使 用 效率 越 高 ,就 越 能 更 经 济 地 管理 生物 资源 。
4. 方 便 系 统 学 知识 的 获得 ,便于 解决 问题 。
5. 在 生物 学 及 其 他 领域 特别 是 生物 技术 的 数据 之 间 建 立新 的 比较 和 联系 的 方法 。
6. 加 强国 际 交 流 与 合作 ,减少 科研 工作 的 重复 。
迎接 挑战 :基础 设施 与 人 才 资源
被 里 约 热 内 卢 召 开 的 联合 国 环境 与 发 展 大 会 以 及 生物 多 样 性 公约 采纳 的 全 球 行动 计划 (21 世 纪
议程 ) 呼 吁 各 参 会 国 制定 国家 策略 ,去 编目 和 了 解 本 国 的 生物 多 样 性 ,并 制定 今后 的 保护 计划 。 在 编目
和 了 解 世界 生物 多 样 性 的 过 程 中 ,国际 社会 将 面临 两 个 重大 的 挑战 .第 一 ,需要 极力 扩大 和 改善 系统
学 研究 的 基础 设施 建设 ,特别 是 修 盖 生物 标本 收藏 馆 ; 第 二 ,强化 专业 系统 学 人 员 的 培训 和 录用 ,改变
“分 类 学 障碍 ”的 说 法 。
系统 学 为 生物 多 样 性 研究 商定 了 基础
“许多 建议 (加 强 基 础 和 应 用 保护 研究 ) 认 为 , 现 有 分 类 学 知识 能 够 承担 这 些 工 作 。 然 而 ,完成 这
项 工作 所 需要 的 训练 有 素 的 分 类 学 队伍 并 不 存在 .生物 多 样 性 的 描述 .编目 分 类 ,监察 和 管理 知识
必须 经 过 培训 .有 了 以 上 这 些 基础 才能 去 研究 和 保护 生物 多 样 性 。”
国家 研究 委员 会 ,保护 生物 多 样 性 ,1992, 第 71 页
系统 学 界 通过 2000 年 系统 学 议程 ?提出 系统 学 行动 计划 的 建议 .上 面 提 到 的 三 项 任务 的 成 功 , 对
履行 这 个 行动 计划 是 必要 的 。 这 项 计划 有 以 下 几 个 主要 点 :
1. 所 有 的 国家 为 了 解 、 保 存 和 利用 他 们 的 生物 多 样 性 就 要 建立 和 加 强 具 标本 收藏 馆 的 系统 学 研
究 中 心 ;
2. 对 系统 学 家 和 其 支撑 系统 工作 人 员 进 行 教育 和 培训 的 有 关 单 位 进行 资助 ;
3. 在 基础 和 应 用 系统 学 范围 内 要 扩大 研究 工作 的 队伍 ;
A. 全 世界 系统 学 研究 单位 之 间 在 研究 和 教育 方面 开展 国际 合作 和 交流 ;
5. 在 上 述 这 些 单 位 之 间 ,并 扩大 到 社会 上 建立 起 电子 交流 的 联系 ;
6. 支持 基于 分 类 单元 和 全 世界 范围 的 比较 系统 学 研究 。
se
建立 和 加 强 系 统 学 研究 中 心 及 标本 收藏
在 一 些 国家 中 没有 合适 的 基础 设施 来 存放 世界 上 大 多 数 国家 的 生物 多 样 性 标本 ,是 得 不 到 生物
多 样 性 综合 知识 的 一 个 原因 。 同 时 ,发 达 国 家 的 系统 学 研究 中 心 也 不 是 以 支持 它们 为 执行 上 述 研 究 任
务 所 承担 的 应 负 的 责任 。 物 种 丰富 国家 未 来 的 繁荣 将 有 赖 于 发 展 管理 他 们 自己 的 生物 资源 的 能 力 ,其
中 包括 要 具备 为 提供 对 有 效 地 作出 决策 所 需 知 识 的 科学 基础 设施 .世界 各 国 为 克服 科学 能 力 的 不 足 ,
就 必须 通过 建造 新 的 或 加 强 现 有 标本 收藏 馆 的 基础 设施 ,例如 博物 馆 、 标 本 馆 和 为 微生物 和 遗传 资源
保存 所 需要 的 贮藏 所 。
全 世界 自然 历史 标本 收藏 馆 拥 有 20 亿 号 标本 (Duckworth 等 ,1993) 。 我 们 虽然 已 掌握 有 如 此 巨大
的 生物 学 遗产 ,但 是 通过 已 保存 的 标本 ,只 鉴定 了 地 球 物 种 多 样 性 的 一 小 部 分 .植物 、 动物 和 其 它 生 物
的 系统 学 标本 收藏 馆 仅仅 是 我 们 生物 区 系 的 永久 性 记录 。 起 源 于 这 些 标 本 收藏 馆 的 特殊 的 库 和 数据
库 是 我 们 对 地 球 自然 历史 的 书面 的 记录 ( 见 专栏 12)。 已 保存 标本 的 系统 学 收藏 馆 可 在 自然 历史 博物
馆 、 标 本 馆 和 大 学 的 标本 馆 和 农业 部 .自然 资源 或 生物 考察 等 政府 有 关 部 门 的 标本 馆 内 见 到 。 这 些 标
本 收藏 馆 也 可 以 活 生 物 的 形式 保存 在 动物 园 、. 水 族 馆 .昆虫 馆 、 乌 类 馆 、 植 物 园 内 ,或 者 如 种 质 、 冷 冻 的
组 织 和 微生物 的 模式 标本 保存 在 特殊 的 贮藏 器 内 。
有 保存 标本 的 标本 收藏 ( 馆 ) 的 系统 学 研究 中 心 馆 是 各 国 乃 至 全 世界 有 关 生 物 多 样 性 知识 的 贮藏
场所 .尽管 各 国标 本 收藏 的 基础 设施 不 同 , 但 它们 基本 上 具有 两 种 主要 功能 。 第 一 种 是 国家 研究 中 心 ,
通过 标本 馆 、 图 书馆 和 数据 库 , 记 载 本 国 的 生物 多 样 性 。 第 二 种 设施 也 很 有 存在 的 必要 ,这 类 中 心 的 功
能 是 支持 重点 放 在 分 类 单元 , 且 有 国际 意义 的 系统 学 研究 或 标本 收藏 .有 些 中 心 只 有 上 述 一 种 功能 ,
而 另外 一 些 中心 则 具有 足够 的 基础 设施 和 科研 力量 ,两 种 功能 兼备 .许多 中 心 可 以 在 现 有 机 构 和 标本
收藏 馆 的 基础 上 建立 ,而 有 些 则 必须 重新 建立 。 不 论 是 那 种 情况 ,科学 设施 的 核心 都 应 当 包 括 有 分 类
单元 知识 的 专业 系统 学 家 。
系统 学 标本 收藏 馆 的 重要 性
“科学 标本 收藏 馆 是 社会 在 了 解 自然 界 过 程 中 的 一 项 持续 性 投资 .… ……'. 随 着 生境 的 消失 、 物 种
的 灭绝 和 有 重要 地 质 学 及 古生物 学 价值 的 遗址 的 破坏 ,这 些 标本 收藏 迄 中 的 标本 已 成 为 一 种 不 可 再
EUR.”
一 保存 自然 科学 标本 收藏 馆 :环境 遗产 记事 ,第 6 页
1. 标本 收藏 馆 是 人 类 自然 遗产 的 永久 性 记录 , 它 包 含 着 许多 科学 领域 的 研究 所 不 可 缺少 的 材
料 ,例如 保存 生物 多 样 性 和 监测 全 球 变化 的 研究 ;
2. 标本 收藏 馆 能 满足 应 用 生物 学 的 需求 ,例如 卫生 科学 (寄生 虫 学 .流行 病 学 .诊断 学 ) PL
源 管理 ` 生 物 技 术 等 ;
3. 标本 收藏 馆 积 极 支 持 公 共 教 育 和 正规 教育 计划 ;
4. 通 过 标本 收藏 馆 的 展览 提高 自然 保护 及 生物 多 样 性 保护 的 公众 意识 。
国家 系统 学 研究 中 心 。 国 家 研究 中 心 应 当 建 有 收藏 各 地 方 或 各 地 区 动 植物 区 系 的 标本 收藏 馆 ,使
国内 生物 多 样 性 研究 和 管理 能 够 采用 准确 .最 新 的 系统 学 数据 。 世 界 各 地 的 标本 收藏 馆 要 求 配 有 专业
人 员 ,以 便 提 供 当 地 生物 区 系 鉴 定 准 确 的 标本 ;这 些 标本 许多 都 是 当地 的 特有 种 .此 外 ,全 国生 物 学 调
查 所 得 数据 的 核实 也 要 依靠 这 些 系 统 学 标本 收藏 馆 中 的 佐证 标本 。 只 有 研究 这 些 标本 ,研究 人 员 才 能
断定 同一 物种 在 不 同 地 区 被 发 现 。
国家 生物 资源 研究 中 心 的 迅速 发 展 以 及 世界 各 国 制 定 的 各 种 计划 ,如 墨西哥 的 全 国生 物 多 样 性
交流 委员 会 (CONABIO)、 哥斯达黎加 的 国家 生物 多 样 性 研究 所 (INBio) .美国 的 全 国生 物 多 样 性 调查
等 ,都 为 此 类 项 目 在 国内 的 顺利 开展 商定 了 基础 .这些 计划 作用 重大 ,是 研究 .管理 和 保护 各 国生 物 多
样 性 的 基础 ,也 是 争取 国内 支持 这 些 行 动 的 依据 。
国际 系统 学 研究 中 心 .2000 年 系统 学 议程 行动 计划 的 内 容 之 一 就 是 建立 新 的 或 完善 现 有 的 系统
。 214
学 研究 中 心 ,为 实现 记录 世界 生物 多 样 性 这 个 目标 作出 贡献 .各 个 国家 研究 中 心 重 复 各 种 生物 类 和 群 的
标本 收藏 馆 或 分 类 研究 既 不 现实 ,也 没有 必要 。 相 反 , 了解 世界 上 某 一 分 类 单元 情况 的 系统 学 家 则 必
须 得 到 收藏 各 国标 本 的 研究 中 心 的 资助 ,以便 在 世界 各 地 开展 研究 工作 ,因为 物种 往往 经 常 是 跨国 境
分 布 的 .系统 学 研究 最 终 以 分 类 单元 来 定向 的 ,所 以 就 必须 全 面 地 在 世界 范围 内 收藏 各 种 生物 类 群 的
标本 。 由 于 地 区 性 标本 收藏 一 般 不 够 全 面 , 很 难 广泛 地 满足 比较 系统 学 研究 的 要 求 , 各 国 研 究 机 构 有
必要 充分 地 参与 。 由 此 ,国际 研究 机 构 间 的 合作 和 数据 库 联网 不 可 缺少 。 物 种 丰富 国家 研究 机 构 间 的
伙伴 关系 也 应 当 建 立 起 来 ,以 便 保 持 系统 学 标本 收藏 馆 的 稳定 和 发 展 , 建 立 起 交流 标本 .生物 多 样 性
信息 、 培 训 水 平和 科学 知识 的 网 络 。 任 何 一 个 标本 收藏 馆 都 不 可 能 有 研究 各 种 生物 类 群 的 系统 学 家 ,
可 见 各 类 群 世 界 级 专家 的 人 员 交 流 也 势 在 必 行 .系统 学 界 如 果 想 多 快 好 省 地 编目 和 划分 世界 的 物种
多 样 性 ,建立 起 这 种 联系 妃 关键 所 在 。
在 各 有 关 国 家 建立 系统 学 研究 中 心 , 就 要 求 开展 一 些 重大 的 国际 合作 项 目 。 除 个 别 情况 外 ,世界
上 物种 丰富 国家 基本 上 没有 标本 收藏 馆 , 即 使 有 也 得 不 到 足够 的 支持 .这 些 标本 收藏 馆 大 部 分 都 缺乏
专业 系统 学 家 和 受过 培训 的 辅助 人 员 ,可 用 于 调查 和 编目 的 经 费 也 普遍 不 足 , 更 不 用 说 资助 系统 学 家
到 世界 各 地 的 标本 收藏 馆 去 进行 必要 的 比较 研究 .物种 丰富 的 国家 如 果 要 建立 一 套 系统 学 知识 体系 ,
为 生物 多 样 性 的 保护 和 永 续 利 用 提供 服务 ,就 必须 解决 这 些 问题 ( 见 专栏 13) 。
在 发 达 国 家 ,系统 学 标本 收藏 馆 的 数量 和 侧重 各 不 相同 。 以 美国 为 例 , 主 要 的 系统 学 研究 中 心目
前 有 50 多 个 ,收藏 从 细菌 到 鲸 几 症 包括 所 有 生命 类 型 的 标本 .大 型 标本 收藏 中 心 都 是 一 些 重要 的 自然
历史 博物 馆 及 植物 园 ,州立 机 构 、 联 邦 机 构 . 许 多 大 学 也 有 .此 外 , 侧重 收藏 地 区 标本 的 研究 机 构 也 很
多 ,这 些 标 本 收藏 馆 具有 重要 的 历史 和 科学 价值 。
与 系统 学 标本 收藏 馆 有 关 的 数据 中 心 `. 图 书馆 和 档案 馆 同样 是 系统 生物 学 研究 的 重要 场所 。 专 业
图 书馆 并 不 仅 限 于 收藏 书刊 ,也 同样 收集 卡片 索引 、 目 录 、 原 稿 、 插 图 .照片 缩微 胶片 记录 、 制 图 法 资
料 、 文 献 档案 及 不 同类 型 的 电子 媒介 物 等 。. 近 几 年 来 ,科学 信息 的 大 量 产生 也 相应 使 大 多 数 研 究 机 构
的 收集 能 力 有 所 提高 。 如 果 生 物 多 样 性 的 全 球 调查 和 编目 工作 获得 成 功 , 即 使 是 最 大 的 研究 中 心 , 其
贮存 和 管理 信息 的 能 力也 会 逐渐 显得 不 足 。 只 有 加 强 基 础 设施 建设 ,提高 系统 学 数据 库 的 储存 、 查 询
和 利用 的 水 平 , 才 能 使 世界 科学 家 共享 信息 ,避免 研究 重复 和 面向 社会 。
利用 收藏 标本 解决 问题
1. 当 公 共 健 康 官员 担心 鱼 类 体内 的 水 银 含量 时 , aL HR ee EE th TE TS
模式 。
2. GFE RYE 2 FE RAF 2 9 A A
研究 人 员 联 想到 由 于 环境 中 存在 有 DDT.
3. 导致 爱滋病 及 其 他 疾病 的 病毒 突变 频繁 , 知 与 前 曾 描述 过 的 .贮藏 在 模式 菌 种 或 冷冻 标本 中
的 菌株 进行 比较 , 便 可 帮助 公共 健康 官员 了 解 疾 病 的 传播 途径 。
改善 系统 学 基础 设施 的 建议 :
1. 建立 和 完善 世界 各 国 的 国家 系统 学 研究 中 心 。 这 些 中 心 应 当 盖 有 收藏 记录 国内 生物 财富 的 地
方 及 地 区 参考 标本 收藏 馆 , 具 有 供 研究 和 储存 信息 之 用 的 设施 ,并 具备 培训 和 教育 能 力 ;
2. 建立 或 完善 国际 系统 学 研究 中 心 ,以 利于 获得 系统 学 知识 和 建设 有 分 类 单元 研究 重点 的 世界
性 标本 收藏 馆 ;
3. 通过 建立 国际 网 络 ,改善 世界 上 标本 的 照管 和 保藏 ,实现 知识 、 信息 及 资源 的 共享 。
4. 加 强 和 扩大 现 有 系统 学 研究 中 心 的 储存 能 力 及 研究 力量 ,包括 制定 相应 计划 ,将 所 有 已 登记
的 生物 多 样 性 录 和 人 数据库。
5. 加强 和 扩大 系统 学 研究 中 心间 国际 合作 项 目 进行 。
° 215°
教育 .培训 及 人 才 资源 开发
在 占 世 界 80 色 的 陆 生 生物 多 样 性 的 国家 中 ,其 科学 家 数量 仅 占 6%% ,这 是 获得 科学 知识 了解 和 有
效 利用 生物 多 样 性 的 一 个 严重 制约 。 除 此 之 外 , 另 一 个 制约 因素 是 全 世界 缺少 许多 生物 类 群 的 分 类 专
家 ,包括 一 些 最 富有 多 样 性 和 最 有 经 济 价值 的 类 群 . 由 此 看 来 ,实现 2000 年 系统 学 议程 提出 的 三 项 研
究 任 务 所 面临 的 最 大 挑战 ,或 许 就 是 在 全 世界 招募 、 教 育 、 培 训 和 聘用 足够 的 系统 学 家 和 技术 人 员 。 美
国 国家 科学 理事 会 的 全 球 生 物 多 样 性 特别 工作 组 (1989)、 英 国 上 议院 的 科学 和 技术 选择 委员 会
〈《1991) 等 众多 组 织 和 特别 工作 组 的 结论 认为 ,缺少 生物 的 鉴定 .记录 和 分 类 方面 的 系统 生物 学 家 , 严
重 妨 碍 了 全 球 生 物 多 样 性 减少 之 问题 的 有 效 解决 。
训练 有 素 的 系统 学 家 数量 减少 的 原因 很 多 。 美 国 国家 科学 基金 会 近期 指导 进行 的 一 项 大 学 调查
发 现 , 在 调查 的 有 博士 学 位 授予 权 的 院 校 中 ,系统 生物 学 家 仅 有 940 名 ,25%% 的 所 有 调查 院 校 只 设置 了
副手 职位 (Higher Education Survey,1990) 。 更 可 悲 的 是 , 收 到 的 回复 中 只 有 18%% 的 院 校 表明 如 果 今
后 有 新 的 教员 职位 ,它们 才 会 聘用 系统 学 家 。 在 美国 和 英国 ,系统 学 家 的 研究 工作 和 (或 ) 教 学 职位 由
于 受到 其 他 生物 学 领域 的 竞争 ,在 几 十 年 前 已 紧缩 .因此 ,大 部 分 研究 机 构 在 调查 时 提出 它们 愿 扩大
的 是 分 子 生 物 学 而 不 是 系统 学 项 目 , 因 为 前 者 "具有 更 大 的 资助 机 会 ”。
出 于 上 述 原因 ,新 培养 的 系统 学 家 的 数量 比 二 十 年 前 减少 了 很 多 。 许 多 生物 类 群 的 分 类 专家 越 来
越 少 , 如 藻类 、 细 菌 、 真菌、 低 等 无 脊 椎 动物 `. 昆虫 及 其 近 缘 种 等 .一 些 对 经 济 和 生态 系统 最 为 重要 的 生
物 类 群 更 需要 专业 培训 的 专家 去 作 研 究 .以 线虫 为 例 , 美 国有 15 个 机 构 所 属 的 标本 馆 和 12 名 专职 线虫
系统 学 家 ,但 带 学 生 的 线虫 系统 学 家 只 有 两 位 。 由 于 线虫 对 农业 有 举足轻重 的 作用 ,缺乏 受过 培训 的
专家 必 将 会 带 来 严重 的 经 济 后 果 。
改变 “分 类 学 障碍 ”的 说 法
过 去 几 年 中 下 降 最 严重 的 是 分 类 学 和 系统 学 领域 .受过 培训 的 分 类 学 家 急 缺 ,热带 国家 | .
几乎 没有 .许多 重要 生物 类 群 方面 的 专家 也 显 不 足 , 发 达 国 家 甚至 也 是 如 此 。 另 外 ,可 参考 的 标本 收
藏 馆 也 不 够 ,而 且 地 区 分 布 不 平衡 ,大 都 远离 被 研究 生物 的 原 产 地 。 目 前 分 类 学 的 效率 低下 ,重复 研
究 较 多 .有 鉴于 此 ,在 开展 任何 生物 多 样 性 研究 之 前 ,必须 首先 强调 改变 “分 类 学 障碍 ”的 说 法 。
—DIVERSITAS: IUBS-IUMS-SCOPE-UNESCO
生物 多 样 性 项 目
尽管 人 们 对 许多 类 群 的 系统 学 知识 不 足 或 严重 不 足 有 一 致 的 看 法 ,但 尚 从 缺 能 说 明 该 学 科 有 这
种 趋势 的 证 据 。 统 计 世 界 现 有 的 各 生物 类 和 群 的 系统 学 专业 人 才 十 分 必要 ,只 有 这 样 ,才能 更 准确 .更 有
效 地 重点 实施 培训 和 吸收 人 才 计划 。
系统 生物 学 人 才 资 源 的 匮乏 在 发 展 中 国家 更 为 突出 。 受 过 培训 的 科学 家 的 人 数 、 研 究 经 费 、 标 本
馆 职位 .部门 支持 等 方面 的 不 足 , 都 意味 着 很 少 有 系统 科学 家 投身 这 一 学 科 行 列 。 要 扭转 这 种 局 势 , 迫
切 需要 强化 发 展 中 国家 地 方 自然 历史 研究 机 构 的 作用 ,建立 与 发 达 国 家 研究 机 构 间 的 联系 (National
Research Council) 。 由 于 在 很 多 发 展 中 国家 环境 恶化 和 生物 多 样 性 丧失 的 趋势 不 断 加 快 ,培训 “ 准 分 类
学 家 ”, 让 他 们 与 专业 系统 学 家 一 道 工作 也 不 失 为 解决 人 才 资 源 问题 的 一 种 办 法 ,但 这 并 不 意 谓 着 可
以 取代 建立 有 效 的 科学 基础 设施 和 强大 的 科学 家 队伍 的 计划 。
在 发 达 国 家 ,不 少 像 博物 馆 和 植物 园 之 类 的 研究 机 构 开 展 了 与 附近 大 学 联合 培养 系统 生物 学 本
科 生 和 研究 生 的 项 目 。 这 些 项 目 一 般 说 来 都 有 很 大 的 国际 性 成 分 .尽管 取得 的 成 绩 不 少 ,但 就 物种 多
样 性 的 危机 程度 和 描述 世界 生物 资源 在 科学 和 经 济 上 的 紧迫 性 来 看 ,系统 学 还 必须 得 到 更 多 的 经 费
支持 ,争取 在 研究 生 和 大 学 生 中 培养 出 更 多 的 科学 家 。 部 分 证 据 表 明 ,大 学 生 对 物种 多 样 性 很 感 兴趣 ,
他 们 为 现代 系统 学 研究 的 重要 性 和 在 智力 上 富有 的 挑战 性 所 吸引 .但 由 于 研究 生 经 费 不 足 和 博士 生
毕业 后 就 业 前 景 渺茫 ,他们 只 好 打消 投身 系统 学 研究 的 念头 。
加 强人 才 资 源 的 利用 的 建议 :
1. 从 事 发 展 中 国家 持续 发 展 和 环境 保护 推动 项 目的 国际 机 构 应 当 为 基础 系统 学 研究 以 及 专业 、
准 专业 系统 学 家 的 培训 和 聘任 提供 经 费 支 持 ;
2. 各 国 应 当 建立 全 国生 物 多 样 性 监测 机 构 、 系 统 学 研究 中 心 及 标本 收藏 馆 及 国家 生物 普查 机
构 ,并 为 上 述 活动 的 开展 配置 专业 的 系统 学 家 ;
3. 各 大 学 和 研究 所 凡 设 有 生物 多 样 性 培训 和 教育 项 目 者 ,应 当 配备 专业 系统 学 教师
4. 发 达 国 家 的 政府 机 构 和 自然 历史 研究 机 构 应 当 向 物种 丰富 国家 的 学 生 及 其 他 科研 人 员 的 培
训 提供 更 大 的 援助 ;
5. 资 源 管理 机 构 ( 如 林业 、 渔 业 、 野 生动 物 等 ) 的 工作 人 员 中 应 当 包括 专业 系统 学 家 。
2000 年 系统 学 议程 完善 了 其 他 生物 多 样 性 计划
国际 社会 中 许多 机 构 和 组 织 已 经 认识 到 描述 和 了 解 地 球 物 种 多 样 性 的 紧迫 性 .这 些 机 构 和 组 织
包括 :
“联合 国 环境 与 发 展 大 会 (UNCED) 及 其 二 十 一 世纪 议程
“联合 国 环境 规划 署 CUNEP)
SKA BAS (UNDP)
“Diversitas ,一 个 包括 以 下 机 构 和 组 织 的 联合 体 :
国际 生物 科学 联盟 (CIUBS)
环境 问题 科学 委员 会 (SCOPE)
联合 国教 科 文 组 织 C(UNESCO)
国际 微生物 学 联盟 (IUMS)
“二 十 一 世纪 的 微生物 多 样 性 ,国际 生物 科学 联盟 (CIUBS) 和 国际 微生物 学 联盟 (IUMS) 的 一 项 行
动 计 划
非 政府 组 织 也 发 出 同样 的 呼吁 ,特别 是 :
“世界 资源 研究 所 (WRI)
“世界 自然 基金 会 (WWFE)
“国际 自然 保护 联盟 /国际 自然 与 自然 资源 保护 联盟 (IUCN)
“大 自然 保护 协会 CTNC)
2000 年 系统 学 议程 从 分 类 单元 着 手提 出 了 全 球 生 物 多 样 性 的 一 个 前 景 展望 ,给 保护 和 管理 这 项
必 不 可 少 资源 的 科学 框架 增添 了 新 的 内 容 。. 对 所 有 旨 在 了 解 、 保 护 和 利用 生物 多 样 性 的 计划 ,如 生态
学 界 提出 的 持续 性 生物 圈 计 划 来 说 ,2000 年 系统 学 议程 起 到 了 锦上添花 的 作用 。
, 对 2000 年 系统 学 议程 的 投资
2000 年 系统 学 议程 之 计划 设想 宏伟 ,需要 众多 方面 的 大 力 支持 才能 得 以 实现 .任何 政 府 或 任何 国
际 机 构 都 不 可 能 去 单独 资助 这 项 计划 的 运作 , 它 需 要 世界 上 众多 组 织 和 政府 的 共同 支持 。2000 年 系统
学 议程 的 任务 通过 一 项 长 远 的 25 年 计划 实现 ,每 年 大 约 需要 投入 经 费 30 亿 美元 。
经 费 预 算 系 根据 各 项 工作 的 开支 制订 ,其 中 包括 人 才 开 发 .建立 计算 机 网 络 、 支 持 标本 收藏 建设
(包括 模式 菌 种 及 种 质 贮藏 所 )、 研 究 项 目 、 宣 传 研究 成 果 等 方面 的 开支 .按照 目前 的 资助 水 平 , 完 成
2000 年 系统 学 议程 的 任务 至 少 需要 150 年 .鉴于 生物 多 样 性 丧失 的 紧迫 性 ,目前 每 年 的 研究 和 基础 建
设 资助 (大 约 5 亿 美元 ) 必 须 增 加 将 近 六 倍 才能 在 25 年 内 完成 这 些 任 务 。
从 生物 多 样 性 显示 出 的 科学 、 经 济 和 美学 价值 中 不 难看 出 这 项 投资 的 产 出 。 发 现 、 描 述 . 了 解 和 利
用 其 他 物种 取得 的 持续 进展 已 经 使 人 类 受益 上 罪 浅 。 人 类 今天 的 进一步 努力 会 带 来 明天 的 更 大 效益 , 同
时 也 将 有 助 于 今后 世 世 代 代 生命 多 样 性 的 保存 。
ee
参考 文献
Brooks,D. R. and B. McClennan. 1991. Phylogeny, ecology, and behavior; a research program in comparative biology. U. of Chicago
Press, Chicago, Illinois. P |
Bull, A. T. » M. Goodfellow, J. H. Slater. 1992. Biodiversity as a sourcé of innovation in biotechnology. Annual Review of Microbiolo-
gy. 46: 219—252. ‘ : .
di Castri, F. , J. R. Vernhes, and T. Younes. 1992. Inventorying an monitoring biodiversity. Biology International , Special issue. 27,
= 3} ;
Duckworth, W. D. , H. H. Genoways, and C. L. Rose, 1993. Preserving natural science collections; chronicle of our environmental her-
itage. National Institute for the Conservation of Cultural Property, Washington, D. C.
Ehrlich, P. R. and A. H. Ehrlich. 1992. The value of biodiversity. Ambio. 21: 219—226.
Ehrlich, P. R. and E.©. Wilson. 1991. Biodiversity studies; science and policy. Science. 253: 758—762.
Gaston, K.G. and R.M. May. 1992. Taxonomy of taxonomists. Nature. 365: 281—282.
Gore, A. 1992. Earth in the balance. Hisapien Mifflin, New York.
Groombridge, B. (ed. ). 1992. Global biodiversity: status of the Earth's living resources. World Conservation Monitoring Centre. Chap-
man and Hall, London.
Hawksworth, D. L. and J. M. Ritchie. 1993. Biodiversity and biosystematic priorities; microorganisms and invertebrates. International
Mycological Institute, CAB International, Wallingford, United Kingdom.
Higher Education Surveys. 1990. Systematic biology training and personnel. Survey No. 10. , Washington, D. C.
Holden, C. 1989. Entomologists wane as insects wax. Science. 246:754—756.
Iltis, H. H. 1989. Serendipity in the exploration of biodiversity; what good are Reedy tomatoes? In Biodiversity (E.O. Wilson, ed. ),
National Academy Press, Washington, D. C. , 98—105.
International Union for the Conservation of Nature (IUCN), World Resource Institute (WRI), Conservation International (CI), World
Wildlife/U.S (WWF/US), and World Bank. 1990. Conserving the world’s biological diversity.
Lubchenco, J. , A.M. Olson, L. B. Brubaker, S.R. Carpenter, M.M. Holland, S. P. Hubbell, S. A. Levin, J. A. MacMahon, P. A.
Matson, J. M. Melillo, H. A. Mooney, C.H. Peterson, H.R. Pulliam, L. A. Real, P. Regal, and P.G. Risser. 1991. The sustain-
able biosphere initiative: an ecological research agenda. Ecology. 72: 371—412.
May, R.M. 1992. How many species inhabit the Earth? Scientific American. 267(4); 42—48.
Miller, E.H. (ed). 1985. Museum collections; their role and future in biological research. Vancouver, B.C. : Brit. Columbia Prov. Mu-
seum Occas. Papers Series, No. 25.
Myers, N. 1988. Threatened biotas; “Hot spots” in tropical forests. Environmentalist. 8; 187—208.
Myers, N. 1990. The biodiversity challenge: Expanded hotspot analysis. Environmentalist. 10; 243—256.
Myers, N. 1991. Tropical forests: present status and future outlook. Climate Change. 19: 3 一 32.
Nash, S. 1989. The plight of systematists: are they an endangered species? Scientist Oct. 16; 7.
National Research Council. 1992. Conserving biodiversity: a research agenda for development agencies. National Academy Press, Wash-
ington, D. C.
National Research Council. 1993. A biological survey for the nation. National Academy Press, Washington, D. C.
National Science Board. 1989. Loss of biological diversity: a global crisis requiring international solutions. National Science Foundation,
Washington, D. C.
Norse, E. A. (ed. ). 1993. Global marine biological diversity. Island Press, Washington, D. C.
Office of Technology Assessment (OTA). 1987. Technologies to maintain biological diversity. Washington, D. C.
Peters, R. L. , and T. E. Lovejoy (eds. ). 1992. Global warming and biological diversity. Yale University Presa, New Haven, Conneti-
cut.
Rasoanaivo, P. 1990. Rain forests of Madagascar: sources of industrial and medicinal plants. Ambio. 19: 421—424.
Raven, P.H. 1993. A plea to the citizens of the world: live as if Earth matters. Diversity. 9(3) : 49—51.
Raven, P.H. and E.O, Wilson. 1992. A fifty-year plan for biodiversity studies. Science. 258: 1099—1100.
Reid, W. V., and K. R. Miller. 1989. Keeping options alive; the scientific basis for conserving biodiversity. World Resources Institute,
Washington, D. C.
Resolutions from the International Symposium and First World Congress on the Preservation and Conservation of Natural History Collec-
tions. 1992. Madrid, Spain, 1—57; EBCOMP, S.A. , Bergantin, 1— 28042. Madrid. Endorsed by United Nations Education, Scien-
tific and Cultural Organization.
we
Yo ee ae am So
Sitarz, D. (ed. ). 1993. AGENDA 21: the Earth Summit strategy to save our planet. Earthpress, Boulder, Colorado.
Stierle, A. , G. Strobel, and D. Stierle. 1993. Taxol and taxane production by taxomyces andreanae, an endophytic fungus of Pacific
Yew. Science. 260: 214—216.
Task Force on Global Biodiversity. 1989. Loss of biological diversity; a global crisis requiring international solutions. NSF—89—171,
Washington, D. C.
U. K. House of Lords. 1991. Systematic Biology Research. Select Committee on Science and Technology, 1st Report. London; HMSO,
HL Paper 22—I.
U.K. Natural Environment Research Council. 1992. Evolution and biodiversity -the new taxonomy. London.
United Nations Conference on Environment and Development (UNCED). 1992. United Nations Convention on Biological Diversity.
Wheeler, Q. D. 1990. Insect diversity and cladistic constraints. Annals of the Entomological Society of America. 83; 1031—1047.
Wilson, E.O. 1985. The biological diversity crisis: a challenge to science. Issues Sci. Technol. (Fall); 20—29.
Wilson, E.O. (ed. ). 1988. Biodiversity. National Academy Press, Washington, D. C.
Wilson, E. O. 1992. The diversity of life. Harvard University Press, Cambridge, Ma.
Wilson, E. O. 1992. Biodiversity; challenge, science, opportunity. American Zoologist. 32; 1—7.
World Resources Institute. 1993. Biodiversity prospecting: using genetic resources for sustainable development. World Resources Insti-
tute, Washington, D. C.
World Resources Institute (WRI) , International Union for the conservation of Nature (IUCN), and United Nations Environment Program
(UNEP). 1992. Global Biodiversity Strategy. Guidelines for action to save, study, and use the earth's biotic wealth sustainably and
equitably. WRI, Washington, D. C. |
* 219°
大
i
词 汇
所 图
LU
mi
0
生物 多 样 性 (Biodiversity) :生物 的 多 样 性 和 变异 性 ,包括 物种 的 数量 .独特 分 支 Cdistinct clades) 的 数
量 、 种 内 遗传 性 变异 及 “功能 的 2 多样 性 (生物 的 功能 .生物 与 其 他 生物 及 其 环境 间 相 互 作 用 的 多 得 不
计 其 数 的 方式 )。
生物 地 理学 (Biogeography) :对 植物 .动物 和 微生物 地 理 分 布 的 研究 。
生物 资源 (Biological Resource,Bioresources) :对 人 类 有 实在 或 潜在 价值 的 某 种 生物 ,或 者 源 于 某 种 生
物 的 产品 。 |
4 4 Fl (Biosphere) :有 生命 存在 的 地 球 部 分 。-
生物 技术 (Biotechnology) :利用 生物 或 源 于 生物 的 物质 ,去 制造 或 改变 某 种 产品 ,改良 植物 或 动物 ,或
者 为 特定 目的 去 开发 微生物 的 任何 技术 。
分 支 (Clade) : 某 一 分 类 单元 ,系统 发 育 中 的 一 个 分 枝 或 一 个 谱系 。
分 类 (Classification)# 正 式 地 、 科 学 地 把 物种 排列 到 某 种 等 级 系统 ,并 给 物种 或 物种 类 群 制订 科学 名
称 。
比较 生物 学 (Comparative biology) :一 个 以 上 物种 之 间 的 比较 研究 。
特有 (Endemic) : 某 种 生境 或 地 理 区 域 特 有 的 某 一 物种 。
44% (Extinction) : 某 一 物种 最 后 一 个 个 体 的 死亡 。
编目 (Inventory) :把 某 一 指定 区 域 的 所 有 植物 .动物 及 微生物 种 的 名 称 或 描述 编列 成 表 。
& ZB (Monograph) :汇集 世界 上 关于 某 一 分 类 单元 的 所 有 已 知 资料 ,包括 新 的 及 过 去 已 知 的 物种 , 按
照 已 知 的 系统 发 育 组 织 编写 的 一 本 全 面 的 论著 。
系统 发 育 多 样 性 (Phylogenetic diversity) : 某 一 类 群 所 代表 的 独特 的 谱系 的 数量 或 分 支 的 数量 。
系统 发 育 (Phylogeny) :物种 间 进 化 中 的 模式 及 物种 间 的 共同 祖先 。
物种 (Species) :生物 的 种 类 ;分 类 学 和 系统 发 育 分 析 的 基本 单位 。
物种 多 样 性 (Species diversity) : 原 义 是 指 即 地 球 上 物种 的 数量 和 种 类 ;广义 上 亦 包括 物种 的 数量 及 其
相互 关系 (如 系统 发 育 多 样 性 ) 。
调查 (Survey) :按照 一 定 的 方法 考察 某 一 选 定 地 区 ,以 便 发 现 大 型 或 微型 的 动 植 物 区 系 内 的 所 有 物
种 。
系统 学 (Systematics) :现在 生活 的 和 化 石生 物 ( 物 种 ) 种 类 的 比较 研究 ,包括 它们 的 描述 、 分 布 及 其 共
存 的 系统 发 育 关 系 。
分 类 单元 (Taxon) :一 个 物种 或 一 组 相关 的 物种 。
分 类 学 (Taxonomy) :把 物种 科学 地 划分 到 一 种 等 级 系统 ,以 此 反映 对 其 系统 发 育 的 了 解 情况 。
〈《 郭 寅 峰 译 。” 钱 迎 倩 和 周 红 章 校 )
«220°
9
ISBN 7-03-005669-8
sul
787030"056696
>
|
ISBN 7-03-005669-8
定价 :41.00 元