2026年6月12日,复旦大学徐书华团队在生物信息学专业期刊 Genomics, Proteomics & Bioinformatics合作发表研究论文“HiMWA: A Hierarchical Multiple-wave Admixture Model for Reconstructing Complex Population Admixture Histories”。该研究提出层级结构多阶段混合模型 HiMWA,为重建真实世界复杂人群混合历史提供了关键方法突破。

工具概览
研究背景
现代人类群体遗传多样性深受迁徙与混合事件的塑造。随着高通量测序与基因分型技术的发展,研究者得以从全基因组水平的祖源片段信息中“读取”人群混合的历史。混合发生后,重组事件不断打断并重新组合来自不同祖源的基因组片段,形成镶嵌式基因组;混合时间越久远,祖源片段通常越短,祖源状态转换也越频繁。基于祖源片段信息推断混合历史,已成为群体遗传学的重要研究方向。
然而,现有方法多基于简化假设,难以推断更复杂的混合模式。次序混合(Sequential admixture,SA)模型假设多个祖先群体依次参与混合;层级结构混合(Hierarchical admixture,HA)模型虽能刻画“混合之混合”过程,但通常假定中间群体仅经历单次近期混合。以新疆维吾尔族为例,其遗传成分主要来自西欧、南亚、东亚和西伯利亚四个祖先来源:东亚与西伯利亚相关祖源先混合形成东欧亚中间祖源(East Eurasian ancestry, EEA),西欧与南亚相关祖源先混合形成西欧亚中间祖源(West Eurasian ancestry, WEA),随后两类中间祖源再混合形成现今维吾尔族。已有研究提示,两类中间祖源对最终群体的遗传贡献可能并非单次完成,而是包含多个波次的混合事件。为准确重建此类复杂混合历史,研究团队提出了能够同时刻画层级结构与多阶段混合过程的新方法 HiMWA。
研究结果
HiMWA方法框架
HiMWA将四祖先群体的混合历史建模为远期层级结构混合和近期多阶段混合两个阶段。远期阶段,四个祖先群体A、B、C、D两两混合,形成中间群体E和F;近期阶段,E与F通过多阶段离散混合形成最终混合群体。该方法以局部祖源推断得到的祖源片段为输入,首先结合祖源转换次数和贝叶斯信息准则进行整体混合模式判定;若识别为层级结构多阶段混合模式,则进一步基于祖源片段长度分布进行参数估计。其中,近期阶段通过似然比检验确定混合波数,并利用期望最大化算法估计各波混合时间和比例;远期阶段则采用矩估计法推断两个中间群体的形成时间,最终重建完整的层级结构多阶段混合历史(图1)。

图1. HiMWA方法原理概览
模拟研究验证方法性能
本研究模拟了HiMWA 1-1、2-1和2-2等不同复杂程度的混合场景,系统评估HiMWA的模型选择和参数估计性能(图2、图3)。结果表明,在HiMWA 1-1和HiMWA 2-1场景下,模型选择准确率接近100%;即使在更复杂的HiMWA 2-2场景下,方法仍能较好识别层级结构多阶段混合模式。远期混合时间在各类场景下均具有较高准确度;近期混合时间在复杂场景下存在一定高估,但基于模拟数据的经验校正可有效提升推断精度。

图2. 不同计算仿真场景下的模型选择准确率

图3. 不同计算仿真场景下参数估计的准确性
重建欧亚混血人群混合历史
该研究将HiMWA应用于192个新疆维吾尔族个体和28个哈萨克族个体的基因分型数据,结果显示两个人群均符合HiMWA 2-2模型(图4)。以维吾尔族为例,远期阶段中,东亚与西伯利亚相关祖源约 217 代前混合形成东欧亚中间祖源(EEA),西欧与南亚相关祖源约 209 代前混合形成西欧亚中间祖源(WEA);近期阶段中,WEA与EEA约154代前首次混合,随后WEA约45代前、EEA约38代前分别参与后续混合。哈萨克族也呈现相似的层级结构多阶段混合模式。以29年/代换算,远期混合事件可追溯至青铜时代,近期混合事件与蒙古帝国扩张等历史过程相吻合,揭示了层级结构多阶段混合在欧亚混血人群形成中的重要作用。

图4. 两个典型欧亚混合人群的演化历史重建
研究意义与展望
该研究提出的HiMWA框架将层级结构混合模型与多阶段混合模型相结合,为重建复杂人群混合历史提供了新的方法框架。应用于新疆维吾尔族和哈萨克族的分析显示,两个人群均呈现相似的层级结构多阶段混合模式,表明该模式可能是欧亚地区人群形成过程中的重要遗传特征。在时间尺度上,远期混合事件与青铜时代考古与遗传学证据相吻合,近期混合事件则与蒙古帝国扩张等历史过程相一致。未来研究可进一步拓展 HiMWA 框架的建模能力,包括引入更灵活的祖源片段分布模型、融合局部祖源不确定性信息,并扩展至更多祖先来源及更复杂的混合图谱推断,以更全面刻画人类迁徙与基因交流的历史。
复旦大学生命科学学院/进化生物学中心徐书华教授为论文的最后通讯,哈佛大学/博德研究所苑锴博士以及北京交通大学倪旭敏副教授为论文共同通讯作者。复旦大学生命科学学院博士研究生杨雨菡为论文第一作者。哈佛大学/博德研究所张瑞博士、北京交通大学博士研究生杨路对本研究做出重要贡献。
该研究得到了国家重点研发计划、国家自然科学基金委等多项基金的资助。相关计算分析工作依托复旦大学CFFF智能计算平台完成。
论文信息:Yuhan Yang, Rui Zhang, Lu Yang, Xumin Ni, Kai Yuan, Shuhua Xu. HiMWA: A Hierarchical Multiple-wave Admixture Model for Reconstructing Complex Population Admixture Histories. Genomics Proteomics Bioinformatics 2026; qzag046.
https://doi.org/10.1093/gpbjnl/qzag046
原文链接:https://academic.oup.com/gpb/advance-article/doi/10.1093/gpbjnl/qzag046/8707280
