2025年8月6日,复旦大学生命科学学院徐书华团队在分子进化领域专业期刊Molecular Biology and Evolution发表题为“Tracing the Genetic Heritage of the Kirgiz People: Dual-Wave Admixture and Ancestry-Biased Adaptation”《追溯柯尔克孜的遗传遗产:双重混合与祖源偏向性适应》的研究论文。首次通过全基因组多样性分析揭示了柯尔克孜族的遗传渊源与适应性进化特征。该研究通过对中国新疆柯尔克孜族(XJ.KGZ)及中亚人群的基因数据分析,绘制了这一民族的“双重混合”遗传交融图谱,并发现其独特的适应性基因特征。
人类走出非洲之后分散在世界各地,逐步适应当地的环境,形成了遗传特征不同的群体,而不同的人群之间的基因交流又会产生新的人群,新人群一方面继承了祖先人群的遗传特征,另一方面又形成了适应新环境的遗传机制。历史及考古学记录表明,欧亚大陆(Eurasia)东西两端的人类文明在东起我国新疆、西至里海的中亚地区产生了交流,这种文化上的交流也伴随着基因的交流。以往的人类遗传学研究已证实,当今中亚地区的突厥语系人群起源于东欧亚(East Eurasia)与西欧亚(West Eurasia)人群的混合,然而其遗传历史不尽相同,由于其居住地区的差异,其基因组中又形成了不一样的局部适应(local adaptation)特征。十余年来,复旦大学人类群体组学课题组(HUMan Population Omics Group,HUMPOG)深耕于新疆地区人类群体遗传历史,先后揭示了维吾尔、回族、哈萨克、塔吉克、罗布等新疆人群遗传起源并分析了这些人群局部适应的演化历程。不过,仍有许多新疆人群的遗传历史有待于深入探索。
柯尔克孜族是新疆人口数量居第三位的少数民族,其境外的同源人群称为吉尔吉斯族,是吉尔吉斯斯坦的主体民族。柯尔克孜族起源于叶尼塞河上游区域,在当今的蒙古及俄罗斯境内。汉代司马迁《史记》中记载匈奴曾征服一个名为“鬲昆”的部族,此即为关于柯尔克孜族最早的历史记录。历经多次战争,柯尔克孜族先民从叶尼塞河上游逐步迁徙至中亚的费尔干那盆地、帕米尔高原东部及天山一带,在此过程中长期于不同人群杂居。虽早有历史记载,柯尔克孜人群的遗传起源尚不明晰。单纯依靠历史、考古记录及体质人类学研究结果,难以了解他们在迁徙及定居中亚过程中所受其他人群的遗传影响,以及他们与其境外同源人群之间由于地理隔离而产生的遗传差异。另外,从叶尼塞河上游地区迁徙至帕米尔高原等地,柯尔克孜人群所处环境发生了巨大变化,其基因组中有可能形成了对中亚当地环境的适应性特征。虽然此前部分生理学研究报道了柯尔克孜人群对高海拔环境具有不完全的适应性特征,亦有基于柯尔克孜族局部基因组区域的自然选择分析,目前尚未有对柯尔克孜人群全基因组范围内适应性特征的系统性分析。
在该研究中,徐书华团队分析了来自中国西北地区216名个体及全球范围内两千余名个体的全基因组单核苷酸多态性数据,对来自中国新疆的柯尔克孜人群(n = 36)及其在吉尔吉斯斯坦的同源人群进行了系统的遗传源流解析,并探讨了柯尔克孜人群在迁徙后适应环境的遗传基础和分子机制。
1. 东西交融:柯尔克孜族的双重基因混合
研究显示,现代柯尔克孜族的基因库主要由东亚(41.7%)、西伯利亚(25.6%)、西欧亚(25.2%)和南亚(7.6%)四大祖先成分构成(图1)。通过重构“双重混合模型”推断,柯尔克孜族的基因融合可分为两个关键阶段(图2):第一次混合(约2225年前):可能在战国至秦朝时期,东西方人群发生接触促成了早期基因交流;第二次混合(约875-425年前):蒙古帝国扩张及后续历史事件推动了新一轮混合,可能与蒙古统治下的族群迁徙密切相关。
图1柯尔克孜族的遗传成分
图2柯尔克孜人群的遗传混合模型
研究团队进一步比较了新疆柯尔克孜人群和吉尔吉斯人群(KRG)的遗传关系,基于有效群体规模(effective population size)等参数估计,两个人群在约450年前发生分化。柯尔克孜人群与境外吉尔吉斯人群之间的分化可能是人口迁移中的瓶颈效应及随后的地理隔离造成的随机漂变,以及柯尔克孜族和新疆各民族人群的长期遗传交融,部分基因的差异也有可能源于两个人群对不同生存环境和生活方式的适应差异。
2. 环境适应:独特机制与关键基因
该研究基于祖源偏向性(ancestry bias)和单倍型纯合度(extended haplotype homozygosity)的原理,筛选了柯尔克孜人群基因组中的自然选择/环境适应性信号。尽管柯尔克孜族长期生活在帕米尔高原,但研究未发现藏族特有的高原适应基因(如EPAS1)的选择信号。然而,研究人员在心脏功能相关基因RYR2和缺氧响应基因C10orf67中检测到西方祖先偏向性,提示柯尔克孜族可能通过不同于藏族的分子机制适应高海拔环境(图3)。
除了低氧,新疆和中亚地区干旱的环境和畜牧生活的饮食习惯也可能是柯尔克孜人群面临的环境选择压力。高血压相关基因CSMD1和SLC35F3在研究团队此前关于其他新疆人群的研究中曾报道。而在柯尔克孜人群基因组中,这两个基因区域也检测出了祖源偏向性信号,可能是干旱环境与肉质饮食共同造成的选择压力所致。此外,该研究还发现了一些在柯尔克孜人群基因组中较为特异的位点频率或单倍型。在细胞紧密连接相关基因PATJ的rs10493314位点(1:62510154:A>T),柯尔克孜等新疆人群相较于东亚和欧洲人群具有较高的衍生等位基因频率(derived allele frequency)。该衍生等位基因与PATJ的表达量下调有关。嗅觉受体基因OR14I1与巨细胞病毒侵染有关,柯尔克孜人群在该基因区域的单倍型与东亚、欧洲人群差异较大,这可能反映了历史上巨细胞病毒对柯尔克孜人群的侵袭所造成的影响。此外,免疫相关基因FYB1的异常频率分布,可能反映了高原病原体压力的自然选择作用(图3)。
图3柯尔克孜人群的适应性演化特征
A. 柯尔克孜人群基因组中重要选择信号总结;B. OR14I1基因区域单倍型;C. FYB1基因区域的iHS选择信号;D. 世界范围内rs10493314等位基因频率分布。
3. 复杂历史与未来展望
研究还揭示了柯尔克孜族与维吾尔族、哈萨克族的基因交流差异:维吾尔族的混合事件更早(约120代前),而柯尔克孜族与哈萨克族的混合则集中于近30代内,可能与蒙古帝国后期的历史动荡有关。通讯作者徐书华教授表示:“这项研究填补了中亚人群遗传演化领域的空白,但受限于样本量和基因组标记密度,未来需结合古DNA和更大规模基因测序数据,进一步解析族群迁徙与适应的细节。”
该项研究增进了我们对于柯尔克孜人群的遗传结构、演化历史和适应环境机制的了解,为中华民族基因多样性和边疆族群演化研究提供了新的洞见。该成果为理解丝绸之路沿线的族群融合提供了新视角,也为高原医学和人类适应性进化研究奠定了重要基础。
上海科技大学生命科学学院硕士毕业生陈双慧为该论文第一作者,复旦大学生命科学学院/进化生物学中心徐书华教授为通讯作者,复旦大学生命科学学院陆艳副教授和中国科学院上海营养与健康研究所陈豪博士对本论文有突出贡献。中国科学院上海营养与健康研究所潘雨闻博士、刘姣姣博士亦参与了本项工作。新疆大学多力坤·买买提玉素甫教授、复旦大学金力教授对本项工作给予了大力支持。该项工作获得了国家重点研发计划、国家自然科学基金、上海市科委项目和全球伙伴关系办公室重点项目发展基金等多项基金的资助。该项研究的计算分析工作得到了复旦大学CFFF智能计算平台支持。
论文信息:Chen S, Lu Y, Chen H, et al. Tracing the Genetic Heritage of the Kirgiz People: Dual-Wave Admixture and Ancestry-Biased Adaptation. Molecular Biology and Evolution, 2025. https://doi.org/10.1093/molbev/msaf196
论文链接:https://academic.oup.com/mbe/advance-article/doi/10.1093/molbev/msaf196/8223450?utm_source=advanceaccess&utm_campaign=mbe&utm_medium=email