截至2022年9月25日,中国学者在Nature Genetics (IF=41)共计发表了20项研究成果,iNature系统总结这些研究成果:

【1】中国农业科学院作物科学研究所宗绪晓研究员、中国科学院微生物所高胜寒特别研究助理、山东省农业科学院农作物种质资源研究所丁汉凤研究员、国际半干旱热带作物研究所和澳大利亚默多克大学Rajeev K Varshney教授共同通讯在Nature Genetics 在线发表题为“Improved pea reference genome and pan-genome highlight genomic features and evolutionary characteristics”的研究论文,该研究报告了一个豌豆品种 ZW6 的从头组装和注释,其 contig N50 为 8.98 Mb,与现有的相比,其 contig 长度增加了 243 倍,复杂重复区域中序列的连续性和质量明显改善 。118 个栽培和野生豌豆的基因组多样性表明,Pisum abyssinicum 是不同于 P. fulvum P. sativum 的一个独立物种。 数量性状基因座分析揭示了两个已知的与茎长 (Le/le) 和种子形状 (R/r) 相关的孟德尔基因,以及孟德尔研究的一些豆荚形式的候选基因。构建了116个豌豆种质的泛基因组,P. abyssinicum P. fulvum 中优选的泛基因表现出明显的功能富集,表明它们在未来作为豌豆育种资源的潜在价值。

【2】2022年9月22日,博德研究所,北京大学,首尔国立大学等多单位合作,周涠、毕文健、赵张琛等在Nature Genetics 在线发表题为“SAIGE-GENE+ improves the efficiency and accuracy of set-based rare variant association tests”的研究论文,该研究提出了 SAIGE-GENE+,它极大地改进了 type I 错误控制和计算效率,以促进大规模数据中的稀有变体测试。该研究进一步表明,结合多个 MAF 截止值和功能注释可以提高效力,从而揭示新的基因-表型关联。在对 30 个定量性状和 141 个二元性状的 UKBB 全外显子组测序数据的分析中,SAIGE-GENE+ 确定了 551 个基因-表型关联。

【3】2022年9月7日,中山大学肿瘤中心郑健团队、美国希望之城国家医学中心贝克曼研究所陈建军团队与中山大学肿瘤中心林东昕团队合作,在Nature Genetics 杂志在线发表题为“RNA m6A regulates transcription via DNA demethylation and chromatin accessibility”的研究论文,该研究表明 METTL3 介导的 RNA m6A形成导致正常细胞和癌细胞中附近基因组位点的 DNA 去甲基化,这是由 m6A 读取器 FXR1 和 DNA 5-甲基胞嘧啶双加氧酶 TET1 之间的相互作用介导的。在识别 RNA m6A 后,FXR1 将TET1 募集到基因组位点以使 DNA 去甲基化,从而导致重新编程的染色质可及性和基因转录。总之,该研究描述了由RNA m6A 形成和DNA 去甲基化介导的染色质可及性和基因转录的调节机制,强调了 RNA m6A 和DNA 修饰之间的串扰在生理和致病过程中的重要性。

【4】2022年8月18日,西湖大学杨剑团队在Nature Genetics 上发表题为“Genetic control of RNA splicing and its distinct role in complex trait variation”的研究论文,该研究介绍了一种 sQTL 映射方法,测试异构体-eQTL 效应 (THISTLE) 之间的异质性,与竞争方法相比具有更高的能力。将 THISTLE 与互补 sQTL 作图策略一起应用于脑转录组 (n = 2,865) 和基因型数据,在 P < 5 × 10−8 处鉴定了 12,794 个具有 cis-sQTL 的基因,其中约 61% 与 eQTL 不同。将 sQTL 数据整合到 GWAS 中的 12 个与大脑相关的复杂性状(包括疾病),该研究通过 cis-sQTLs 确定了与这些性状相关的 244 个基因,其中大约 61% 无法使用相应的 eQTL 数据发现。总之,该研究证明了大多数 sQTL 在转录和复杂性状变异的遗传调控中的独特作用(点击阅读)。

【5】2022年7月18日,吉林省白城市农业科学院任长忠研究员、中国科学院遗传与发育研究所鲁非研究员、四川大学马涛教授、四川农业大学魏育明教授和彭远英教授共同通讯(四川农业大学彭远英、颜红海、邓操,吉林省白城市农业科学院郭来春、王春龙和四川大学王毓博为论文共同第一作者)在Nature Genetics在线发表题为“Reference genome assemblies reveal the origin and evolution of allohexaploid oat”的研究论文,该研究发布了栽培六倍体裸燕麦及其二倍体和四倍体祖先的参考基因组,并进一步选择能代表燕麦属现存所有基因组类型的二倍体、四倍体和六倍体材料结合全基因测序、叶绿体基因组和转录组分析,深入探究六倍体燕麦的起源与亚基因组进化。 这些发现和此处介绍的高质量参考基因组将有助于充分利用作物遗传资源来加速燕麦改良。

【6】2022年7月11日,浙江大学郭国骥及韩晓平共同通讯在Nature Genetics在线发表题为“Systematic identification of cell-fate regulatory programs using a single-cell atlas of mouse development”的研究论文,该研究在单细胞水平的发育过程中构建了小鼠谱系分化的细胞景观,并描述了细胞类型成熟期间的谱系常见和谱系特异性调节程序。该研究还发现了在无脊椎动物和脊椎动物发育过程中广泛活跃的谱系共同调控程序。特别是,该研究将 Xbp1 鉴定为跨不同物种的细胞命运决定的进化保守调节剂。该研究证明了 Xbp1 转录调控对于稳定各种小鼠细胞类型的基因调控网络很重要。总之,该研究结果为细胞基因调控程序提供了遗传和分子方面的见解,并将作为进一步促进对细胞命运决定的理解的基础(点击阅读)。

【7】2022年6月2日,福建农林大学海峡联合研究院基因组中心张积森团队(张清、齐浥颖、潘浩然及唐海宝为本文的共同第一作者)在Nature Genetics 上发表了题为“Genomic insights into the recent chromosome reduction of autopolyploid sugarcane Saccharum spontaneum“的研究论文,该研究将甘蔗细茎野生种Np-X (2n = 4x = 40) 的高质量同源多倍体基因组组装成 10 个同源组的 40 条假染色体,这更好地阐明了大约 150 万年前发生的最近染色体减少和多倍化 (Mya)。 甘蔗中的一对古复制染色体 NpChr5 和 NpChr8 在 0.80 Mya 附近经历裂变,随后融合伴随着着丝粒分裂。研究人员推断,x = 10 的 Np-X 最有可能代表祖先核型,x = 9 和 x = 8 是从其进化而来的。对 102 个甘蔗细茎野生种种质的重新测序表明,甘蔗细茎野生种起源于印度北部,其祖先是 x = 10,然后辐射到印度次大陆、中国和东南亚的四个主要群体。总之,该研究提出了加速甘蔗改良的新方向,并扩展了我们对同源多倍体进化的认识。

【8】2022年5月12日,伊利诺伊大学厄巴纳香槟分校明瑞光团队(福建农林大学为第一单位,岳晶晶,Robert Van Buren,刘娟及方静平为论文共同第一作者)在Nature Genetics 在线发表题为“SunUp and Sunset genomes revealed impact of particle bombardment mediated transformation and domestication history in papaya”的研究论文,该研究该研究破译了番木瓜转基因品种SunUp与非转基因品种Sunset高质量的基因组图谱,首次揭示了植物基因枪介导的转基因过程对基因组结构和功能的影响,以及番木瓜地理起源和驯化历史。该成果是在植物转基因过程解析方面取得的原创性突破,对深入解密植物转基因过程具有重要参考价值,对推动果树作物的基础研究以及品种改良等具有里程碑式的意义。

【9】2022年5月9日,贝勒医学院Margaret A. Goodell团队(贝勒医学院Gu Tianpeng及哈尔滨医科大学郝大鹏为该文章的共同第一作者)在Nature Genetics 在线发表题为“The disordered N-terminal domain of DNMT3A recognizes H2AK119ub and is required for postnatal development”的研究论文,该研究报告长亚型 DNMT3A1,但不是短 DNMT3A2,对小鼠出生后发育至关重要。DNMT3A1 结合并调节大脑中的二价神经发育基因。引人注目的是,神经系统中的 DNMT3A1 恢复可以部分挽救 Dnmt3a1 敲除围产期致死率。进一步表明,DNMT3A1 本质上无序的 N 末端是 DNMT3A1 富集区域的正常发育和 DNA 甲基化所必需的。从机制上讲,嵌入在 N 末端推定的 α-螺旋中的泛素相互作用基序与单泛素化组蛋白 H2AK119 结合,可能介导 DNMT3A1 向 Polycomb 调节区域的募集。这些数据证明了 DNMT3A1 在小鼠出生后发育中的作用,并揭示了 N 末端是 DNMT3A1 染色质占据和神经系统功能的必要调节域。

【10】2022年5月5日,哈佛医学院Ge Tian,黄海亮及上海交通大学秦胜营共同通讯在Nature Genetics 在线发表题为“Improving polygenic prediction in ancestrally diverse populations”的研究论文,该研究提出了一种新的 PRS 构建方法 PRS-CSx,它通过整合来自多个群体的 GWAS 汇总统计数据来改进跨群体多基因预测。PRS-CSx 通过共享的连续收缩 (CS) 先验在群体之间耦合遗传效应,通过在汇总统计数据之间共享信息和利用发现样本之间的连锁不平衡多样性来实现更准确的效应大小估计,同时继承 PRS-CS 的计算效率和稳健性。该研究表明,PRS-CSx 在具有广泛遗传结构、跨群体遗传重叠和发现 GWAS 样本量的模拟中优于跨性状的替代方法,并改进了对非欧洲人群数量性状和精神分裂症风险的预测。

【11】2022年4月28日,中国农业科学院油料作物研究所伍晓明和诺禾致源田仕林共同通讯(胡继宏、陈碧云、张付贵、谢婷、许鲲和赵静为论文共同第一作者)在Nature Genetics 上在线发表题为“Genomic selection and genetic architecture of agronomic traits during modern rapeseed breeding”的研究论文,该研究基于 418 个不同油菜种质的全基因组重测序,在育种过程中对油菜进行了全面的基因组评估。该研究揭示了选择适应性和农艺性状的基因组基础。全基因组关联研究确定了 628 个与位点相关的致病候选基因,用于 56 个重要的农艺性状,包括植物结构和产量性状。此外,该研究发现了农艺性状的合理候选基因中的非同义突变,在整个改进过程中等位基因频率分布存在显著差异,包括种子重量的核糖体回收因子 (BnRRF) 基因。本研究为改进油菜品种的基因组基础提供了见解,并为基因组辅助油菜育种提供了宝贵的基因组资源。

【12】2022年4月11日,阿尔伯特·爱因斯坦医学院 Jan Vijg(杨·维吉,上海交大医学院单细胞组学与疾病研究中心主任)等团队在Nature Genetics 在线发表题为“ Single-cell analysis of somatic mutations in human bronchial epithelial cells in relation to aging and smoking ”的研究文章,该研究对 33 名年龄在 11 至 86 岁之间、吸烟史从不吸烟到 116 包年(每天吸烟的包数 x 吸烟年数)不等的参与者进行近端支气管基底细胞的单细胞全基因组测序。该研究发现从不吸烟者的单核苷酸变异和小插入和缺失的频率随着实际年龄的增长而增加,吸烟者的突变频率显著升高。当与吸烟进行包/年作图时,突变跟随癌症风险的线性增加,直到大约 23 包年,之后没有观察到突变频率进一步增加,这表明个体选择避免突变。已知的肺癌定义的突变特征与年龄和吸烟有关。没有观察到肺癌驱动基因中体细胞突变的显著富集。

【13】2022年4月7日,中科院上海营养与健康研究所汪思佳,李嘉睿及复旦大学金力共同通讯(张曼菲、吴思杰、杜思源及钱微为该论文共同第一作者)在Nature Genetics 在线发表题为“Genetic variants underlying differences in facial morphology in East Asian and European populations”的研究论文,该研究将数据驱动的表型分析和多变量全基因组扫描方法应用于具有东亚血统 (EAS) 个体的大量 3D 面部图像,在 166 个基因座(62 个新)中发现了与典型范围面部相关的 244 个变体变化。一项新提出的多基因形状分析表明,EAS 中变体对面部形状的影响可以推广到 EUR。基于此,该研究进一步确定了与 EUR 和 EAS 人群面部形状差异相关的 13 个变体。进化分析表明,EUR 和 EAS 种群之间鼻子形状的差异是由定向选择引起的,主要是由于欧洲人的局部适应。该研究结果说明了不同人群面部差异的潜在遗传基础。

【14】2022年3月28日,复旦大学余宏杰团队在Nature Genetics 在线发表题为“Global landscape of SARS-CoV-2 genomic surveillance and data sharing”的研究论文,该研究使用一组特定国家的数据对 SARS-CoV-2 基因组监测和基因组数据进行了全球景观分析。该研究描述了 2021 年初 Alpha 变体的日益流行,随后在 2021 年 5 月左右被 Delta 变体取代。SARS-CoV-2 基因组监测和测序可用性在各国之间存在显著差异,有 45 个国家进行了高水平的常规基因组监测以及 96 个具有高可用性 SARS-CoV-2 测序的国家。该研究还观察到不同地区和不同收入群体的测序百分比、测序技术、周转时间和已发布元数据的完整性存在显著差异。共有 37% 明确报告了变体的国家在公共存储库中共享了不到一半的关注变体 (VOC) 序列。总之,该研究结果表明,迫切需要增加序列的及时和全面共享、元数据文件的标准化以及对测序和生物信息学能力有限的国家的支持(点击阅读)。

【15】2022年3月10日,康奈尔大学Charles G. Danko团队(大连理工大学王忠为第一作者)在Nature Genetics 在线发表题为“Prediction of histone post-translational modification patterns based on nascent transcription data”的研究论文,该研究使用实验扰动结合敏感的机器学习工具检查组蛋白修饰和转录之间的关系。转录预测了活性组蛋白标记和复杂染色质状态(如二价启动子)的变化,直至单核小体分辨率,其准确性可与独立 ChIP-seq 实验之间的对应性相媲美。H3K27me3 的维持也需要转录,这与 RNA 在招募 PRC2 中的作用一致。 总之,该研究结果与过去的文献相结合,支持一个模型,在该模型中,活性组蛋白修饰在转录中起到支持作用,而不是基本的调节作用。

【16】2022年3月7日,昆士兰大学Peter M. Visscher,Pierrick Wainschtein及现任职西湖大学的杨剑共同通讯在Nature Genetics 在线发表题为“Assessing the contribution of rare variants to complex trait heritability from whole-genome sequence data”的研究论文,该研究根据 25,465 名欧洲血统无关个体的全基因组序列数据估计了身高和体重指数 (BMI) 的遗传力。身高的估计遗传力为 0.68(标准误差 0.10),体重指数的估计遗传力为 0.30(标准误差 0.10)。与相邻变体的低连锁不平衡(LD)中的低次要等位基因频率变体富集了遗传力,更大程度地用于蛋白质改变变体,与负选择一致。总之,该研究结果表明,稀有变异,特别是那些在连锁不平衡程度低的区域中的变异,是复杂性状和疾病的遗传力仍然缺失的主要来源。

【17】2022年3月3日,马克斯普朗克植物育种研究所Korbinian Schneeberger团队(马克斯普朗克植物育种研究所孙贺全及现任职华中农业大学焦文标为该文章的共同第一作者)在Nature Genetics 在线发表题为“Chromosome-scale and haplotype-resolved genome assembly of a tetraploid potato cultivar”的研究论文,该研究报告了基于高质量长读数、717 个花粉基因组的单细胞测序和 Hi-C 数据的马铃薯栽培品种“Otava”的 3.1 Gb 单倍型解析(精度为 99.6%)、染色体规模的组装。出乎意料的是,由于最近的近亲繁殖,约 50% 的基因组在血统上是相同的,这与涉及约 20% 基因组的高度丰富的结构重排形成鲜明对比。在 38,214 个基因中,只有 54% 存在于所有四种单倍型中,每个基因平均有 3.2 个拷贝。以叶转录组为例,11% 的基因在至少一种单倍型中表达不同,其中 25% 的基因可能通过等位基因特异性 DNA 甲基化进行调控。该研究工作揭示了马铃薯最近的育种历史,其四倍体基因组的功能组织,并有可能加强基因组学辅助育种的未来。

【18】2022年2月3日,St. Jude儿童医院的杨俊教授团队和西北大学Feinberg医学院的岳峰共同通讯(现任职复旦大学杨红波,现任职国家儿童医学中心上海儿童医学中心张辉及西北大学栾宇为本文的共同第一作者)在Nature Genetics 在线发表题为“Noncoding genetic variation in GATA3 increases acute lymphoblastic leukemia risk through local and global changes in chromatin conformation”的研究论文,该研究通过对 5,008 名患者进行靶向测序,确定了 GATA3 中与费城染色体样 ALL(Ph 样 ALL)相关的关键调控变异。使用 CRISPR-Cas9 编辑和来自 Ph 样 ALL 患者的样本,该研究发现这种变体激活了一种上调 GATA3 转录的强增强子。这反过来又重塑了染色质可及性和三维基因组组织,包括接近 ALL 癌基因 CRLF2 的区域。最后,该研究发现 GATA3 直接调节 CRLF2 并在白血病发生过程中增强 JAK-STAT 的致癌作用。总之,该研究为非编码变异有助于癌基因激活、表观遗传调控和三维基因组重编程的独特机制提供了证据。

【19】2022年1月3日,华南农业大学李建国、夏瑞、陈厚彬、伊利诺伊大学香槟分校明瑞光及南洋理工大学Victor A. Albert共同通讯在Nature Genetics 在线发表题为“Two divergent haplotypes from a highly heterozygous lychee genome suggest independent domestication events for early and late-maturing cultivars”的研究论文,该研究对栽培品种“妃子笑”的基因组组装成15条假染色体,总计约470 Mb。高杂合度 (2.27%) 导致两个完整的单体型组装。共有 13,517 个等位基因 (42.4%) 在不同组织中差异表达。该研究利用72份荔枝资源重测序数据,鉴定到3.88 M高质量的SNPs(单核苷酸多态性)位点,提出了荔枝“一个起源中心、两个独立驯化事件”假说,证明了云南是世界荔枝唯一起源中心,有助于消除国外学者有人认为荔枝也可能起源于越南的认知。早熟品种可能是通过极早熟品种和晚熟品种个体杂交在广东发展起来的。一对 CONSTANS 样基因包含的 3.7 kb 区域的可变缺失可能调节了荔枝品种之间的果实成熟差异。这些基因组资源有助于深入了解荔枝驯化的自然历史,并将加速荔枝和相关作物的改良。

【20】2022年1月3日,深圳华大生命科学研究院张涛及贾慧珏共同通讯在Nature Genetics 在线发表题为“Mendelian randomization analyses support causal relationships between blood metabolites and the gut microbiome”的研究论文,该研究对 3,432 名具有全基因组、全宏基因组、人体测量学和血液代谢特征数据的中国人进行了双向孟德尔随机化分析。该研究确定了肠道微生物组和血液代谢物之间的 58 种因果关系,并复制了其中的 43 种。粪便 Oscillibacter 和 Alistipes 的相对丰度增加与甘油三酯浓度降低有因果关系。相反,血液代谢物(如谷氨酸)似乎会减少粪便中的草酸杆菌,变形杆菌的成员则受 5-甲基四氢叶酸、丙氨酸、谷氨酸和硒等代谢物的影响。来自日本生物银行数据的两样本孟德尔随机化部分证实了甘油三酯和尿酸的结果,也为已发表的癌症和心血管疾病粪便细菌标志物提供了因果支持。这项研究说明了人类遗传信息的价值,有助于为临床研究确定肠道微生物特征的优先级。

番木瓜是一种优质热带水果,在我国有“岭南佳果”之美誉,拥有“乔木葱葱滋地气,圆实累累衬红霞”的赞叹。番木瓜不仅汁多味甜,而且具有很高的营养和药用价值,在中国的早期典籍《食物本草》中就有记载。

番木瓜科由6个属共40个种组成,番木瓜属于番木瓜科番木瓜属,主要分布于热带和亚热带地区,野生番木瓜仅在墨西哥南部和中美洲发现。番木瓜于17世纪传入我国,最早在1661年的《九江乡志》书中有记载,称之为“万寿果”,说明我国栽培番木瓜至少有300多年历史了。

1992年,由于番木瓜环斑病毒(PRSV)的大流行,番木瓜产业面临崩溃的威胁。转基因番木瓜品种的诞生使番木瓜产业免遭PRSV的毁灭,这是番木瓜生产上的第一次革命性突破,是转基因作物拯救整个产业的一个典型的成功案例。目前番木瓜是我国批准商业化种植的唯一转基因水果作物。

然而在获得转基因植物的过程中,外源DNA片段是如何整合到核基因组上的?整合过程中植物基因组发生了哪些结构变异?这些结构变异对基因功能造成了哪些影响?这些科学问题仍然未知。

本研究以番木瓜转基因品种SunUp中基因枪轰击介导的转基因事件为研究对象,对植物转基因过程进行深入研究以期解决上述科学问题。为克服番木瓜性染色体区域以及转基因插入区域重复序列多的困难,研究者通过使用Nanopore MinION 超长reads对两个品种的基因组进行组装,结合HiC技术最终得到组装大小为351.5Mb和350.3Mb的染色体级别的基因组。番木瓜超高分辨率基因组的获得,为解密SunUp转基因过程中基因枪轰击引起的基因组结构变异和基因表达变化奠定了坚实的基础。

通过全基因组共线性分析,研究者在SunUp品种的5号染色体上发现两个大的结构变异,一个1.6 Mb插入和591.9 Kb的缺失(图1)。研究发现,三个转基因片段均位于该1.6 Mb的插入片段上,并且三个转基因插入片段的6个侧翼序列中有5个侧翼序列来源于核质体基因组片段(NUPTs),它们在转基因过程中经历了结构变异,只有一个序列来源于核线粒体基因组片段(NUMTs)并且未发生结构变异(图1)。对1.6 Mb和591.9 Kb这两个大的结构变异上的基因进行分析,研究者意外的发现几乎所有基因都是叶绿体和线粒体基因组编码基因。通过 SunUp和Sunset品种不同发育阶段的叶和花组织的表达谱分析发现:两个结构变异上的差异表达基因中只有9个基因是单拷贝基因,表明基因枪轰击介导的转基因可引起显著的基因组结构变异,但是对基因功能造成的影响非常小,这为植物基因枪轰击介导的转基因过程对基因组结构和功能的影响提供了直接的证据。

图1. SunUp 基因组中转基因插入的整合位点

SunUp和Sunset基因组的比较分析进一步发现1.6 Mb插入片段是由77个重排和异位的片段组成,包括3个转基因片段、61个来自Sunset核基因组的片段和13个来自叶绿体和线粒体细胞器基因组的片段。其中 61个核基因组片段包括1个核基因组、18个NUMTs和42个NUPTs片段(图2)。这个结果说明转基因插入位点偏向于插入叶绿体富集区域,具有“偏好性”。通过以上发现,研究人员推测了基因枪介导的外源基因整合到基因组的可能机制:外源 DNA片段整合到富含NUPTs的区域,伴随着基因组中已有的NUPTs、NUMTs和核基因组序列发生多聚化、异位以及重排。由于基因枪穿透细胞引发的损伤反应促使叶绿体和线粒体细胞器片段整合到转基因插入片段所在的多聚化区域,这种机制可能是植物自身应对外界伤害的一种精密的自我保护的调控机制(图3)。

图2. SunUp 5号染色体上的 1.6Mb 插入片段来源分布图

番木瓜具有三种性别,是研究植物性染色体起源和演化的优异物种。野生番木瓜是雌雄异株,番木瓜两性植株是由野生种群中的MSY3类群人工驯化而来,是在4000年前玛雅文化的兴起时期产生的。虽然目前番木瓜性染色体起源和演化已经研究比较清楚了,但是番木瓜的性别决定基因还有待揭秘。通过Nanopore技术,研究者填补了之前版本中X和HSY上的缺口,HSY 区域从之前的7.8 Mb组装到9.8 Mb,X区域从5.3 Mb组装到6.0 Mb,并且在新组装的HSY和X上注释出了更多的基因,这将为深入研究性别决定区域,揭示番木瓜性别决定基因提供重要的研究基础。

图3. 外源 DNA 整合到核基因组中的模式图

番木瓜起源于墨西哥南部和中美洲,基于番木瓜的高质量参考基因组,研究人员对分布在夏威夷、中美洲、南美洲、东南亚和中国的86份栽培品种和野生种群进行遗传多样性分析,揭示了番木瓜遗传多样性主要存在于野生种质中。基于种群遗传结构分析表明栽培番木瓜分为Solo、普通番木瓜(Common)和哥斯达黎加(Costa Rican)三个类群。Solo番木瓜的特征是果实小,是夏威夷番木瓜品种的代表。普通番木瓜果实比较大,是最大的一个栽培品种类群,在驯化过程中经历了广泛杂交或野生渗入。哥斯达黎加类群是具有野生种质渗入的哥斯达黎加地方品种与夏威夷Solo品种之间产生基因交流后通过近亲繁殖稳定下来的一个类群(图4)。

之前研究表明番木瓜的性别、果实大小、种子萌发等是番木瓜驯化的主要特征。研究人员通过群体遗传分析在番木瓜6号染色体鉴定到一个受到人工选择的重要基因,该基因编码胡萝卜素生物合成途径中的zeta-胡萝卜素去饱和酶 (ZDS),可催化ζ-胡萝卜素转化为番茄红素,在控制果肉颜色中发挥重要作用。此外,研究者们还发现一些与果实糖分代谢相关的基因也显著受到人工驯化,包括蔗糖合酶相关基因CpSUS5以及编码糖转运蛋白的基因,如单糖糖转运蛋白(CpSTP)、蔗糖转运蛋白4 (CpSUC4)和CpSWEETIE,这一结果表明番木果肉颜色、风味也是人工驯化的重要目标。

图4. 栽培和野生番木瓜的种群结构

该研究通过高质量的转基因植株与其非转基因祖先的基因组之间的详细比较,首次实现了转基因过程引起的1.6 Mb 重组插入片段的单核苷酸分辨率水平的解析,揭示了基因枪轰击介导的转基因事件对基因组结构和功能的影响。番木瓜Y染色体性别决定区域的无缺口图谱将为性别决定基因的鉴定奠定坚实基础。通过番木瓜种群水平遗传分析鉴定到的人工驯化的基因将加速番木瓜分子育种的效率。

福建农林大学海峡联合研究院基因组与生物技术研究中心青年教师岳晶晶博士为论文第一作者,美国密歇根州立大学助理教授Robert VanBuren,海峡联合研究院基因组与生物技术研究中心已毕业博士刘娟(目前为中科院武汉植物园助理研究员),已毕业博士方静平(目前为福建师范大学副教授)为论文共同第一作者,美国伊利诺伊大学香槟校区明瑞光教授为通讯作者。中国农业科学院深圳农业基因组所张兴坦研究员、海峡联合研究院基因组与生物技术研究中心张积森教授、唐海宝教授、美国德克萨斯农工大学于青一教授、福建农林大学基因组与生物技术研究中心马晓开博士、黄永吉博士,科研助理徐秀明、张晟铖、邓班、邓芳、林京、赵晓兵,研究生廖振阳、陈帅、马亚影、余虹莹、周平、严寒松、Mahpara Fatima、林志聪、张小丹等参与了本项目的研究。该研究得到了福建农林大学先导项目、国家自然科学基金(31701889)、福建省自然科学基金(2018J01601,2018J01604)等项目的联合资助。

注:文章解析来源于福建农林报道。

参考消息:

https://www.nature.com/articles/s41588-022-01068-1