生命之树是进化生物学的核心,但由于 不完全谱系排序(ILS)杂交 和 多倍化 等复杂过程,解析深层且难解的系统发育关系仍然是一个挑战。**豆科(Leguminosae)**这一物种丰富且生态多样化家族的理解,但在族级及更高层次的许多深层关系依旧未能解决。研究结合 231 个物种的新测序 genome skimming 数据 与已有的 叶绿体基因组、线粒体基因组和转录组数据,基于 完整叶绿体基因组、39 个线粒体基因和 1559 个低拷贝核基因 重建了豆科系统发育树,涵盖了几乎所有已知族和主要未定位类群。通过 核基因树四分分析 并结合最大似然树与 ASTRAL 结果,对 22 个有争议节点 提出了最可能的系统关系解释。研究表明:ILS 是主要冲突来源,基因流(gene flow) 是一个被低估但重要的次要因素。这些过程可能解释了 Papilionoideae 中 50-kb 倒位类群 等顽固难解的系统发育关系。总体而言,本研究通过多数据分区与多方法结合,解析了豆科的关键系统发育争议,建立了一个稳健的系统发育框架,为进一步研究这一在生态与经济上都极其重要的家族提供了新基础。

文章来源:https://doi.org/10.1093/sysbio/syaf057

研究背景

  • 豆科约 22,520 种、796 属,广泛分布于全球几乎所有生境,在生态(固氮作用)和经济(大豆、豌豆、苜蓿等重要作物和药用/木材植物)上极其重要。

  • 由于其快速多样化(尤其在白垩纪—古近纪交界时期),豆科深层次系统发育关系一直难以解决。

  • 主要挑战:不完全谱系排序(ILS)、基因流(introgression/hybridization)、多倍化(polyploidization)、基因树估计误差(GTEE) 导致的基因树与物种树冲突。

研究方法

1. 样本与取样策略

  • 覆盖范围:几乎所有豆科亚科(6 个)与族(49 个)。

  • 新增数据

    • 235 个样本(231 个物种),利用 genome skimming 获得叶绿体和线粒体数据。

    • 样本来源包括新鲜叶片、硅胶干燥样品和标本馆标本。

  • 数据整合

    • 叶绿体基因组(plastome):696 个样本(677 个物种,433 属,约覆盖已知属的 54.4%)。

    • 线粒体数据:459 个样本,包含 39 个线粒体蛋白编码基因。

    • 核基因数据:1559 个低拷贝核基因(来源于转录组和基因组数据,463 个物种,333 个属)。

  • 外群选择:包括同目内的其他科(如 Polygalaceae、Quillajaceae、Surianaceae),以及若干其他被子植物科。


2. DNA 提取与测序

  • DNA 提取

    • 新鲜/硅胶干燥叶片 → 改良 CTAB 法。

    • 标本馆样品 → DNeasy Plant Mini Kit(针对降解 DNA 适配)。

  • 文库构建

    • DNA 片段化,筛选 350 bp 插入片段。

    • Illumina HiSeq 4000/X-Ten 平台测序(2 × 150 bp)。


3. 基因组装与注释

  • 叶绿体基因组

    • 使用 GetOrganelle(调用 Bowtie2、SPAdes、BLAST+)进行组装。

    • 组装图用 Bandage 可视化和人工修正。

    • 注释使用 PGA 和 Geneious,以大豆基因组为参考。

  • 线粒体基因

    • 使用 SPAdes + GetOrganelle 获取线粒体 contig。

    • 对照已发表的豆科线粒体基因组进行比对和人工修正。

  • 核基因数据

    • 引用 Zhao et al. (2021) 的数据集(1559 个低拷贝核基因)。

    • 基因主要功能:DNA 修复、RNA 剪接、蛋白结合等 housekeeping genes。


4. 数据处理与比对

  • 叶绿体:提取 203 个片段(81 coding + 122 noncoding),分别比对(MAFFT)并拼接为不同矩阵。

  • 线粒体:保留 39 个基因,拼接为 MG39 矩阵。

  • 核基因:1559 个基因分别比对和拼接为 Nucl1559 数据集。

  • 低质量或缺失严重的片段会被 trimAl 过滤。


5. 系统发育推断

  • 最大似然树(ML)

    • 使用 PartitionFinder2 确定分区方案。

    • RAxML 推断树(GTR+G 模型),1000 bootstrap。

  • 物种树推断

    • 使用 ASTRAL-III(基于基因树四分法,适用于 ILS 情况)。

    • 主要对核基因和叶绿体数据应用,线粒体数据由于信息量有限未用于冲突分析。

  • 冲突分析

    • 核基因树Quartets分析:检测基因间冲突。

    • ILS 与基因流检测:使用局部支持值、Reticulation Index 等方法分离不同冲突来源。

研究结果

1. 系统发育框架

  • 六个亚科的单系性得到强烈支持

  • 49 个已承认族单系得到确认

  • 在蝶形花亚科(Papilionoideae)内,识别出 10 个潜在新族(tribes) 候选群体,建议提升为正式族级单位。

  • 一些关键关系得到澄清:

    • ADA 类群(Angylocalyceae + Dipterygeae + Amburaneae) 与其他 Papilionoideae 的关系。

    • Baphieae、Dalbergioid、Genistoid 等重要类群的相对位置。

    • 对长期未定位的属(如 Austrosteenisia、Dermatophyllum)提出分类学参考。

图片

图1豆科696个质体基因组的编码区和非编码区串联的最大似然树

图片

图2 豆科核基因和质体基因组系统发育树在族级分支层面存在的核质冲突

图片

图3 叶绿体和核基因的单基因树支持度频率分布


2. 冲突模式

  • ILS 是主要冲突来源:解释了大多数深层次分支的不一致。

  • 基因流(introgression)

    • 在 ADA 类群、Wisterieae、Mimoseae、Caesalpinieae 等分支表现突出。

    • 主要造成 细胞核-叶绿体冲突

  • 基因树估计误差(GTEE):在 Papilionoideae 的 50-kb inversion clade 中尤为明显。

  • 定量结果:

    • ~71% 的冲突节点与 ILS 相关;

    • 18% 主要受基因流驱动;

    • 31% 由 ILS 与基因流共同作用。

图片

图4 基于豆科核基因系统发育树的不完全谱系分选(ILS)、基因树估计误差(GTEE)及基因流(RI)信号的量化

图片

图5 不完全谱系选、基因树估计误差以及基因流对豆科植物系统发育树结构的影响

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/921298.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/921298.shtml
英文地址,请注明出处:http://en.pswp.cn/news/921298.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

从Java全栈到前端框架:一次真实的面试对话与技术解析

从Java全栈到前端框架:一次真实的面试对话与技术解析 在一次真实的面试中,一位拥有多年经验的Java全栈开发工程师,被问及了多个涉及前后端技术栈的问题。他的回答既专业又自然,展现了扎实的技术功底和丰富的实战经验。 面试官&…

阿瓦隆 A1566HA 2U 480T矿机参数解析:性能与能效深入分析

在矿机行业,AvaLON是一个备受关注的品牌,尤其在比特币(BTC)和比特币现金(BCH)挖矿领域,凭借其强劲的算力和高效能效,在市场中占据了一席之地。本文将针对阿瓦隆 A1566HA 2U 480T矿机…

小迪安全v2023学习笔记(七十八讲)—— 数据库安全RedisCouchDBH2database未授权CVE

文章目录前记服务攻防——第七十八天数据库安全&Redis&CouchDB&H2database&未授权访问&CVE漏洞前置知识复现环境服务判断对象类别利用方法数据库应用 - Redis-未授权访问&CVE漏洞前置知识案例演示沙箱绕过RCE - CVE-2022-0543未授权访问 - CNVD-2019-2…

HTML + CSS 创建图片倒影的 5 种方法

HTML CSS 创建图片倒影的 5 种方法 目标:掌握多种生成“图片倒影 / Reflection”效果的实现思路,理解兼容性、性能差异与最佳实践,方便在真实业务(商品展示、相册、登陆页面视觉强化)中安全使用。 总览对比 方法核心…

一个文件被打开io流和不打卡 inode

1. 磁盘 最小基本单位 扇区 机器磁盘的io效率 (读和取)2. 文件系统 对磁盘分区 ,最小的文件单位块组,快组内部已经划分好区域,巴拉巴拉,总之,每次使用数据,以操作系统的处理都是块级…

ThermoSeek:热稳定蛋白数据库

这篇论文提出了ThermoSeek,一个综合性的网络资源,用于分析来自嗜热和嗜冷物种的蛋白质序列和结构。具体来说,数据收集:从美国国家生物技术信息中心(NCBI)的基因组数据库中收集了物种的分类ID,并…

leetcode算法刷题的第二十七天

1.leetcode 56.合并区间 题目链接 class Solution { public:static bool cmp(const vector<int>& a,const vector<int>& b){return a[0]<b[0];}vector<vector<int>> merge(vector<vector<int>>& intervals) {vector<v…

解决 Apache/WAF SSL 证书链不完整导致的 PKIX path building failed 问题

文章目录解决 Apache/WAF SSL 证书链不完整导致的 PKIX path building failed 问题为什么会出现证书链错误&#xff1f;常见场景直连服务器正常&#xff0c;但经过 WAF 出错Windows/Linux 下证书文件说明引入 WAF 或其他中间层&#xff1a;解决方法方法一&#xff1a;单独配置 …

十一、标准化和软件知识产权基础知识

1 标准化基础知识 1.1 基本概念 1.1.1 标准的分类 1.1.1.1 按使用范围分类 国际标准&#xff1a;由国际组织如 ISO、IEC 制定的标准。国家标准&#xff1a;由国家标准化机构制定的标准&#xff0c;如中国的 GB&#xff0c;美国 ANSI。行业标准&#xff1a;由行业主管部门制定的…

计算机毕设选题:基于Python数据挖掘的高考志愿推荐系统

精彩专栏推荐订阅&#xff1a;在 下方专栏&#x1f447;&#x1f3fb;&#x1f447;&#x1f3fb;&#x1f447;&#x1f3fb;&#x1f447;&#x1f3fb; &#x1f496;&#x1f525;作者主页&#xff1a;计算机毕设木哥&#x1f525; &#x1f496; 文章目录 一、项目介绍二…

什么是PCB工艺边?猎板给您分享设计要点

什么是PCB工艺边&#xff1f;猎板给您分享设计要点在PCB设计和制造领域&#xff0c;工艺边是一个看似简单却至关重要的概念&#xff0c;它直接关系到生产流程的顺畅性与最终产品的质量。本文将为您详细解析PCB工艺边的定义、作用、设计要点&#xff0c;并分享猎板PCB在高精度制…

Rustdesk搭建与客户端修改与编译

Rustdesk是一个开源的远程桌面工具&#xff0c;客户端可以自己定制修改编译 这里主要记录一下搭建的过程 服务端搭建 主要是参考了这篇文章&#xff0c;感觉作者分享~ 在 Linux VPS 上创建 RustDesk 服务器 - 知乎 https://zhuanlan.zhihu.com/p/1922729751656765374 这里主要…

数字人系统源码搭建与定制化开发:从技术架构到落地实践

随着元宇宙、直播电商、智能客服等领域的爆发&#xff0c;数字人从概念走向商业化落地&#xff0c;其定制化需求也从 “单一形象展示” 升级为 “多场景交互能力”。本文将从技术底层出发&#xff0c;拆解数字人系统的源码搭建逻辑&#xff0c;结合定制化开发中的核心痛点&…

2025国赛C题创新论文+代码可视化 NIPT 的时点选择与胎儿的异常判定

2025国赛C题创新论文代码可视化 NIPT 的时点选择与胎儿的异常判定基于多通道LED光谱优化的人体节律调节与睡眠质量评估模型摘要无创产前检测&#xff08;NIPT&#xff09;通过分析孕妇血浆中胎儿游离DNA来筛查染色体异常&#xff0c;其准确性很大程度上依赖于胎儿Y染色体浓度的…

2021/07 JLPT听力原文 问题一 4番

4番&#xff1a;女の人が新しい商品の紹介をしています。よく頭が痛くなる人は、どの商品を選びますか。女&#xff1a;こちら、新発売の中国茶をご案内します。今回皆様にご紹介いたしますのは、月・星・虹・空のお茶の4種類でございます。さあ、どうぞ召し上がってください。…

爆改YOLOv8 | 即插即用的AKConv让目标检测既轻量又提点

突破固定卷积核的局限,让卷积核形状随目标变化而动态调整 目标检测技术在当今计算机视觉领域扮演着至关重要的角色,而YOLO系列作为其中佼佼者,以其高速和高精度获得了广泛应用。但在实际应用中,传统的卷积操作存在一些固有缺陷**。本文介绍了一种创新性的改进方案——AKCon…

linux inotify 功能详解

内核宏开启机制inotify 功能依赖 Linux 内核宏 CONFIG_INOTIFY_USER CONFIG_INOTIFY_USER=y该宏控制用户态程序能否调用 inotify 相关系统调用,如 inotify_init(),inotify_add_watch() inotifywait 侧重实时响应,适合触发后续操作; inotifywatch 侧重数据统计,适合分析事件…

Docker Registry 实现原理、适用场景、常用操作及搭建详解

一、实现原理 Docker Registry 是基于 无状态服务架构 的镜像存储与分发系统&#xff0c;其核心设计包含以下关键点&#xff1a;存储驱动抽象层 Registry 通过 storagedriver.StorageDriver 接口实现存储解耦&#xff0c;支持多种后端存储&#xff1a; 本地存储&#xff1a;默认…

【LeetCode热题100道笔记】轮转数组

题目描述 给定一个整数数组 nums&#xff0c;将数组中的元素向右轮转 k 个位置&#xff0c;其中 k 是非负数。 示例 1: 输入: nums [1,2,3,4,5,6,7], k 3 输出: [5,6,7,1,2,3,4] 解释: 向右轮转 1 步: [7,1,2,3,4,5,6] 向右轮转 2 步: [6,7,1,2,3,4,5] 向右轮转 3 步: [5,6,7…

【Linux我做主】细说进程等待

Linux进程等待Linux进程等待github地址0. 前言1. 进程等待的必要性1.1 避免僵尸进程与资源泄漏1.2 僵尸进程不可被直接清除1.3 获取子进程的运行结果2. 进程等待的三个问题1. 为什么要有进程等待2. 进程等待是什么3. 怎么实现进程等待3. 僵尸进程演示4. waitwait的手册声明wait…