网站架构规划,seo与网站优化,网站建设需要学什么证,seo技术平台Hybrids reveal accessible chromatin trans genetic associations
杂交后代揭示可及染色质的反式遗传关联
对遗传背景差异大的玉米#xff08;Zea mays#xff09;自交系进行杂交#xff0c;可产生杂交优势#xff08;heterosis#xff09;#xff1a;即植株营养生长和籽…Hybrids reveal accessible chromatin trans genetic associations杂交后代揭示可及染色质的反式遗传关联对遗传背景差异大的玉米Zea mays自交系进行杂交可产生杂交优势heterosis即植株营养生长和籽粒产量均表现出超显性增长。尽管决定这一优势的位点尚不明确杂交优势强度呈多基因控制且“硬秆stiff stalk”与“非硬秆non-stiff stalk”两大谱系间的杂交常产生农业上广泛利用的高优势 F1 种子。由于 F1 基因组保留了亲本的顺式调控状态其性状超显性和杂交优势基因表达主要源于不同单倍型间的反式互作。基因表达依赖于转录因子结合可及染色质区ACRs中的顺式调控元件并招募 RNA 聚合酶 II。本研究利用转座酶可及染色质测序ATAC-seq分析了 3 个不同 F1 亲本-子代组合包括典型的硬秆 × 非硬秆杂交 B73×Oh43中顺式调控元件的染色质可及性遗传模式。通过拼接参考基因组比对我们将 ACR 的遗传方式分类为加性、显性及超/亚显性发现 ACR 大多呈加性遗传且染色质可及性具有较高的狭义遗传力。然而与其他杂种优势表型一致B73×Oh43 组合表现出最多的显性与超显性遗传。比较亲本到子代的等位基因特异性染色质可及性我们鉴定出 F1 中差异反式调控的 ACR。利用匹配的可及染色质多样性群体发现 B73×Oh43 的 SNP 所关联的反式调控 ACR 数量显著高于随机期望。这些反式调控变异揭示了杂种优势 F1 幼苗中细胞分裂与合成代谢增强的分子机制。这种多重发现过滤MDF策略检测反式调控变异的方法不依赖于特定组学类型可广泛应用于多种遗传模型中反式关系的解析。引言不同的环境条件与个体遗传多样性共同决定着性状的变异而表型的遗传力则代表了其中受遗传控制的比例。许多具有重要经济价值且遗传力很高的性状都是由多个不连锁位点共同作用的结果。例如在玉米Zea mays中这类复杂、数量或多基因性状包括植株架构Wallace 等2014Wang 等2023a、开花时间Buckler 等2009Li 等2016Romero Navarro 等2017以及产量Mural 等2022。由于数量性状涵盖了这些关键的农艺表型人们对其背后的遗传机制极为关注。然而调控数量性状的基因网络极其复杂使得解析控制性状的具体通路变得困难重重。相比之下功能不同的等位基因的遗传规律已较为清楚。大多数等位基因以同等强度控制各自的表型表现为加性遗传。例如在受控环境下若两个亲本分别对两个不同的加性等位基因纯合AA × aa子代Aa的表型将接近两者的平均值即中亲值。然而也存在非加性的遗传模式如果子代表型与某一亲本完全一致则称为显性遗传如果子代出现超越双亲的极端表型高于高亲或低于低亲则分别称为超显性over-dominance或亚显性under-dominance统称为越亲遗传。从骡子到玉米多种多样的真核生物都表现出一种有趣的超显性现象——杂种优势heterosis又称 hybrid vigourKaeppler2012。杂种优势源于两个亲缘关系较远的个体之间的“远缘”杂交使许多形态和生理性状同时出现超显性。然而杂交优势的程度本身受遗传控制因而杂种优势也可被视为一个可变的数量性状Stuber 等1992Kaeppler2012Riedelsheimer 等2012Li 等2018Xiao 等2021Wang 等2023b。在玉米生产中人们利用强且一致的 F1 代杂种优势Shull1908East 和 Jones1920Duvick2005通常让来自不同杂种优势群的自交系进行杂交——尤其是硬秆stiff stalk与非硬秆non-stiff stalk谱系之间的配对。这些 F1 植株在许多性状上均表现出超显性Xiao 等2021包括幼苗的营养生长Li 等2018而该性状与最终产量密切相关Lu 等2011Trachsel 等2017。营养生长离不开水分、矿质元素、碳骨架和能量——后两者主要由光合作用提供。光合产物糖类在含叶绿体的“源”组织合成后被转运至消耗性的“汇”组织如正在生长的器官MacNeill 等2017。直观上看提高光合速率可促进生长South 等2019Wu 等2019。然而增强“汇”强度也能改善作物生长Nuccio 等2015部分机制是通过加速碳从源组织输出缓解高糖浓度对光合的负反馈Moore 等2003Cho 等2006Vanderwall 与 Gendron2023。在营养生长阶段叶片本身是最大的碳汇之一也是一项能源投资——当下的碳支出可换取未来的光合能力Wright 等2004。器官形成中的碳投入遵循一套跨性状相关模式即“获取型–保守型”轴该轴在不同物种间Wright 等2004以及同一物种内Gorné 等2022均有变化与器官干质量/体积比密切相关。保守型组织建造成本高但寿命长、抗逆性强可带来持久的光合“回报”相反获取型组织成本低更积极地消耗水、碳和矿质以复利方式提升光合收益但会以增加草食、病害及胁迫敏感性为代价缩短器官寿命。当前作物生长可能过于“保守”因为获取型策略的负面效应可通过农艺措施如杀虫剂、转基因如 Bt 毒素Santos-Amaya 等2015和金融工具作物保险得以缓解。然而促进获取型营养活力的分子机制复杂且知之甚少阻碍了通过工程手段提升作物生长与产量的进程Simmons 等2021。此外种间比较表明常规育种并未把作物的获取型性状推向超越其野生祖先的水平Gómez-Fernández 等2024。研究杂种优势下的营养旺盛生长或有助于揭示控制生长速率的一般遗传基础。尽管一些常见的杂种优势调控因子如昼夜节律相关基因Ni 等2009Yang 等2021以及花期调控基因Xiao 等2021正在浮现但杂交优势的多基因和多期性特征使其机制依旧神秘莫测。杂种优势被认为源于转录水平的改变事实上已知的杂种优势强度决定因子就包括转录因子TFNi et al., 2009Xiao et al., 2021Yang et al., 2021。TF 通过结合特定的 DNA 序列基序——即顺式调控元件CRE——来调控基因转录这些元件与基因相连Schmitz et al., 2021Marand et al., 2023。结合的 TF 可调节 RNA 聚合酶 II 的招募从而将转录与发育和环境信号协调起来。TF 结合大多需要肽段与 DNA 的直接接触这一过程在空间上受限于无核小体可及的染色质这些可及染色质区ACRs可通过转座酶可及染色质测序ATAC-seq揭示Buenrostro et al., 2013Minnoye et al., 2021从而展示可供 TF 结合的 CRE 全貌。除 CRE 可及性存在差异外TF 活性还受细胞生化状态影响包括蛋白-蛋白互作Kim Wysocka, 2023、激素/代谢物结合Carthew, 2021Hornisch Piazza, 2025以及翻译后修饰Weidemüller et al., 2021。解析杂种优势的基因表达机制因而颇具挑战因为不同的 CRE 变异与蛋白组分会协同作用。然而由自交系衍生的 F1 杂交种为研究基因调控提供了独特契机自交系单倍型在 F1 中保持完整。未重组的单倍型不仅可实现精确且可重复的基因型构建还保留了亲本原有的顺式调控环境——即 CRE 变异与其靶基因之间的全局连锁关系保持不变。相反反式调控定义为所有与其靶基因不连锁的调控因子在杂交种中发生变化。来自双亲的 TF 及其他调控蛋白共同作用于 F1 基因组尽管剂量减半但反式调控空间涵盖了两自交系的全部组分。由于所有顺式效应已被固定杂种优势的机制必然存在于 F1 的反式调控差异之中换言之染色体间的遗传互作最终表现为杂种优势表型。然而描绘这些基因间的反式调控关系在技术上仍极具挑战。种内反式调控变异的表达效应量通常很小Dixon et al., 2007Göring et al., 2007West et al., 2007Swanson-Wagner et al., 2009Li et al., 2013Võsa et al., 2021Zhan et al., 2025加之极高的多重检验负担使得遗传变异与其非连锁靶标之间难以建立高置信度的关联。转录决策是多种生命过程中的关键“整合节点”Katagiri 和 Chua1992Paz-Ares 等2002Lambert 等2018因此大量研究致力于解析驱动转录的因素既包括单基因水平也包括全基因组范围。遗传力估算——狭义遗传力h²仅考虑加性遗传效应Monks 等2004Dixon 等2007Göring 等2007Price 等2011Yang 等2014Ouwens 等2020和广义遗传力H²涵盖加性、显性以及上位性等全部遗传效应Sun 等2023——均表明转录处于遗传控制之下。相较之下关于染色质可及性遗传力的测量极少Gate 等2018Zhu 等2024且环境与遗传对核小体占位的影响程度仍存疑问。然而在遗传多样性作图群体中对染色质可及性的测定已揭示出染色质可及性数量性状位点caQTLGate 等2018Kumasaka 等2019Aygün 等2023Benaglio 等2023Zeng 等2024Marand 等2025Zhu 等2025强调遗传变异能够调控特定 CRE 的可及性。然而由于上述绘制反式调控差异的困难已知的 caQTL 主要涵盖顺式连锁遗传决定因子Gate 等2018Kumasaka 等2019Aygün 等2023Zeng 等2024Marand 等2025。本研究将同期生长的三套玉米自交系 B73、Oh43 和 Ki3 及其 F1 组合 B73×Ki3、B73×Oh43、Oh43×Ki3后文简称 B×K、B×O、O×K幼苗用于 bulk ATAC-seq 染色质可及性分析。利用对应的高质量参考基因组Hufford et al., 2021我们全面测定了单倍型分辨的 ACR可及染色质区组成刻画了种内 ACR 的保守性与分歧。通过比较亲本与 F1 子代的染色质可及性我们解析了 ACR 的遗传方式与比例并估算了染色质可及性的狭义遗传力h²。借助 F1 中顺式效应被保留以及等位基因特异的 ATAC-reads我们发现了可及性因 F1 反式调控环境而改变的位点。为探究这种 F1 ACR 反式调控的遗传基础我们将上述 bulk 数据与一份组织与环境均匹配的单细胞染色质可及性多样性群体Marand et al., 2025整合。为了赋能反式效应的遗传定位我们开发并展示了一种新的“多重发现过滤”MDF策略通过筛选与众多非连锁 ACR/基因存在关联的反式调控变异有效控制假阳性I 类错误。该方法同时发现了与 B×O 幼苗杂种优势相关的反式调控变异及其参与的生物学过程。结果F1 染色质可及性遗传模式解析利用 bulk ATAC-seq 对 7 日龄的 B73、Oh43、Ki3 及其 F1 组合 B×K、B×O、O×K 幼苗进行染色质可及性检测图 1A每个基因型设置 4–6 次生物学重复。该时期与一份更大规模的单细胞染色质可及性多样性群体Marand et al., 2025在环境和发育阶段上保持一致。选择这三份自交系的原因1在玉米系统发育中分布代表性良好Hu et al., 20212具备高质量参考基因组Hufford et al., 20213杂种优势强度存在差异其中 B×O硬秆 × 非硬秆F1 的杂种优势强于另两个组合Li et al., 2018。为尽可能准确地衡量单倍型间的可及性差异我们同时采用单一参考基因组B73与“拼接基因组”比对策略Engelhorn et al., 2025后者可检出存在-缺失变异PAVACR并避免单倍型比对偏差。质控指标显示 ATAC-seq 数据质量良好表 S1仅剔除 1 个 B73 文库读段数过低。对于每条拼接参考序列要求在 n-1 个生物学重复中均出现重叠峰才定义为 Tn5 插入峰ACR最终分别获得B×K 参考B73 51,459 峰、Ki3 51,060 峰B×O 参考B73 40,939 峰、Oh43 40,649 峰O×K 参考Oh43 63,845 峰、Ki3 63,048 峰图 1C表 S2。随后在每个 F1 中对上述 ACR 进行分类数据 S1,2,3TSS 区转录起始位点近端区TSS 上游 2 kb基因间区TSS 上游 2 kb 或基因内部所有 ACR 集合的 ACR-to-基因距离分布一致图 1D-E。按单倍型间保守性进一步划分保守型是如何估计的??61.5–65 % 为共享 ACR高序列一致性13.1–17.2 % 为模糊 ACR低一致性17.3–19.7 % 为某单倍型特有 ACR2.2–2.8 % 为重复CNVACR图 1F。由于限制多定位最多 2 次比对对高序列一致性的年轻大段重复 ACR 的检出偏低因此 CNV ACR 数量被低估。明确各单倍型 ACR 组成后我们借鉴亲本-子代比较框架Coolon et al., 2014考察 F1 相对于亲本的染色质可及性Tn5 插入率变化图 2A-C图 S1并将 ACR 的染色质可及性遗传模式划分为相似无显著变化加性显性亚显性超显性大部分 ACR42.1–49.5%在亲本与 F1 之间的可及性水平相似表明这些位点在 F1 中保留了与亲本一致的染色质可及性控制。在出现差异的 ACR 中加性遗传最为常见38.5–49.9%显性模式也较多6.8–11.0%而超显性与亚显性则罕见分别为 0.2–0.8% 和 0–0.02%。有趣的是我们的亲本-子代可及性图谱结构与以往基因表达研究Coolon 等2014所见不同ACR 图谱的“加性象限”呈现出明显的长尾。我们推测这可能反映染色质可及性的遗传模式比 mRNA 更简单更多 ACR 呈二元的“有/无”变异且完全由顺式效应驱动。若如此F1 的可及性应等于亲本的一半即与等位基因剂量减半相符。为验证这一假设我们筛选出那些可及性与“半亲本值”无显著差异的 ACR单样本 t 检验未 FDR 校正p 0.05这些位点恰好重现了加性象限的长尾图 S2。此外这类“半亲本”ACR 占全部加性遗传 ACR 的 19.0–38.1%说明严格由等位基因剂量驱动的遗传事件非常普遍。综上染色质可及性的遗传模式与转录类似但具有更高比例的忠实“等位基因剂量”遗传。我们还比较了不同 F1 组合间 ACR 遗传模式的差异。显性 ACR 的数量在 B73 单倍型BxK 5,639 个BxO 4,088 个和 Oh43 单倍型BxO 4,922 个OxK 7,831 个上相近但 Ki3 单倍型的显性 ACR 较少BxK 1,340 个OxK 2,280 个。超显性 ACR 在所有 F1 中均有出现但在 BxO 中最多。总体来看高杂种优势的 BxO 组合所含显性 ACR 和超显性 ACR 数量显著多于另外两个 F1二项检验p 2.2×10⁻¹⁶。此外BxO 是唯一未检出任何亚显性 ACR 的组合。与 F1 个体水平的超优表型相呼应BxO 整个基因组的染色质可及性均达到或超过亲本水平。分子层面与生理层面杂种优势的同步出现表明CRE 染色质可及性在全基因组范围内的提升有助于 F1 活力。通过亲本-子代染色质可及性比较我们依据 ACR 的基因组位置、单倍型间同源程度及遗传模式对其进行分类。随后在三种类别间图 2D-F数据 S4检验 ACR 的富集/缺失比例发现三套 F1 中呈现的规律高度一致单倍型特有 ACR显著富集于基因间区而在 TSS 区域缺失并且与“半亲本”加性遗传模式高度吻合。高同源、单倍型共享 ACR富集于 TSS基因间区缺失提示这些保守位点多靠近核心启动子。低同源、“模糊” ACR主要位于启动子近端proximal符合种内 CRE 在 TSS 周边而非正中心发生创新的观点。最显著的差异出现在显性与超显性 ACR 中BxO 组合的这两类 ACR 在基因内部显著富集图 S3与显性/超显性可及性常伴随转录活性升高一致Cusanovich et al., 2018Marand et al., 2021Tu et al., 2022。此外BxO 显性 ACR 还富集于低同源的“模糊”且近端区域暗示显性 TF 可能与这些分化较大的近端 ACR 发生新型互作。ACR 类别及基因型间的转录因子结合基序偏好性在进一步研究 F1 代的可接近染色质区域ACR互补集时我们搜索了 ACR 各个类别中 DNA 序列基序motif的富集或缺失情况。在此过程中我们剔除了基因内 ACR因为其序列具有密码子偏好性以及数量极其稀少的超显性under-dominantACRBxK 杂交组合8 个BxO0 个OxK21 个。尽管种内分化巨大但最显著的趋势在所有基因型中均保持一致图 3A-D图 S4图 S5数据 S5基因间区与 TSS ACR 的差异 最强的基序富集现象出现在基因间区 ACRintergenic ACRs与转录起始位点 ACRTSS ACRs之间且两者呈现互补态势。相较于 TSS ACR基因间区 ACR 中含有更多种类的普遍基序。具体而言许多 AP2/EREBP 基序在 TSS ACR 中显著富集而 B3 结构域、WRKY、DOF、TCP 等基序则在基因间区 ACR 中更为富集。单倍型共享与特有 ACR 的差异 单倍型共享shared与特有unique的 ACR 同样表现出强烈且在不同基因型间一致的基序富集特征。例如C4-锌指 GATA (MA1325.2)、MYB (MA1175.2) 和 G2-like1 (MA1827.2) 基序在特有 ACR 中富集而在共享 ACR 中缺失。相反SPL (MA1056.2)、bZIP (MA1822.2) 和 NAC (MA2036.2) 等基序在特有 ACR 中缺失但在共享 ACR 中广泛存在。**杂交 ACR **继承类别也存在 motif 富集/缺失但程度小于位置或同源性类别且具有更大的基因型变异性Data S5。在 F1 代之间显性 ACRs 具有大体上保守的 motif 富集而与杂交配对无关Figure 3D所有显性 ACRs 均表现出 SPL (例如 MA2452.1) motif 富集而 B73 显性富集 B3 结构域 (MA0565.3) motifsOh43 显性富集 DOF (MA0977.1) motifsKi3 显性富集 bZIP motifs (MA1822.1)。Ki3 单倍型显性表现出比其他两种单倍型更弱、更不一致的 motif 富集Figure 3D这可能反映了 Ki3 显性 ACR 数量的减少。超显性 ACRs 在遗传力组中具有最差的 motif 富集表明与特定 TF 家族的关联性较弱Figure 3 B 和 C。超显性 ACRs 具有可变的 F1 motif 富集但在所有 F1 代中都弱富集 MADS 家族 motifs (MA0548.3-AGL15, MA1199.1-AGL16, MA0555.2-SVP, MA0005.3-AG)Data S5。BxO 超显性 ACRs 具有 TGA1 (SPL-like) motifs 缺失且 BxK 和 BxO 超显性 ACRs 均表现出 NTL9 (NAC) motif 富集Figure 3E。BxO 超显性 ACRs 也比其他两种 F1 代含有更多数量的更强烈的 motif 富集Figure S5t 检验BxO 对比 BxKp1.612×10−12p1.612\times 10^{-12}p1.612×10−12BxO 对比 OxKp6.97×10−10p6.97\times 10^{-10}p6.97×10−10这可能暗示着 BxO 中更复杂的超显性调控。总而言之BxO 杂种优势heterosis包含比其他两种 F1 代更多的显性和超显性染色质可及性——且 BxO 显性具有比超显性更强的 CRE 关联。F1 代 ACR 狭义遗传力估计环境和遗传对染色质可及性的相对影响尚不完全清楚。这些数据提供了一个机会通过测量在受控生长条件下中亲值与观察到的 F1 染色质可及性的相关程度来单独计算每个 ACR 的h2h^2h2狭义遗传力估计值。尽管是一种启发式方法但这里对h2h^2h2的计算得到了 ACR 继承的叠加性占主导地位的支持。为了直接比较独立的 ATAC-seq 数据集我们根据 Marand 等人 (2025) 的 B73 参考 ACR 计算了 F1 代的h2h^2h2Figure 4A。我们观察到 高h2h^2h2的 ACR 与已定位的染色质可及性数量性状基因座 (caQTL) 之间存在高度重叠Figure 4A这表明在这三种基因型中受到强遗传控制的 ACRs在更广泛的群体中也以同样方式受到控制。进一步研究 ACRh2h^2h2我们根据 ACR 相对于基因的位置对其进行了子分类Figure 4B-F。在所有 ACR 类别中都存在一些极低h2h^2h2的 ACRs。这些低h2h^2h2ACRs 与来自动态细胞过程的基因本体论 (GO) 术语的基因相关联Table S3例如内质网相关的错误折叠蛋白分解代谢过程 (GO:0071712)、吡啶核苷酸补救 (GO:0019365) 和 NAD 生物合成过程 (GO:0009435)。研究与遗传力更高的 ACRs 相关联的基因功能揭示了代谢方面如己糖磷酸转运 (GO:0015712) 和木聚糖分解代谢过程 (GO:0045493)以及发育基因如涉及叶形态发生调控 (GO:1901371) 和油菜素甾醇介导的信号传导 (GO:0009742) 的基因。此外检查更高h2h^2h2的 ACRs 揭示了二元对立的 ACR 继承模式Figure 4B-F即转录的 ACRs转录起始位点 (TSS)、外显子、内含子的h2h^2h2低于****严格调控的 ACRs近端、基因间。转录 ACR 的h2h^2h2估计值与玉米基因转录的估计值相似 (Sun et al., 2023)这表明转录 ACR 上的染色质可及性主要由 RNA 聚合酶 II 核小体置换控制。此外由于严格调控的 ACRs 具有比转录 ACRs 更高的遗传力Figure S6因此它们比转录或转录的 ACRs 对环境更不敏感。内含子 ACRh2h^2h2似乎与其他转录 ACR 类别不同具有两个高h2h^2h2遗传力峰值分别与转录 ACR 和严格调控 ACRh2h^2h2的峰值相吻合。鉴于所有内含子都会被转录调控h2h^2h2值的普遍性令人惊讶并暗示了独特的内含子 CRE 染色质动态。这些研究揭示了靠近转录的位置会影响染色质可及性h2h^2h2。此外在固定的生长条件下低h2h^2h2的 ACRs 与高度动态的过程相关例如细胞稳态而高h2h^2h2的 ACRs 可能控制更“硬连线”的过程例如器官发生和营养/碳利用。方法1.植株生长、细胞核分离、Tn5 标签化、文库制备与测序杂交手授是在 2023 年使用从玉米 CO-OP 种质中心获得的种子在温室种植的植株上进行的。所分析的每个 F1 基因型都是相同的手授杂交。所有分析的植株都在与 Marand 等人 (2025) 相同的条件下和空间中生长。具体来说所有生物学重复 (n4-6) 均在 Sungro 土壤 (Sungro Horticulture Canada Ltd) 中生长置于 16 小时光周期下50:50 混合的荧光灯光照来自 4100K Sylvania Supersaver Cool White Delux F34CWX/SS, 34W 和 3000K GE Ecolux w/ starcoat, F40CX30ECO, 40W 照明恒定温度约 25°C。所有基因型同时生长托盘按照基因型进行分块blocked。播种后七天在上午 8 点到 10 点之间黎明后 1-3 小时收获第一个节间约±1cm\pm 1 \text{cm}±1cm组织进行新鲜细胞核提取使用 Personna 剃须刀 (74-0002 Personna Stainless Steel Surgical Prep Blades)。细胞核提取细胞核提取方法与之前相同 (Marand et al., 2025)。简而言之将分离的组织在冰上使用 Personna 剃须刀片在细胞核提取缓冲液 (1X NIB:10mM10\text{mM}10mMMES:KOH pH 5.4,10mM10\text{mM}10mMNaCl,10mM10\text{mM}10mMKCl,2.5mM2.5\text{mM}2.5mMEDTA pH 8,250mM250\text{mM}250mM蔗糖,0.1mM0.1\text{mM}0.1mM亚精胺,0.5mM0.5\text{mM}0.5mM精胺,1mM1\text{mM}1mM新鲜 DTT) 中切碎 2 分钟并加入0.5%v/v0.5\% \text{v/v}0.5%v/vTriton X100。将组织浆液通过40μm40\mu \text{m}40μm细胞过滤器 (Pluriselect) 过滤到一个2mL2\text{mL}2mL锥形管中并在4∘C4^\circ\text{C}4∘C下以500g500\text{g}500g的离心力使用水平转子离心机 (Eppendorf 5810R Centrifuge) 离心 5 分钟使细胞核沉淀。移除上清液将细胞核重新悬浮在500μL500\mu \text{L}500μL1X1\text{X}1XNIB 中然后通过一个10μm10\mu \text{m}10μm细胞过滤器 (Pluriselect)。将细胞核轻轻叠层在另一个2mL2\text{mL}2mL锥形管中的1mL1\text{mL}1mL35%v/v35\% \text{v/v}35%v/vPercoll:1X1\text{X}1XNIB 溶液上方并在4∘C4^\circ\text{C}4∘C下以500g500\text{g}500g的离心力离心 10 分钟。之后移除所有上清液将细胞核重新悬浮在1X1\text{X}1XTAPS 缓冲液 (10mM10\text{mM}10mMTAPS-NaOH, pH8.0,5mM5\text{mM}5mMMgCl2) 中并用 DAPI最终浓度1μg/mL1\mu \text{g/mL}1μg/mL染色然后进行计数。Tn5 标签化、文库制备与测序每个重复约 40,000 个细胞核在2.5X2.5\text{X}2.5XTAPS 中进行 Tn5 标签化方法与先前描述的相似但使用了1.75μg1.75\mu \text{g}1.75μgTn5 (Ricci et al., 2019)。然后纯化这些标签化产物 (Monarch PCR DNA Cleanup Kit; 作为≤2kb\le 2\text{kb}≤2kb的双链 DNA; NEB #T1030)并按照先前描述的方法 (Ricci et al., 2019) 进行 PCR 扩增以添加测序接头。使用 AMPure XP 磁珠 (Beckman Coulter) 对这些文库进行清洗然后使用 Illumina Novaseq 6000 进行测序约 1 亿条150bp150\text{bp}150bp双端测序。2.ATAC-seq 读取处理首先使用 FASTQC 确认所有测序文库的质量。然后所有双端读取paired end reads被比对到单个参考基因组 (B73) 或串联参考基因组该串联参考基因组对应于亲本-子代比较中涉及的基因型 (Hufford et al., 2021)。串联参考基因组的构建这些串联参考基因组是通过以下步骤构建的1.合并参考染色体序列不包括未定位的重叠群/contigs和注释信息。2.在每个单倍型的染色体字段中添加一个独特的标识符例如chr1→B73_chr1\text{chr1} \rightarrow \text{B73\_chr1}chr1→B73_chr1和Oh43_chr1\text{Oh43\_chr1}Oh43_chr1。单个参考基因组的处理流程对于单个参考基因组B73使用 Trimmomatic (Bolger et al., 2014) 进行读取修剪。使用 bowtie2 (Langmead and Salzberg, 2013) 进行比对使用 --no-unal 参数。过滤掉非唯一的比对。通过 Picardtools 进行去重deduplicated。针对黑名单blacklist进行过滤。随后通过 Sinto 和一个未使用的虚拟细胞条形码dummy cell barcode定量 Tn5 片段和插入位点。ACRs 的确定单个参考基因组的峰值即 ACRs是使用 Marand 等人 (2025) 论文中单细胞 ATAC-seq 数据先前生成和注释的那些。串联参考基因组比对比对到串联参考基因组的方法已在其他地方描述 (Engelhorn et al., 2025)。通过 Trimmomatic 修剪后使用剪接读取比对器 STAR (Dobin et al., 2013) 进行比对以考虑参考基因组之间的 插入/缺失 (indels) 问题。比对时使用了特定的参数–outSAMmultNmax 2 --winAnchorMultimapNmax 100 --alignIntronMax 1 -outBAMsortingBinsN 5。然后这些比对结果被视为与单个参考读取一样来生成 Tn5 插入位点。根据这些插入位点使用 MACS2 (Zhang et al., 2008) 来调用峰值即 ACRs。调用峰值时使用了参数g 1.6e9 --nomodel --keep-dup all --extsize 150 -shift -50 --qvalue 0.05。随后使用 Perl 脚本 (cleanBED.pl) 对这些 MACS2 峰值进行清理。生成可重复峰值为了为每个串联参考基因组生成可重复的峰值我们首先合并了在所有 F1 重复中发现的所有重叠峰值。如果这些合并后的峰值在n−1\mathbf{n-1}n−1个 F1 生物学重复中存在重叠峰则将它们保留下来进行最终分析其中nnn是生物学重复的数量。ACR 同源性/保守性、继承性、位置和 Motif 内容分析在为每对亲本-子代确定了一组峰值ACR后我们使用单倍型互惠比对方法 (Li et al., 2009; Quinlan and Hall, 2010; Neph et al., 2012; Li, 2018) 来确定玉米内部的 ACR 保守性。ACR 同源性分类流程比对使用 Minimap2 (Li, 2018)参数-x splice -t 20 -k 12 -a -p 0.4 -N 3将每个 ACR 比对到另一个单倍型参考基因组上例如将 B73 的 ACR 比对到 Oh43 基因组上。泛基因组注释过滤利用泛基因组注释 (Hufford et al., 2021)我们过滤那些至少共享一个与查询 ACR 最近的基因的比对例如Oh43 上那些最靠近与查询 B73 ACR 相同的泛基因的比对。重叠交集然后我们将比对坐标与在另一个单倍型上发现的 ACR 补集ACR complement进行交集例如将 B73 到 Oh43 的比对坐标与 Oh43 单倍型上发现的 ACRs 进行比较。保守性阈值我们要求比对必须跨越在另一个单倍型上检测到的 ACR 至少45%\mathbf{45\%}45%的长度。ACR ACR 同源性分类标准基于这个45%45\%45%的序列同源性关系ACRs 被分为以下几类共享 (Shared)如果45%45\%45%的序列同源性关系是互惠的例如B73 到 Oh43 的比对找到了一个特定的 Oh43 ACR并且使用这个特定的 Oh43 ACR 进行 Oh43 到 B73 的比对又找到了我们最初的 B73 ACR则将这些 ACRs 分类为 “共享”。-模糊 (Ambiguous)如果45%45\%45%的序列同源性阈值不是互惠的则将这些 ACRs 分类为 “模糊”。-独特 (Unique)如果另一个参考基因组中在同一基因旁边****没有满足45%45\%45%序列同源性比对的 ACRs则将它们分类为 “独特”。-重复 (Duplicated)如果 ACRs 在另一个单倍型上具有不止一个45%45\%45%同源性比对且这些比对位于至少一个相同基因的旁边则将它们分类为 “重复” ACRs。ACR 染色质可及性继承模式分类为了对ACR 染色质可及性继承模式进行分类我们参照了 Coolon 等人 (2014) 中的基因表达继承分类方法。然而我们对该方法进行了修改使其在判断基因型之间ACR Tn5 插入率“不同”时更加严格。1. 相似 ACRs (Similar ACRs)具体来说“相似 ACRs”是指在所有基因型比较中例如 B73 对 BxKKi3 对 BxKB73 对 Ki3染色质可及性相似DESeq2 (Love et al., 2014)最小ppp值0.050.050.05或在每次亲本到子代的比较中logfcFold Change, FC小于 2。2. 继承模式分类对于其余的 ACRs我们使用亲本与 F1 子代之间染色质可及性的差异来对 ACR 继承模式进行分类继承模式染色质可及性特征相对于两个亲本显性 (Dominant)相对于其中一个亲本logfc1.251.251.25相对于另一个亲本logfc1.251.251.25。加性 (Additive)染色质可及性高于其中一个亲本但低于另一个亲本。不完全显性 (Under-dominant)染色质可及性低于两个亲本。超显性 (Over-dominant)染色质可及性高于两个亲本。ACR 基于其相对基因位置的分类ACRs 也根据其相对于基因的位置进行了分类方法与先前描述的一致 (Ricci et al., 2019; Marand et al., 2025)。使用每个参考基因组对应的基因注释ACRs 被划分为以下几类转录起始位点 (TSS)与所有已注释的 TSS任一链上±25bp\pm 25\text{bp}±25bp范围内重叠的 ACRs。近端 (Proximal)距离 TSS 超过25bp25\text{bp}25bp但小于2kb2\text{kb}2kb的 ACRs。基因内 (Genic)与已注释的基因重叠但不与 TSS 重叠的 ACRs。基因间 (Intergenic)距离基因超过2kb2\text{kb}2kb的 ACRs。富集/缺失分析为了找到这些 ACR 类别之间相对的富集/缺失情况我们比较了ACR 类别交集的比例例如共享∩\cap∩基因内ACRs 的比例。ACR 类别在整个 ACR 集合中的比例如 Figure 2 所概述。TF F1 ACR Motif 分析所有 TF F1 ACR 的 motif 分析都是在串联参考 ACR 集合上进行的因为这些集合最准确地反映了可用于转录因子 (TF) 结合的顺式调控元件 (CREs)。1. Motif 查找首先针对每次亲本-子代比较通过FIMO(Grant et al., 2011) 找到了JASPAR 2024 数据库(Rauluseviciute et al., 2024) 中列出的所有 motifs的出现情况参数--max-stored-scores 500000。2. 富集/缺失分析然后将motif 在特定 ACR 类别中发生的比率与纯属偶然预期发生的比率进行了比较如 Figure 3 所示。计算示例例如将TCP23 motif(MA1066.1) 在加性 ACRs中观察到的比例与在加性 ACRs 中发现的所有 motifs 的比例进行比较。效应量这些比例之间的差异观察值 – 预期值就是用于可视化的效应量measure of effect size。3. 特殊区域 Motif 分析还对与Tb1Tb1Tb1控制区域内两个通过 MDFMinimum Difference Filter最小差异过滤的变异位点反式关联的 ACRs 进行了motif 富集分析。从头 (De novo) motif 富集是使用STREME(Bailey, 2021) 进行的。Motif 富集验证是使用SEA(Bailey and Grant, 2021) 进行的使用的是TB1TB1TB1motif MA1430.2。狭义遗传力估计 (Narrow Sense Heritability Estimates)1. 估算方法概述狭义遗传力h2h^2h2的估算方法遵循了其他地方概述的步骤 (De Villemereuil et al., 2013)。简而言之对于 Marand 等人 (2025) 中定义的每个B73 参考 ACR我们首先使用DESeq2(Love et al., 2014) 对所有采样的基因型之间的染色质可及性进行比较。2. 数据过滤步骤只有那些至少存在一个显著差异的 ACRsFDR0.050.050.05才被保留下来进行h2h^2h2评估。这样做排除了在我们样本中没有遗传或环境变异的 ACRs。为了确保足够的 Tn5 插入即限制因测序深度变化引起的技术偏差ACRs 随后被过滤仅保留那些Tn5\text{Tn5}Tn5插入量大于0.1CPM0.1 \text{CPM}0.1CPM每百万计数的 ACRs。3.h2h^2h2计算经过这些过滤后将观察到的 F1 染色质可及性值与基于中亲值mid-parental value预测的值进行比较。通过将F1 生物学重复的值与中亲值进行关联correlating来实现h2h^2h2的计算。负相关的 ACRs 的h2h^2h2被设定为零(De Villemereuil et al., 2013)。4. 遗传力分组随后ACRs 被分为三个h2h^2h2组h2h^2h2范围遗传力分组特点描述基于原文语境h20.3h^2 0.3h20.3低遗传力(Low heritability)主要受环境或非遗传因素影响。0.3≤h2≤0.650.3 \le h^2 \le 0.650.3≤h2≤0.65“转录”遗传力(‘Transcriptional’ heritability)与转录调控水平相似。h20.65h^2 0.65h20.65“调控”遗传力(‘Regulatory’ heritability)遗传控制力强可能对应严格的调控元件。5. 功能富集分析最后通过‘TopGO’ R 包(Alexa and Rahnenfuhrer, 2010)对最接近这些分组 ACRs 的基因进行了基因本体论 (Gene Ontology, GO) 富集分析。F1 代 ACR 差异性反式调控检测正如正文中所述这项分析旨在寻找偏离“半亲本”值的等位基因特异性染色质可及性。该“半亲本”值与等位基因遗传和染色质可及性的严格顺式调控strictly cis control是一致的。####1. 独特 ACRs 的过滤排除假阴性对于独特 ACRs我们首先排除了那些可能因一个基因型中的峰值调用假阴性而被判定为独特的 ACRs。为此如果缺乏峰值的自交系样本中该独特 ACR 具有0.15CPM0.15 \text{CPM}0.15CPM的Tn5\text{Tn5}Tn5插入量则该 ACR 被移除。例如在 BxK 比较中如果Ki3 自交系样本中有0.15CPM0.15 \text{CPM}0.15CPM的Tn5\text{Tn5}Tn5插入交叉比对到 B73 单倍型上的该 ACR则该 B73 独特 ACR 将被排除。设定0.15CPM0.15 \text{CPM}0.15CPMTn5\text{Tn5}Tn5的截止值是根据所有 F1 串联基因组中所有独特 ACRs 的总和经验性确定的。与其他分析一样独特 ACRs 随后被过滤以保留那些0.1CPM0.1 \text{CPM}0.1CPMTn5\text{Tn5}Tn5插入的 ACRs以最小化不同读取深度带来的技术影响。####2. 反式调控的检测对于保留下来的独特 ACRs所有Tn5\text{Tn5}Tn5插入CPM\text{CPM}CPM均进行对数转换。将观察到的 F1 值与减半的亲本值halved parental value即“半亲本”值进行比较。为了在不同CPM\text{CPM}CPM范围内检测反式调控的 ACRs将这种偏离或**“距离”基于该 ACR 的F1CPM\text{CPM}CPM值进行了归一化**。然后绘制所有 F1 组中所有 ACRs 的归一化距离。####3. 严格的筛选标准基于这个总体的归一化距离设定了一个严格的截止值如果一个 ACR 的归一化距离在n−1\mathbf{n-1}n−1个 F1 生物学重复中和F1 平均值中都大于整个群体平均值两个标准差则认为该 ACR 发生了F1 代差异性反式调控。####共享 ACR 中 SNP 位点 F1 差异性反式调控检测对于共享 ACRs中SNP 位点上的Tn5\text{Tn5}Tn5片段读取使用了类似的方法。1. SNP 识别与定量互惠比对首先使用与最初识别共享 ACRs 时相似的参数-x splice --secondaryno -t 20 -k 12 -a --MD -p 0.4 -N 1进行Minimap2(Li, 2018)互惠比对但只使用两个共享 ACRs 对应的参考序列例如BxK 共享 ACR 将比对 B73 和 Ki3 参考基因组中对应的 ACRs。SNP 提取利用该比对结果一个Python 脚本提取所有SNPs及其 ACR 位置到一个 “关键文件”‘key’ file中。SNP 匹配然后该关键文件被用于查找在相同位置被调用、并具有对应参考/替换碱基调用的两个互惠 ACR 比对中的 SNPs。读取计数与归一化随后对于每个共享 SNP使用经过轻微修改的JVarkit(Lindenbaum and Redon, 2018) 脚本从相应的比对文件中计数包含相应 SNP 的读取数量并进行CPM\text{CPM}CPM归一化。####2. 反式调控检测在生成了 SNP 位点解析的Tn5\text{Tn5}Tn5片段计数后我们采用了与独特 ACRs 相同的方法距离计算我们再次测量了偏离“半亲本”值的偏离程度或“距离”。归一化该距离再次基于CPM\text{CPM}CPM进行了归一化。截止值设定这些归一化距离在所有 F1 组中被汇总并设定了一个反式调控的截止值大于总体群体平均值两个标准差的值。最终判定如果 SNP 的归一化距离在n−1\mathbf{n-1}n−1个 F1 生物学重复中和F1 平均值中均大于此截止值则该 SNP 被认为是F1 代差异性反式调控。反式染色质可及性遗传关联反式染色质可及性 QTLcaQTL和基因表达 QTLeQTL是使用tensorQTL v1.0.09(Taylor-Weiner et al., 2019) 检测的使用了非默认设置--dosages --pval_threshold 0.01 -mode trans。所使用的输入文件协变量和整体组织归一化的染色质可及性值与先前报道的顺式 caQTL 检测所使用的文件相同 (Marand et al., 2025)。为了通过独立过滤来减少测试数量我们仅测试了那些还与非基因 ACR 共定位的 SNPs这导致总共有481,944 个变异位点。反式 caQTL和eQTL的发现都使用了这同一组变异位点。#*QTL(Quantitative Trait Loci)数量性状基因座。#*caQTL(chromatin accessibility QTL)染色质可及性 QTL。#*eQTL(gene expression QTL)基因表达 QTL。#*顺式 (Cis)关联变异位点SNP与它附近的基因或 ACR 的调控关联。#*反式 (Trans)关联变异位点与它远端通常在不同染色体或1Mb1 \text{Mb}1Mb之外的基因或 ACR 的调控关联。#*SNP单核苷酸多态性Single Nucleotide Polymorphism。#*非基因 ACR未与基因重叠的开放染色质区域通常指调控区域。多重发现过滤 (MDF)####1. MDF 的核心概念MDF围绕的核心理念是不连锁相距5Mbp5\text{Mbp}5Mbp的反式关联假阳性是独立事件。这种独立性使得我们能够确定在给定α\alphaα水平下针对每个被测试的变异位点观察到nnn个或更多假阳性“变异位点-ACR/基因”关联的概率公式 #1。####2. 计算预期假阳性数量将每个 SNP 的假阳性概率乘以测试的变异位点总数就可以得出在α\alphaα阈值下与重复发现次数n-DISCn\text{-DISC}n-DISC的 ACRs/基因相关的预期假阳性变异位点的数量前提是假设基因型和环境保持不混淆 (Kaur et al., 2024)。####3. 结果判定在根据这些n-DISCn\text{-DISC}n-DISC和α\alphaα阈值对观察到的数据进行过滤后我们计算假阳性率预测的假阳性 / 观察到的阳性。通过 MDF 过滤的变异位点拥有的反式关联数量多于仅由偶然因素预期的数量这表明它们与真阳性反式调控基因相关联。