公司新闻

第三方横评数据实证:中国智造 WES Panel 领跑国际厂牌

浏览量:175 / 发布时间:2025-04-10

01 背景

全外显子组测序是基因组学领域的一项关键技术,专注于解析基因组中蛋白质编码区域。过去十年间,由于该技术显著提升诊断效能的优势,其在常规临床诊断中的应用日益广泛。WES 极大促进了疾病相关遗传变异的识别能力,在科研与临床实践中展现出重要价值。

然而,尽管 WES 已被列为一线遗传检测手段,其实验室操作流程仍存在高度复杂性和敏感性,且缺乏统一标准与操作指南。如何实现全面覆盖与均一性、确保高灵敏度与特异性,同时保持成本效益,始终是 WES 技术面临的核心挑战。

通常用来对比不同 WES 试剂盒的性能指标包括:Panel 设计、富集质量指标 (如同数据量下目标区域覆盖百分比、GC 偏好性) 以及变异检测在灵敏度和特异性方面的表现等。一些研究者通过引入了新的质量评估指标,如衡量读段比对准确性的"基因分型能力";用于深度评估读段覆盖分布的"队列覆盖稀疏性"和"不均匀性"评分;反映数据有效利用率的"捕获效率"等,但这些参数均直接受各厂商探针设计影响,包括其使用 RNA 还是 DNA 探针。值得注意的是,即使杂交缓冲液和洗涤缓冲液成分的微小变化,也可能显著改变杂交效率和后续捕获流程,导致重要功能基因的漏检[1-3]

近期研究表明,人类外显子组测序中约有 1.19 Mb 的难测序区域可能被遗漏。这些难测序区域包括:假基因、串联重复序列、同聚物及其他低复杂度区域等低比对区域[4]。近日,国外第三方科研机构在 BMC Genomics 发表了题为“Comparative evaluation of four exome enrichment solutions in 2024: Agilent, Roche, Vazyme and Nanodigmbio”的系统性评测,研究针对 Agilent、Roche 等国际品牌及中国创新型企业纳昂达 (Nanodigmbio) 的 WES 试剂盒进行对比,并首次揭示了在难测序区域中的具体覆盖情况。结果显示,纳昂达的 NEXome Plus Panel v1.0 不仅具有最高的的靶向捕获效率 (87.3%),也在难测序区域覆盖效果最佳 (相对其他厂商提高 >10%)、数据库中疾病相关基因覆盖最优 (MedGen database)。在变异检出性能方面,所有试剂盒的检出率都很高 (F 测量值均 > 95.87%),纳昂达的 WES 具有最高的精度和最少的假阳性。


02 研究方法

研究团队使用同一文库构建试剂盒构建了 96 个文库:72 个文库来自 18 例患者样本与 24 个文库来自 E701 参考 DNA。杂交前的 Pooling 环节中,研究团队将 9 例患者与 3 例标准品文库组成 12-plex 混合文库。杂交反应均按照 Agilent SureSelect Human All Exon v8 probes (有修改), Vazyme VAHTS Target Capture Core Exome Panel, Roche KAPA HyperExome Probes 和 Nanodigmbio (纳昂达) NEXome Plus Panel v1.0 的厂商标准流程操作。

所有文库依托 DNBSEQ-G400 平台完成 PE100 测序,平均覆盖深度达 100x,并降采样至 50 M reads 消除测序深度偏差。本研究还构建了标准化流程生物信息分析流程:原始数据经 FastQC 质控与 BBDuk 动态修剪后,采用 bwa-mem2 算法精准比对至 GRCh38.p14 基因组,Picard 工具组计算目标区域覆盖统计量,bcftools 与 DeepVariant 交叉验证变异检测结果。


03 研究结果

3.1 Panel 设计

这几款 WES 试剂盒的基因组覆盖区域大小相近:Agilent V8 为 35.13 Mb,Nanodigmbio 为 35.17 Mb,Roche KAPA 为 35.55 Mb。这些区域中 92.14% (33.86 Mb) 在所有试剂盒中是相同的 (图 1.)。他们对 RefSeq 数据库的覆盖也几乎相同:Agilent V8 为 82.12% (34.39 Mb),Nanodigmbio 为 81.43% (34.25 Mb),Roche KAPA 为 80.76% (34.26 Mb)。这些对比表明不同外显子组靶标大小的一致性和重叠性较好。

图 1. 不同 Panel 的靶区域重叠情况。
注:单位:M Base。

3.2 目标覆盖率

为了评估富集质量,研究团队以相等的概率采样 50 M Reads,并使用 Picard 获得覆盖率统计数据,并将样本的指标平均化。然后根据各试剂盒的 BED 文件和 Refseq BED 文件确定平均中靶率、脱靶率和重复率 (图 2.)。虽然重复和脱靶读长的数量因平台而异,但 Agilent V8、Roche 等试剂盒的平均中靶读长数量相似 (76-78%),Nanodigmbio 由于脱靶读长较少,因此表现出更高的中靶率 (87%),即比国际厂商高出约 10%。

图 2. 捕获效率对比。
注: a:根据厂商 BED 文件计算;b:根据 RefSeq BED 计算。


当比较同一样品中所有 WES 产品的特定区域时,可以在 IGV 中看到这种脱靶读数的减少。以 22 号染色体的 ADA2 基因为例,其他三款产品在该基因上各存在 2 处明显的非特异性捕获区域,而纳昂达在同一区域无非特异性序列捕获 (图 3.)。

图 3. 非特异性捕获情况对比。
注:黄圈表示非特异性捕获 Reads。


这些产品的覆盖深度中位数略有不同,Agilent V8 和 Roche 的分别为 61x 和 62x。Nanodigmbio 的较好,为 71x (表 1.)。

表 1. 不同 WES 产品的捕获表现数据统计。

研究团队也评估了覆盖广度这一经典指标,即给定样本在指定读数的情况下,靶标至少覆盖一定次数 (x) 次的比例。在 50 M Reads取样时,所有产品的 10x 覆盖深度的比例均 > 97.5%,20x 覆盖深度比例均 > 95%,无显著差异。但是当使用 RefSeq 数据库 BED 文件 (41.13 Mb) 而不是各产品本身标准 BED 时,情况则有所不同,所有产品的 10x 覆盖深度比例在 81.14-82.68% 之间,中位覆盖深度则分别为:Agilent V8 55x,Roche 55x 和 Nanodigmbio 62x。Nanodigmbio 的表现较好,可能是由于 RefSeq BED 文件的初始过滤不同导致。


3.3 难测序区域和 ACMG 基因的覆盖比较

研究团队接着分析了每组样本在 Hijikata 等人给出的 1.19 Mb 难测序区域中的覆盖表现。结果令人遗憾,所有产品的中位数覆盖率均低于 5x。尽管如此,Nanodigmbio 的覆盖表现依然显著优于其他厂商,10x 覆盖深度比例如下:Agilent V8 为 41.29 ± 1.16%,Roche 为 41.71 ± 1.17%,Nanodigmbio 为 45.27 ± 1.02%。这些难测序区域的特征是低比对率,存在节段重复、串联重复序列和均聚物、不良启动子、%GC 含量 < 25% 或 > 65% 等。这些因素在当前的实验室方案和短读长测序技术下带来了重大挑战,还需要进一步优化。

研究团队利用 MedGen database 编制了一份与疾病相关的基因列表。在 50 M Reads 取样时,MedGen BED (34.42 Mb) 中 20x 覆盖深度的目标区域如下:Agilent V8 为 96.66 ± 0.24%,Roche 为 96.12 ± 0.38% 和 Nanodigmbio 为 97.19 ± 0.17%。


3.4 变异检出

研究团队评估了不同 WES 产品准确识别遗传变异 (特别是单核苷酸变异 SNV 和小片段插入缺失 Indel) 的能力。在 50 M Reads 取样时,各试剂盒靶向区域内 SNV 平均总数分别为:Agilent V8 (69,829)、Nanodigmbio (74,689) 和 Roche (72,979);Indel 平均总数则分别为:Agilent V8 (11,113)、Nanodigmbio (11,085) 和 Roche (11,261)。

图 4. 展示了各 WES 产品在不同测序深度 (按10 M Reads逐步降采样) 下的平均变异检出数。数据显示,当测序 Reads 量达到约 30 M 时,各试剂盒的 SNV 检出数开始趋于稳定;而 Indel 数量则随着 Reads 量的增加 (在 DP ≥ 13 条件下) 持续上升。值得注意的是,尽管 Nanodigmbio 的靶向区域最小,但其富集的样本却显示出最高的变异检出数——这与其他试剂盒"靶向区域越大,检出变异越多"的常规表现形成鲜明对比。

图 4. 不同 WES 产品的变异检出。
注:a: SNV;b: Indel。


为评估变异检测结果的准确性,研究团队使用不同 WES 产品分别检测 E701 标准标准品,将 WES 数据与全基因组测序 VCF 文件进行比对,并计算精确率 (precision)、召回率 (recall) 和 F 值 (F-measure)。结果显示,Nanodigmbio 试剂盒的表现与其他试剂盒差异最为显著,其未检出变异数量略多,但假阳性变异 (FP) 数量最少,精确率最高 (表 2.)。其他试剂盒结果相似,表现为假阳性变异略多,但未检出变异较少。所有试剂盒均展现出极高的召回率。就综合平衡精确率与召回率的 F 值而言,所有试剂盒均在 96% 左右。

表 2. E701 标准品中 SNV 检出情况。


04 讨论

研究团队认为所有测评的 WES 产品都表现出强大的性能指标,均是外显子组测序的可靠选择。其中,Roche 可提供最均匀的外显子组覆盖,Nanodigmbio 则推荐用于精度至关重要的场景。

本文系统评估了国内外多款外显子捕获试剂盒的综合性能,评测结果显示,纳昂达 NEXome 系列外显子 Panel 凭借较低的非特异性捕获实现了更高的靶标区域捕获效率,核心指标与 Agilent、Roche 等国际品牌处于同一水平。这项由国外第三方独立机构完成的研究,标志着中国在靶向捕获技术领域已具备全球竞争力,为精准医学研究提供了更高性价比的“中国方案”。


参考文献

[1] Ross M G, Russ C, Costello M, et al. Characterizing and measuring bias in sequence data[J]. Genome biology, 2013, 14: 1-20.
[2] Casey J, Davidson N. Rates of formation and thermal stabilities of RNA: DNA and DNA: DNA duplexes at high concentrations of formamide[J]. Nucleic acids research, 1977, 4(5): 1539-1552.
[3] Wang V G, Kim H, Chuang J H. Whole-exome sequencing capture kit biases yield false negative mutation calls in TCGA cohorts[J]. PLoS One, 2018, 13(10): e0204912.
[4] Hijikata A, Suyama M, Kikugawa S, et al. Exome-wide benchmark of difficult-to-sequence regions using short-read next-generation DNA sequencing[J]. Nucleic acids research, 2024, 52(1): 114-124.