01背景
在新冠肺炎疫情爆发的三年里,SARS-CoV-2 已严重威胁了全球公共卫生安全,给经济和医疗系统带来了沉重负担。世界卫生组织于 2020 年 6 月成立了病毒进化工作组,特别关注了 SARS-CoV-2 变异株、其表型及其对应对措施的影响。自 SARS-CoV-2 出现以来,科研人员已通过测序的方式从数百万例临床样本发现了数百种 SARS-CoV-2 变异株[1]。因此,对病原体基因组特征的持续追踪显得至关重要,以促进病原体的早期发现、准确监测和变异追踪,并迅速评估 SARS-CoV-2 变异株对公共卫生构成的风险。
目前,基于 NGS 对特定基因组区域进行选择性富集或捕获测序的方式主要分为两种:第一种是基于多重 PCR 扩增子的富集[2],需要对目标基因组区域进行引物设计,其对于新突变的检测能力较差[3]。第二种是传统液相杂交捕获技术[4],捕获探针具有一定的容错性,因此能够用来持续追踪新的变异类型;然而,该方法的流程较为繁琐,操作时间长,从核酸提取到文库捕获需要 2-3 天,无法满足突发疫情快速响应的需求。
2024 年 4 月 2 日,南京医科大学公共卫生学院联合国家卫健委相关重点实验室,在 mSystems
(IF = 6.4) 期刊上发表了题为“A novel fast hybrid capture
sequencing method for high-efficiency common human coronavirus whole-genome
acquisition”的研究性论文。该研究团队介绍了一种新颖、快速、高效的全新杂交捕获方法,名为微靶杂交捕获系统 (Micro-target Capture, MT-Capture),旨在实现病毒全基因组的及时测序。研究人员通过对上百份临床样本进行测试,发现该方法不仅解决了传统杂交捕获测序 (Traditional Capture,T-Capture) 耗时长、操作复杂的痛点问题,还比多重 PCR 扩增子的富集更具兼容性,并且相较于其他两种方法具有更高的灵敏度。MT-Capture 新方法的出现使流行病学干预和公共卫生策略变得更加精准,不仅适用于人类冠状病毒,还可扩展至其他微生物病原体、人类癌症,甚至复杂的环境样本。因此,这种方法可以用来增强监测工作,从而有可能预防或缓解未来的流行病。
其中,靶向富集测序方案中的总 RNA 反转录试剂盒和文库构建以及液相杂交捕获全系列试剂均来自纳昂达 (Nanodigmbio)。纳昂达基于全新 μCaler 杂交捕获技术,为文章中使用的微靶杂交捕获系统 (MT-Capture) 提供了技术支持。
02研究方法
2.1样本来源
从江苏省疾控中心和江苏省各城市哨点医院获得的 SARS-CoV-2、HKU1、229E、OC43、NL63 等阳性鼻咽拭子临床样本,以及数种 SARS-CoV-2 变异株 (如:Alpha, Beta, Wuhan, Delta 和 Omicron BA.1)。
2.2靶向富集测序
病毒基因组靶向富集测序流程包括:核酸提取、预文库制备、MT-Capture/T
Capture/多重 PCR 测序文库制备、测序及生物信息学分析。
每样本投入 200 μL,使用自动核酸提取仪进行核酸提取。分别利用 NadPrep®️ Total RNA-To-DNA Module (Nanodigmbio) 对 RNA 样本进行反转录和 NadPrep®️ DNA Library
Preparation Kit (for Illumina®️) (Nanodigmbio) 进行预文库构建。
MT-Capture 利用 SARS-CoV-2 一系列具有代表性的基因组序列进行探针设计,采用“共轭效应”的原理设计了 20-100 nt 非等长的探针集。在该技术中,探针不仅因为其 5’ 端被生物素修饰得以与靶区域结合,相邻的探针之间还会由于在 3’ 端和5’ 端分别添加的一段互补碱基从而形成“手拉手”式的共轭效应 (图 1. B),完成整个捕获流程仅需 2.5 小时 (图 1. A)。
图 1. 三种靶向测序方法的比较。(A) 采用两种液相杂交捕获测序方法和多重 PCR 测序方法进行全基因组测序的实验过程和具体所需时间的比较。(B) MT-Capture 设计原则:探针为 20-100-nt 非等长生物素寡核苷酸。(C) T-Capture 设计原则:探针为叠瓦式设计的 120 nt 等长的生物素寡核苷酸。(D) 多重 PCR 引物设计原则:采用叠瓦式设计的特异性引物池和高保真酶对 SARS-CoV-2 核酸进行全基因组片段扩增。
03研究结果
3.1三种靶向测序预处理方法的设计原则和工作流程的比较
· 多重 PCR 扩增子测序是一种针对目标区域进行引物设计的方法 (图 1. D)。然而随着新突变的出现,则可能需要对某些区域的引物序列重新设计[5]。
·
T-Capture 测序基于生物素探针和靶区域之间的亲和力,对错配的较高容忍度使其能够成功捕获高度分化的序列[6],从而促进了对各种突变类型的发现。然而,传统杂交捕获过程复杂且缺乏稳定性。
·
MT-Capture 测序的探针主要由三部分组成,中间部分为靶标结合区,5′ 和 3′ 部分为共轭区。探针与靶标之间的结合区长度大于共轭区长度,所以探针与靶区域结合后会发生共轭效应;而 MT-Capture 探针 (20-100 nt) 的平均长度比 T-Capture 探针 (120 nt) 短,所有 MT-Capture 探针具有更多的生物素基团;共轭效应和更多的生物素基团加快了链霉亲和素磁珠与靶区域结合的速度和效率。这一创新型方法学简化了杂交和洗脱流程,从而将实验时间缩短至与多重 PCR 测序相当的水平 (图 1. A;表 1.)。
表 1. 三种不同测序方式的比较。
3.2MT-Capture 持续追踪多种 SARS-CoV-2 亚型
MT-Capture 探针设计最初源自武汉原始毒株,得益于杂交捕获探针的容错性,其能够有效追踪 SARS-CoV-2 不断变异的变体。由图 2. 可知,除武汉原始毒株外,MT-Capture 对不同变体如 Alpha、Beta、Delta 和 Omicron
BA.1 都可以实现完整的基因组覆盖。杂交捕获探针在监测病原体内部多样化突变模式方面提供了灵活性。
图 2. MT-Capture 可实现对不同变种的追踪。 该图展示了 SARS-CoV-2 5 种不同毒株 (包括 Alpha、Beta、Wuhan、Delta 和 Omicron BA.1) 的测序深度和全基因组覆盖率。
3.3MT-Capture 显示更高的检测灵敏度
为了比较多重 PCR 扩增子测序和 MT-Capture 测序在不同 SARS-CoV-2 病毒载量下的检测效果,使用了梯度稀释的 Omicron BA.1 和 Delta 样本。从结果可以看出,MT-Capture 显示出了更高的灵敏度,即使在极低的病毒载量下 (CT = 38) 也能拼接出全基因组序列 (图 3. A),并且能够对 CT 值在 32-38 之间的样本进行全基因组测序,而多重 PCR 测序则难以从高 CT 值的样本中扩增全基因组序列。尽管病毒载量低,但与多重 PCR 相比,MT-Capture 可以实现全基因组覆盖和均匀的测序深度 (图 3. B-E)。
图 3. MT-Capture 测序与多重 PCR 测序的检测灵敏度比较。(A) 利用 RT-PCR 获得的 N 基因 CT 值作为病毒系列稀释样品病毒载量的指标,比较不同 CT 值下 MT-Capture 和多重 PCR 的全基因组覆盖率。△,经 MT-Capture 富集的 Delta 菌株;〇,经 MT-Capture 富集的 Omicron 菌株;▲,经多重 PCR 扩增富集的 Delta 菌株;⚫,经多重 PCR 扩增富集的 Omicron 菌株。(B) 和 (C) 分别为 MT-Capture 测序和多重 PCR 测序时不同 CT 值 Delta 菌株的覆盖范围和测序深度;(D) 和 (E) 分别为 MT-Capture 测序和多重 PCR 测序时不同 CT 值 Omicron BA.1 菌株的覆盖范围和测序深度。
3.4MT-Capture 测序检测突变位点的准确性和灵敏性更优
研究人员使用 36 例临床样本检验了三种不同测序方法的有效性,研究的重点包括中靶率、基因组覆盖率和突变检测。
与 T-Capture 和多重 PCR 相比,MT-Capture 在识别 ORF1ab、S、ORF3a、M、ORF7a、ORF7b 和 N 基因突变位点方面表现出更强的能力 (表. 2);
同时,MT-Capture 和 T-Capture 比多重 PCR 测序具有更高的全基因组覆盖率 (图 4.),特别是对于 CT ≥
29 的样本,MT-Capture、T-Capture 和多重 PCR 测序的全基因组覆盖率分别为:99.80%、99.77% 和 95.20%;
此外,MT-Capture (99.76%) 具有比 T-Capture (99.49%) 更高的覆盖均匀性;与多重 PCR 测序 (61.91%) 相比则具有更明显的优势。
表 2. 突变位点的检出数量汇总。
S 基因 (21563-25384) 包含了确定相关 SARS-CoV-2 变异的最具信息量的片段[7]。从测序显示的突变检测结果来看,三种方法的同义突变检出基本一致,而 MT-Capture (926个) 检测到了较 T-Capture (897 个) 和多重 PCR 测序 (821 个) 更多的错义突变。采用三种测序方法对 36 例临床样本的 spike S1 突变进行了进一步的详细分析,结果显示 (图 4.),对于 CT > 25 的样本,MT-Capture 和 T-Capture 都比多重 PCR 方法更好地覆盖了 S 基因,并且 MT-Capture 能够检测到比 T-Capture 和多重 PCR 更多的突变位点。
图 4. 三种方法的覆盖率和突变位点检测比较。利用 RT-PCR 获得的 N 基因 CT 值作为临床样本病毒载量的指标,比较不同 CT 值下的 (A) 36 例临床样本的全基因组覆盖率和 (B) 36 例临床样本的 spike 基因覆盖率 [MT-Capture (白色“○”),T-Capture (绿色“×”),多重 PCR (红色“○”)]。(C) 应用 MT-Capture、T-Capture 和多重 PCR 测序对临床样本的 S1 基因突变分析。检测位点按照 S 基因 5′−3′ 的顺序排列,展示突变频率大于 50%,测序深度大于 50 的位点。
04总结
多重 PCR 测序被全球实验室广泛接受,其对典型病毒载量 (CT ≤ 32) 的样本检测种表现出一定效果。然而该方法存在一些局限性,首先是容易导致 5' 或 3' 端附近区域的丢失,并可能错过指定退化碱基范围外的新病毒突变。这可能是由于该方法依赖于特定的引物序列,导致扩增过程中的错配,基因组组装过程中存在较大的缺失区域,并且对基因组簇的分类或值得关注的变异的识别造成了阻碍。此外,多重 PCR 测序对于低病毒载量的样本存在扩增不均匀且覆盖不均匀的现象,从而给测序带来了困难,特别是在 CT 值较高的样本中表现更为明显。虽然 T-Capture 可以在低病毒载量的基因组目标区域实现均匀和全面的基因组覆盖,但整个实验过程需要耗费大量的人力和时间成本。
全新方法学 (MT-Capture) 的出现有助于 SARS-CoV-2 和更多流行病原体的富集和变异研究。基因组测序的持续创新正在彻底改变流行病学,提高了其检测的效率和准确性,并加强了对疾病暴发的响应和准备。MT-Capture 不仅适用于 SARS-CoV-2,还可扩展至其他微生物病原体、人类癌症,甚至复杂的环境样本。因此,这种增强灵敏度的方法学可以用来改善监测工作,从而有可能预防或缓解未来的流行病。
参考文献
[1] Chang Y H, Yu C H, Jou S T, et al.
Targeted sequencing to identify genetic alterations and prognostic markers in
pediatric T-cell acute lymphoblastic leukemia[J]. Scientific Reports, 2021,
11(1): 769.
[2] Quick J, Grubaugh N D, Pullan S T, et
al. Multiplex PCR method for MinION and Illumina sequencing of Zika and other
virus genomes directly from clinical samples[J]. Nature protocols, 2017, 12(6):
1261-1276.
[3] Schultzhaus Z, Wang Z, Stenger D.
CRISPR-based enrichment strategies for targeted sequencing[J]. Biotechnology
advances, 2021, 46: 107672.
[4] Li B, Si H R, Zhu Y, et al. Discovery
of bat coronaviruses through surveillance and probe capture-based
next-generation sequencing[J]. Msphere, 2020, 5(1): 10.1128/msphere. 00807-19.
[5] Nasir J A, Kozak R A, Aftanas P, et al.
A comparison of whole genome sequencing of SARS-CoV-2 using amplicon-based
sequencing, random hexamers, and bait capture[J]. Viruses, 2020, 12(8): 895.
[6] Klempt P, Brož P, Kašný M, et al.
Performance of targeted library preparation solutions for SARS-CoV-2 whole
genome analysis[J]. Diagnostics, 2020, 10(10): 769.
[7] Martínez-Murcia A, Garcia-Sirera A,
Navarro A, et al. SARS-CoV-2 Variants Identification; A Fast and Affordable
Strategy Based on Partial S-Gene Targeted PCR Sequencing[J]. Viruses, 2022,
14(11): 2588.