随着 NGS 的发展和测序成本的降低,其在病原体诊断中的应用也得到了日益推广。然而,在 2019 年末开始爆发的新型冠状病毒疫情中,NGS 测序技术的介入,极大的加速了病毒序列解析、溯源、疫苗和检测试剂的研发等应用。可以说,NGS 技术在此轮战“疫”中功不可没。目前,全球新冠疫情依旧呈现紧张态势,正如 James Hamblin 所述,进一步的病毒基因组分析必不可少,而 NGS 则是其中的关键。
将 NGS 常规化应用于病毒分析,其面临的最大挑战之一为:样本中病毒核酸量是否充足。为了提高 NGS 数据中病毒序列的比例,研究人员一方面引入非序列特异性病毒富集技术,包括:超速离心、样本过滤或病毒培养等,在进行样本核酸提取前实现病毒颗粒的富集;另一方面通过 DNA 酶处理去除宿主 gDNA 或采用 rRNA 去除,降低样本中的宿主核酸背景。尽管上述方法在一定程度上提高了病毒序列的比例,但常常需要大量的优化过程,且达不到理想的富集效果。与之相比,靶向富集技术基于病毒序列进行特异性富集,在降低宿主核酸背景的同时增加了对病毒基因组的覆盖深度,可显著提高对目标病毒的分析效率(图1)[1-2]。
图1. 病毒富集方案概览。 A. 核酸提取前的病毒富集:样本经离心或过滤后进行核酸提取,核酸酶处理去除宿主DNA或RNA,最后完成扩增和测序; B. 通过阴性(设计靶向非病毒的探针)或阳性(设计靶向病毒的探针)杂交捕获方案富集病毒。
纳昂达推出的 NanoRV Panel v1.0-Tech Access,以下简称 NanoRV Panel,是一款液相杂交靶向捕获 Panel,可用于包含冠状病毒在内的多种呼吸道病毒基因组的靶向富集(图2)。
图2. NanoRV Panel 探针组成。Panel 靶向人呼吸道病毒,涉及冠状病毒(包含新型冠状病毒)和其它呼吸道疾病相关病毒,如:流感病毒、副流感病毒、呼吸道合胞病毒、偏肺病毒、肠道病毒、鼻病毒、腺病毒和博卡病毒。
与扩增子测序相比,杂交捕获技术具有更好的扩展性和更高的容错度,这对 RNA 病毒检测尤为重要。受 RNA 聚合酶保真性的影响,RNA 病毒易在复制过程中引入突变而产生变异株;冠状病毒拥有长达 30 kb 的非分段基因组,更易发生突变或重组而呈现遗传多样性[3]。对 SARS-CoV-2 的进化追踪提示,该病毒的突变正以 1~2 突变/月的速率累积,部分变异见于介导病毒进入宿主细胞的 Spike 蛋白编码基因[4-5]。目前全球范围内已有多个 SARS-CoV-2 变异株在传播,最引人注目的是首见于英国的 B.1.1.7;另一种变异株 B.1.351 见于南非,其独立于 B.1.1.7,尽管存在一些共同突变[6]。
面对 SARS-CoV-2 变异,基于扩增子的富集方案将被迫不断改版升级,而杂交捕获方案尚无需忧虑。对于单条 120 bp 的探针覆盖区域而言,以目前观测到的变异速度,要累积到超过探针容错度的突变数量,平均需要数十年时间;此外,相邻探针可以互相补充,即每条探针的靶标区域还有可能被相邻的探针捕获到(图3)。
图3. B.1.1.7 和 B.1.351 变异株在 Spike 蛋白编码基因上的突变分布及 NanoRV Panel 对相关区域的覆盖情况。
纳昂达的 RNA 靶向捕获测序整体解决方案结合 NanoRV Panel,为新冠病毒的追踪性研究提供了一个有力的工具。下面以新冠病毒全长 RNA 质控品展示这一方案的整体捕获表现。
图4. 病毒基因组建库流程及相关产品信息。
cDNA 合成 |
文库构建 |
封阻序列 |
靶向捕获 |
相关产品仅限研究使用,不用于临床诊断。
样本采用 COVID-19 RNA 质控品(菁良,GW-CRPM002),包含SARS-CoV-2 病毒全基因组和人源 RNA。取 20 ng input(包含 ~267 copy SARS-CoV-2 病毒全基因组),通过NadPrep®️ Total RNA-To-DNA Module 进行逆转录,经 NadPrep®️ DNA 通用型文库构建试剂盒(for Illumina®️)完成文库构建。将靶向 7 个人源看家基因(7 housekeeping gene,HK7)的探针 spike-in 至 NanoRV Panel 后进行杂交捕获。对看家基因的捕获一方面可用于稳定实验及测序数据量,另一方面可作为内参指示病毒含量。完成单次或二次靶向捕获后进行上机测序,测序数据以salmon v1.2.0 分析,统计各部分 reads 占比。仅当 reads 比对到 SARS-CoV-2 或 7 个看家基因时计为中靶;比对到 rRNA 或其它转录本的 reads 视为脱靶。
(1) 中靶率
单次捕获的中靶率为 56.3%;二次捕获基本清除了 rRNA,中靶率提高至 99.5%。
图5. 单次捕获或二次捕获对中靶率的影响。
(2) RNA 相对丰度
SARS-CoV-2 及 7 个人源看家基因的丰度在单次捕获或二次捕获数据中呈一致性趋势。
图6. 单次捕获或二次捕获后,SARS-CoV-2 及 7 个人源看家基因的丰度。
(3) 覆盖深度及均一性
> NanoRV Panel 对 SARS-CoV-2 基因组的覆盖较均一,99% 以上的区域达到 0.2x 平均覆盖深度。二次捕获提高了测序数据的利用率,但对病毒基因组的覆盖均一性受轻微影响。
图7. 单次捕获或二次捕获后,SARS-CoV-2 基因组的覆盖均一性。
考虑到病毒拷贝数通常较少,实际应用时可依据时效优先或有效数据量优先的原则分别选择单次杂交捕获或二次杂交捕获。纳昂达提供全面的 RNA 病毒靶向捕获测序解决方案可实现对 SARS-CoV-2 和其他多种呼吸道病毒基因组的稳定覆盖。
[1] O'Flaherty, Brigid M., et al. Comprehensive viral enrichment enables sensitive respiratory virus genomic identification and analysis by next generation sequencing. Genome research 28.6 (2018): 869-877.
[2] Kumar, Arvind, Satyapramod Murthy, and Amit Kapoor. Evolution of selective-sequencing approaches for virus discovery and virome analysis. Virus research 239 (2017): 172-179.
[3] Li, Bei, et al. Discovery of bat coronaviruses through surveillance and probe capture-based next-generation sequencing. Msphere 5.1 (2020).
[4] https://www.sciencemag.org/news
[5] Santos, Jadson C., and Geraldo A. Passos. The high infectivity of SARS-CoV-2 B. 1.1. 7 is associated with increased interaction force between Spike-ACE2 caused by the viral N501Y mutation. bioRxiv (2021): 2020-12.
[6] https://www.nytimes.com