01 背景
病原靶向测序 (tNGS) 是目前应用广泛的病原微生物检测技术,主要有两种技术路线:一种是基于多重扩增子对靶标序列进行富集并形成测序文库;另一种是在宏基因组测序 (mNGS) 的基础上增加探针杂交步骤,即对 mNGS 文库进行靶向捕获,富集病原序列。
前一种方法可以实现数千扩增子规模的多重扩增,虽然实验步骤较为简单快捷,但其稳定性相对较低,存在一定的扩增失败率。后一种方法更具可扩展性,目前市面上的解决方案大多采用百万级别的探针来提供与 mNGS 相媲美的检测广度,通过正向筛选的方式解决了 mNGS 的一个主要问题:宿主序列去除。
02 方案简介
NEX-t Panel v1.0 是一款基于探针杂交捕获的 tNGS Panel,靶向从数百种病原 (病毒、细菌、真菌、寄生虫) 基因组中挑选的一系列特征序列,涵盖了 16S/ITS、看家基因、耐药相关基因等丰富内容。通过充分利用探针容错性的优势,在保证富集信息量的同时,将 Panel 规模精简至约 8,000 条探针,降低了应用门槛。
NEX-t Panel v1.0 推荐与 NadPrep®️ ES Hybrid Capture Reagents 搭配使用,可显著缩短杂交时间,同时简化实验步骤。
2.1 方案设计
NEX-t Panel v1.0 主要包括以下三部分:
(1) 针对表 1. 中病毒、细菌、真菌、寄生虫在内的数百个物种的特征序列设计的探针;
比较种或属下的多个参考序列,选取其中处于探针容错范围内,且包含一定多样性的区域;
参考多位点序列分型 (MLST) 所涉及的序列;
结合相关文献。
(2) 针对 16S/ITS 设计的少量泛用性探针;
参考多个数据库 (SILVA,Greengenes,RDP,Unite)。
(3) 针对耐药、毒力等相关基因设计的探针。
表 1.NEX-t Panel v1.0 涉及的主要病原物种
2.2 分析流程推荐
NEX-t Panel v1.0 捕获数据的分析可以从第一部分探针捕获到的序列开始,分析表 1. 中所涉及的病原物种;进一步地可以从第二部分 16S/ITS 探针捕获到的序列中查找是否存在表 1. 中不包括的其他微生物;对于特定的病原,可进一步从第三部分探针捕获到的序列中查找耐药和毒力相关的信息 (图 1. )。
图 1. NEX-t Panel v1.0 捕获数据分析
03 特点与表现
3.1 tNGS 探针的设计比数量更重要
一般来说,对病原微生物基因组进行完整的探针覆盖是无法实现的。一方面是由于在考虑参考基因组以外的序列多态性时,一种细菌所需的探针即可达数十万条;另一方面是由于当病原序列与宿主序列存在一定相似性时,为防止脱靶,需要舍弃这些区域。因此,NEX-t Panel v1.0 在探针设计时侧重于以最少的探针实现最多的病原分析功能,Panel 规模相比于百万级探针杂交捕获的 tNGS 方案大为精简。
探针条数可近似等效于多重扩增子的扩增子个数,但由于探针具有更高的容错性,同时还能捕获到探针侧翼的序列;因此,一定数量的探针可获得比相似扩增子个数的多重扩增更丰富的信息。
与多重扩增子相比,杂交捕获 Panel 的扩展更为简单,只需增加探针。因此,NEX-t Panel v1.0 可以方便地进行定制和组合升级。
图 2. NEX-t Panel v1.0 探针容错性示例 (非设计区)
3.2 捕获中靶率与病原拷贝数密切相关
病原捕获的中靶率受到病原含量的影响较大。如图 3. 所示,在相同的宿主背景下,随着微生物参考品的梯度稀释,其数据量呈等比例下降的趋势,而中靶率也随之降低。
尽管多轮捕获能够显著地提高中靶率,但这种策略同时伴随着信息丢失 (dropout) 的风险。尤其在病原含量较低的情况下,中靶率低,同时也对 dropout 更为敏感。因此,在考虑多轮捕获时需要谨慎权衡利弊。此外,从另一个角度来看,当样本中的病原基因组拷贝数为个位数时,提高中靶率实际上只是将这几个拷贝反复测序,并未产生更多的有用信息。
图 3. NEX-t Panel v1.0 对不同样本的捕获中靶率和 reads 分布。A. 中靶率;B. 捕获 reads 分布。
注:
① 以人类基因组 DNA 标准品 (Promega,G1471) 按照不同比例对 20 菌株交错的混合基因组材料 (ATCC,MSA-1003) 进行稀释以获得 0.001%-1% MSA-1003 的模拟菌群样本。
② 50 ng Input 以 NadPrep® 快速 DNA 酶切文库构建试剂盒 v2 建库,利用 NEX-t Panel v1.0 搭配 NadPrep®️ ES Hybrid Capture Reagents 完成杂交捕获 (杂交 2 hr)。
③ 测序模式为 Novaseq6000,PE150。测序数据利用 BWA 比对到由 hg19 人类基因组和 20 种微生物基因组参考序列组成的参考基因组,统计 reads 分布。
3.3 检测灵敏度
如图 4. 所示,对于不同微生物含量的样本,检出下限均在 3 拷贝左右。在实际应用中,灵敏度主要由建库投入量决定。值得注意的是,文库制备过程中存在转化率的制约因素,因此并非所有拷贝都能成功转化。类似地,在拷贝数为个位数时,多重扩增子的扩增成功率也会降低。
此外,拷贝数小于 1 并不意味着无法被检出。这是因为 NEX-t Panel v1.0 在一个物种存在多个探针捕获区域时,其拷贝数可以累加,从而提高检测灵敏度。
图 4. NEX-t Panel v1.0 针对不同微生物含量的样本捕获去重后的覆盖深度
3.4 混合杂交模式
由于不同样本中的病原含量存在较大差异,如果希望每个样本都获得相似的数据量,则无法混合杂交,只能采取单独杂交的方式。不过,如图 5. 所示,当样本中微生物含量存在数量级的差异时,虽然数据量差异较大,但是对于低丰度的样本,其本身所需的数据量相对较低。同时,不同样本之间由于使用相同的实验参数,具有相似的 PCR 重复率。如果将它们分别杂交捕获,并设置相同的测序量,则低丰度样本需要增加 PCR 循环数,相同的信息量只会以重复的形式组成提升的测序数据量,这是因为 Panel 捕获后测序更容易达到饱和。基于以上考虑,对于具有相似来源的样本,我们推荐采用混合杂交的方法。
图 5. NEX-t Panel v1.0 针对不同数量级的微生物样本进行混合杂交的捕获数据量
3.5 RNA 和 DNA 病毒共捕获
针对 RNA 病毒和 DNA 病毒可采取不同的文库制备方式。一种方式是共建库,即将 RNA 病毒和 DNA 病毒一同制备文库,并进行后续捕获步骤。另一种方式是分别制备 RNA 文库和 DNA 文库,然后将它们混合后进行杂交捕获。一般情况下,对于 RNA 文库,不需要进行宿主核糖体 RNA 的去除步骤。
如图 6. 所示,示例展示了含有流感病毒 (H10N3) 的 RNA 文库与 DNA 文库共杂交的捕获情况。共计 15 个文库中包含了 11 个 DNA 文库和 4 个 RNA 文库。示例文库数据量为 100 Mb (15 个文库总数据量为 9.3 Gb),其中宿主序列占比为 58.3%。
图 6. NEX-t Panel v1.0 对 RNA 和 DNA 病毒共捕获
04 总结
无论是 mNGS 还是 tNGS,均是感染检测的有效工具,但使用场景不同。临床可根据患者需求选择合适的技术,从而辅助精准诊断和治疗。NEX-t Panel v1.0 的推出,在超大规模杂交捕获 tNGS 和多重扩增子 tNGS 之间提供了一种新的选择,有望为 tNGS 检测提供更精准、更经济的解决方案,在临床实践中发挥重要作用。
05 订购信息