在肿瘤高通量测序应用中,可衍生出三种常见方案:肿瘤Panel、全外显子(WES)和全基因组(WGS)。其中,全外显子是一种针对人类基因的外显子进行检测的方法,在临床应用上还具有诸多优势。
作为肿瘤突变负荷(TMB)检测的金标准,WES可为肿瘤免疫治疗选择提供依据。此外,它能为肿瘤微小残留病(MRD)检测提供突变信息,让变异标志物的选择更加游刃有余,为肿瘤治疗方案评估、复发监控等提供更多参考;还可以通过构建患者个体的全外突变谱,在个性化肿瘤疫苗制备中,筛选更为有效的新生抗原。
之所以选择WES,是由于与全基因组测序(WGS)相比,其位点数仅为1%,却覆盖了大部分基因组编码区,还可以灵活添加其他区域,例如线粒体、CNV和病毒模块等。因此,WES是一种相对简便、快速的诊断方案,也被认为是目前临床应用中最具性价比的基因检测技术之一。
而与固定的panel相比,肿瘤异质性与Panel基因固定的矛盾很难” One Size Fits All”(图1)。随着测序平台国产化趋势越来越明显,测序成本大幅下降,WES在肿瘤临床的应用也越来越广泛。
图1. 上图:50例NSCLS患者体细胞突变重合比例(TCGA)[1] 。下图:WES检测到的突变基因与商品化Panel基因List的重合基因数量。上方Panel,10例NSCLC队列数据;下方Panel,1059例NSCLC TCGA数据;红色方框为根据WES突变谱设计的个性化Panel,蓝色方框是固定基因的商品化Panel[1]。
作为国内靶向捕获技术的佼佼者,伯科生物对其设计与生产的当家WES panel(TargetCap Core Exome Panel v3.0)进行了全面测评,并评估了其在华大智造(MGI)测序平台的数据表现。
结果显示,华大智造测序平台的表现超出预期。下文将阐述测评数据质量、覆盖度等方面的质量指标,变异结果将在下篇进行展示。
实验设计
1 WES Panel:伯科生物自主研发生产的TargetCap Core Exome Panel v3.0,由近40万条120nt ssDNA探针组成。
2 样本:采用含有不同突变数量的5套TMB gDNA标准品(Set 1-5),每套标准品由不同等位基因频率的5个样本组成(0%-40%),共25例样本,按照样本质量的高低分为两类,分别为稍低质量样本(LQ,15例)和高质量样本(HQ,10例)。
3 建库与测序:对上述25例样本构建华大智造平台的双端Index文库,按照5-Plex与TargetCap Core Exome Panel v3.0杂交16h,在 MGISEQ-2000平台进行150PE测序50Gb以上,随机抽取10Gb进行数据质控。
图2. TargetCap Core Exome Panel v3.0测试实验流程
测评结果
冗余数据低至2%
华大智造平台保持着一如既往的低冗余度约~2%。这得益于华大智造平台 DNBSEQ的非线性扩增技术,同样的数据量10G下,MGISEQ-2000能够获得更高的平均测序深度,达到131x。换个角度说,如果要达到相同的测序深度,华大智造平台可有效节省测序成本。
图3. MGI平台信号放大示意图
99.8%超高目标区域覆盖率
目标区域覆盖率在MGISEQ-2000达到总体99.8%,LQ 99.7%,HQ 99.9%,高质量样本覆盖率稍高于稍低质量样本。
99.4%超高0.2x Mean Depth覆盖率
1.低深度区域占比
0.2x Mean Depth: 25个样本在华大智造平台的均值为99.4%,LQ和HQ样本在MGISEQ-2000上分别表现为99.3%和99.6%。
0.5x Mean Depth: 25个样本在华大智造平台的均值为92.9%,LQ和HQ样本在MGISEQ-2000上分别表现为92.5%和93.4%。
2.整体均一性(Fold 80)
华大智造平台上Fold80值为1.44,在不同质量样本中差别不大。
数据表明,在WES的各项关键指标中,华大智造MGISEQ-2000的表现优异。总结如下表:
CV低至0.1%
数据的稳定性至关重要,而本次测评也对以上指标的稳定性进行了评估。简单来说,就是测了以上指标的CV值(变异系数,Coefficient of Variation),结果同样令人惊喜。
对于总体25例样本,除Duplication参数外,其他各项参数的CV值均控制在3.1%及以下,覆盖率和0.2x Mean Depth覆盖率更低至0.1%,数据表现出极佳的稳定性。至于冗余率(Duplication)的CV值达到13.5%,由于MGISEQ-2000的冗余率已经低至2.2%,这个CV值可以忽略不计。
图4. TargetCap Core Exome Panel v3.0各指标CV值
在后续文章中,我们将给大家带来TargetCap Core Exome Panel v3.0在MGISEQ-2000平台变异检测方面的内容,敬请期待。
华大智造MGISEQ-2000适配应用
参数解释
对于靶向测序数据的评估,冗余度和中靶率决定了有效数据,即平均测序深度,而覆盖均一性则决定了有多少目标区域能够用于最终分析,FDA所批准的全外产品Omics Core规定平均测序深度≥500x,0.2x Mean Depth≥95%(≥100x的目标区域占比)。
和木桶效应一样,木桶够高还不行(平均测序深度),能盛多少水取决于最矮的木板(0.2x Mean Depth);除了最矮的木板,还有一些木板稍高,他们就是0.3、0.4、0.5…x Mean Depth等,对于体细胞突变分析,当然是“多多益善”,即更多的区域达到更深的测序深度,因此0.3-1.0x Mean Depth的值越高越好。
图5. 靶向测序评估参数示意图
除此之外,还有一个评估均一性的参数叫Fold 80,计算公式为平均深度/80%以上目标区域覆盖的深度,低于2.0均一性较好,可以理解成评估整个决口的大小。
*以上评测结果来自伯科生物
参考文献
[1] Reinert T , Henriksen T V , Christensen E , et al. Analysis of Plasma Cell-Free DNA by Ultradeep Sequencing in Patients With Stages I to III Colorectal Cancer[J]. JAMA Oncology, 2019, 5(8).