背景
随着新冠疫情进入攻坚阶段,基于实时荧光RT-PCR法的核酸检测技术在新冠病毒快速鉴定及确诊中发挥了重要作用。然而,若要对新冠病毒来源、变异进化及致病机理等进行研究,需获取完整的病毒基因组信息,这离不开高通量测序和病毒序列组装。
我们以某疾控中心收到的1例新冠病毒肺炎疑似样本为例,为您解析该CDC首例新型冠状病毒感染病例呼吸道标本宏转录组测序及病毒序列组装全流程。
方案
1月20日,文库制备。使用MGIEasy RNA文库制备试剂套装进行建库,制备DNA纳米球。
1月21日,上机测序。基于MGISEQ-200平台,对该地发现的首例病例的呼吸道标本进行300M的高深度测序,测序读长PE100。
1月22日上午,数据分析。使用结合病原感染快速鉴定系统对下机数据进行分析,鉴定未知病原。
1月22日上午,拼接组装。使用拼接效率高的IDBA方法成功完成新型冠状病毒的序列组装。
图1 新型冠状病毒全基因组序列获取全流程
结果
产出32Gb数据,总reads数318M。结合病原感染快速鉴定系统,鉴定出2,337,442条新型冠状病毒reads。分析软件自动将2,337,442条的新型冠状病毒reads从所有序列中抽出,使用拼接效率高的IDBA方法进行组装,成功完成新型冠状病毒的序列组装,获得基因组序列全长29.9kb。
图2 分析报告病毒鉴定结果
图3 病毒基因组序列拼接组装流程