记录一下首次发现新型冠状病毒的经历

(曾錚注:本文公众号原文已被删除)

原创 Winjor    来源:小山狗

2019年12月26日刚上班,还是如往常一样先大概浏览一下这一天的mNGS病原微生物自动解读结果,没问题的话就开始一天的研发工作了。

意外的是,发现有一个样本报出了敏感病原体——SARS冠状病毒,有几十条的序列,且这个样本只有这么一个有意义的病原体,如果是普通病毒,这已经是一个相当可靠的结果了。心头一紧,赶紧后台查看详细的分析数据,发现相似度并不算很高,只有大约94.5%(这跟卡相似度的阈值有关,相当于只筛选下了相似度比较高的序列)。想到有几种可能:1、SARS不同毒株基因组有一定差异;2、RNA病毒容易突变,距离SRAS事件17年了,变异比较大;3、近缘物种的错误比对等等。为了确认结果的可靠性,开始了详细分析。

好在之前已经遇到过几次这种类似的敏感的病原体确认分析工作,而且领导也曾跟我讨论过几次能不能做一个新发病原自动挖掘的分析流程,心里一直记着这个事情,在做其他权重更高优先级更高的项目时也随手做了一个初步的版本出来, 这个样本刚好可以派上用场。我给它起了个名字,相比于日常生产用的分析流程,它多了个后缀:“探索版”,包含了几乎所有已测序的病毒基因组。

探索版的分析结果提示这个病原体跟Bat SARS like coronavirus最相似,整体相似度在87%左右,而跟SARS的相似度是约81%。比对上的序列数由几十条上升到了500多条,此外也组装出了5条contig,加起来有1200多bp,此时基本上可以确认是一种冠状病毒,可以针对冠状病毒进行详细分析。分析期间也开始跟解读负责人和领导小范围内部保密讨论。

1-23.png

进一步分析,无论是拿原始序列去NCBI nt库blastn,还是拿组装后的序列去blastn,结果都是跟Bat SARS like coronavirus最相似,但整体的相似度也是只有87%左右,进行nr库蛋白blastx对比的相似度也差不多,因此对结果保留怀疑。

2-14.png

病毒的分类信息一直都很混乱,分类规则不统一,有些基于分型基因(比如甲流)、有些则没有明确的分型基因,通过其他方法去分类。此前并没有去调研过Bat SARS like 跟SARS的分类方法,在NCBI Taxonomy上,Bat SARS like 是划分到SARS下面的。如此紧急的情况下,没有时间去调研文献,手上的数据也不多,基于基因组的相似度,潜意识里认为既然Bat SARS like是SARS的下属分类,那么这个检测到的未知病毒至少也是一个跟Bat SARS like平行的物种,即一个新型的Bat SARS like(后来看文献SARS和Bat SARS like是通过几个非结构蛋白进行分类)。

3-11-1024x400.png

进一步地毯式地分析了几千个冠状病毒基因组,从相似度、覆盖率、基因组分布均匀等几方面进行评估,最终找出两株最相似的基因组,bat-SL-CoVZC45和bat-SL-CoVZXC21(1月9号公布基因组序列后,很多文章分析的也是这两个)。

(下午才发到群里的图)

4-9.png

仅仅这些信息还是不够的,至少还要看看进化上的信息,于是开始着手做进化树分析。

5-10.png

下载了所有冠状病毒的基因组,最后经过质量过滤、聚类等分析,筛选出了160株的冠状病毒基因(基本包含了所有已知的各种动物的冠状病毒)。将组装的序列与160株冠状病毒基因组基于全基因组平均相似度做了进化分析(题外话,个人认为在物种进化分析上,基于全基因平均相似度构建进化树,比基于某个基因构建的进化树要更准确、合理一些,毕竟是从全局来考量,当然,研究结构、功能等另说,此时组装的序列也很短,没有完整的基因序列),结果不出意外,还是跟Bat SARS like coronavirus聚得最近,而且也是在SARS的大支上。

(跑到了傍晚才出图)

6-7.png

图注:左上角一大块红色是SARS,边缘颜色没那么红的是Bat SARS like,再往外的大蓝边是另一群Bat SARS like,未知的病毒跟45、21聚在比较独立的一支上了,红框圈起来的。

比较奇怪的是,这个未知的病毒跟bat-SL-CoVZC45和bat-SL-CoVZXC21聚到了一个相对独立的分枝上,而其它Bat SARS like则很集中地聚在SRAS那一群里面,想着也许是这两个的分类有点问题,但去看了出处的文献,方法上跟其它的也没啥区别,尊重文献的分类吧,暂且认为是对的。(这也是后面某些专家们把这个未知病毒判定为新型冠状病毒的依据之一)

9-7.png

(部分进化树截图)

前端反馈这个患者病重,着急要检测结果,但是这么一个重大的病原体确实不可轻易报出,中午跟几个领导紧急开了个会,决定继续深入分析,延迟发放报告,同时分享数据给中国医学科院病原所一块分析。

后面从基因层面(orf1ab、S、N等基因)进行了深入分析,并没有什么意义比较大的发现了,主要还是检测到的序列数少,覆盖率太低,都是不完整的基因,做不了什么。

10-6.png

中午时已经提出了重测补数据进行分析。重测可以进行技术重复性验证,避免一些未知因素的污染导致的假阳,确保样本确实有该病原体,另外可以有更多的数据进行分析,如能组装出完整的基因组,分析结果更可靠,能做的深入分析也更多。

11-8.png

第二天(2019.12.27)一早数据出来后,赶紧进行了组装分析,终于组装出了接近完整的基因组序列。数据同时也共享给了中国医学科学院病原所做其他深入分析。这次的序列数由之前的500多条升到了47万多条!

12-4.png13-3.png

因为时间有限,还有其他研发项目需要做,就没有详细去对组装结果进行补gap获取完整基因组了。另外也已经分享数据给病原所了,他们也会做这个,所以就没有去组装出一条完整的基因组序了,已有的组装结果能满足大部分分析需求了。

后面也继续做了一些深入的分析。

回帖序列分布均匀,没有明显的偏好,平均深度和中位深度基本一致,深度达到了1000x,说明组装没啥问题,测序也挺好,未知病原体也是完整的基因组存在。

14-3.png

重新构建了进化树,这次选择了NCBI所有冠状病毒的参考株(以登录号以NC开头,官方认为最可信的),外加几株前一天分析最近源的株。

15-1.png

进化树结果跟前一天的基本一致。

16-1-1024x768.png

基因组共线性分析、ORF注释等表明这个未知冠状病毒是典型的BetaCoV(orf1ab、S、M、N、E等基因)。共线性图里颜色较浅的是S蛋白区域,是差异最大的基因。

17.png

经过与WHO官网推荐的SARS 7条PCR验证靶标序列比对,发现平均相似度也只有90%左右,关键是引物序列也有几个变异,推测SARS的检测试剂盒无法检测这个未知病原体(后面的很多地方的实验验证也是如此)。

此外还做了很多其他针对基因、蛋白等详细的深入分析,不再赘述了。

分析至此已经基本可以确认这个患者的样本里面确实有一个病毒,但这个病毒与所有已知基因组信息的病毒都不太像,可能是一种跟Bat SARS like coronavirus类似的新型病毒。

18-1.png

(现在看回我当时的那句话,真是一语成谶,对不起全国人民了,都怪我这个乌鸦嘴)

这不一定是SARS,传染性、致病性都未知,同时也意识到了问题潜在的严重性,对实验室做了全面清理消毒,样本无害化销毁,实验操作相关人员进行了相关监测。

接下来就是怎么去报告的问题了,直接报可能会吓着医生,何况这可能是一个新发病毒,报错了就是重大的事故。有一些必要的信息还是需要先进行排查的。

最先想到的当然是野生动物接触史,当时得到的信息是这个病人回过老家,不排除接触过蝙蝠,或者被蝙蝠咬了都可能。

19-1.png

也曾怀疑是不是哪里的人工病毒相关工作人员操作不慎误感染,毕竟前段时间的布鲁菌集体感染就是因为某个工厂灭菌不彻底引发的。

20-1.png

没有更多信息了,还是要赶紧跟医生沟通这个事情,毕竟我们能保证送检的样本里面就是有这个未知病毒,其他事情就交给医生去调查处理了。

中午前已经跟医生沟通了,患者也隔离了。

21-1.png

因为没有掌握其他更多信息,患者也隔离了,这个病毒又不是真正的SARS,想着或者仅仅只是个野生的Bat SARS like,传染性未知,所以紧张的心情也有些放松了。但因为患者病重,也不容小觑,仍然密切跟医院沟通中。期间也在继续做一些深入分析。27号、28号公司领导也在跟医院和疾控的人电话沟通这个事,29号、30号还亲自去武汉跟医院、疾控中心的领导当面汇报交流这个事情,包括所有我们的分析结果以及医学科学院病原所的分析结果。一切都在紧张、保密、严格的调查中(此时医院和疾控的人早已经知道有多名类似患者,我们沟通了检测结果之后已经开始了应急处理,但我不知道而已)。

本以为这个事情会很快过去,毕竟除了这个患者,好像也没有听到其他患者感染的消息,但到12月30号的时候,听到消息说类似症状的患者还有挺多个,神经又一下子绷紧了。特别是,大概是30号下午吧,一个“友商”在另一个患者的样本里面可能也检测到了同一种病毒,但他们直接发了检测到SARS冠状病毒的报告,瞬间把消息给引爆了。晚间相关部门也发了“不明原因肺炎”的公告,31号凌晨时相关流言也开始在微博上大肆传播。

真正让我再度紧张的是,友商共享了序列给我们分析,我分析一看,确实就是同一种病毒!潜意识里的第一个想法就是“这病毒具有传染性”!可能还真是一种新型的SARS!

30号深夜拿到友商的序列进行分析。

22-1.png23-1.png

两个未知病毒聚在了一起,相似度超过99%

24-1010x1024.png

(由于友商的序列是经过与SARS比对筛选的,所以跟SARS相似度达到93%,而我们的完整的序列则约86%,但两者的同源性还是接近100%)

25.png

两两直接比对,所有序列均能比对上,相似度达99.6%,再保守的区域,不同物种间的相似度几乎不可能这样高,而且全基因组覆盖率超过了20%,确认是同一种病毒无疑!

26.png

此时的心情既很紧张,也很激动。紧张在于,这个未知的病毒可能会像SARS那样恐怖;激动在于,我们通过mNGS技术及早发现并确认了这个病原体,并且对患者进行了隔离,在病毒大范围传播之前有可能通过防控措施把它扼杀在摇篮中!

心情复杂,感慨万分,随即发了条没几人能懂的朋友圈。

27.png

12月31号早间,微博上关于SARS的流言开始大肆传播。我一直在等着看官方如何回应。下午官方发布通告,只说了是“不明原因肺炎”, 并未提是什么病原体,有27例类似的病例,其中7例重症。看到这个消息后,我感觉事情不妙了,猜测这个病毒传染能力并不低。然而官方的通报却是“未发现明显人传人现象”,早期掌握的数据并不多,局势不好判断,何况是新发病毒,为了稳住社会情绪,避免民众过度恐慌,这样的通告其实也可以理解。

此时专家组已经开始介入,武汉病毒所等“国家队”也开始分析鉴定,他们知道更多信息,有更多样本和数据,也更有条件更专业,所以后续我就没有做太多深入分析的工作了,等待官方的结果。

刚开始我对国家在处理这些突发的重大公共卫生事件的能力还是挺有信心的,毕竟经过了SARS、甲流等事件的洗礼。此外,就在两个多月前的北京鼠疫事件,也是由我们通过mNGS检测出来上报的,当天上报后他们就启动了应急处理程序,马上用了其他方法再次验证,第二天一早就看到新闻了,后续也没有发现新传染的病例,防控做得很好。mNGS在鼠疫事件中立了大功,想着在这个未知病毒的防控中也能起很大作用吧。

媒体开始辟谣,最早见新京报发出“SARS系谣言”,人民日报等则用词稍微委婉些“不能断定是SARS”,后面8位“造谣”的人被抓了。看到这些新闻后,不知怎么的,心里突然有点失望了。科学上尚未有定论或者有争议的东西,直接就是谣言了?开始有一种感觉:这种辟谣的论调,以及那些过度乐观的宣传都会把这个事情推向难以挽回的局面。媒体的高调辟谣会干预这个病毒科学的定性,过度乐观的宣传会让大众缺乏敬畏之心,不会采取防卫措施。后续事态的发展又一次验证了我的担忧。

事件引爆了以后,也有些朋友来问我是否知情,特别是武汉的朋友。在告知一定要先严格保密后(毕竟有人被抓了),我还是透露了一点消息给他们,让他们一定要注意防护。

28.png29.png

这个对话或许也能理解为什么要辟谣SARS,以及命名为新型冠状病毒,毕竟基因组相似度只有80%左右(题外话,肠道病毒同一个型别的不同毒株,很多的相似度也才80%左右),SARS给我们带来了太多创伤,大众对其极为恐慌。

30-1019x1024.png

新型冠状病毒和SARS不同的基因的相似度不同,从75%到94%不等,特别是S基因,与人细胞受体(ACE2)相关,相似度才75%。所以说不是SARS,那也算是有依据吧。不过后来石正丽的文章中,通过他们的方法分析,新型冠状病毒也是属于SARSr-CoV(SARS相关冠状病毒)。

事件后续的发展大家都知道了。这里再说说几个问题。

为什么我们两天就已经分析出了这个未知的病毒是一个跟SARS很像的冠状病毒,并且上报了所有分析结果,官方要到1月7号才发布消息明确肺炎是由新型冠状病毒引起的?

其实我们做的工作只是分析鉴定了送检样本里面有这么个病毒,但肺炎是否是这个病毒导致的,我们并没有去分析,也无法去分析,检测到病毒不等于肺炎由该病毒引起。如此重大的卫生事件,官方自然要严谨论证,而且也有一套国际参考验证流程(科赫法则)。官方要做的不仅是检测到多个样本都有这么个病毒,还要验证肺炎是因为这个病毒导致的等等。

31.png

分离、培养、验证等等这些都是很花时间的,还要经过专家讨论,达成共识。从近段时间发表的很多关于新型冠状病毒的论文上也可以看到,很多测序数据都是在1月份的头两三天就完成了的。

这个事情还有一个很感概的事情就是,知道真相的人噤如寒蝉,不知道真相的人各种“大力科普”、“深度分析”;亲身经历的公司只字不敢言,其他公司各种借势营销。从鼠疫到新型冠状病毒皆是如此,呵呵,好有意思。

要谈对整个事件的看法,最大的感觉就是失望,痛心,还有愤怒。我们都已经发现那么及时了,为啥现在还是没能控制住?让全国进入的疫情大战?更多的不是科学因素,也不是技术因素,而是决策和媒体。

我曾经是个很愤青的人,事已至此,无力回天,传递信心才是最重要的吧。马后炮,人人都是精英,谁都不曾想到事情发展成这个样子,所以也懒得去批判很多事情了。但有些话还是想说几句。

辟谣SARS、媒体宣扬的乐观情绪,这些在最早期的时候都没有太大问题,毕竟对这个病毒的认知非常有限。在应对这些重大公共卫生事件时,疾控系统可能采用“内严外松”的规则,内部谨慎小心、严格验证、仔细评估,对外通告却可能偏向乐观,避免引起过度恐慌。何况在这次事件上,怎么去给公众交代,显然已经不是疾控系统能单独决策的事了。

武汉交通枢纽的地位不必多言,当时也临近春节,正是餐饮、旅游、电影等服务业的旺季。悲观的宣传无疑会重创这些服务业,还会引起大众过度恐慌,导致物资哄抢,社会混乱等严重后果。若这病毒真无什么传播能力,或者因为采取了这些措施扼杀了病毒的传播,社会没看到这个病毒能带来什么危害,决策者必然会被骂反应过度、小题大做,到时自然要背锅。相反,过于乐观的宣传,病毒不强则皆大欢喜,开心过大年,病毒强则会导致大众缺乏防范意识,防控工作难以展开,最终导致病毒的快速传播,产生更加严重的后果。所以,当你作为一个决策者的时候,你不得不综合考虑方方面面的因素,社会、经济乃及政治各方面都需要做一个平衡,非常考验决策者和专家们的能力和远见。

走对了,平淡无奇,走错了,千古罪人。

这个世界没有平行宇宙,我们无法知道哪种决策才是更正确的,或更错误的。在国内这种什么事情都喜欢往乐观上面宣传的大氛围下,以及侥幸心理的存在,决策者做什么决策,可想而知。

在事件的后期发展中,特别是1月12号左右开始,我相信专家们已经看到事情正在往不好的方向发展了(首批确诊的41例患者,约30%并无海鲜市场接触史,此时多地开始出现疑似病例了,有些已经初步核酸阳性)。但是在后续的宣传上还是太过于乐观和艺术化了,同时还在不断辟谣,还没任何发布预警的迹象。“不排除有限人传人,持续人传人风险低,可防可控”,用词颇为谨慎讲究,且不说是否过于乐观,就问有多少普通民众知道什么是“有限人传人”?什么是“持续人传人”?他们的理解可能就是基本不会人传人,自然毫无戒备之心。我还在朋友圈科普了一下。

32.png

从现在发表的很多论文上也可以看出,很多专家很早就对这个病毒的传播能力有较深的认识了,越往后,掌握的数据越多,对局势的预判越清晰。我相信专家们早已给出不怎么乐观的预判,但如果某些人,为了顾及某些人或某些媒体的面子(毕竟之前宣传得太乐观,现在打脸太疼),罔顾专家意见,不顾民众健康,不得不往乐观上面去通告,坚持不发布预警,这就不可原谅了。无论是谁,该罚的罚,该撤职的撤职。

别的不多说了,谈点希望吧。

mNGS确实是一个好技术,在疑难、危重病例诊断以及这种突发的重大公共卫生事件的早期监测和爆发监测中起到很大的作用。现在提供mNGS病原体检测服务厂商有很多,建议疾控系统可以跟一些技术好的企业建立直接沟通的渠道,能够更快速地应对像这样的突发事件。另外,mNGS企业们也可以建立一个信息共享平台,在遇到这些事件时及时共享信息,看看是否有爆发(我知道这个很难,一方面本来就是商业机密,另一方面敏感病原体谁都不敢轻易报吧,但我还是觉得这个事情很有意义,希望有朝一日可以成为现实吧)。

也希望我们经历了这次新型冠状病毒事件后,国家的重大公共卫生事件的处理能力有长足进步吧。个人认为,在通告宣传上可以借鉴天气预报的规则——“总是会往危害大些方面去预报”,以提醒民众做更多预防,降低心理预期。俗话说:没有期望就不会失望。

这件事情对我而言,仿佛就是一场年终大考,用尽所学,交了一份还算合格的答卷吧,只是这份答卷是否发挥出最大的作用了呢?第一次亲身参与到了一次如此重大的公共卫生事件,做出了一点贡献,也锻炼成长了许多。

据我目前所知,最早发现这个病毒的应该就是我们了,因为也是我们上报结果以后,疾控系统开始介入。从GISAID数据库网站上提交的数据看,样本收集的时间也是我们最早的。也许其他机构也测到了这个病毒,但这是未知的病毒,核酸数据库中没有参考基因组,他们不一定有这个生信能力去分析鉴定。

33.png

所以,应该就是我们首次发现了这个新型冠状病毒吧,记录一下。

希望早点战胜疫情吧。

中国加油!武汉加油!

2020.01.28

 

此条目发表在时评分类目录。将固定链接加入收藏夹。