一场流行病暴发以后,世界各国的科学家们都会测序新收集到的病毒样本。因为疫情紧急,很多科学家会把尚未发表的病毒基因序列上传到一些共享数据库(例如GISAID),和全世界共享。
西雅图弗雷德·哈钦森癌症研究中心的Trevor Bedford等病毒进化专家团队组织了一个名为Nextstrain的项目。科学家们会尽快去把共享的病毒序列下载到Nextstrain的后台,将这些序列纳入全球传播地图,并在nextstrain.org上公布新冠病毒的基因组流行病学的最新信息,更新病毒家族树谱。
Nextstrain软件平台在过去几年逐步开发完善,曾应用于埃博拉、Zika和季节性流感等疫情,旨在让基因组流行病学在疫情期间尽快地发挥作用。今年它也在时刻更新新冠病毒的传播信息。
近日,Nextstrain的twitter公布了新的3条新冠病毒基因序列,均来自最近北京暴发的病毒样本。这3个样本采集于2020年6月11日,两个来自于感染者,一个是环境采样。由中国疾控中心病毒病预防控制所(NIVDC)快速测序并且在GISAID共享。
这3个序列落在一个进化簇中,该簇包含了很多来自欧洲的样本(图1,上下两幅),和2020年3月19—20日采样的3个输入北京的病毒的基因序列很不一样。
在全球架构中,和这3个北京的序列最接近的序列来自捷克、中国台湾、希腊和葡萄牙(图2)。因为Nextstrain最近精简了数据库里的很多重复的序列,还不能确认北京的病毒到底来自什么地方。
如果按地区分布看,在亚洲架构中(图3),北京的序列和来自捷克、中国台湾、丹麦、哥伦比亚、以色列和奥地利的序列很接近。
在欧洲架构中(图4),北京的序列和来自捷克、丹麦等许多欧洲国家的序列很接近,其中和来自葡萄牙和瑞典的基因序列只相差1个突变。
因此从基因序列分析来看,北京最近传播的新冠病毒与欧洲流行的病毒有关。但是因为与许多国家/地区的序列类似,还无法定论它可能起源于何处,何时传入北京的。
最后,最重要的一点,北京的3个病毒基因序列虽然接近,但都不相同。样品(1)和样品 (2、3)之间已经有两个突变(图5)。其中第一步突变(A29694C)样品(2、3)都有,但是第二步突变是不一样的 (C12085T和A11910G)。这暗示了在暴发之前,新冠病毒可能已经在北京社区里默默传播了一段时间。因为新冠病毒的变异速度不算快,平均每月突变两次。如果是一个点(新发地市场)短时间内的暴发,病毒的基因序列很大可能是一样的。
世界很多地区,例如美国的西雅图和纽约,法国巴黎等,新冠病毒都是在社区里默默地、不被人们所意识到地传播了1~2个月,才引起了全面的暴发。北京的新冠病毒的社区传播很可能也在1~2个月之前就开始了。