自从美国新冠肺炎感染数据大幅度上升开始,媒体引用的数字来源逐渐从美国CDC等国家官方机构转向了知名顶尖高校约翰·霍普金斯大学,原因之一是美国CDC这样的官方机构更新数据缓慢且不具体,那么为什么约翰·霍普金斯大学能够获得美国CDC都无法及时跟进的感染数据呢?他们的数据又是哪里来的呢?
顶级期刊Science也有这样的疑惑,这两天,他们专访了约翰·霍普金斯大学疫情跟踪项目背后的主管系统科学与工程馆中心主任Lauren Gardner,为大家揭开了谜底。这及时的疫情信息更新背后,还有中国留学生和美国中文社区的功劳。
1 中文社区竟是美国疫情数据来源
与部分人猜测中不同,Gardner的团队并没有什么神秘的疫数据来源。她坦白告诉Science,美国的疫情数据并不是来自美国CDC的公布,“CDC只有州一级的数据,而且一般有24-48小时的延迟”,这显然不能满足这个项目快速和准确更新的需求。
Gardner表示,美国目前的疫情数据主要来源于一个叫做“1亩3分地(1point3Acres )”的华人中文社区,他们从这个社区获取美国疫情的数据,这个社区从约翰·霍普金斯大学获取全球其他地区的数据。
当然,这个社区并不是他们的唯一信源,各地官方公布的数据或者当地媒体公布的数据也会被关注,通过交叉检验等方案更新到数据库里。
2 始于中国博士生对武汉疫情的关注
Gardner的团队是较早开始坚持发布疫情动态的信息源之一,美国当地时间1月21日,她的在读博士生董恩盛(Ensheng Dong)对当时中国新冠疫情非常关注,并且对于建立一个疫情信息追踪和公示系统感兴趣。Gardner描述,他们很快在几个小时内就搭建了一个初始系统,第二天她在自己的社交帐号上分享了这个系统,结果大受欢迎。
疫情追踪系统上线近一个月,2月19日,他们将系统本身的介绍以及自身如何收集以中国为主的疫情信息的方案发布在柳叶刀感染病学分刊上。
Gardner介绍,最初这个系统的大部分工作依靠人工完成,她的团队只有6个人,头两个月,他们要靠自己收集数据,识别来源可信度,进行统计和计算。不过,随着他们的系统热度挤爆云服务器,越来越多的机构和志愿者加入了他们的行列。
现在这个系统每小时更新一次,主要依靠的是自动化而非刚开始的手工作业,通过程序自动收集过来的数据又将通过程序设置的检验点来确保数据的准确性,最终由来自世界各地的志愿者在24小时轮转的方案下进行及时更新和维护,Gardner举例称,“比如目前,一名居住在英国的博士生会帮助我们完成早上的轮班。”
3 回归工作,重在预测分析
尽管美国的数据一直在走高,但是因为已经由手工工作转向了自动化,再加上有足够的人加入进来维护这个系统,Gardner告诉Science,自己90%的精力已经回归本职工作——疾病的数学模型。
她认为,比起直接追踪数据,自己更应该通过已有数据对疾病进行预测,比如通过模型计算出接下来美国的哪些郡会进入新冠肺炎的高速增长期,以便提前通知决策者,做出合理的应对预案。
最后,Gardner对全球的疫情做出了预测,她认为自己跟踪疫情的工作应该会持续一整年,疫情在此期间将在全球起伏不定,同时,她估计今后两个月也将和已经过去的两个月一样紧张。
参考文献:
https://coronavirus.jhu.edu/map.html
https://coronavirus.1point3acres.com/
Jocelyn Kaiser,‘Every day is a new surprise.’ Inside the effort to produce the world’s most popular coronavirus tracker doi:10.1126/science.abc1085
Ensheng Dong,Hongru Du,Lauren Gardner. An interactive web-based dashboard to track COVID-19 in real time DOI:https://doi.org/10.1016/S1473-3099(20)30120-1
(文/小编)
标签阅读: