洞查数据背后,MSRA 推出Cv新冠数据分析网站-

洞查数据背后,MSRA 推出Cv新冠数据分析网站

阿里云服务器优惠

这场疫情再次拉近大众和科学家的距离。疫情之下,研究人员每次探索与发现,都成为大众关注的焦点和政策制定的依据。获取最新科研资讯,对建立更立体、客观的肺炎疫情认知,有着关键意义。

近日,微软亚洲研究院(Microsoft Research Asia,MSRA)推出了一个新冠肺炎数据分析网站 COVID Insights,旨在透过较为全面的疫情数据,达到支援学术研究和向公众科普的目的。

COVID Insights 网站基于计算生物学、数据分析等领域的专业知识和研究经验,使用约翰霍普金斯大学、美国疾病控制与预防中心、GISAID 等机构的官方数据,主要分为感染数据分析、基因组和蛋白质结构、研究趋势三大类别。

跨国家或地区比较传播动态

哪些地区的疫情发展趋势比较接近?有些国家的数据降下来,做法值得参考吗?

实质上,「感染数据分析」板块对这类问题有答案──透过微软亚洲研究院对 COVID-19 数据的分析,流行病学参数对特定国家与地区的疾病传播动态的影响便一目了然。

例如,澳洲 2 月 3 日至 4 月 26 日的疫情传播趋势与冰岛 2 月 1 日至 4 月 17 日的趋势相似度为 56%,因此冰岛便可借鉴澳洲的疫情防控措施。

而透过移动游标位置,将时间限定在 3 月 22 日至 4 月 15 日,可发现这段时期澳洲的传播趋势与南韩在 2 月 29 日至 3 月 17 日的趋势相似度为 80%,因此澳洲便可参考南韩 3 月中下旬的防疫措施。

众所周知,当前美国Cv新冠确诊人数逼近 100 万,若利用这个功能,可看到 3 月 20 日至 4 月 26 日(目前数据只更新至 4 月 26 日)美国的疫情发展趋势和两週前的伊朗有 75% 相似度,那幺此时参考对方的措施不失为可行方案。

据了解,这个功能的数据集来源于约翰霍普金斯大学系统科学与工程中心公布的Cv新冠疫情数据。

SARS-CoV-2 的病毒学分析结果

相比上述类别,「基因组和蛋白质结构」则比较抽象,展示  SARS-CoV-2(新型冠状病毒)的病毒学分析结果,主要将目光放在 SARS-CoV-2 病毒本身,主要包括以下两个功能:

第一,基因组与蛋白质结构。

外媒「新冠病毒来自武汉」报导让中国政府大声抗议。而早在 2020 年 2 月 20 日,中国科学院西双版纳热带植物园就曾发布研究成果,声称武汉华南海鲜市场的新型冠状病毒是从其他地方传入,于是中国国内又出现新冠病毒「国外起源论」。

这个研究有一幅非常複杂的图,反映出病毒基因组变异的问题。就病毒基因组变异而言,如今全球已经有了很多的研究数据。

根据网站介绍,微软亚洲研究院从全球流感序列资料库 GISAID 下载 SARS-CoV-2 基因组数据,以病毒株 Wuhan-Hu-1 为参考序列,确定各病毒序列发生变异的氨基酸及位置。

因此,透过下拉列表选定某个大洲,能直觉看到特定核酸片段发生变异的氨基酸数目、地区分布与变异时间线。

同时,网站经 SARS-CoV-2 病毒核酸序列转化得到的蛋白质三维结构,也为相关研究提供参考。

第二,与其他冠状病毒比较。

全球肆虐的 SARS-CoV-2 病毒是目前已知第 7 种可感染人的冠状病毒,其余 6 种包括不陌生的 SARS-CoV(引发「SARS」的病毒)和 MERS-CoV(引发中东呼吸症候群冠状病毒感染症的病毒)。

除了拿 SARS-CoV-2 与 SARS-CoV、MERS-CoV 比较,COVID Insights 网站还有 SARS-CoV 和另外两种病毒的比较。

另两种病毒 Bat-CoV 和 Pangolin-CoV 分别来自新冠病毒潜在中间宿主的热门人选:中华菊头蝠和马来穿山甲。

根据 COVID Insights 网站,Bat-CoV、Pangolin-CoV、SARS-CoV、MERS-CoV 与 SARS-CoV-2 的相似度依次递减,分别为 96%、90%、79%、49%。

全球Cv新冠研究趋势

2020 年 1 月 1 日至 4 月 22 日,众多领域科研人员都做了非常多研究。微软亚洲研究院经由统计、整合论文开放获取资料库 COVID-19 Open Research Dataset 的数据,根据不同时间段(按週统计),得出流行病学、社会科学、 病毒学、诊断学 4 领域的Cv新冠研究趋势词云。

因此可发现,2 月 26 日至 3 月 4 日那週,流行病学研究的「transmission」(传播)出现频率较高。

4 月 8~15 日那週,社会科学研究的「number」(数字)成为关键词。

COVID Insights 网站也将流行病学、社会科学、 病毒学、诊断学 4 领域的高引用论文列出,这样一来,大众某种程度降低受低品质论文误导的风险。

这段时间以来,疫情相关的学术论文呈现爆发式增长,低品质研究论文氾滥也相当严重。4 月 23 日,卡内基美隆大学道德与政策中心主任 Alex John London 和麦吉尔大学生物医学伦理部教授兼主任 Jonathan Kimmelman 也在《科学》杂誌发表文章呼吁:

不应以 COVID-19 疫情爆发的紧迫性为藉口,在病毒研究和疫苗研发等方面降低研究标準。

可见,虽然 COVID Insights 网站目前数据并非特别全面,但的确在加速优质研究资讯的互通互享发挥重要作用,正如比尔盖兹所说:

这次疫情是现代社会第一场真正意义的大流行病。这就像一场世界大战,不同的是,这次我们在同一条战线。

  • 微软亚洲研究院推出新冠数据分析网站COVID Insights
赞(0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
  • potplayer
  • directx