早期新冠病毒基因序列資料被刪 專家:從雲端恢復部份資訊

大陸科學家要求,美方在2019年年底時將在武漢傳播新冠病毒最初版本基因序列訊息資料庫裡刪除,現在正嘗試網路雲端的某些角度找到相關資訊來恢復這些數據,以利於追索病毒的來源。(圖/Shutterstock)

美國媒體引述美國衛生研究院(National Institutes of Health 簡稱NIH)消息人士指出,應大陸科學家要求,美方在2019年年底時將在武漢傳播的新冠病毒最初版本的基因序列訊息從資料庫裡刪除。不過,美方研究人員努力從谷歌雲端資料上的文件分析後,恢復了其中13個原始序列。而這基因序列訊息可以用來識別病毒可能是何時、以及如何從蝙蝠或其他動物傳播到人類的。

據《華爾街日報報導,這項有關新冠病毒基因序列的資訊是由中國政府提供,於2020年3月從武漢發往美國國立衛生研究院。但是3個月後,中國研究者向美國衛生研究院要求刪除這些資訊,理由是關於基因序列的資訊已更新,爲了避免資料出現差異,需要更換。美方也因此刪除了最初從中國獲得的有關SARS-CoV-2的原始資訊。

報導引述消息人士的話說,在準備進一步追查新冠病毒來源,而且有關病毒是從武漢實驗室泄露的質疑下,中國要求刪除原始資料的做法引起研究人員的關切。美國衛生研究院強調,此類刪除資訊的流程是正常做法,提供結果的研究人員對自己的資訊擁有權利,可以要求刪除。因此,除了中國科學家的官方動機外,無法做出任何假設

美國專家認爲,原始病毒的基因序列訊息支持早些時候的說法,即在2019年12月與生鮮市場有關的最初疫情暴發之前,有多種冠狀病毒已經在武漢傳播開來。圖爲被認爲是疫情起源地的武漢華南海鮮市場。(圖/中新社

報導表示,美國西雅圖福瑞德.哈金森腫瘤研究中心(Fred Hutchinson Cancer Research Center)的病毒學家布魯姆(Jesse Bloom)在網上發表一篇新論文中描述了上述測序數據刪除的情況。這篇尚未經過同行評審的論文稱,刪除的數據包括2020年1月至2月期間在中國武漢市收集的新冠肺炎住院患者疑似病例的病毒樣本中提取的病毒序列,現在已經透過谷歌雲端的資訊恢復了部份的基因序列資料。

紐約時報》也引述該論文分析稱,原始病毒的基因序列訊息支持早些時候的說法,即在2019年12月與生鮮市場有關的最初疫情暴發之前,有多種冠狀病毒已經在武漢傳播開來。病毒學家布盧姆的研究既未加強、亦未否定病毒是從武漢的著名實驗室泄漏出來的假設,它只證實一點:許多研究資料確實可以從網路上的某些不受人注意的地方重新恢復。

布魯姆在其論文中說,這些基因序列訊息被刪除的動機有點可疑,「刪除這些序列似乎是爲了掩蓋它們的存在」。他與一個向來敢於直言的科學家團體於5月發表公開信說,現在跟本沒有足夠的信息來確定新冠病毒是來自於與動物接觸,還是從實驗室泄漏出來。

報導說,布魯姆在審查各個研究小組公佈的基因數據時,看到了2020年3月的一項研究,其中包含武漢大學科學家收集的241個基因序列的信息。電子表格顯示,科學家們已經將這些序列上傳到一個名爲「序列讀取檔案」(Sequence Read Archive)的網路數據庫中,該數據庫由美國政府國家醫學圖書館(National Library of Medicine)管理