陸基礎研究大突破 「美國人不再比中國人更瞭解中國人」

大陸基礎研究重大突破,從此美國人不再比中國人更瞭解中國人。圖爲「唐堯」課題組高佔成團隊。(大陸科技日報/受訪者提供)

大陸基礎研究重大突破,從此美國人不再比中國人更瞭解中國人。圖爲「唐堯」課題組康禹團隊。(大陸科技日報/受訪者提供)

大陸《科技日報》2 日報導,北京大學人民醫院教授高佔成團隊和中國科學院北京基因組研究所(國家生物資訊中心)研究員康禹團隊,利用山西省洪洞縣民何忠(化名)不到20毫升的血液樣本,完成世界首次從端粒到端粒的中國人全基因組,獲得包括Y染色體在內的高品質真實人類二倍體、以及完整無間隙的全基因組參考序列(44+XY)。中國工程院院士、哈爾濱醫科大學黨委書記張學評價,此爲中國乃至世界裡程碑式的事件成果。

因爲這個採樣點位於山西省臨汾市——幾千年前堯帝建立的古唐國遺址附近,研究團隊將該參考基因組命名爲「唐堯」。

《科技日報》報導,人類基因組圖譜早已公佈,如今普通人的基因組也很容易被測出來。爲何「唐堯」基因組會被評價爲里程碑式的事件,這一基礎研究領域的突破意味着什麼?

1、現有人類參考基因組用於中國人有偏差:這是一項由臨牀應用需求催生的基礎研究。

過去幾十年,北京大學人民醫院呼吸與危重症醫學科主任高佔成的主要工作是接診來自大陸各地的呼吸科疑難雜症患者。他帶領團隊首次診斷出多例孤兒肺病,如瀰漫性肺淋巴管瘤病、肺泡蛋白沉積症等。

諸多案例豐富了他的醫學實踐,但也給他帶來了診療困惑。不少疾病綜合徵在不同種族人羣中的臨牀表現存在不小的差異。

「目前所有的腫瘤、遺傳病等測序診斷報告,均根據美國主導的GRCh37/38爲人類參考基因組序列來判定正常或變異。」高佔成說,GRCh37/38是來自多個人類個體基因組序列嵌合而成的一套基因組,主要來源是非洲和歐洲人。它不但不完整、錯誤多,而且難以代表中國乃至亞裔族羣。

以遺傳性肺囊性纖維化爲例,這種病在歐美白人中表現爲跨膜氯離子轉錄因數突變導致的功能缺失。但在中國患者中,該轉錄因數突變的發生率要小得多。

「預測疾病風險和診療時,對於亞洲人種而言,僅對照現有參考組,可能會產生較大的偏差。」高佔成說,這種偏差還會影響靶向藥物的研發。

2003年,國際知名藥廠阿斯利康在全球率先研發成功表皮生長因數受體酪氨酸激酶抑制劑(EGFR-TKI)——吉非替尼,適用於存在表皮生長因數受體(EGFR)基因突變的非小細胞肺癌患者。

隨後的研究發現,EGFR基因突變存在明顯的種族特異性。中國和東亞種族不吸菸肺腺癌患者的突變率明顯高於歐美白人患者。

「目前的主流觀點認爲,不同人種基因組之間的差別只有千分之一。但從臨牀實踐來看,實際差別可能遠大於這個數字。」高佔成說,「所以,我們有必要構建中國人自己的參考基因組。」但對於一個臨牀醫生來說,這是個全新且較難攻克的課題。

2、爲中國人基因組研究提供更準確的座標系:何忠何許人?爲什麼何忠的基因組就可以稱爲參考基因組?

康禹說,選擇合適的樣本是第一步。悠久的歷史、多樣的地理氣候環境,塑造了中華民族獨特的遺傳多樣性。「唐堯」基因組是研究的起點,因此決定從人數最多的漢族開始。

「構建中國人自己的參考基因圖譜,目的是爲了更好地服務現代醫學應用,所以樣本需要更好地代表現代中國人的基因組特徵。」康禹說,最終他們確定的樣本來自一名現在生活在山西省洪洞縣一個古老村莊的健康男青年——何忠。

這個地區是明代洪洞移民,即歷史上有名的「大槐樹」移民的起點。600多年前的這場遷徙持續了近半個世紀,大量移民遍佈中國各地,有些進入東南亞。「我們認爲何忠的基因組有望成爲現代漢族人羣的代表。」高佔成說。

根據祖源分析,「唐堯」基因組的絕大部分爲東亞人羣特徵。「這個樣本的Y染色體的分型在中國除了新疆、西藏等地外都有廣泛分佈,極具代表性。」康禹說。

「唐堯」 基因組提示了中國人和歐洲人基因組水準的顯著差異。對照國際科學團隊「端粒到端粒(T2T)」聯盟(以下簡稱「T2T」聯盟)於2022年發佈的新版本人類參考基因組T2T-CHM13,「唐堯」顯示出11%差異序列和5%差異基因。

中國科學院院士陳潤生說,「唐堯」彌補了漢族高品質基因組的空白,完整的中國人基因組序列的發佈,也將改變以往認爲不同人種基因組之間只有千分之一區別的認知。

3、用兩年時間完成國際領先的品質標準:配置最先進的測序儀器和最精幹的研發人員,「唐堯」專案以最快速度啓動。僅用了不到兩年時間,2023年8月,項目組獲得何忠的完整無間隙高品質基因組序列。

4、避免「西方人比中國人更瞭解中國人」的尷尬:「這是中華民族羣體遺傳學研究的一個新起點。」中國科學院北京基因組研究所原副所長於軍說,「接下來,我們將推進其他有代表性的個體參考基因組測序,並開展不同民族等羣體的測序,最終我們希望能啓動全民基因組測序工程。」

專家認爲,中國要加快構建中國人自己的基因組研究「座標系」的步伐。

20多年前,在人類基因組計劃基礎上,美國正式提出全新的大科學計劃——精準醫學計劃。該計劃最終目標是測定每一個人的基因組,也稱爲「全民基因組計劃(All of Us研究計劃)」。2022年,該計劃研究專案公佈了第一批近10萬人的全基因組測序數據供研究人員使用。數據包括身高、體重和血壓等基礎資料和調查資料,例如關於參與者的人口統計資料、生活方式和總體健康狀況的資料。

高佔成說,一旦美國的全民基因組計劃完成包括500萬美籍華人在內基因組測序,完全有可能形成「別人比我們自己更瞭解中國人基因組」的局面。

近年來,國際科學家聯合成立了人類泛基因組聯盟(HPRC),試圖建立更精準完整的世界主要人羣的參考基因組,瞭解世界人口的多樣性。去年5月,HPRC製作的首個人類泛基因組參考草圖在《自然》發佈,納入了全球47個樣本,其中包括3例中國南方漢族樣本。

張學關注到一個現象:基因組領域最主要的兩個國際聯盟——國際人類泛基因組聯盟、國際T2T基因組聯盟,其中的重要成員都是來自歐美的大學和研究所,中國研究機構和實體並不在內。

「這種形勢下,建立中國人自有的高品質參考基因組是防止被『卡脖子』的關鍵一步。」張學說。

「接下來我們將對『唐堯』進行進一步的解析和註釋,讓它能更好地應用於臨牀。」康禹說,我們希望基於自己的參考基因組發展出服務華人的靶向測序、基因組分析和診療技術,並推動未來的新藥研發。

5、亟待構建中國人自己的基因組技術體系:受訪專家預計,T2T-CHM13以其完整性和高品質,有望逐漸取代目前正在使用的GRCh38參考基因組。

陳潤生和中國檢驗檢疫科學院體外診斷試劑所副所長黃傑均建議,在新舊參考基因組交接之際,中國應建立國家標準,推廣使用「唐堯」作爲中國人羣基因組研究和臨牀應用中測序和分析的標準物質和參考基因組,不再使用歐洲人的參考基因組來定義中國人的遺傳變異。同時,在此基礎上建立中國人基因組學知識框架和應用技術體系。

于軍等科學家認爲,要實現上述目標,中國人類基因組研究亟待進一步加強頂層設計和規劃。「由誰來測,給誰用,資料安全如何保障,這些問題都需要系統研究。」