深圳市大鵬新區(qū)大鵬街道下沙片區(qū)禾塘仔,這里依山傍海,環(huán)境優(yōu)美,背山面海的幾棟白色的建筑并不起眼,但令人難以置信的是,龐大的數(shù)據(jù)如同螺旋一般,每天從這里源源不斷地涌出。這些白色的梯田造型的建筑就是中國首個獲批籌建的國家基因庫,也是目前全球最大的綜合性基因庫。
  國家基因庫項目一期占地面積4.75萬平方米,擁有基因測序房、超級計算房以及冷凍資源房,相較于其龐大的建筑規(guī)模,它豐富的內(nèi)容更是令人瞠目結(jié)舌:國家基因庫目前已存儲多種生物資源樣本1000萬份,可檢索生物信息條目數(shù)已經(jīng)超過一個億,我國更是計劃把它打造成為中國的諾亞方舟,建立一個巨大的生物活體庫,保護和保存世界約三十萬種植物、百萬種動物、近千萬種微生物活體資源。如此大手筆、高規(guī)格的項目究竟什么來頭?建立國家基因庫的意義何在?下面就讓我們一起走進關(guān)于國家基因庫的專業(yè)解讀。


圖1 位于深圳市大鵬新區(qū)的國家基因庫一期項目

“干”“濕”“活”三位一體
  在我國建立基因庫之前,美國、歐洲和日本就已經(jīng)建立了大型基因數(shù)據(jù)庫,而且這三大庫里的生物信息數(shù)據(jù)幾乎涵蓋所有已知的脫氧核糖核酸、核糖核酸和蛋白質(zhì)數(shù)據(jù)。中國國家基因庫與這三大庫的不同就在于,它不僅僅是數(shù)據(jù)庫,而是國際上現(xiàn)有的各類生物樣本庫、數(shù)據(jù)庫、生物多樣性庫、疾病庫等的綜合升級版。除了所謂的“干庫”,——基因、蛋白、分子、影像等多組學生物信息數(shù)據(jù)庫,和“濕庫”——多樣性生物樣本和物種遺傳資源庫之外,中國的國家基因庫還引入了“活庫”,也就是生物活體庫,將存儲的內(nèi)容擴展到動物資源、植物資源、微生物資源和海洋資源。同時,該基因庫不僅面向科研,還面向推動中國精準醫(yī)學、精準農(nóng)業(yè)的發(fā)展,利用對基因信息的掌控推動產(chǎn)業(yè)的發(fā)展。


圖2 國家基因庫中的生物信息數(shù)據(jù)庫

基因的“國庫”
  2011年,國家發(fā)改委等4部委批復同意深圳依托華大基因研究院組建國家基因庫,今年9月,國家基因庫正式投入運營,這是中國首個獲批籌建的國家基因庫,同時也是目前為止的唯一一個。
  國家基因庫有“超測”、“超算”、“超存”的能力:其中,人類資源方面基因庫主要保存血液樣本、組織樣本、細胞系、細胞和尿液等,將為重大疾病的前瞻性研究提供樣本資源支撐,為疾病診斷與預測及個性化醫(yī)療等奠定基礎(chǔ)。在動物資源方面,基因庫主要保存珍稀動物及具有重要經(jīng)濟價值的動物組織、細胞等。此外,國家基因庫除了存儲人類資源、動物資源以外,還存儲植物資源、海洋資源和微生物資源。這些都可以為日后的研究工作收集大量的信息。這個建設(shè)中的基因“國庫”,數(shù)據(jù)規(guī)模到底有多大?打個形象化的比方,目前深圳國家基因庫已建成20 Pb數(shù)據(jù)的可訪問能力,以一部電影約500Mb計算,20Pb相當于四千萬部電影,一個人一天看一部電影,至少需要10萬年才能看完。
存儲健康的“生命銀行”
  2015年1月,美國總統(tǒng)奧巴馬在國情咨文演講中談到“人類基因組計劃”所取得的成果,并宣布新的項目——— 精準醫(yī)療計劃。更有專家表示,精準醫(yī)療計劃在時間上是承接人類基因組計劃,在本質(zhì)上是對現(xiàn)行的以藥物治療為主體的醫(yī)療進行改革。科學家們認為,絕大多數(shù)的疾病都可以通過基因測序得以提前防范和管理。那么,基因測序究竟如何“鎖定”疾病?以一個形象化的比喻來解釋,一個D N A的正常表達可以理解為一段文字,如果該文字中出現(xiàn)一個錯別字,可能就失去其正確意義。測序就是要與正常序列比對,找出哪個細胞哪里出錯。通過測序結(jié)果,分析基因突變的部分,就能夠找到某個疾病對應(yīng)的基因,方便對癥下藥。事實上,每個人一生中所有關(guān)鍵階段的標本都應(yīng)該永久保存起來:比如出生時的干細胞,20歲時的免疫細胞,30歲時的生殖細胞等等……而國家基因庫,就是儲存這些樣本和數(shù)據(jù)的地方,它就像是人類的“生命銀行”一般。通過有意識地存儲自己的健康數(shù)據(jù),讓人們對自己身體變化狀況了如指掌,并且根據(jù)這些數(shù)據(jù)設(shè)計自己的飲食、運動和生活節(jié)奏,“對抗”衰老。
  深圳國家基因庫建成后,這個巨型“生命銀行”將為中國生命科學研究和生物產(chǎn)業(yè)發(fā)展提供基礎(chǔ)性和支撐性服務(wù)平臺,儲存和管理中國特有的遺傳資源、生物信息和基因數(shù)據(jù)。同時,以生物資源為依托,形成從資源到科研到產(chǎn)業(yè)的全貫穿、全覆蓋模式,實現(xiàn)大資源、大數(shù)據(jù)、大科學、大產(chǎn)業(yè)的整合與應(yīng)用。


圖3 國家基因庫的工作人員將細胞樣品放入液氮中保存

  在農(nóng)業(yè)時代,一個國家擁有的耕地越多優(yōu)勢越大;在工業(yè)時代,擁有的石油、礦產(chǎn)等能源越多優(yōu)勢越大;而在生命時代,擁有更多基因資源同時能對基因資源進行認知和利用,則意味著更大的優(yōu)勢。國家基因庫的成立,正在為我國積累全新的優(yōu)勢。目前,國家基因庫已與聯(lián)合國糧食及農(nóng)業(yè)組織、國際農(nóng)業(yè)研究磋商小組、國際生物及環(huán)境樣本庫協(xié)會、挪威斯瓦爾巴全球種子庫、美國自然歷史博物館等100多個組織和科研機構(gòu)建立戰(zhàn)略合作關(guān)系,將在人類健康、生物多樣性、生物進化機制等方面開展合作研究。

國家基因庫:存儲健康的生命銀行

圖文簡介

2011年,國家發(fā)改委等4部委批復同意深圳依托華大基因研究院組建國家基因......