1月9日,深圳商報記者來到大鵬新區觀音山腳下,走進國家基因庫。在這里,機器人和研究人員一起工作,立體蔬菜庫有兩層樓高,工作區的墻上寫滿了華大集團董事長汪健的“奇思妙想”……
這只是表象。這艘“諾亞方舟”,承載著人類及其他生物的遺傳樣本和密碼——基因、蛋白、分子等生物信息數據,被儲存在超級計算機房里;人體腸道微生物、植物種子等生物資源樣本,藏在醫療級“冰箱”里;黑天鵝、梅花鹿、火烈鳥等生物活體,則在園區安家。
儲存基因保持物種“永存”
走進國家基因庫一層,“猛犸象”的塑像映入眼簾:它的身上印著“永存、永生”的字樣。據資料記載,最后一批猛犸象已于公元前1650年左右滅絕。工作人員介紹,全球范圍內,許多生物物種正在以前所未有的速度消失,基因技術也許是拯救瀕危生物的最后一絲希望,儲存基因是保持物種“永存、永生”的關鍵。
國家基因庫的三層到五層,分別是高通量基因測序房、數據機房以及冷凍資源房。這三個工作區域是國家基因庫核心功能運作的核心。
據工作人員描述,國家基因庫的核心功能可概括為“三庫兩平臺”。“三庫”分別是生物樣本資源庫、生物信息數據庫和生物活體庫。“兩平臺”則為數字化平臺(讀平臺)、合成與編輯平臺(寫平臺),具備對海量生物資源“存、讀、寫”的能力。
“存”指的是對基因、細胞乃至生命個體的實物存儲、生物信息的存儲、活體物種的保護與繁衍。據了解,樣本主要通過自主采集,與醫療機構和科研院合作收集、合作共享等方式獲取。2500萬份,這是工作人員給出的數字,也是最新的生物樣本資源庫實現的可溯源生物樣本儲存能力。
去年10月,華大主導的最大規模的中國人基因組學大數據研究成果,在《細胞》雜志上發表。華大生命科學研究院院長徐訊介紹,實驗過程中的計算和數據的存儲,主要依托國家基因庫的“三庫兩平臺”完成。記者了解到,這是高水平國際學術期刊首次認可,在其上發表基因組學文章所使用的數據僅保存于國內的國家基因庫,無需備份至境外數據庫。國家基因庫對我國生命科學研究和生物產業發展的重要性不言而喻。
這里藏著“基因界的谷歌”
“三庫兩平臺”離不開高通量基因測序儀、數據機房和冷凍資源房。在三層、四層、五層,記者隔著玻璃看到了它們的工作過程。
三層是基因測序的區域,目前已經裝備了150臺華大自主研發的桌面式測序儀BGISEQ-500、1臺華大去年10月發布超高通量測序儀MGISEQ-T7、9套集約式高通量測序儀和1臺超級測序儀Revolocity。
記者看到,基因測序區內只有幾位工作人員,相比之下更忙的是機械臂。工作人員介紹,人工提取DNA樣本后,經過處理裝載到芯片上,就可以放入測序儀進行測序了,機械臂可以代替人工裝載測序樣本。
目前,依托國產基因測序儀,數字化平臺的數據產出能力達10PB/年,相當于一年10萬人全基因組測序的產出規模。國家基因庫方面表示,數字化平臺的國產化對我國生物遺傳資源的安全性具有重要意義。
測序儀產生的數據,被存儲在四層的數據機房里,也就是前文所提到的生物信息數據庫。工作人員介紹,為了給科研工作者提供更好的生物大數據共享和應用服務,國家基因庫去年10月正式發布了生命大數據平臺CNGBdb。CNGBdb被描述為“基因界的谷歌”。它整合了全球四大國際基因庫的數據,覆蓋母嬰健康、腫瘤、動植物多樣性、病原微生物等十幾個研究領域的科研數據。科研人員可以從這個平臺免費獲取知識搜索、數據歸檔、計算分析、數據可視化、資源共享、管理授權等服務。
10萬人刷臉可查DNA檔案
市民有機會把自己的基因信息儲存在國家基因庫嗎?從基因庫工作人員處,記者得到了肯定答復。
去年6月,華大集團旗下的深圳華大法醫科技有限公司對外宣布,已為全國各地10萬余人建立DNA檔案,相關數據就存儲在國家基因庫的“DNA檔案數據庫”。
DNA檔案可以與新生兒出生證明綁定,成為一份終身不變的個人檔案,為預防兒童走失、棄嬰、尋找失蹤人口、災難身源鑒定等各項相關應用提供科學依據。市民登錄微信小程序“DNA檔案”,即可通過“人臉識別”查詢自己的DNA檔案。據了解,目前除了深圳等城市外,DNA檔案已經普惠國內9個地級市縣,包括河南長垣、西藏拉薩、陜西商洛、河北張北等,覆蓋人群超過百萬。
記者在采訪中了解到,目前國家基因庫二期建設已經啟動。國家基因庫方面表示,隨著基因科學技術的快速發展,精準醫療、全民大健康、新型農業等領域發展對生物大資源,大數據的迫切需求,二期基因庫需要對現有能力進行擴容,并加大技術研發,提升樣本及數據的存儲能力,提高存儲效力,節省空間降低耗能。
- 上一篇:世界首座“數字有機礦”落戶深圳
- 下一篇: “5G網絡4k傳輸”來了!今年的春