日前,中國(guó)科學(xué)院青島生物能源與過(guò)程研究所單細(xì)胞研究中心正式發(fā)布首個(gè)微生物組大數(shù)據(jù)搜索引擎——MSE(Microbiome Search Engine:http://mse.single-cell.cn),使得以整個(gè)微生物組為分析單元的智能搜索和大數(shù)據(jù)挖掘成為現(xiàn)實(shí)。

微生物組,又稱“菌群”。人體微生物組也被稱為每個(gè)人的“第二基因組”。一個(gè)“第二基因組”可由數(shù)百萬(wàn)個(gè)微生物基因組成,其數(shù)據(jù)量是一個(gè)人類基因組的成百上千倍。根據(jù)人類已經(jīng)積累的海量微生物組數(shù)據(jù),尋找“結(jié)構(gòu)”或“功能”類似的菌群樣本,從而實(shí)現(xiàn)對(duì)未知功能菌群的解讀和挖掘,以及對(duì)整個(gè)已知微生物組數(shù)據(jù)空間的全局性思考,一直是微生物組業(yè)界的關(guān)鍵瓶頸之一。對(duì)海量微生物組“大數(shù)據(jù)”的搜索、挖掘與機(jī)器學(xué)習(xí),能夠幫助人們了解微生物組與相關(guān)疾病之間的關(guān)系,從而利用人體各個(gè)部位的共生菌群實(shí)現(xiàn)個(gè)體化的精準(zhǔn)健康、精準(zhǔn)護(hù)理與精準(zhǔn)營(yíng)養(yǎng)。

MSE通過(guò)建立針對(duì)微生物群落的超高速比對(duì)算法和數(shù)字索引機(jī)制,為海量的樣本列出基于菌群結(jié)構(gòu)或功能相似性的“目錄”。當(dāng)輸入未知樣本時(shí),引擎能夠根據(jù)這一帶有菌群相似性信息的“目錄”從浩瀚的微生物組大數(shù)據(jù)海洋中迅速自動(dòng)選取與該樣本最為相似的匹配。

配合該搜索引擎,單細(xì)胞研究中心還發(fā)布了分析軟件Parallel-META3,可以將數(shù)量龐大的未知微生物組樣本進(jìn)行結(jié)構(gòu)與功能解析,可以與其數(shù)據(jù)庫(kù)搜索匹配結(jié)果進(jìn)行更深入的比對(duì)分析。(記者 王建高 通訊員 孔鳳茹)

全球微生物組大數(shù)據(jù)搜索引擎上線

圖文簡(jiǎn)介