新聞網(wǎng)訊 近日,計(jì)算機(jī)科學(xué)技術(shù)學(xué)院蘇曉泉教授團(tuán)隊(duì)研發(fā)了第二代微生物組搜索引擎MSE 2(http://mse.ac.cn),以支撐更全面、更深入、更便捷的菌群大數(shù)據(jù)挖掘,推動“數(shù)據(jù)驅(qū)動型”的微生態(tài)研究和大健康產(chǎn)業(yè)應(yīng)用。該成果于1月20日發(fā)表于mSystems(美國微生物學(xué)會會刊,SCI IF=6.63)。
蘇曉泉教授團(tuán)隊(duì)在之前的研究中,采用基于大數(shù)據(jù)搜索的策略,從全球尺度上揭示了人類已知菌群在結(jié)構(gòu)空間上的全局特征,并首次提出了人體菌群的“搜索邊界效應(yīng)”(Su et al., mBio 2018)。同時,依托菌群大數(shù)據(jù)搜索的疾病檢測新策略,在一些菌群相關(guān)疾病的識別準(zhǔn)確率上均優(yōu)于常用的機(jī)器學(xué)習(xí)算法,從而有效降低了“漏診”和“誤診”幾率(Su et al., mSystems 2020)。此外,由于涵蓋了全面、多維、海量的微生物組及其生境信息,MSE 2已成為評估微生態(tài)健康、評價微生態(tài)產(chǎn)品療效的有力工具?;谄洳粩嗤卣沟膽?yīng)用,本次蘇曉泉教授團(tuán)隊(duì)研發(fā)的MSE 2將成為遨游微生物組數(shù)據(jù)空間的“羅盤”,推動“數(shù)據(jù)驅(qū)動型”的微生態(tài)研究和大健康產(chǎn)業(yè)應(yīng)用。
該研究論文由青島大學(xué)與中科院青島能源所、中科院文獻(xiàn)情報(bào)中心、中國海洋大學(xué)等科研機(jī)構(gòu)合作完成,計(jì)算機(jī)科學(xué)技術(shù)學(xué)院為第一單位,蘇曉泉教授為共同通訊作者。該項(xiàng)目獲得了國家自然科學(xué)基金、山東省自然科學(xué)基金的支持。
微生物組(即“菌群”)是微生物在自然界的存在形式,它們在自然界中無處不在,而且塑造了人類社會的過去、現(xiàn)在和未來。因此,微生物組“大數(shù)據(jù)”的深度挖掘,是利用菌群實(shí)現(xiàn)精準(zhǔn)診斷、精準(zhǔn)護(hù)理與精準(zhǔn)營養(yǎng)的重要工具,也是認(rèn)識生物資源、監(jiān)控環(huán)境健康、維護(hù)國家生物安全的新手段。
在海量的人類已知微生物組數(shù)據(jù)空間中,微生物組搜索引擎(Microbiome Search Engine;MSE)針對新的菌群樣本,以亞秒級別的反應(yīng)時間尋找結(jié)構(gòu)類似樣本,從而全面、快速地挖掘新樣本的特征。因此,MSE被譽(yù)為“the Google of Microbiome”,并入選“2016年中國醫(yī)藥生物技術(shù)十大進(jìn)展”。MSE 2從參照數(shù)據(jù)庫、搜索引擎內(nèi)核和用戶界面等三個方面做了全面升級。首先,相對于包含10萬例16S rRNA擴(kuò)增子測序樣本的第一代MSE數(shù)據(jù)庫,MSE 2中搜集、標(biāo)準(zhǔn)化分析和可視化了涵蓋16S rRNA擴(kuò)增子和鳥槍法宏基因組類型的近27萬個樣本,是國內(nèi)外生態(tài)系統(tǒng)覆蓋最全面、樣本數(shù)量最豐富的標(biāo)準(zhǔn)化微生物組數(shù)據(jù)庫之一。其次,MSE 2的搜索引擎內(nèi)核已完全兼容16S rRNA和鳥槍法兩種測序數(shù)據(jù),可從OTU(Operational Taxonomy Unit)、物種名稱以及功能特征等三個角度進(jìn)行大規(guī)模的菌群搜索和深度分析。這一能力對于多來源、多類型、兼容各種測序策略與技術(shù)的菌群數(shù)據(jù)融合具有重要意義。