科學家開發(fā)出基于拉曼組與機器學習的微藻種質(zhì)挖掘新技術(shù)

微藻是地球上代謝功能較為多樣化的生物類群,在全球碳循環(huán)中發(fā)揮關(guān)鍵作用,也是生物技術(shù)產(chǎn)業(yè)中重要的一類光合細胞工廠。但微藻的種質(zhì)鑒定和代謝功能檢測繁瑣,且自然界大部分微藻難以培養(yǎng)。近日,中國科學院青島能源研究所單細胞中心發(fā)表了首個微藻拉曼組數(shù)據(jù)庫,并結(jié)合機器學習示范了單細胞精度、快速的微藻種類鑒定和代謝功能表征。該技術(shù)為微藻細胞工廠的高效挖掘和篩選提供了一個免培養(yǎng)、高通量的強有力手段,相關(guān)研究成果發(fā)表在《分析化學》上。

  微藻是在自然界中廣泛存在的單細胞光合自養(yǎng)生物,可將空氣中的二氧化碳高效轉(zhuǎn)化為油脂、碳水化合物、蛋白質(zhì)和色素等高附加值產(chǎn)品,應(yīng)用于第三代生物燃料、飼料、食品和保健品等。因此,“微藻細胞工廠”有望成為服務(wù)“碳中和”和“碳達峰”的低碳制造解決方案之一。這一前景的前提和基礎(chǔ)是微藻種質(zhì)資源的快速鑒定和代謝功能檢測,然而,傳統(tǒng)上“先養(yǎng)后篩”的種質(zhì)篩選策略面臨著諸多瓶頸。

  為此,中科院青島能源所單細胞中心Mohammadhadi Heidari Baladehi等人開發(fā)出基于拉曼組的藻類細胞快速辨別與代謝功能快檢技術(shù)。拉曼組是一個細胞群體的單細胞拉曼光譜的總稱,代表著可以在單細胞精度快速、低成本、高通量獲取的細胞群體實時代謝狀態(tài)。首先,針對已獲純培養(yǎng)的藻種,研究人員采集了色素分子拉曼光譜(PS)和微藻細胞自身拉曼光譜(WS)這兩張譜圖,構(gòu)建了首個藻類拉曼組數(shù)據(jù)庫。該數(shù)據(jù)庫包含了在不同生長期(穩(wěn)定期和指數(shù)期)、分屬27個微藻種屬的超過9000個單細胞的拉曼光譜。該團隊開發(fā)的機器學習算法,通過PS和WS的聯(lián)用辨別待測單細胞的藻種和生長狀態(tài),準確率可達97%。其次,針對環(huán)境中難培養(yǎng)的藻類細胞,研究人員借助前期發(fā)明的單細胞拉曼分選技術(shù)來捕獲活性藻類單細胞,采集其PS和WS這兩張拉曼譜圖,進而結(jié)合下游單細胞測序,建立了環(huán)境中微藻單細胞代謝表型組和基因型的關(guān)聯(lián)。該方法不需分離培養(yǎng),即可構(gòu)建環(huán)境中任何微藻細胞的拉曼光譜數(shù)據(jù)庫,進而基于機器學習,支撐尚難培養(yǎng)藻種的快速鑒定和代謝功能檢測。此外,除了種質(zhì)辨別,單細胞拉曼光譜還能揭示微藻利用二氧化碳后的碳源存儲形式(如油脂、淀粉、蛋白、色素等),及其含量和化學性質(zhì)(如油脂的不飽和度等)。這些代謝表型信息,對于快速評估微藻種質(zhì)的培養(yǎng)工藝、經(jīng)濟價值和應(yīng)用潛力十分重要。

  與傳統(tǒng)上依賴于培養(yǎng)的“先養(yǎng)后篩”的策略不同,這一基于拉曼組的種質(zhì)篩選策略無需培養(yǎng)與擴繁細胞,節(jié)約了大量時間和人工,并能挖掘和篩選尚難培養(yǎng)的微藻細胞。針對每個微藻細胞,拉曼光譜的采集通常僅需數(shù)秒的時間,且無需破壞細胞,故而步驟簡潔、分析通量高、易于實現(xiàn)自動化,還能在單細胞精度同時探測從代謝表型組到基因組的全面信息。因此,該技術(shù)將加速微藻細胞工廠及其代謝產(chǎn)物的挖掘與利用。

  此次首個微藻拉曼組數(shù)據(jù)庫及其機器學習手段的發(fā)表,將加速新一代微藻資源信息平臺的構(gòu)建和共享,促進藻類為“雙碳行動”做出貢獻。研究工作得到科技部、國家自然科學基金委員會、中科院、山東能源研究院、青島海洋科學與技術(shù)試點國家實驗室等的支持。

  拉曼組機器學習加速微藻種質(zhì)挖掘、服務(wù)“雙碳行動”

  來源:中國科學院青島生物能源與過程研究所

 

Related Posts

Write a comment