科技日報記者 張夢然
美國麻省理工學院、密歇根大學和東北大學聯合團隊在最新《自然·方法》雜志上發表論文,介紹了一種名為“MultiCell”的幾何深度學習模型。該模型首次實現了在單細胞分辨率下,預測果蠅胚胎發育過程中,每個細胞在每分鐘的行為變化。未來可在此基礎上設計出通用的多細胞發育預測模型,構建“數字胚胎”,用于藥物篩選甚至指導人工組織設計。

一個胚胎如何從一團細胞變成有頭有尾、有器官的完整生命體,是發育生物學領域持續百年的核心謎題。雖然科學家早已知道細胞會分裂、移動、折疊,但具體到某一個細胞在下一分鐘會有什么動態行為,卻一直難以預測。
模型采用四維全胚胎數據進行訓練和測試,這些數據具有亞微米級分辨率和較高的幀率,每個胚胎包含約5000個被標注邊界和細胞核的細胞。在測試中,模型不僅能判斷細胞是否會發生特定行為,還能精確預測行為發生的時間是幾分鐘后。團隊將這一方法與“阿爾法折疊”預測的蛋白質結構相類比:阿爾法折疊是從氨基酸序列推斷蛋白質三維結構,“MultiCell”則是從細胞群落的幾何特征,預測多細胞系統的自組織過程。不過,由于胚胎發育是持續演變的動態過程,后者遠比前者復雜。
團隊將該方法應用于果蠅早期胚胎發育的關鍵階段——原腸胚形成。模型在3個胚胎視頻上訓練后,被用于預測第4個新胚胎的演化過程。結果顯示,模型在預測細胞連接丟失方面的準確率約90%;在預測細胞內陷、分裂或重排行為時,也表現了較高的準確率。
團隊表示,“MultiCell”是首個能在多細胞自組裝過程中,實現各類細胞行為單細胞精度預測的算法。鑒于其可捕捉細胞動力學上存在的微妙差異,未來將助力早期診斷或藥物篩選。
不過,該方法仍面臨一些問題,包括數據稀缺,以及當前模型僅基于幾何信息,未整合基因表達、蛋白質定位等。之后加入這些維度,有望更全面揭示物理與生物信息的互動。
總編輯圈點
預測單個細胞行為,其實也是解析整個生命體的第一步,在探索生命奧秘的道路上人類又取得了一大進展。科學家現在能高精確預測每個細胞在下一分鐘會做什么,而最令人興奮的地方則是其應用前景:臨床診斷中,醫生可能通過分析細胞行為的微小異常,在疾病癥狀出現前就作出早期預警;藥物研發領域,這種技術可以作為平臺來模擬藥物效果,大幅提升研發效率。更長遠看,它甚至可能助力人工組織設計和器官再生。