• 儀器無(wú)憂網(wǎng)首頁(yè)

軟銀投巨資的機(jī)器人完勝人類(lèi)科學(xué)家400倍,人工智能有望全面接管生物實(shí)驗(yàn)室

瀏覽次數(shù):2659
時(shí)間:2017-07-21 10:44

2016 年 10 月,日本軟銀(SoftBank)領(lǐng)銜多家頂級(jí)風(fēng)投,向一家當(dāng)時(shí)還名不見(jiàn)經(jīng)傳的初創(chuàng)公司 Zymergen 投資總計(jì) 1.3 億美元。在此 B 輪融資完成后,美國(guó)前任能源部長(zhǎng)、諾獎(jiǎng)得主朱棣文也加入了 Zymergen 董事會(huì)。

簡(jiǎn)單而言,Zymergen 是一家專(zhuān)注于合成生物學(xué)的美國(guó)初創(chuàng)公司,主要開(kāi)發(fā)用于工業(yè)發(fā)酵的基因工程細(xì)菌,并結(jié)合機(jī)器學(xué)習(xí),進(jìn)行自動(dòng)化分析和生物信息學(xué)處理。昨日,《Science》網(wǎng)站刊文首次披露這家神秘公司的創(chuàng)業(yè)野心以及背后的一些技術(shù)細(xì)節(jié)。

合成生物學(xué)雖然叫“生物學(xué)”,其實(shí)卻與工程學(xué)理念更為接近。相比機(jī)械零件、電路元件等傳統(tǒng)工程學(xué)科,合成生物學(xué)擺弄的生物零件更復(fù)雜、更多變。研究者通過(guò)調(diào)控相關(guān)基因通路對(duì)細(xì)胞進(jìn)行“編程”,讓它們像微型工廠或機(jī)器一樣,生產(chǎn)特定產(chǎn)品或完成特殊任務(wù)。

傳統(tǒng)的生物學(xué)操作方式是:提供一些有限數(shù)量的假設(shè),由人類(lèi)科學(xué)家在實(shí)驗(yàn)室里每個(gè)月進(jìn)行 10 次測(cè)試,但現(xiàn)在有一種機(jī)器人每周可執(zhí)行多達(dá) 1000 次實(shí)驗(yàn),這相當(dāng)于將效率提升了400倍。但這些機(jī)器人只能服從命令,這意味著輸入正確的命令是這一過(guò)程中真正的瓶頸。

這些機(jī)器人屬于 Zymergen 公司,這是一家專(zhuān)注于合成生物學(xué)的公司。2014年,這家公司搬進(jìn)了一個(gè)位于加州舊金山灣區(qū)的廢舊電子工廠。

在一大堆設(shè)備中,有一個(gè)名叫 Echo 的機(jī)械臂,它正抓起一個(gè)有著上百個(gè)裝滿液體的方格的塑料盒。在將塑料盒放入托盤(pán)前,Echo會(huì)對(duì)其條形碼進(jìn)行掃描,接下來(lái)會(huì)發(fā)生的事情,就不是人眼能看得見(jiàn)的了。

圖丨由AI控制的機(jī)械臂正在對(duì)微生物菌群進(jìn)行液移

Zymergen公司的聯(lián)合創(chuàng)始人、分子生物學(xué)家、運(yùn)營(yíng)和工程副總裁Jed Dean說(shuō):“這個(gè)過(guò)程并不是手工進(jìn)行移液的簡(jiǎn)單復(fù)制,而是一種完全不同的方式?!?/span>

機(jī)器人并不是使用傳統(tǒng)的移液管吸取液體后再轉(zhuǎn)移到每個(gè)方格中,而是使用每秒 500 次的聲波脈沖,讓液體震動(dòng)并形成小液滴,這些液滴要比每次人工移液的量小數(shù)千倍。所以,機(jī)器人并不會(huì)直接接觸液體。

實(shí)際上,整個(gè)流程中并沒(méi)有太多未來(lái)元素,稍微有點(diǎn)規(guī)模的生物實(shí)驗(yàn)室中都在使用機(jī)器人和條形碼系統(tǒng)。哪怕是上文提到的移液技術(shù),這種稱(chēng)為“聲波液移技術(shù)”(Acoustic Droplet Ejection)其實(shí)也已經(jīng)存在十多年了。

圖丨聲波液移技術(shù)可在非物理接觸情況下,實(shí)現(xiàn)微量液體的精準(zhǔn)提取

然而,有意思的是,當(dāng)Jed Dean被問(wèn)到現(xiàn)在這些機(jī)器人在做什么實(shí)驗(yàn)時(shí),他居然理直氣壯的回答道:“我不知道?!?/span>

的確,整套實(shí)驗(yàn)流程都由計(jì)算機(jī)程序自行設(shè)定及操作,如果想要知道實(shí)驗(yàn)相關(guān)信息,只需要去電腦屏幕上看一眼就行了,何必要時(shí)時(shí)刻刻記在腦子里呢?

Zymergen公司的首席執(zhí)行官Joshua Hoffman說(shuō):“整個(gè)實(shí)驗(yàn)過(guò)程中只有一名人類(lèi)科學(xué)家參與,負(fù)責(zé)實(shí)驗(yàn)結(jié)果分析和事實(shí)檢查?!钡庾x實(shí)驗(yàn)數(shù)據(jù)、生成假設(shè)、規(guī)劃實(shí)驗(yàn)這類(lèi)工作,Zymergen的終極目標(biāo)將是“去除一切人類(lèi)直覺(jué)的干擾”,實(shí)現(xiàn)科學(xué)實(shí)驗(yàn)的全過(guò)程人工智能。

圖丨Zymergen公司的首席執(zhí)行官Joshua Hoffman

Zymergen的做法代表了生物技術(shù)公司的一種趨勢(shì):利用人工智能來(lái)增強(qiáng)、甚至取代人類(lèi)在科學(xué)研究中的作用,即實(shí)現(xiàn)“AI驅(qū)動(dòng)的生物技術(shù)”

從宏觀上看,就像工廠里的生產(chǎn)流水線一樣,科學(xué)發(fā)現(xiàn)也是一個(gè)循序漸進(jìn)的過(guò)程:科學(xué)家們發(fā)表論文,然后指導(dǎo)在實(shí)驗(yàn)室中完成實(shí)驗(yàn),進(jìn)而得到全新的發(fā)現(xiàn),最終又會(huì)以科學(xué)論文的形式呈現(xiàn)出來(lái)。這是一個(gè)標(biāo)準(zhǔn)的周期,就連當(dāng)今最典型的人工智能以自動(dòng)化的優(yōu)勢(shì)代替人力勞動(dòng)也是遵循這個(gè)路線:

圖丨“AI驅(qū)動(dòng)的生物技術(shù)”流程圖

作為上述“AI驅(qū)動(dòng)的生物技術(shù)”中的重要環(huán)節(jié),Zymergen所做的工作就是為生物燃料、塑料、藥品等提供工業(yè)化的微生物配方。為了提高微生物的生產(chǎn)效率,客戶們往往會(huì)將主力菌種直接送到Zymergen,然后由那里的機(jī)器人對(duì)每種微生物的基因進(jìn)行分析和修補(bǔ),從而得到一個(gè)高效版本的的工程微生物。

但問(wèn)題是,那些被客戶送到Zymergen的微生物已經(jīng)是高度優(yōu)化過(guò)的。所以說(shuō),如果要在這個(gè)基礎(chǔ)上進(jìn)一步提高效率,就只能進(jìn)行更深層次的基因組研究、設(shè)計(jì)實(shí)驗(yàn)、分析數(shù)據(jù)。換句話說(shuō),越是要壓榨出最后那點(diǎn)效率提升,越是要求更先進(jìn)的技術(shù)手段。

圖丨Zymergen的實(shí)驗(yàn)流程基本實(shí)現(xiàn)了完全自動(dòng)化

那么,究竟怎樣用算法來(lái)設(shè)計(jì)實(shí)驗(yàn)?一個(gè)原始微生物約有 5000 個(gè)基因,假設(shè)有10種可以改變給定的基因的方法,那么就有了 5 萬(wàn)種不同的組合。然后,可以用1000個(gè)菌株進(jìn)行實(shí)驗(yàn),每一個(gè)菌株都有可能突變,也許 25 個(gè)菌株就會(huì)產(chǎn)生足夠的目標(biāo)化學(xué)品。這樣的菌株就可以用于下一輪實(shí)驗(yàn)育種,其余的菌株則放入冷凍室。

實(shí)際上,只是盲目地提高效率并不會(huì)帶來(lái)科學(xué)發(fā)現(xiàn)上的重大進(jìn)展。因?yàn)槿绻阉械耐蛔兌冀M合成一個(gè)單一的微生物,往往不能達(dá)到“1+1>2”的效果,很有可能顧此失彼——微生物反而因此呈現(xiàn)出“病態(tài)”,這類(lèi)病態(tài)菌株可能還不如先前未經(jīng)改造的原始菌株。

因此,要選出正確的路徑,這就需要一張“地圖”。這張“地圖”可以顯示所有突變?cè)斐傻挠绊懀疫€是基于多個(gè)維度的,因?yàn)槿祟?lèi)需要為機(jī)器學(xué)習(xí)設(shè)定一個(gè)方向。

舉例而言,在合成生物學(xué)中,一條代謝通路通常擁有十幾或幾十個(gè)基因表達(dá)產(chǎn)物——有些對(duì)生產(chǎn)率的改善微不足道,有些卻舉足輕重,而代謝通路之間也經(jīng)常存在交流,互相調(diào)節(jié)。想要成功制造一個(gè)工程細(xì)菌,一般要經(jīng)過(guò)成百上千次的實(shí)驗(yàn)試錯(cuò),才能一步步逼近正確答案。

在分子生物學(xué)中所提到的“代謝通路”(metabolic pathway),通常是指某個(gè)或某幾個(gè)基因表達(dá)所涉及的全部酶或信號(hào)分子。細(xì)胞內(nèi)這些不同代謝通路組成了代謝網(wǎng)絡(luò),令生物保持其內(nèi)環(huán)境穩(wěn)定。

然而,Zymergen的模式卻完全不同,他們專(zhuān)門(mén)為此開(kāi)發(fā)了一套機(jī)器學(xué)習(xí)系統(tǒng),讓人工智能技術(shù)從浩如煙海的實(shí)驗(yàn)數(shù)據(jù)中進(jìn)行分析,指出代謝通路的要害,并根據(jù)需求找出相應(yīng)的、能實(shí)現(xiàn)特定功能的基因表達(dá),把這個(gè)表達(dá)寫(xiě)入微生物中,最后生產(chǎn)出所需的微生物,從而避免了繁雜的試錯(cuò)過(guò)程。

圖丨迷宮——細(xì)胞的代謝通路匯總

但是,這里有個(gè)尷尬的問(wèn)題:當(dāng)機(jī)器人終于發(fā)現(xiàn)那些能提高產(chǎn)量的遺傳變化時(shí),它們對(duì)背后具體的生物化學(xué)機(jī)制一無(wú)所知。

如果實(shí)驗(yàn)不能加深我們對(duì)生物學(xué)原理的理解,那這真的能稱(chēng)為“科學(xué)”么?對(duì)于 Zymergen 的首席技術(shù)官 Aaron Kimball 來(lái)說(shuō),這個(gè)哲學(xué)觀點(diǎn)可能并不那么重要,而且他的解釋也相當(dāng)直接:“能給我們帶來(lái)收入的是最終結(jié)果,而不是我們是否明白其中的原理。”

到目前為止,Zymergen公司的機(jī)器人實(shí)驗(yàn)室將化學(xué)生產(chǎn)微生物的效率提高了10%以上。這個(gè)數(shù)字看起來(lái)并不起眼,但要知道,化學(xué)工業(yè)中有一些部門(mén)十分依賴微生物發(fā)酵,一點(diǎn)小的技術(shù)改進(jìn)都有可能節(jié)省大量的成本、帶來(lái)更多的收益,甚至?xí)^(guò)美國(guó)國(guó)家科學(xué)基金會(huì) 70 億美元的年度預(yù)算。

機(jī)器人也許會(huì)發(fā)現(xiàn)那些被科學(xué)家忽略了的有益遺傳變化,因?yàn)榇蠖鄶?shù)能提高生產(chǎn)率的基因與人類(lèi)所能預(yù)見(jiàn)的產(chǎn)物沒(méi)有直接關(guān)系。如果沒(méi)有正確的組合,一些基因可能根本無(wú)法表達(dá)。 Jed Dean說(shuō):“我已經(jīng)在幾種不同的微生物中看到了這種模式。如果不使用機(jī)器學(xué)習(xí),尋找正確的基因組合就像試圖破解極其復(fù)雜的密碼,人類(lèi)的直覺(jué)和信心很容易被問(wèn)題的復(fù)雜性所壓倒?!?/span>

科學(xué)研究能在多大程度上交給機(jī)器來(lái)完成,不同領(lǐng)域的研究人員會(huì)有不同的答案。加州大學(xué)戴維斯分校計(jì)算機(jī)科學(xué)家Ilias Tagkopoulos認(rèn)為:“為了最大限度地提高信息收益,為了更接近目標(biāo),我們應(yīng)該讓數(shù)據(jù)決定實(shí)驗(yàn)步驟?!边@位教授的研究領(lǐng)域是遺傳學(xué),在他看起來(lái)永無(wú)止境的研究課題里,包括了預(yù)測(cè)細(xì)菌如何適應(yīng)不斷變化的醫(yī)院環(huán)境、設(shè)計(jì)出更健康的零食等諸多問(wèn)題。

如果機(jī)器真的能夠在某些科研任務(wù)中取代部分人類(lèi)勞動(dòng),想必很多科學(xué)家都會(huì)欣然接受。與工廠工人或出租車(chē)司機(jī)不同,大多數(shù)研究科學(xué)家都希望將部分工作自動(dòng)化,特別是分子和細(xì)胞生物學(xué),其中人工移液、培養(yǎng)細(xì)胞、菌落數(shù)量統(tǒng)計(jì)等繁瑣且高成本的環(huán)節(jié)尤其如此。

一名研究生的小失誤可能會(huì)浪費(fèi)數(shù)周的辛苦工作。更糟糕的是,為研究生設(shè)計(jì)實(shí)驗(yàn)的那位博士數(shù)月的努力可能也付諸東流了。

圖丨高效運(yùn)行中的Zymergen自動(dòng)化設(shè)備

然而,人工智能為生物技術(shù)領(lǐng)域帶來(lái)的也不全是驚喜。在嘗試?yán)肁I技術(shù)解讀數(shù)據(jù)和設(shè)計(jì)實(shí)驗(yàn)之后,也有一些生物學(xué)家表示失望。

斯坦福大學(xué)計(jì)算生物化學(xué)家Rhiju Das的主要工作是研究分子如何折疊以設(shè)計(jì)新藥。他表示,目前的機(jī)器學(xué)習(xí)方法仍然無(wú)法完成相應(yīng)任務(wù)。與人類(lèi)科學(xué)家相比,AI在RNA設(shè)計(jì)問(wèn)題上的表現(xiàn)非常糟糕,這些“設(shè)計(jì)”任務(wù)似乎還是需要人類(lèi)的直覺(jué)。

圖丨Zymergen公司的自動(dòng)化設(shè)備

此外,人工智能的“黑盒子”問(wèn)題在生物技術(shù)領(lǐng)域似乎表現(xiàn)得更為突出,由 AI 控制的研究工作所取得成果將缺乏可解釋性。

對(duì)此,卡內(nèi)基·梅隆大學(xué)的計(jì)算機(jī)科學(xué)家Adrien Treuille提出了一個(gè)有趣的觀點(diǎn):我們正在離“可解釋的”科學(xué)時(shí)代越來(lái)越遠(yuǎn)。研究人員不僅要依靠計(jì)算機(jī)來(lái)從事科研,而且甚至需要計(jì)算機(jī)去解釋其中的原理。生物學(xué)如此復(fù)雜,而目前的AI技術(shù)又處于起步階段,把一切都交給計(jì)算機(jī),人類(lèi)真的能放心嗎?


上一篇:離心機(jī)產(chǎn)品種類(lèi)繁多 用戶不容忽視兩個(gè)挑選因素

下一篇:高速激光共聚焦拉曼光譜成像儀名列2018重大儀器專(zhuān)項(xiàng)