創新工場和BCG諮詢合作的「+AI改造者」系列:創新工場投資的Insilico Medicine,看AI新藥研發平臺如何賦能傳統藥企,一起進行“AI+生命科學”的顛覆式創新!
改造者系列:AI醫藥的下一站是長壽 -- 本文来自BCG微信公眾號,經授權轉載。
近期,創新工場聯合BCG波士頓咨詢旗下亨德森智庫,推出「AI融合產業:『改造者』如何促進AI普惠」系列研究。人工智能在中國大陸有著明確的落地應用場景,大量的AI企業活躍於這些垂直場景中,我們定義這些企業為「改造者」。「改造者」通過傳授其AI技術和垂直行業理解,極大地打破了傳統企業應用AI的瓶頸。
作為擅於趨勢前瞻的TechVC,創新工場長期看好AI領域,深入佈局,至今已經投出了7只AI獨角獸。在系列研究中,我們采訪了數家創新系AI企業,通過這些「改造者」的視角,探究傳統企業擁抱AI的範式與路徑。
創新工場投資的英矽智能(Insilico Medicine)是一家由人工智能驅動的全球領先生物技術公司,通過發明和迭代人工智能藥物研發平臺,變革創新藥物和療法的發現方式。
英矽智能的AI藥物研發平臺已經證明了自己的能力:在今年2月和8月,半年的時間內,先後公佈了兩種臨床前候選藥物,分別用於治療特發性肺纖維化和腎臟纖維化。
在采訪中,英矽智能創始人兼首席執行官Alex Zhavoronkov博士表示,AI醫藥企業的下一個重要問題將是如何更好地理解生物學和跨物種生物學,長壽業或者抗衰老技術將會是未來的方向。以下:
■系列導讀
本系列由BCG亨德森智庫與創新工場董事長兼首席執行官李開復博士帶領的創新工場團隊共同推出,圍繞「AI融合產業:『改造者』1如何促進AI普惠」的課題,我們致力於探究傳統企業在應用AI過程中的關鍵要素與合作夥伴,以及傳統企業擁抱AI的範式與路徑。
AI製藥領域於2014年左右興起,在2018—2020年間全面爆發。AI能夠快速識別大量樣本中的客觀規律,加速尋找和測試潛在靶點的過程。「有了AI,我們50個人可以做到的事情,比得上一個典型的製藥公司5000人所做的事情」,英矽智能創始人Alex Zhavoronkov在「未來呼嘯而來」一書中如是分享。2
1 「改造者」 通過傳授其AI技術和垂直行業理解,極大地打破了傳統企業應用AI的瓶頸,充當產業中傳統企業應用AI的橋樑。「改造者」包括AI企業與成功轉型AI的傳統企業。
2「未來呼嘯而來」,彼得·戴曼迪斯(Peter H.Diamandis)和史蒂芬·科特勒(Steven Kotler)著。
■本期受訪嘉賓:Alex Zhavoronkov
英矽智能(Insilico Medicine)是一家由人工智能驅動的全球領先生物技術公司,通過發明和迭代人工智能藥物研發平臺,變革創新藥物和療法的發現方式,加速研發進程,為癌症、纖維化、抗感染、免疫和抗衰老等未被滿足的臨床治療需求提供創新的藥物和療法方案。
Alex Zhavoronkov是英矽智能的創始人兼首席執行官。他擁有皇后大學學士學位,約翰·霍普金斯大學生物技術碩士學位,以及莫斯科國立大學物理和數學博士學位。
■對談實錄
Q1 英矽智能原來在美國創立,後來為什麼選擇遷至中國?
Alex:中國構建了一套完善的體系和土壤,吸引創業企業、大型企業紛紛入駐。中國大陸多樣化的投資者,包括傳統藥企、科技巨頭、PE/VC等各類投資者,能將最優質的AI人才、CRO、藥企融合在一起。投資者能為初創企業提供資質牌照、幫助招聘、企業管理和宣傳等等。英矽還與許多學校開展了合作研究,擁有豐富的內部研發管線。中國完整的生態夥伴體系使得像我們這樣的企業能夠迅速擴大研發規模,甚至與大藥廠競爭。
Q2 英矽智能和輝瑞、安斯泰來、楊森製藥等諸多藥企都有合作,在和大型藥企合作的過程中有什麼心得或者經驗?
Alex:創新型的AI生物技術公司按照創立時間可以分為三大類:2014年之前成立、2014年—2015年左右成立、最近5年成立。2014年之前成立的企業通常不運用深度學習(deep learning),或者不具備向藥企提供解決方案所需的行業知識。2014—2015年間成立的企業則創立的正是時候,生成式對抗網絡(Generative Adversarial Network)出現,AI製藥開始興起。同時,許多藥企缺乏AI的專業知識和AI團隊,如果想要獲取AI方面的知識和技能,就必須與初創企業合作。作為交換,那時候的藥企也通常願意向初創企業提供資料和各類資源。英矽智能很幸運,創立時間(2014)正處於大藥企對外部合作最為開放和寬鬆的時期。而最近幾年成立的企業就沒那麼幸運了,很多藥企已經開始自建AI團隊、自研AI應用,只有具備非常特定細分領域AI技術的初創企業才有可能成功撬動藥企,與之建立合作。
然而據我的觀察,儘管許多大藥企都建有自己的AI部門和數據科學家團隊,但他們並沒有足夠強的AI能力——他們往往缺乏具備足夠AI知識的團隊。以生物醫藥方面的論文發表為例,在2014—2019年間,英矽智能發佈了上百篇AI相關的論文,然而發表AI論文數量最多的藥企阿斯利康則只有65篇,位列其次的諾華有54篇。
藥企往往也不知道從何處開始應用AI,而這正是AI初創公司能夠創造價值的地方。但是,在AI初創公司開始接觸藥企和銷售方案之前,首先要充分理解大型藥企錯綜複雜的組織架構和部門分工,針對不同部門銷售定制化的模塊,而非從一開始就銷售整體性、綜合性的解決方案。這是因為藥企內部通常很難有一個部門能夠處理所有的模塊,部門之間的協同往往沒有那麼強。因此,AI初創公司在提供解決方案的時候也要靈活地劃分模塊,對症下藥,英矽智能通常一次只銷售一個模塊。
儘管銷售是模塊化的,AI初創公司需要具備端到端、全鏈路的解決方案。英矽根據不同的研發週期,設計了三大AI平臺——新藥靶點發現平臺、分子生成和設計平臺、臨床試驗預測平臺。據我們瞭解,中國還沒有任何一家同行,同時擁有生成生物學和生成化學兩大AI平臺,能把靶點發現和小分子化合物生成有機結合在一起的公司很少。此外,英矽智能的AI系統可以用軟件形式呈現,藥企可以自行操作,用自己的數據運算測試。這些都為我們創造了差異化的優勢。
最後,對於藥企而言,如果想要應用綜合的AI解決方案,需要有整體性的戰略為引領。咨詢公司可以充當整合各部門組織、統籌整體戰略的角色,AI企業可以選擇與之合作。
Q3 在您看來,未來AI醫藥領域的發展趨勢是什麼?
Alex:在未來,最重要的不是AI技術,而是如何將AI和行業特定的實驗數據或模型結合。現在市場上已經充滿了各種各樣的技術企業,他們在不斷精進演算法模型和數據。未來的競技不會是關乎演算法或者算力,而是新的商業模式或者應用AI的新方式。
AI初創公司需要積累足夠的行業專識,理解藥企的需求,學習藥企的經驗,並向藥企證明自己提供的模塊能夠在真實的商業環境下應用,並且模塊之間能夠很好地兼容,能融入業務流程,且符合監管要求。比如機器學習加速了藥物識別,但還有很多步驟和流程並不能被加速或跨越:實驗論文不能被跨越,你依然需要向藥物監管部門提供大量實驗數據和模型來證明研究的有效性;實驗中的生物過程不能被加速,你依然需要等待生物體自然的新陳代謝和細胞活動,你也不可能直接從大鼠實驗跨越到人類實驗。而這些都涉及到更細分的新技術問題。
所以,對於AI醫藥企業而言,下一個重要的問題將是如何能夠更好地理解生物學?如何理解跨物種生物學?正因如此,我判斷長壽業或者抗衰老技術將會是未來的方向,即如何運用AI來監督和追蹤生命體在漫長時間裡無數細微的實時變化,來創建數字孿生(digital twin),進行跨物種比較、跨疾病模型比較。我相信AI是説明我們更好地認識生命體的最佳工具。
■要點回顧
1、中國的資本環境天然地聚集了垂直產業領域的優質企業,幫助AI初創公司,即「改造者」,迅速汲取經驗、擴大規模,加速行業創新與賦能。
2、在與垂直行業企業合作時,「改造者」既要有端到端的解決方案,也要有靈活、敏捷的銷售和服務模式。端到端、全鏈路的方案有助於「改造者」更靈活地根據傳統企業的需求組合方案,能夠擴大服務範圍和客群,提升「改造者」的競爭優勢。
3、未來最重要的不是AI技術,而是如何將AI與行業特定的實驗數據或模型結合。限制因素並不是演算法或者算力,而是新的商業模式或者應用AI的方式來實現行業定制化。
生成式ai模型 在 緯育TibaMe Facebook 的最佳解答
#每日5分鐘快速添補ai知識與技能
深度學習創造出各種模型,
但會納悶DNN、CNN、RNN這幾個網路有何不同?
作用、差別為何、彼此之間的關係?
⠀⠀
大部分神經網路,可以用深度和連接結構來定義
也可分為有監督、無監督、半監督學習的神經網路
⠀⠀
將介紹4種類型神經網路
1、類神經網路ANN 和 深度神經網路DNN
2、循環神經網路RNN 和 遞歸神經網路RNN
3、卷積神經網路CNN
4、生成式對抗網路GAN
⠀⠀
觀看全文👇
https://blog.tibame.com/?p=19032
⠀⠀
#AI60問 #深度學習 #人工智慧 #神經網路
【AI/資料科學不可不知的60道問題】
每週4篇AI新知識,一次只要5分鐘,
具備AI跨域知識,為職場技能加分💪
#TibaMe #緯育TibaMe #知識 #學習 #科技
生成式ai模型 在 台灣物聯網實驗室 IOT Labs Facebook 的最佳解答
AI 如何為公司創造更多價值?專家:2 個缺陷,要先由人類來修補
2021/05/13
採訪‧撰文
盧廷羲
張凱崴
美國人工智慧國家安全委員會(NSCAI)今年 4 月建議,國防部每年應至少分配 3.4% 的預算投入科技領域,並提撥 80 億美元研發 AI。企業方面,微軟(Microsoft)4 月宣布,將以 197 億美元收購語音辨識開發商紐安斯通訊(Nuance Communications);後者是雲端與 AI 軟體的先驅。
從企業到國家,都愈來愈重視人工智慧,知道要想辦法運用 AI 創造更好的生活。不過,目前 AI 發展到底處於什麼階段?我們又該如何應用?
美國加州大學洛杉磯分校(UCLA)電腦科學系助理教授張凱崴形容,目前人工智慧技術已經可以幫助人類完成很多事,像是疫情來襲,電腦可以從大數據中篩選條件,自動搜尋、判讀潛在病例,幫助醫生大幅減少檢查時間,但 AI 也並非萬能,要先認知它的局限。他研究如何讓 AI 更符合人性,獲得 2021 年的史隆研究獎(Sloan Research Fellowships)。
AI 局限1. 資料寬廣度不足時,就會複製人類偏見
張凱崴認為,電腦在學習的時候,是依賴「彙整數據資料」來判斷,並沒有真正思考,如果資料來源太狹隘、不夠多元,資料寬廣度不足,電腦判斷就會出現偏差,「你跟電腦講清楚 input(輸入)、output(輸出),提供足夠的數據資料,它可以對應、學得很好,但還有很多面向 AI 做不到。」
舉例來說,亞馬遜(Amazon)2014 年推出智慧音箱(Amazon Echo),使用者口頭下指令給語音助理 Alexa 就能放音樂、查資訊。然而,有些人口音較罕見,或是用字較特殊,智慧音箱的資料庫沒有「不同口音」「不同用詞」的檔案,就可能失靈,這是當前 AI 的其中一大問題。
張凱崴進一步解釋,AI 另一項挑戰是,它無法清楚分辨「不曾出現」與「不能出現」(無法出現)之間的區別,只是從資料統計出要學的東西,無法像人類一樣進行邏輯思辨。
AI 的運作方式,第一步是輸入資料,第二步是分析,但這過程容易出現偏見。例如電腦在理解「總統」這個字,會去看四周有什麼字詞,來學習總統這個詞,由於許多總統都是男性,電腦就會「覺得」總統是男性。
這也是為什麼,如果讓 AI 學習,在它的認知裡,女性「不可能」當美國總統(因為沒有資料紀錄)。「你可以跟人類說,任何職業、性別都是平等的,但對電腦來講,這很困難,」張凱崴說明,一旦資料的寬廣度受限,電腦就容易產生偏見。
就像在自然語言處理(Natural Language Processing,讓電腦把輸入的語言變成有意義的符號)領域,張凱崴說明,AI需要知道代名詞指的是「哪個名詞」,才能運算下去。但如果資料受限,使用男性的「他」,電腦可能判斷這個代名詞是指總統、總理、執行長;但換成女性的「她」,由於數據不足,電腦就會混亂,出現系統性誤差。
他再舉一例,美國人工智慧研究組織 OpenAI 提出「生成式預先訓練」系統(GPT,Generative Pre-training),推出到 GPT3 版本,屬於書寫類 AI,電腦能夠揣測人們說完上一句話,下一句可能會講的句子,自動完成後半段。
好比有人上一句寫下「我正在和教授聊天」,系統可能推導出「我們在研究室討論學術問題」,因為電腦藉由蒐集來的語料資料中判讀出「教授」和「學術」具高度相關。但研究也顯示,GPT2(前一代版本)系統也從資料中學習到許多偏見,像是如果句子前半談論白人男性,系統傾向產生正面評價;如果句子前半是黑人女性,系統竟會產生負面句子。對企業來說,許多組織接觸 AI,想讓它們取代部分工作,首先需要留意資料的廣度、多元性,才能減少電腦犯錯的機會。
AI 局限2. 即便條件相同,也無法每次都做出正確判斷
「其實,現在的 AI 就像一台原型飛機,還缺乏穩定性。」張凱崴說,現行的 AI 就好比萊特兄弟(Wright brothers)剛發明飛機,看似可以做很多有趣的事,但「可以飛」跟「飛得很好」,有一大段落差。
紐西蘭的簽證系統曾鬧出笑話。人們上傳簽證照片,AI 掃描後,確認是不是本人,但當時系統沒有估算到某些亞洲人眼睛比較小,一名亞裔男子被判定「沒有張開眼睛」,因此照片無效。
張凱崴說,在這個例子中,凸顯出 AI 的穩定性不足,「系統沒有考慮到不同人種的差異,很死板地認為你眼睛沒張開。」所謂的缺乏穩定性,指的是 AI 沒辦法在相同條件下,每次都做出正確決策,這也是使用 AI 時,須留意的第二個挑戰。
他再舉例,許多模型可以準確分析,一則影評對電影的評價是正面或負面。然而研究顯示,有時只要將影評中一些字換成同義詞,例如把電影(movie)換成影片(film),或改寫句子,即使意思並未改變,系統卻把原本判斷為正面的影評標註成負面。這顯示AI系統還未真正了解語言的含義。
在設計這些程式時,人們必須注意到 AI 可能有局限,設定的資料範圍要更完整,考慮這些因素,就能減少偏見、落差,進而加強穩定性。
餵指令給 AI 要多元化,嘗試「換句話說」、刻意混淆
經理人雖然不一定具備 AI 方面的專業知識,但只要掌握觀念,再透過 AI 領域專才協助,也能優化系統。張凱崴指出,最直接的方法是,設計 AI 模型時,要把來源群組不同的資料分門別類測試,在測試階段讓群體多元化,並確保不同特色的使用者,用起來都沒有問題。
舉例來說,一套 A 系統擁有來自各地的使用者,如果設計者是台北人,設計系統的思維容易以台北生活為主,很可能因為當地習慣不同,導致花蓮使用者操作不順。
另一個方法,則是用不同的「語意」,去測試 AI 有沒有徹底學會一個概念。例如,有一套餐廳評鑑的 AI 系統,只要蒐集、整理使用者意見,就能判斷每個顧客對於餐廳的評比是高分或低分。那麼要如何確認這套系統的穩定性?張凱崴建議,可以利用「抽換詞面」的方法。
比如,把詞彙換成同義字,再看 AI 是否能運算出相同結果,「你可能會發現,原本評比結果是食物很美味,但如果美味換成比較困難的詞,AI 就會分不出這則評比是好是壞。」因此在訓練模型時,可以將詞彙隨機抽換成同義詞,增加 AI 的詞彙量。
第三種方式更進階:改變句型、重寫句子。張凱崴指出,同樣一句話,如果換成不同說法,電腦可能判讀錯誤,將「因為發生 A 事件,所以導致 B 事件」,改寫成「B 事件發生了,是因為 A 事件的緣故」,明明兩句話意思一樣,但 AI 很可能因為穩定性不足,搞混兩者的差別。如果要鞏固 AI 的穩定性,可以使用自動改寫的方式,增加資料的多樣性。
張凱崴表示,經過這些測試,讓 AI 接受更多元化的訓練,得到更廣的學習範圍,往後碰到同義詞、相似資訊,才能有效判讀。
張凱崴總結,AI 還在快速發展,或許可以創造更多工作機會、新的職位,但現行階段,它只是輔助角色。AI 並非魔術盒子,使用它就一定有更好結果,人們還是要保持高度耐心,先認識它的缺陷,才能在技術更迭下,發揮出最好的結果。
張凱崴
台灣大學資訊工程系碩士、美國伊利諾大學(UIUC)電腦科學博士。美國加州大學洛杉磯分校(UCLA)電腦科學系助理教授,研究領域包括人工智慧、機器學習、自然語言處理。2021 年獲得史隆研究獎(Sloan Research Fellowship),研究團隊開發的運算方法,使人類語言處理的程序更有效率、更多元,同時兼具公平性。
附圖:優化AI系統的3方法
資料來源:https://www.managertoday.com.tw/articles/view/62902?fbclid=IwAR2jI1bhg1anqct0AZZR_3LKKJqIsvG0wz2whSN8iniROZApHt-_qpD7dis