騰訊的“移動互聯網+AI”,正通往移動醫療
BAT們與各路資本齊齊砸下血本,對這個AI技術當下最熱門的垂直場景之一發起了多輪攻勢。AI與醫療的雙高門檻,是區別于兩年前移動醫療熱潮的最重要因素之一。但是,將上一輪移動醫療熱情徹底澆滅的那些教訓,卻仍然值得此輪醫療創業者借鑒。
當下,移動醫療從2015年下旬開始經歷的那一場突然而又漫長的寒冬,已基本無人談起。
那是2015年吧,移動醫療就已經死了一批了,有些融完A輪就不行了。后來慢慢的,相比移動醫療,大家就開始更多地用數字醫療這個詞了。這是一位從2014年就開始深入調查分析醫療創業項目的分析師給到我們的碎片式回憶。
實際上,早在2016年10月,動脈網根據深入調查而出具的一份名為《互聯網醫療生存報告:38家企業為什么死去?》的醫療創業項目倒閉白名單,曾轟動一時。
其中,技術含量不高導致的創業同質化,對醫療工作流程特殊性的錯誤理解,監管層面的約束,對市場的忽視,以及過高的估值與資本介入,都是那時候醫療創業者用血與淚換來的教訓。
2016年中旬左右,幾乎像是一場足球比賽上下場的轉換,AI+醫療強勢崛起。這個難得讓BAT與資本們共同找到興奮點的醫療新賽道,在過去不到2年的時間里,孕育出超過100家以醫療為重點的AI創業公司。
如果再快進到2017年,你會發現在過去的9個月中,國內外以醫療為重點的AI創業公司獲得融資的頻率幾乎可以媲美曾紅極一時的共享充電寶。其中,醫療影像自動化診斷算是一個近期各家齊頭并入的熱門應用場景。
當然,與曾經同質化嚴重的移動醫療相比,極高的AI門檻加上極高的醫療門檻,讓進入AI醫療界的一眾創始人們一開始就似乎有了睥睨天下的資本。
業內人士,算法專家,海歸博士與其他AI創業公司并無太多差異,技術與研發當仁不讓成為公司宣傳的核心;而資本方也難得進入高僧打坐模式,只是期待,閉口不談商業模式與盈利要求。
那么,一個如此早期的領域,只有拼技術就夠了?移動醫療曾經經歷的那一場暴風雪,是否也有相似的教訓值得當下借鑒?
VoxelCloud(體素科技),算是最近一頭扎入這個領域的AI創業公司中比較露鋒芒的一個。2016年才成立,就在2017年5月獲得紅杉領投的千萬級融資;僅隔3個月,又在今天得到騰訊的超億元人民幣A+輪投資。很顯然,這個數額與融資頻率應該會讓當下一眾同類型的創業公司十分眼紅。
當然,盡管騰訊有自己醫療布局的考慮在內(剛剛推出一款醫療影像產品覓影),但對于選投VoxelCloud的理由,騰訊與紅杉的口徑較為一致:
他們之前就有了明確的產品,以后還會有更多創新性應用。
VoxelCloud的創始人丁曉偉很爽快地接受了我們的專訪,而且并不避諱一些敏感問題。不過,自始至終,對于AI醫療,他的態度是謙卑且謹慎的,甚至承認現在的技術和硬件并不天然滿足醫療應用級產品的研發,需要通過大量另辟蹊徑實現。
我們有技術,有很強的人,但是我們也必須考慮商業模式,也需要正確面對那些市面上的AI醫療診斷系統曾經犯過的錯誤。
只談學術,不談應用,這不靠譜
借助先進的人工智能技術,系統在短時間內處理海量數據,并對病人做出愈加準確的診斷。這是IBM旗下的AI診療系統Watson曾做出的承諾。
然而,在IBM將Watson推向全世界的6年里,這個AI醫療領域最負盛名的產品,卻遭到了無數醫生的質疑與媒體的嘲諷。
可靠的技術,高質量的數據,醫生的配合。事實上,這些在研發人員中最為看重的幾個因素,一旦合體落實到臨床實驗中,就會遇見各種各樣的麻煩。這就像一個僅有完整的身體與四肢,卻沒有關節與潤滑劑的機器人,只能是一個無法動彈的殘次品。
譬如,在實際工作中,Watson合作醫院的醫生們真的會主動用它來處理病患信息嗎?醫生輸入數據過程中是否會遇到各種問題?給出的診斷結果是否會參考不同國別、人種的差異?
作為加州大學洛杉磯分校的計算機視覺博士,VoxelCloud的創始人丁曉偉并沒有否認研發與應用之間橫亙著巨大的鴻溝。那些在實驗室中熠熠閃光,讓人十分興奮的技術與樣品,其實很容易見光死。
這也是他為何通常在產品研發過程中,選擇與醫生們一待就是6個月的原因:
我雖然學的是計算機視覺這一學科,但是我家人都是醫生,我基本從小就長在中國的醫院里。哪個科室做什么,到底怎樣運轉,我都見過。我覺得,做醫療產品必須走到醫院里,去觀察醫生的每一步到底是怎么做的。
譬如我們在研發無創肺癌篩查診斷系統的時候,就跟醫生長時間一起工作,大概要相處半年吧,天天在一起討論。這不是說我們一定要掌握哪一種病癥,而是要去了解這個病的知識難點,看看醫生處理的時候會有哪些問題。然后我們再獨立去分析一個病種的時候,再去考慮怎么與深度學習技術融合。
另外在臨床實驗過程中,對某一項任務的安全編制,醫生的需求是什么,這里面的容錯空間有多大,做成什么樣子是最能為他們解決問題的,這些都是非常細節的問題。
你不走進醫院,你絕對不知道有哪些很棘手的問題。
但是,即便與醫院進行長時間無縫隙合作,也不能保證機器給出的治療方案給出的一定是精準的,或者是被醫生認同的解決方案。這就像歐洲一些曾對Watson系統多有抱怨的醫生透露,Watson給出的建議帶有針對美國患者與美國醫院治療方案的傾向。
對于這個疑問,丁曉偉首先提出了一個大部分人對人工智能醫療應用的理解誤區:機器診斷報告一定需要與某個醫生的主觀印象高度匹配。
他認為,與醫生主觀印象做比對是一種錯誤的認知,機器診斷結果,應該在有條件的情況下,去對比該疾病的金標準檢查結果(GoldStandard)。
早期疾病的篩查在絕大多數狀況下,不確定性是不可避免的。而且醫生也知道,在初步篩查結果下得到的只是初步意見,不能作為金標準來下定論。我們能夠保證的,是基于數據信息量,讓病癥在某一階段的診斷準確率無限接近金標準。
當然,如果出現某一特殊病癥沒有現有的金標準可以參考,也同時為了保證診斷結果的客觀性,我們會請權威醫療專家,把他們分成4~5組,分別獨立去做一批數據診斷,對數據做質控標記。
這就相當于,把我們的系統作為第6組醫生,它與每一組醫生的差異率要維持在這幾組醫生之間差異率之內。
實際上,一些市場中現有計算機輔助診斷系統出現的問題,在某種程度上也被丁曉偉認為是AI醫療產品之間存在的目標性差異。
譬如,有些公司可能只做圖像診斷,給出一個輔助性的診斷結果,而有些產品是既給出診斷結果,也會改進醫生的工作流程,把醫生寫報告、做隨訪的時間也給一同安排了。大概我們的產品在人性化方面會要求的更高一些,丁曉偉說得比較委婉。
你看市面上的大部分的診斷應用,可能都是機械地去做特定疾病檢測與判斷。這起到的是查缺補漏的作用,因為我們顯然不可能完全相信算法。
但我想讓自己的系統多一點特性,就是能給予醫生一種信任感,讓人不會覺得那么生硬。你看,就像完成一個機械動作,人與機器都能完成,但是過程與感覺是不一樣的。
作為醫生,除了給出一個診斷,他還具備『處理不確定性的能力』。他知道哪些是不確定的,會去找上級醫生尋求幫助,會去尋求更進一步的但代價更大的醫學檢查。
舉個例子,某一種病的治療方案如果沒有特別有說服力的信息量,醫生的選擇總是通過各種各樣的方式去驗證,譬如不斷地去隨訪,或者尋求外部援助。而這些機制機器都是通通忽略的,妄圖在一次檢查中給出最好的答案。
換句話說,在他的認知中,一件成功的醫療診斷產品,不僅會學習海量的數據,還要對診斷過程有一個深度理解。把醫生寫報告,向上級尋求幫助,二次審核等梯級任務都學到手,具備像人類一樣的處理不確定性的能力。
某種程度上,這個設想與GoogleDeepmind團隊一邊做糖網病篩查診斷系統,一邊研發醫務支持與任務管理系統的兩手抓計劃有共通之處。
所以,我們想優化的是整個看病流程,而非僅僅提高一個診斷結果的準確率。這不是一個單純拼技術水平高低的問題,而是誰能在現實診療過程中更有風險控制的能力。
但是,無論通過什么手段來保證診斷的準確率與提升醫生的滿意度,丁曉偉也承認一定需要考慮地域之間的差異。這也是VoxelCloud在美國與中國分別設立研發中心,與美中兩國醫療機構同時進行項目試驗的根本原因:
我們的研發中心是洛杉磯,跟梅奧醫學中心,UCLA醫學中心的關系也非常好,項目都是一起合作的。在國內,雖然合作醫院需要取得授權才可以透露名字,但已經有100多家了,都是北京和上海的三甲醫院。
這樣做的理由,不只是因為病患的數據會有地域差異。國內外的診療流程也很不一樣,兩者都是相輔相成的,而且兩地的研發結果也能做到互補,我們必須同時考慮到。
VoxelCloud與交大洽談醫療影像合作
數據是否是核心競爭力?
好算法雖然是價值千金,但是好數據卻更是千金難買。
風投機構8VC的CEOJoeLonsdale曾在今年在斯坦福舉行的LightForum會議上稱:做醫療診斷一開始遇到的挑戰就在于搜集與創建數據。
而美國癌癥中心MDAnderson的一位負責人也認為,只有在擁有上萬患者數據的前提下,才能初步找到針對性治療模式:
從各種患者數據中找到不同的特征很關鍵,這對針對性治療與精確用藥非常有幫助。但是如果不能擴大現有數據集,上述愿景是無法實現的。你可能只有1萬個肺癌患者數據,但其實這個數字并沒有很大。
此外,一位專注于醫療創業項目的分析師告訴機器之能:現在AI醫療初創項目之間的競爭核心,就在于誰能拿到更多的數據。
很簡單,醫療數據之于醫療診斷的重要性,就像道路測試之于無人駕駛汽車。你只有不斷地讓汽車去實地訓練,不斷地收集與咀嚼道路數據,才能繪制出更高精的地圖,逼近更高的安全數值。
同理,人體的復雜性更是不必多說。這也是為何IBM的數據工程師與醫生們耗費了六年之久,才僅僅讓Watson學習了7種癌癥;而科技巨頭與這個領域內所有創業公司也只能從單一的或者兩三種疾病入手來進行摸索學習。
丁曉偉也認同這個觀點。他認為,目前這個市場,大多數公司都在做肺癌、糖網病的AI醫療診斷,一方面是因為這些病種發病率非常高,影響范圍非常廣,且難以攻克,所以研究價值非常大。
而另一方面,其實是因為這些病的數據比較容易能拿到,包括網絡等很多途徑都是能搜集到很多案例的。
這些可能是起點與上手都相對其他病癥來說更容易一些(不是說本身容易)的項目,所以大家都從這幾個病種入手。
目前大多數AI醫療公司研究最多的4種病癥:肺癌、糖網病、冠心病、肝病
根據知名醫療媒體mobihealthnews的一份調查,在醫療領域,數據的收集形式其實很豐富,包含臨床實驗、醫生報告、醫學圖像、傳感器和生物樣本等多種獲取途徑。
然而,如何獲取優質數據,特別是干凈的患者數據,對于所有該領域的公司來說,是更為至關重要的。
不管是研究項目、還是產品項目,模型的能力是不可能超出收集數據的質量。目前對于癌癥來講,可能最有效的做法就是取得病人的手術活檢,或者穿透活檢的病例結果,然后把這個結果作為金標準用于目前的訓練。
但問題在于,在一家醫院里,有活檢病人的數量是遠少于沒有活檢病人數量的。丁曉偉這樣解釋高質量數據的重要性。
換句話說,要保證有持續的高質量數據的輸入,公司只能盡可能多得通過與醫院及其他醫療機構的合作來獲得。因此,如何拿下醫院的合作項目,也是鑒別AI醫療創業公司生存能力的一個重要衡量標準。