新冠疫情之下,不少國家和地區(qū)的醫(yī)生往往處于超負荷的工作狀態(tài)。
隨著近年來AI技術(shù)的發(fā)展,醫(yī)療AI在疫情中發(fā)揮了越來越重要的作用,不少AI病毒檢測系統(tǒng)研發(fā)者都表示,相關(guān)產(chǎn)品實驗室準(zhǔn)確率都已經(jīng)達到了96%及以上。
那么,在醫(yī)院真實使用的時候,這些系統(tǒng)真的能讓醫(yī)生護士們“如虎添翼”嗎?
讓我們先把目光聚焦于對既有疾病的診斷和治療上。
比如去年,谷歌落地泰國的眼疾檢測人工智能明星產(chǎn)品。
谷歌此前曾高調(diào)宣布,正式與泰國公共衛(wèi)生部建立合作關(guān)系,在帕圖姆和清邁落地了一個用AI檢測糖尿病性視網(wǎng)膜病變的系統(tǒng)。
作為FDA批準(zhǔn)的首款人工智能診斷設(shè)備,谷歌和泰國雙方都表示了極高的期待。
但是,根據(jù)谷歌最近發(fā)表的相關(guān)報告,該系統(tǒng)在泰國表現(xiàn)出強烈的“水土不服”:在部署系統(tǒng)的11家診所中,只有2家具有滿足條件的影像室,而由于醫(yī)院的光線環(huán)境經(jīng)常不利于拍攝,超過五分之一的圖像都會被系統(tǒng)拒絕;同時,必須將照片上傳到云端進行處理才能獲取結(jié)果,而泰國多數(shù)診所的網(wǎng)絡(luò)連接不夠理想,有護士和患者因此等待了兩個多小時。
醫(yī)療AI落地任重道遠,一起來看看谷歌AI這起泰國“翻車”故事。
當(dāng)高精準(zhǔn)AI遭遇“人擠人的小診所”:理想有多豐滿,現(xiàn)實就有多骨感
這款產(chǎn)品會首先落地泰國事實上意義重大。
根據(jù)2016年的一項調(diào)查顯示,泰國共有9.6%人民患有糖尿病性視網(wǎng)膜病變,34%的患者會因為此雙眼視力明顯低下甚至失明。而在世界范圍內(nèi),約5%的失明患者都是因為身患糖尿病性視網(wǎng)膜病變導(dǎo)致。
2013年,泰國公共衛(wèi)生部宣布,泰國居民可在指定的檢查日到當(dāng)?shù)卦\所進行糖尿病性視網(wǎng)膜病變的檢測,最初公共衛(wèi)生部預(yù)計的目標(biāo)是覆蓋每個地區(qū)60%的患者。然而數(shù)據(jù)顯示,即使這樣,每年接受檢測的患者數(shù)也不到50%。
在傳統(tǒng)的檢測過程中,護士會為患者拍攝一張“眼底照片”(fundus photo),這些照片隨后通過電子郵件或郵寄光盤發(fā)送給眼科醫(yī)生,而更進一步的眼部檢查至少也要在4-5周后進行。
谷歌的這款醫(yī)療AI在落地之前也做了完備的準(zhǔn)備:通過一個12.8萬幅圖片的數(shù)據(jù)集訓(xùn)練建立起來,每張圖片記錄了3-7名眼科醫(yī)師的評估結(jié)果,為了驗證算法的性能,他們還使用了2個獨立的臨床試驗數(shù)據(jù)集,包括1.2萬幅圖片,審核結(jié)果由專家來判決。
在構(gòu)想中,該AI系統(tǒng)能在幾秒鐘內(nèi)給出可堪比眼科醫(yī)生的具有專業(yè)價值的結(jié)論,在內(nèi)部測試中,系統(tǒng)也以90%的準(zhǔn)確度獲得了高度認可。在這種情況下,護士就能在幾分鐘內(nèi)給出初步建議,大大縮短了時間差。
可以說,這個系統(tǒng)在泰國的落地具有劃時代的意義。
泰國衛(wèi)生部門對于這一產(chǎn)品抱著極高的期待,但是,根據(jù)相關(guān)反饋,該系統(tǒng)在泰國“擁擠的診所”表現(xiàn)完全不及格。
谷歌發(fā)布相關(guān)產(chǎn)品落地反饋報告鏈接:
https://dl.acm.org/doi/abs/10.1145/3313831.3376718
當(dāng)然,這不完全是谷歌產(chǎn)品本身的問題。
泰國當(dāng)?shù)乇硎?,這款A(yù)I測試產(chǎn)品也有正常工作的時候,的確大大提升了檢測效率;但是更多的時候,系統(tǒng)無法給出一個明確的結(jié)果。
這也是多方面因素導(dǎo)致的。首先,和大多數(shù)的圖像識別系統(tǒng)一樣,深度學(xué)習(xí)模型的訓(xùn)練環(huán)境是基于高質(zhì)量的掃描圖像,對于低于一定質(zhì)量閾值的圖像,系統(tǒng)會自動拒絕。
但在現(xiàn)實中,護士一小時要面對幾十名患者,醫(yī)院的光線環(huán)境經(jīng)常不利于拍攝,超過五分之一的圖像都會被系統(tǒng)拒絕。
而這些被系統(tǒng)“拒絕”的患者不得不再另選時間前往另一個診所讓人類專家診斷,不少人往往難以請到兩天連休,或者沒有更便利的交通工具,這些都將導(dǎo)致該系統(tǒng)進入當(dāng)?shù)蒯t(yī)療系統(tǒng)后被人們排斥。
對此,護士也時常感到沮喪,尤其是當(dāng)她們拍攝的照片被系統(tǒng)拒絕,或者被認定為沒有疾病特征的時候。而為了達到系統(tǒng)要求的精度,她們有時會花費很多時間在一張照片上。
其次,就算護士們費盡力氣拍攝了滿足系統(tǒng)要求的眼球照片,她們還必須將必須將照片上傳到云端進行處理,其中診所的網(wǎng)絡(luò)連接就是另一個影響因子。
“患者往往習(xí)慣于馬上看到結(jié)果,但由于網(wǎng)速問題,患者不得不等待很長時間,他們就會抱怨,”一位護士說,“有人從早上6點開始就在這里排隊了,但我們這2個小時只檢測了10個病人”。
在評價該AI系統(tǒng)的不成熟和局部應(yīng)用時,研究團隊表示:本次在引進新技術(shù)時,規(guī)劃者、政策制定者和技術(shù)設(shè)計者都沒有考慮到復(fù)雜的醫(yī)療項目在落地過程中會出現(xiàn)的問題,但其實人們的動機、價值觀、職業(yè)身份以及他們工作的現(xiàn)行規(guī)范和常規(guī)等社會因素,都是至關(guān)重要的。
谷歌健康團隊的研究人員Emma Beede更是一針見血地指出:“在廣泛部署AI工具之前,必須首先了解AI如何在特定環(huán)境中為人們服務(wù),在醫(yī)療保健領(lǐng)域尤其如此?!?/FONT>
針對種種問題,谷歌健康團隊正在與當(dāng)?shù)蒯t(yī)務(wù)人員合作,重新設(shè)計工作流程。例如,讓護士接受培訓(xùn),讓她們在極端情況(borderline cases)中相信自己的判斷,同時模型本身也將進行再次調(diào)整,以更好地處理不完美的圖像。
FDA批準(zhǔn)的首款人工智能診斷設(shè)備,實驗室準(zhǔn)確率高達90%
谷歌這款人工智能眼疾診斷產(chǎn)品算是全球醫(yī)療AI領(lǐng)域的明星產(chǎn)品。
2018年4月,在美國食品和藥物管理局(FDA)首次批準(zhǔn)了這種人工智能診斷設(shè)備,并且罕見宣布,該設(shè)備不需要專家醫(yī)生來解釋結(jié)果。
這也就意味著,這個名為IDx-DR的軟件程序可以通過觀察視網(wǎng)膜的照片來判斷患者是否有眼科疾病,某些情況下甚至不需要配備人類醫(yī)生的進一步診療。
它的工作原理是這樣的:護士或醫(yī)生上傳病人視網(wǎng)膜的照片,這些照片是用專門的視網(wǎng)膜攝像機拍攝的。
IDx-DR軟件首先判斷照片的清晰度是否支持下一步的疾病判斷。
然后,對這些合格圖像進行分析,以確定病人是否患有糖尿病性視網(wǎng)膜病變。糖尿病性視網(wǎng)膜病變是糖尿病性微血管病變中最重要的表現(xiàn),是一種具有特異性改變的眼底病變,是糖尿病的嚴重并發(fā)證之一。
在一項使用超過900張圖像的臨床試驗中,IDx-DR正確檢測到糖尿病性視網(wǎng)膜病變的準(zhǔn)確率為87%,正確識別無病患者的準(zhǔn)確率為90%,準(zhǔn)確度可以媲美專業(yè)醫(yī)師。
據(jù)了解,這也是機器學(xué)習(xí)被首次應(yīng)用于醫(yī)療AI系統(tǒng)的案例。當(dāng)時可謂轟動一時的消息,文摘菌也曾就這一研究成果做過報道。
科技公司翻車不止谷歌一家,AI落地醫(yī)療行業(yè)前路崎嶇
醫(yī)療AI在落地過程中,除了谷歌本次暴露出來的問題,似乎還有更多的問題有待解決。
比如去年8月,在蘋果秋季發(fā)布會前夕,蘋果健康團隊被曝出內(nèi)部存在極大的管理問題,直接導(dǎo)致員工扎堆離職。在醫(yī)療健康這條路上,蘋果高層傾向于采取安全漸進的方法,這與醫(yī)療行業(yè)本身的復(fù)雜程度有一定的關(guān)系。
但是蘋果健康團隊內(nèi)部不少員工卻不這么認為,他們急于解決醫(yī)療系統(tǒng)中最“棘手”的問題,比如醫(yī)療設(shè)備、遠程醫(yī)療和醫(yī)療支付等。有員工透露道,蘋果完全有能力開發(fā)更多更有前景的項目,在醫(yī)療健康這條路上走得更遠,但是,公司主打的仍是“手表心電圖”這類面向廣大健康用戶的功能。
除此之外,兩名知情人士表示,對于該公司應(yīng)在多大程度上向醫(yī)療行業(yè)透明化,內(nèi)部也存在分歧。蘋果此前一直對自己的項目高度保密。然而,這種嚴格保密在使得蘋果在衛(wèi)生保健領(lǐng)域發(fā)展更具挑戰(zhàn)性,因為該行業(yè)通常需要依靠已發(fā)表的研究、臨床研究,并與行業(yè)內(nèi)組織保持公開對話。
監(jiān)管機構(gòu)與科技公司的角逐也影響到了醫(yī)療AI的落地。去年4月,IEEE Spectrum發(fā)布特別報告《How IBM Watson Overpromised and Underdelivered on AI Health Care》,在文中細數(shù)了IBM的明星醫(yī)療部門Watson Health是如何走向衰落的。
文中稱,盡管IBM花費數(shù)十億美元收購AI企業(yè),加強內(nèi)部開發(fā)實力,但內(nèi)部人士表示,被收購公司并沒有發(fā)揮什么作用。這其中還存在監(jiān)管機構(gòu)的干預(yù),監(jiān)管機構(gòu)只批準(zhǔn)少數(shù)基于AI的工具在醫(yī)院和醫(yī)生的辦公室使用,這些開創(chuàng)性產(chǎn)品主要聚集在圖像診斷領(lǐng)域,比如通過計算機視覺技術(shù)識別X射線和視網(wǎng)膜掃描圖像進行診斷,而IBM卻沒有醫(yī)學(xué)圖像識別的產(chǎn)品落地。
除了管理問題,醫(yī)學(xué)領(lǐng)域本身也存在極大的挑戰(zhàn),比如為醫(yī)生的專業(yè)知識編碼,這項浩大的工程即使是如今最優(yōu)秀的AI也難稱可以實現(xiàn)。
正如在2014年離職IBM的Kohn所說,“擁有強大的技術(shù)是不夠的,你還要向我證明,這款產(chǎn)品的確是有價值的,可以讓我生活的更好,讓我的父母生活的更好”。這也清楚地指出了科技公司在醫(yī)療領(lǐng)域的崎嶇前路。
面對如此多的難關(guān),科技公司將如何逐一攻破,我們期待著醫(yī)療AI能在實際環(huán)境下更有效地工作的一天。
作者/劉俊寰
來源:大數(shù)據(jù)文摘(ID:BigDataDigest)
(轉(zhuǎn)載)