時間的博弈:人工智能可提前2天預測急性腎損傷
2019年08月20日09:29

  來源:Nature自然科研

  器官損傷總是不易察覺,往往會因此錯過最佳治療時機。基於人工智能的新方法能持續監測病人的健康數據並及時預測即將發生的腎臟損傷。

  在美國的醫院中,急性腎功能損傷的發病率高達20%[1],包括異常血壓和血容量等多種因素都會誘發這種十分普遍的病症。但目前醫療界卻缺乏有效的手段來預測病人是否會發生以及何時會發生急性腎損傷。目前對於高危病人的臨床處理手段是每天檢測血液中的肌酸酐濃度,濃度過高就意味著腎功能出現了問題。

  近日,來自DeepMind等多個機構的研究人員[2]提出了一種基於人工智能的新方法,能夠有效預測病人即將發生的腎功能損傷。相較於傳統方法,這種新方法可以提前一到兩天檢測出大部分病人的腎臟損傷的發生風險。由於腎臟損傷往往在最後階段才被察覺,此時腎臟已經發生不可逆的損害,嚴重時將會留下需要暫時或長期透析的後遺症,甚至引起病人的死亡。對於腎臟損傷的早期檢測方法將為有效的臨床治療贏得寶貴的時間。

  深度學習作為近年來發展最快的人工智能方法,可以有效識別出數據中隱含的與特定結果相關的模式。在這一研究中,研究人員利用深度學習的方法來檢測急性腎損傷。訓練深度學習算法需要大量的數據,研究人員從美國退伍軍人事務部(US Department of Veterans Affairs,為美國退伍軍人及其家屬提供服務)負責運營的172家醫院和1062家門診中,收集了超過70萬例成年病例的數據(2011年-2015年)。這些經過匿名處理的數據為研究人員提供了人口統計信息、電子健康檔案、化驗結果、藥物處方和過往治療記錄等數據。論文的第一作者Tomašev和同事們從數據中整理出了約60億個數據點和60多萬個記錄特徵,他們選擇了一種被稱為循環神經網絡的深度學習方法來處理時序數據並對計算機進行訓練,這種方法在深度學習領域被證明非常適合處理時序數據。

  在訓練完成後,研究人員利用事先分離出的獨立數據集對算法的有效性進行了測試。基於測試數據,計算機將生成接下來48小時內連續的概率值來追蹤每個病人隨時間推移發生急性腎損傷的可能性。如果預測的概率值超過一定閾值,這個預測結果將被標記為陽性(如圖一所示)。病人後續是否被檢查出病情則會驗證算法的預測精度。該模型同時還提供了預測概率值的不確定性,為醫生提供了評估預測信號的強度指標。

圖一:預測腎功能障礙的結果。圖a表示Tomašev 團隊提出的方法可以給出急性腎損傷的預警信號。研究人員利用人工智能中的深度學習方法來訓練計算機從數據中檢測與後續腎損傷相關的模式。研究人員利用這種算法來分析過往的醫療數據,包括電子健康檔案和化驗結果等等。計算機分析某個病人的歷史數據後,將生成接下來48小時內的連續概率值,對應病人發生急性腎功能損傷的可能性。如果概率超過一定閾值,預測結果將被標記為陽性,並向醫生發出警報(紅點)。圖b則表示檢測病人腎功能的常規手段:每日監測血液中的肌酸酐。在此假設場景下,Tomašev團隊的研究方法將提供比傳統方法更早的預警信號,為醫生和病人贏得了寶貴的治療時間。
圖一:預測腎功能障礙的結果。圖a表示Tomašev 團隊提出的方法可以給出急性腎損傷的預警信號。研究人員利用人工智能中的深度學習方法來訓練計算機從數據中檢測與後續腎損傷相關的模式。研究人員利用這種算法來分析過往的醫療數據,包括電子健康檔案和化驗結果等等。計算機分析某個病人的歷史數據後,將生成接下來48小時內的連續概率值,對應病人發生急性腎功能損傷的可能性。如果概率超過一定閾值,預測結果將被標記為陽性,並向醫生發出警報(紅點)。圖b則表示檢測病人腎功能的常規手段:每日監測血液中的肌酸酐。在此假設場景下,Tomašev團隊的研究方法將提供比傳統方法更早的預警信號,為醫生和病人贏得了寶貴的治療時間。

  Tomašev 和同事們提出的新方法比其他基於統計或機器學習的方法更為精確地預測了即將要發生的腎損傷[3,4],而且對於醫院內病人的預測精度最高——醫院內病人發生急性腎損傷的比門診診所更為頻繁,同時時間窗口也更為短暫。對於所有病人和所有類別的腎損傷,包括較為輕微的損傷,這一系統的平均預測精度達到了56%;而針對更為嚴重的腎損傷預測,對於後續30天和後續90天內需要透析的病人預測精度則分別達到了84%和90%。該模型在不同的醫療場所和不同時間週期內具有相似的預測精度。

  此外,研究人員使用了消融性分析方法來鑒別與腎損傷發生風險相關的因素,結果發現有很多,這也許解釋了為何過去讓研究人員分析這種風險是一件棘手的事。

  圖一中的假設病例顯示了研究人員所開發的新方法的重大應用潛力。如果利用傳統方法檢測,醫生將在第四天才能獲悉腎損傷的發生,而新方法則可以提前兩天預測出來,為醫務人員提供了更多寶貴的時間和更多幹預治療的手段,包括增加病人的液體攝取,或者避免使用可能造成腎毒性的藥物。

  然而這一系統也存在一定問題:生成一系列假陽性的預測結果,即誤報一些沒有發生的腎損傷。每個精確的預測會對應兩個假陽性結果。假陽性絕大多數來源於患有慢性腎病的病人,疾病的症狀會與急性腎損傷疊加,造成結果難以預測。

  本研究的另一局限在於這是一項回顧性研究,利用回顧性研究構建的人工智能方法將在前瞻性研究中發生一定程度的退化[5],這可能是因為臨床中的真實數據會比預先存在的經過清洗的“乾淨”數據要複雜得多。

  前瞻性研究是檢測預測系統的真實臨床價值的根本所在,而預測成功與否不是唯一應加以評估的因素。要確定計算機生成的預警信號是否在臨床中減少了急性腎損傷的發生率,一種方法是開展隨機設計的臨床試驗,只將其中一半的預測傳遞給醫生。此外,作者的模型也應該在其他的人群身上進行有效性測試。作者的研究只包含了不到7%的女性病例,那麼模型對於不同性別的病人是否具有相同的預測精度,也值得在未來進行深入研究。

  雖然這一研究包含了不同種類的數據,但還有其他數據源也值得納入進來,例如病曆上的手寫內容,來自可穿戴傳感器的連續生命監測信號,如心率等,這些都有可能提供有價值的相關信息。

  對於非重症病人來說,常規監測方法是每天測量一次生命體徵,但病人經常會突然出現病情急轉直下的情況。Tomašev 和同事的研究對於這樣的病人來說十分有用,可以在病人發生嚴重的器官衰竭之前發出預警,為病人贏得寶貴的救治時機。先前,很多臨床背景下基於人工智能的預測性研究主要著重於研究疾病轉歸,包括死亡、再入院或住院時間等[6],而Tomašev 等人的研究結果則提供了獨特的視角,為臨床干預提供了有效的預測信號。

  深度學習有望為醫生提供針對任何器官狀況的有力預警手段,它的廣泛應用也許需要醫療界改變思維方式。但是從非經常的一次性測試轉向系統性的連續監測,或將為醫務人員提供更有效的手段來預測病人的病情變化。

關注我們Facebook專頁
    相關新聞
      更多瀏覽