華中科大AI模型預(yù)測(cè)新冠生存率準(zhǔn)確率90%,有助早期介入!
當(dāng)?shù)貢r(shí)間3月17日,預(yù)印醫(yī)療平臺(tái)medRxiv發(fā)布了一項(xiàng)名為“基于機(jī)器學(xué)習(xí)的嚴(yán)重co vid-19感染患者生存預(yù)測(cè)模型”的研究成果(未經(jīng)同行評(píng)審)。這項(xiàng)由29名科學(xué)家共同進(jìn)行的研究,利用最新的可解釋機(jī)器學(xué)習(xí)算法,揭示了預(yù)測(cè)新冠肺炎(新冠肺炎)患者存活率的生物標(biāo)志物,有望加強(qiáng)新冠肺炎高?;颊叩脑缙诟深A(yù),降低死亡率。
研究團(tuán)隊(duì)來(lái)自華中科技大學(xué)同濟(jì)醫(yī)學(xué)研究所附屬同濟(jì)醫(yī)院,華中科技大學(xué)人工智能與自動(dòng)化學(xué)院,劍橋大學(xué)植物科學(xué)學(xué)院等。本文作者為華中科技大學(xué)人工智能與自動(dòng)化學(xué)院教授袁燁、同濟(jì)醫(yī)院麻醉科徐輝、醫(yī)學(xué)急診(重癥)科主任李樹(shù)生。
研究人員收集了來(lái)自武漢同濟(jì)醫(yī)院的404名新冠肺炎感染患者的血液樣本,并對(duì)其進(jìn)行了回顧性分析。通過(guò)機(jī)器學(xué)習(xí)工具,研究團(tuán)隊(duì)最終選擇了三種生物標(biāo)志物來(lái)預(yù)測(cè)個(gè)體患者的生存率,準(zhǔn)確率超過(guò)90%: LDH(乳酸脫氫酶)、淋巴細(xì)胞和hs-CRP(高敏C反應(yīng)蛋白)。
特別是,只有高LDH水平的指標(biāo)可用于區(qū)分需要立即治療的絕大多數(shù)病例。研究人員表示,這一發(fā)現(xiàn)與目前的醫(yī)學(xué)知識(shí)相一致,即LDH水平高與各種疾病中的組織分解有關(guān),包括肺炎等肺部疾病。
在現(xiàn)階段,對(duì)疾病的嚴(yán)重程度進(jìn)行快速、準(zhǔn)確和早期的臨床評(píng)估是非常重要的。然而,目前還沒(méi)有明確的生物標(biāo)志物作為區(qū)分需要立即就醫(yī)的患者的標(biāo)準(zhǔn)。
在這項(xiàng)研究中,作者使用最先進(jìn)的機(jī)器學(xué)習(xí)框架表明,上述三種生物標(biāo)志物可以準(zhǔn)確預(yù)測(cè)疾病的嚴(yán)重程度,從而大大減輕臨床參數(shù)監(jiān)測(cè)和其他相關(guān)醫(yī)療負(fù)擔(dān)的壓力。
研究人員開(kāi)發(fā)了一種基于XGBoost機(jī)器學(xué)習(xí)的預(yù)后模型,通過(guò)使用患者的最新血液樣本,可以預(yù)測(cè)新冠肺炎重癥患者的存活率,準(zhǔn)確率超過(guò)90%。使用其他血液樣本可以達(dá)到90%的預(yù)測(cè)準(zhǔn)確率。
本研究提出了一個(gè)簡(jiǎn)單可操作的公式,可以快速發(fā)現(xiàn)新冠肺炎高?;颊?,早期干預(yù),盡可能降低其死亡率。
研究樣本和模型訓(xùn)練
研究人員進(jìn)行了一項(xiàng)分類(lèi)任務(wù),輸入普通、重癥和危重疾病患者的基本信息、癥狀、血液樣本和實(shí)驗(yàn)室檢查結(jié)果(包括肝功能、腎功能、凝血功能、電解質(zhì)和炎癥因子),并將其與測(cè)試期結(jié)束時(shí)的臨床后果(存活或死亡)對(duì)應(yīng)起來(lái)。
研究樣本為同濟(jì)醫(yī)院于2020年1月10日至2月20日收集的404例患者的醫(yī)療信息。在這404名患者中,213名康復(fù),其余191名死亡。作者指出,高死亡率與同濟(jì)醫(yī)院作為定點(diǎn)醫(yī)院有關(guān),它治療最嚴(yán)重的病例。研究人員使用標(biāo)準(zhǔn)病例報(bào)告表來(lái)收集醫(yī)療記錄,包括流行病學(xué)、人口統(tǒng)計(jì)學(xué)、臨床、藥物、護(hù)理和死亡率信息。
研究人員使用375名患者的信息進(jìn)行算法開(kāi)發(fā),并使用29例進(jìn)行驗(yàn)證。
研究人員將患者數(shù)據(jù)分為訓(xùn)練集、測(cè)試集和其他附加驗(yàn)證集。共有375名患者被包括在訓(xùn)練集和測(cè)試集中,而29名患者被包括在驗(yàn)證集中。按照7: 3的比例設(shè)置訓(xùn)練集和測(cè)試集的樣本數(shù),然后進(jìn)行5次交叉驗(yàn)證。
驗(yàn)證組的患者都是重癥患者,因?yàn)榫团R床結(jié)果而言,他們是最不可預(yù)測(cè)的。從臨床癥狀來(lái)看,發(fā)熱是最常見(jiàn)的首發(fā)癥狀(49.9%),其次是咳嗽(13.9%)、乏力(3.7%)和呼吸困難(2.1%)。375例患者的年齡分布為58.83±16.46歲,其中男性占58.7%?;颊咧?7.9%為武漢市居民,6.4%為家庭聚集性病例,1.9%為醫(yī)療務(wù)工人員。
患者的年齡、性別、流行史等特征。
雖然大多數(shù)患者在整個(gè)住院期間收集了多個(gè)血樣,但模型訓(xùn)練和測(cè)試僅使用患者的最新血樣記錄作為輸入,以獲得評(píng)估疾病嚴(yán)重程度的關(guān)鍵生物標(biāo)志物,區(qū)分需要立即醫(yī)療援助的患者,并準(zhǔn)確匹配每個(gè)標(biāo)簽的相應(yīng)功能。
患者三種生物標(biāo)志物的中值,以及25和75的百分位數(shù)。
與死亡風(fēng)險(xiǎn)最相關(guān)的臨床特征
研究人員使用名為XGBoost的分類(lèi)器作為預(yù)測(cè)模型。XGBoost是一種高性能的機(jī)器學(xué)習(xí)算法,由于其基于樹(shù)型方法的遞歸決策系統(tǒng),具有很大的可解釋性。模型的輸出對(duì)應(yīng)于患者的生存狀況。研究人員將存活的患者歸類(lèi)為0,死亡的患者歸類(lèi)為1。
研究者之所以沒(méi)有采用黑盒建模策略,是因?yàn)槠鋬?nèi)部建模機(jī)制通常難以解釋。在XGBoost中,每個(gè)函數(shù)的重要性取決于它在樹(shù)的每個(gè)決策步驟中的累積使用量。通過(guò)這種方式,可以獲得一個(gè)度量來(lái)表征每個(gè)特征的相對(duì)重要性,這對(duì)于評(píng)估模型結(jié)果中最顯著的特征尤其有價(jià)值,尤其是當(dāng)研究與臨床醫(yī)療參數(shù)相關(guān)時(shí)。
為了評(píng)估死亡風(fēng)險(xiǎn)的標(biāo)志,研究人員通過(guò)特征選擇過(guò)程評(píng)估了每個(gè)患者參數(shù)對(duì)算法決策的貢獻(xiàn)。XGBoost根據(jù)函數(shù)的重要性對(duì)其進(jìn)行排序。該算法選擇三個(gè)頂級(jí)臨床特征:LDH、淋巴細(xì)胞和hs-CRP,因此它們被設(shè)置為關(guān)鍵特征。
根據(jù)其在多樹(shù)XGBoost算法中的重要性,研究人員排列了十大關(guān)鍵臨床特征,LDH、淋巴細(xì)胞和hs-CRP排在前三位。
結(jié)果表明,在不考慮入院時(shí)的初始診斷的情況下,該模型可以準(zhǔn)確地預(yù)測(cè)患者的預(yù)后。
此外,附加驗(yàn)證集的性能類(lèi)似于訓(xùn)練和測(cè)試集的性能,這表明該模型捕獲了與患者生存相關(guān)的關(guān)鍵生物標(biāo)志物。同時(shí),算法結(jié)果進(jìn)一步強(qiáng)調(diào)了LDH作為患者存活率關(guān)鍵生物標(biāo)志物的重要性。
訓(xùn)練/測(cè)試拆分和附加驗(yàn)證集三個(gè)關(guān)鍵特征的模型性能,F(xiàn)1-score是算法準(zhǔn)確率和召回率的調(diào)和平均值,最高為1,最低為0。
根據(jù)對(duì)LDH、淋巴細(xì)胞和hs-CRP重要性的發(fā)現(xiàn),研究人員進(jìn)一步構(gòu)建了一個(gè)可以應(yīng)用于臨床的簡(jiǎn)化決策模型,即單決策樹(shù)。因?yàn)?4名患者的三個(gè)主要生物標(biāo)志物中至少有一個(gè)是不完整的,所以研究人員用剩余的351名患者確定了XGBoost模型。
簡(jiǎn)單來(lái)說(shuō),研究人員選擇模型中性能最好的樹(shù),利用三個(gè)關(guān)鍵特征及其閾值來(lái)預(yù)測(cè)患者的死亡或存活。
根據(jù)測(cè)試數(shù)據(jù)集及其準(zhǔn)確性選擇具有最佳性能的樹(shù)
該模型顯示了100%的死亡率預(yù)測(cè)準(zhǔn)確性和90%的生存預(yù)測(cè)準(zhǔn)確性。總體來(lái)看,無(wú)論是多樹(shù)XGBoost模型還是單樹(shù)XGBoost模型,模型對(duì)于生存和死亡預(yù)測(cè)的準(zhǔn)確率、宏觀和加權(quán)平均得分始終超過(guò)0.90。
最后,大多數(shù)患者在住院期間接受了多個(gè)血液樣本。研究人員用成千上萬(wàn)的額外血液測(cè)試結(jié)果驗(yàn)證了該模型,發(fā)現(xiàn)預(yù)測(cè)準(zhǔn)確率達(dá)到90%。此外,相關(guān)結(jié)果進(jìn)一步表明,無(wú)論患者的臨床結(jié)果如何,該模型都可以應(yīng)用于任何血液樣本。
盡早識(shí)別高風(fēng)險(xiǎn)患者,并快速確定優(yōu)先級(jí)。
研究人員表示,這項(xiàng)研究的意義是雙重的。首先,一般的相關(guān)研究只會(huì)“提供高危因素的范圍”,而這個(gè)模型提供了一個(gè)簡(jiǎn)單直觀的臨床測(cè)試,然后可以準(zhǔn)確快速的量化死亡風(fēng)險(xiǎn)。
如果醫(yī)生能夠提前知道某些治療方法會(huì)導(dǎo)致某些患者治療效果不理想,那么醫(yī)生就可以在病情變得更嚴(yán)重之前采取不同的方法。應(yīng)用該模型的目的是在不可逆病變發(fā)生前識(shí)別高危患者。
其次,任何醫(yī)院家族都可以很容易的收集到患者的LDH(乳酸脫氫酶)、淋巴細(xì)胞、hs-CRP(高敏C反應(yīng)蛋白)的信息。這個(gè)簡(jiǎn)單的模型可以幫助在擁擠的醫(yī)院中醫(yī)療資源短缺的情況下,快速確定患者的優(yōu)先級(jí)。
患者體內(nèi)LDH水平的升高可以反映組織或細(xì)胞的破壞,這被認(rèn)為是組織或細(xì)胞損傷的共同標(biāo)志。血清LDH已被確定為特發(fā)性肺纖維化嚴(yán)重程度的重要生物標(biāo)志物(IPF)。
在嚴(yán)重的肺間質(zhì)疾病患者中,LDH的升高是顯著的,并且它是肺損傷的最重要的預(yù)后指標(biāo)之一。因此,對(duì)于重度新冠肺炎患者,LDH水平的升高表明肺損傷的嚴(yán)重程度增加。
研究小組指出,較高的血清hs-CRP也可以用來(lái)預(yù)測(cè)重癥新冠肺炎患者的死亡風(fēng)險(xiǎn)。hs-CRP的升高是ARDS患者預(yù)后不良的重要標(biāo)志,反映了炎癥的持續(xù)狀態(tài)。
值得注意的是,這種持續(xù)炎癥反應(yīng)的結(jié)果可以從新冠肺炎死者的尸檢中看出,即肺部出現(xiàn)大量灰白色病變,組織切片中也可見(jiàn)大量肺泡的粘稠分泌物。
最后,研究結(jié)果還表明,淋巴細(xì)胞可能作為潛在的治療靶點(diǎn),這一點(diǎn)得到了臨床研究結(jié)果的支持。此外,包括北京中日友好醫(yī)院呼吸科主任曹斌在內(nèi)的研究人員已經(jīng)證明,淋巴細(xì)胞減少是新冠肺炎患者的常見(jiàn)特征,可能是與疾病嚴(yán)重程度和死亡率相關(guān)的關(guān)鍵因素。
與SARS和MERS患者肺泡穿透和抗原呈遞細(xì)胞(APC)損傷的方式一樣,新冠肺炎患者受損的肺泡上皮細(xì)胞可誘導(dǎo)淋巴細(xì)胞浸潤(rùn),導(dǎo)致持續(xù)性淋巴細(xì)胞減少。
之前的一項(xiàng)患者活檢研究表明,外周血中CD4和CD8 T細(xì)胞的數(shù)量大大減少,它們的狀態(tài)是過(guò)度激活的。此外,一些研究表明,淋巴細(xì)胞減少主要與CD4和CD8 T細(xì)胞減少有關(guān)。因此,淋巴細(xì)胞在新冠肺炎中可能起著明顯的作用,值得進(jìn)一步研究。
作者說(shuō)這項(xiàng)研究也有一些局限性。首先,因?yàn)檫@種機(jī)器學(xué)習(xí)方法是純數(shù)據(jù)驅(qū)動(dòng)的,如果我們從不同的數(shù)據(jù)集出發(fā),模型可能會(huì)不一樣。
另外,雖然作者掌握了80多個(gè)臨床測(cè)量結(jié)果,但為了避免過(guò)擬合,團(tuán)隊(duì)采用的建模原則是在最少的臨床測(cè)量結(jié)果數(shù)和良好的預(yù)測(cè)能力之間進(jìn)行權(quán)衡,因此可能存在臨床測(cè)量結(jié)果不夠豐富的問(wèn)題。
最后,本研究平衡了模型的可解釋性和較高的準(zhǔn)確性。雖然臨床環(huán)境傾向于使用可解釋的模型,但如果使用黑盒模型,準(zhǔn)確性可能更高,但同時(shí)決策的風(fēng)險(xiǎn)也更高。
從技術(shù)角度來(lái)看,作者認(rèn)為這項(xiàng)工作有助于使用機(jī)器學(xué)習(xí)方法預(yù)測(cè)和診斷正在經(jīng)歷大規(guī)模全球爆發(fā)的COVID 19病例。
本文網(wǎng)址:http://m.gmeo.cn/news/968.html
相關(guān)標(biāo)簽:醫(yī)學(xué)急診,醫(yī)學(xué)知識(shí),醫(yī)院家族,醫(yī)院中醫(yī)
最近瀏覽:
相關(guān)產(chǎn)品:
相關(guān)新聞:
- 醫(yī)學(xué)教學(xué)模型——讓醫(yī)學(xué)知識(shí)更易于理解
- 為“小時(shí)候的自身”送去“一束光”
- 醫(yī)學(xué)教學(xué)用人體模型,提升醫(yī)學(xué)知識(shí)與技能
- 華中科大AI模型預(yù)測(cè)新冠生存率準(zhǔn)確率90%,有助早期介入!
- 醫(yī)學(xué)模型教程,探究醫(yī)學(xué)知識(shí)的重要工具
- 中南大學(xué)湘雅醫(yī)學(xué)院赴文家市鎮(zhèn)暑期社會(huì)實(shí)踐順利開(kāi)展!
- 學(xué)會(huì)他這項(xiàng)技藝 要害時(shí)刻能救命
- 2017醫(yī)療健康行業(yè)年度報(bào)告:獨(dú)創(chuàng)VB象限模型,用數(shù)據(jù)管窺醫(yī)療!
- 學(xué)會(huì)他這項(xiàng)技藝 要害時(shí)刻能救命
- 2020安徽醫(yī)學(xué)倫理備考資料-醫(yī)患關(guān)系的三種模型!