心肺復(fù)蘇模型

新聞分類

臨床預(yù)測模型這么火,它到底是什么?!

臨床預(yù)測模型這么火,它到底是什么?!

發(fā)布日期:2022-03-10 作者:WLT 點擊:

臨床預(yù)測模型既重要又復(fù)雜。

近年來,臨床預(yù)測模型在診療決策、患者預(yù)后管理和公共衛(wèi)生資源配置中的應(yīng)用越來越重要,但臨床預(yù)測模型的建立是一項復(fù)雜的系統(tǒng)工程。本文回顧了相關(guān)的權(quán)威研究,總結(jié)了建立臨床預(yù)測模型的全過程,介紹了相關(guān)概念和重要原則。

建立臨床預(yù)測模型的五個階段

在個性化的醫(yī)學時代,對流行病或意外疾病的結(jié)果(診斷)或未來疾病進展(預(yù)后)的預(yù)測對于醫(yī)護人員的患者管理變得更加重要。臨床預(yù)測模型用于研究特定條件下患者未來或未知結(jié)局(終點)與基線健康狀態(tài)(起點)之間的關(guān)系。它通常結(jié)合多個參數(shù)來幫助醫(yī)生洞察模型中每個預(yù)測因子的相對影響。

該模型需要準確預(yù)測特定事件,并且相對簡單易用。一方面,如果預(yù)測模型對未來事件的估計不準確,會誤導(dǎo)醫(yī)療專業(yè)人士;另一方面,如果模型具有較高的可預(yù)測性,但難以應(yīng)用(例如,計算復(fù)雜或不熟悉的問題/項目或單元),耗時、成本高或相關(guān)性低(例如,對所有患者進行無差別篩查),則不會在臨床上廣泛應(yīng)用。因此,可預(yù)測性和可操作性之間的平衡是建立良好臨床預(yù)測模型的關(guān)鍵。

目前,雖然對預(yù)測模型的理想構(gòu)建方法還沒有達成共識,但臨床研究領(lǐng)域的許多專家提出了許多方法來提高模型開發(fā)的質(zhì)量和影響力?;谇叭说难芯砍晒疚膶⒔⑴R床預(yù)測模型的全過程歸納為五個主要階段:


1.jpg


建立臨床預(yù)測模型的五個階段

一個

第一階段:界定研究問題。

從統(tǒng)計技術(shù)的角度來看,臨床預(yù)測模型是臨床研究中比較先進的研究類型,但并不是所有的問題都適合用臨床預(yù)測模型來回答。例如,干預(yù)/暴露措施的效果估計和比較適合用傳統(tǒng)的統(tǒng)計假設(shè)檢驗或校正模型來回答,如T檢驗/方差分析、卡方檢驗和對數(shù)秩檢驗。臨床預(yù)測模型適用于回答與疾病的診斷或預(yù)后相關(guān)的問題,特別是如何通過預(yù)測因素的組合來準確估計疾病或事件發(fā)生的概率。臨床預(yù)測模型的本質(zhì)是利用臨床數(shù)據(jù)集建立一個多元的、高精度的、有意義的預(yù)測模型。首先,我們需要明確幾個重要的研究問題:1)靶疾病領(lǐng)域的靶結(jié)果是什么?如糖尿病和心血管疾??;某種并發(fā)癥,死亡。2)目標患者是誰?例如普通人群、65歲以上的老年人或二型糖尿病患者。3)預(yù)測模型的目標用戶是誰?例如疾病領(lǐng)域的其他醫(yī)生、健康相關(guān)組織、處于疾病風險中的群體和關(guān)注疾病的其他群體。根據(jù)以上問題的回答,結(jié)合患者選擇的目標區(qū)域和相關(guān)區(qū)域的數(shù)據(jù)集,目標用戶的類別將決定指標的選擇和處理過程,從而影響臨床預(yù)測模型的專業(yè)性和復(fù)雜性。


2.jpg


預(yù)測模型適用的問題類型。

2

第二階段:選擇數(shù)據(jù)集。

在融合的過程中,醫(yī)學教學、科研、管理的應(yīng)用需要人才的聚集和產(chǎn)業(yè)生態(tài)的建立。自2013年成立以來,國內(nèi)已有近百家領(lǐng)先的醫(yī)療研究機構(gòu)(150強)和政府機構(gòu)與醫(yī)療人工智能公司醫(yī)療都勻展開合作。醫(yī)學都勻在發(fā)展中,憑借其戰(zhàn)略國際化和文化多樣性,吸引了專業(yè)領(lǐng)域的世界知名科學家和人才。整合了跨越10余年的醫(yī)學信息進行醫(yī)院處理和整合,覆蓋40余種重大疾病,創(chuàng)建了3000余個專科疾病模型,自主研發(fā)了醫(yī)學數(shù)據(jù)智能平臺。數(shù)據(jù)集是臨床預(yù)測模型最重要的組成部分之一。在現(xiàn)實中,需要搜索最合適的數(shù)據(jù)集并充分利用它。通常,您也可以選擇使用專業(yè)的臨床數(shù)據(jù)源輔助和管理工具來整理和建立包含研究終點和所有關(guān)鍵預(yù)測指標的主數(shù)據(jù)集。研究人員可以根據(jù)預(yù)測模型的目的,使用不同的方法提取不同的子數(shù)據(jù)集。不同的臨床預(yù)測模型問題適合用不同的研究設(shè)計數(shù)據(jù)來回答。對于診斷問題來說,預(yù)測因素和結(jié)果都在同一時間或短時間內(nèi),因此使用橫截面數(shù)據(jù)建立診斷模型是合適的。對于預(yù)后問題,預(yù)測因子和結(jié)果之間存在縱向時間邏輯,適合用隊列研究數(shù)據(jù)擬合預(yù)后模型。隨機臨床試驗可視為更嚴謹?shù)那罢靶躁犃校虼艘部捎糜诮㈩A(yù)后模型,但外推法有限。不同類型的臨床預(yù)測模型的特征如下表所示:


3.jpg


不同預(yù)測模型的特點及數(shù)據(jù)選擇

對于數(shù)據(jù)集中樣本容量的最低要求,沒有絕對的共識。一般來說,較大且較新的數(shù)據(jù)集能更好地反映目標群體的特征,增強模型的相關(guān)性、可重復(fù)性和普及性,是建模的理想選擇。為了客觀地驗證建模結(jié)果,通常需要將研究數(shù)據(jù)分為訓(xùn)練數(shù)據(jù)集和驗證數(shù)據(jù)集兩部分。根據(jù)研究者的具體目標,分割率可能有所不同,但一般來說,更多的研究對象應(yīng)該被分配到開發(fā)數(shù)據(jù)集,而不是驗證數(shù)據(jù)集。臨床預(yù)測模型首先通過算法從訓(xùn)練集中提取規(guī)則,其預(yù)測性能要根據(jù)驗證集在不同的組中進行評估。為了確定模型的可擴展性和健壯性,可以根據(jù)數(shù)據(jù)集格式,盡可能使用來自外部研究組或隊列的測試數(shù)據(jù)集進行外部驗證。


4.jpg


醫(yī)療大數(shù)據(jù)成為預(yù)測模型數(shù)據(jù)集的重要選擇。

第三階段:處理特征變量。

首先,需要對確定的數(shù)據(jù)集進行基本的清洗,包括檢查數(shù)據(jù)一致性、處理無效值和錯誤值等。因為數(shù)據(jù)集通常包含比最終預(yù)測模型中使用的變量更多的變量,所以在建立模型之前,需要評估和選擇最可預(yù)測和最敏感的預(yù)測因子。一般來說,特征變量的評價主要有三個方面:1。要求檢查員處理丟失的數(shù)據(jù)。在大多數(shù)數(shù)據(jù)分析中,數(shù)據(jù)缺失是一個長期的問題,丟失的原因各不相同,包括不收集、不可用或不適用、被調(diào)查者拒絕,或者“不知道”。為了解決這個問題,研究人員可以考慮使用插值技術(shù)將答案分為“是”和“其他”,或者允許“未知”作為單獨的類別,以盡可能提高數(shù)據(jù)填充率。

2.需要專家對之前發(fā)現(xiàn)的顯著預(yù)測因子進行判斷,通常應(yīng)將其作為候選變量,如糖尿病風險評分中的糖尿病家族史。應(yīng)該注意的是,并非所有重要的預(yù)測因素都需要包括在最終模型中,例如P

3.要求數(shù)據(jù)科學家對變量編碼分類變量和連續(xù)變量有不同的處理方法。對于分類變量,我們可以根據(jù)臨床實際意義和數(shù)據(jù)特點,對類別進行組合或重新分類。比如,在基本的人口特征中,教育程度往往分為小學、初中、高中、大專、本科、研究生、博士等。根據(jù)分析和以往研究的需要,高中畢業(yè)與否可能是一個重要的分界點,可以重新劃分為小學、中學、本科及以上。這樣可以相對平衡其他人的數(shù)量,避免過度細分。連續(xù)變量的相對影響由模型中使用的測量尺度決定。例如,空腹血糖水平對心血管疾病風險的影響可以解釋為,每10 mg/dl通常比每1 mg/dl對結(jié)果的影響更大。在對特征變量進行求值和處理后,由于不同的算法需要不同的數(shù)據(jù)類型,所以需要對數(shù)據(jù)和算法進行適配。通常情況下,連續(xù)變量通常比分類變量承載更豐富、更準確的信息,但同時也可能增加模型的復(fù)雜性和難度或者外行人難以理解。研究者可以通過觀察建模過程中的一些預(yù)測因素,進一步調(diào)整變量類型,從而優(yōu)化模型。


5.jpg


加工特征變量的工作比例

第四階段:預(yù)測模型的建立。

雖然在選擇預(yù)測目標變量和確定預(yù)測模型方面沒有全行業(yè)一致的指南,但我們可以借鑒統(tǒng)計分析的概念。根據(jù)預(yù)期用途,將問題求解方法定義為分類預(yù)測模型、線性預(yù)測模型和風險預(yù)測模型。建立臨床預(yù)測模型的幾點建議:

所有的候選變量都包含在模型中,一些不重要的候選變量可以通過逆向淘汰或逐步選擇的方法去除。包含所有候選變量可以避免過度擬合和選擇偏差。模型的擬合程度可以通過參考赤池信息準則(AIC)和貝葉斯信息準則(BIC)來檢查。AIC是模型擬合的一個指標。通常,AIC值越低,模型擬合越好。有人認為AIC涉及解釋,而BIC涉及預(yù)測,其中BIC可視為貝葉斯算法的相應(yīng)指標。如果研究人員對高級算法比較熟悉,可以考慮用機器學習算法進行模型擬合。根據(jù)響應(yīng)變量(因變量Y)的類型,可以分配不同的建模算法。類似研究中常用的算法如下。


6.jpg


常見算法和特征

第五階段:模型評估與驗證(內(nèi)部/外部)模型生成后,研究人員應(yīng)使用獨立的測試數(shù)據(jù)集來評估其提出的模型的預(yù)測能力。不同類型的問題有不同的評價指標,可以反映模型不同方面的特點。下面分別列出分類問題和回歸問題的評價指標。在實際的建模工作中,還需要了解各個指標的含義,并對這些指標進行合理的解讀。


7.jpg


分類問題中的指標


8.jpg


回歸問題中的指標

預(yù)測模型的驗證及應(yīng)用方向

由于模型開發(fā)的復(fù)雜性,咨詢數(shù)據(jù)科學家和統(tǒng)計專家可以提高預(yù)測模型研究的有效性和整體質(zhì)量。在開發(fā)模型之后,在使用模型之前,我們應(yīng)該使用盡可能多的外部數(shù)據(jù)集,并有效地傳播給相關(guān)方。臨床預(yù)測模型的應(yīng)用場景不限于醫(yī)療機構(gòu)。基于中國目前的情況,Web或智能移動應(yīng)用程序可以更好地成為向公眾宣傳和普及預(yù)測模型的重要渠道。希望本文的內(nèi)容能夠幫助醫(yī)生和研究人員對臨床預(yù)測模型有一個初步的了解,并能夠支持實際的科學研究。在未來的推文中,我們將詳細介紹預(yù)測模型中使用的回歸方法和算法的主題。

參考文獻:moonskg,Royston P,Vergouwe Y,格羅布·比德,奧特曼DG。預(yù)后和預(yù)后研究:什么、為什么和如何?BMJ 2009;338:b375。Hemingway H,Croft P,Perel P,Hayden JA,Abrams K,Timmis A,等。預(yù)后研究策略(進展)1:研究臨床結(jié)果的框架。BMJ青奧會;346:e5595。Greenland S .對成本效益預(yù)測重新定位的需要:對M. J. Pencina等人的“評估一種新標記物從ROC曲線下面積到重新分類及以后的額外預(yù)測能力”的評論,醫(yī)學統(tǒng)計學(DOI: 10.1002/sim.2929)。統(tǒng)計醫(yī)學2008;27:199-206.格里芬SJ,小PS,黑爾斯CN,金月AL,韋勒姆新澤西州。糖尿病風險評分:全科醫(yī)療中二型糖尿病的早期檢測。糖尿病代謝研究2000年修訂版;16:164- 71.小戈夫·DC、勞埃德·瓊斯、貝內(nèi)特·G、科亞迪·S、達戈斯蒂諾·RB、吉本斯·R等,2013年美國心臟病學會/美國心臟協(xié)會心血管風險評估指南:美國心臟病學會/美國心臟協(xié)會實踐指南工作組報告。循環(huán)2014;129 (25補編第2號):S49-73。邁向更好的臨床預(yù)測模型:發(fā)展的七個步驟和驗證的ABCD。歐洲心臟雜志2014;35:1925-31.我們驗證一個預(yù)后模型意味著什么?統(tǒng)計醫(yī)學2000;19:453-73.斯特耶伯格。臨床預(yù)測模型:開發(fā)、驗證和更新的實用方法。紐約:斯普林格;2009.Steyerberg EW,Moons KG,van der Windt DA,Hayden JA,Perel P,Schroter S,等。預(yù)測研究策略(進展)3:預(yù)測模型研究。PLoS Med 201310:e1001381??铝炙笹S,賴茨馬JB,奧特曼DG,月亮KG。個體預(yù)后或診斷多變量預(yù)測模型的透明報告(TRIPOD):TRIPOD聲明。Ann實習生Med 2015162:55-63.李YH,邦H,樸YM,Bae JC,李BW,康ES,等。非酒精性脂肪性肝病的非實驗室自我評估篩查評分:發(fā)展,驗證和與其他評分的比較。PLoS One 20149:e107584。Bang H,Edwards AM,Bomback AS,Ballantyne CM,Brillon D,Callahan MA,等。糖尿病風險患者自我評估評分的開發(fā)和驗證。Ann實習生Med 2009151:775-83.Kotronen A,Peltonen M,Hakkarainen A,Sevastianova K,Bergholm R,Johansson LM,等.利用代謝和遺傳因素預(yù)測非酒精性脂肪性肝病和肝臟脂肪.胃腸病學2009;137:865-72.回歸建模策略:應(yīng)用于線性模型、邏輯回歸和生存分析。紐約:斯普林格;2001.主要血管手術(shù)后心臟事件的預(yù)測因素:臨床特征、多巴酚丁胺超聲心動圖和β-受體阻滯劑治療的作用JAMA 2001285:1865-73.解釋還是預(yù)測?統(tǒng)計科學2010年:289-310。Heikes KE,Eddy DM,Arondekar B,Schlessinger L .糖尿病風險計算器:檢測未診斷糖尿病和糖尿病前期的簡單工具。2008年糖尿病護理;31:1040-5.統(tǒng)計建模:兩種文化(作者有評論和反駁)。統(tǒng)計學家Sci 200116:199-231.Steyerberg EW,Vickers AJ,Cook NR,Gerds T,戈寧M,Obuchowski N,等,《評估預(yù)測模型的性能:傳統(tǒng)和新方法的框架》。流行病學2010;21:128-38.一種新的肝脂肪變性診斷評分的開發(fā)、外部驗證和比較評估。美國胃腸病學雜志2014;109:1404-14.Hilden J .評論:關(guān)于NRI、IDI和“好看”的統(tǒng)計數(shù)據(jù),下面什么也沒有。2014年流行病學;25:265-7.

欣賞醫(yī)學的美好,快樂學習生活。歡迎關(guān)注微信官方賬號【樊棋醫(yī)學BioSCI】。微信官方賬號專注于生物醫(yī)學研究、科研項目設(shè)計、SCI論文寫作等領(lǐng)域的知識梳理和數(shù)據(jù)分享。,為醫(yī)務(wù)工作者提供了方便。



本文網(wǎng)址:http://m.gmeo.cn/news/924.html

相關(guān)標簽:醫(yī)學時代,醫(yī)學教學,醫(yī)學都勻,醫(yī)學信息,醫(yī)院處理,醫(yī)學數(shù)據(jù),醫(yī)學統(tǒng)計學,樊棋醫(yī)學BioSCI

最近瀏覽:

在線客服
分享