生存分析原理简明教程 单因素生存分析 Kaplan-Meier、LogRank 只能针对单一的变量进行 多因素cox回归分析
一、生存分析
狹義上來說,生存分析用來分析病人的生存和死亡情況。廣義上講的是事件是否發生。在這里就用是否死亡來代替。一般來說,生存的數據一般有兩個變量,一個事件是否發生,病人是否死亡,死亡為1,未死亡為0,一個是事件發生經歷的時間,這里用生存時間來代表。簡而言之,數據有兩個變量,一個是生存狀態(0或1),一個是生存時間。
二、刪失
刪失指的是未觀察到時間發生,在這里就是未觀察到患者死亡,若患者死亡,則生存狀態為1,若在觀察時間內不知道患者是否死亡,稱為刪失,生存狀態為0。造成刪失有很多種情況,可以是截止到生存時間為止仍然存活,也可以是失訪。
三、Cox比例風險模型
Cox回歸主要探討什么樣的患者死亡的更快,什么因素影響了患者死亡的速度。Cox回歸分為單因素分析和多因素分析,分別探討的是單個因素對于患者死亡的影響和多個因素對于患者死亡的影響。通常的做法是單個因素的影響比較顯著時再將該因素用來多因素分析。Cox回歸的公式如下
h(t)是風險函數,風險函數是指在時間t時刻事件發生的概率,也就是說在t時刻之前患者都未死亡。?h0(t)?是基準風險函數。?x1?....?xn是協變量,也就是我們的多因素分析中的每一個因素,?β1?....?βn?是變量前的系數,稱為回歸系數。這里通過極大似然法來估計回歸系數。Cox回歸的公式類似于一個廣義線性回歸。最后可以得到一個函數h(t),反應的是在若干個因素的影響下,t時刻患者死亡的概率。
生存分析簡明教程 生存分析原理
在生物醫學研究中,生存分析 是非常重要和常見的分析方法。本文對 生存分析 中的Kaplan–Meier 模型、Cox 比例風險模型進行了簡要而詳盡的概述,幫助大家更好的理解生存分析等相關概念。本文適用于生物醫學專業初學者以及對生存分析感興趣的非專業人士。
生存分析
首先,簡單描述一下 生存分析 的使用場景,已經熟悉的同學可以選擇直接跳過。 生存分析 經常用在癌癥等疾病的研究中,例如在對某種抗癌藥物做臨床試驗時,會首先篩選一部分癌癥患者隨機分為兩組,一組服用該試驗藥物,一組服用對照藥物,服藥后開始統計每個患者從服藥一直到死亡的生存時間,通過考察兩組之間的病人在生存時間上是否有統計學差異來判斷試驗藥物是否有效。在這里,死亡是整個實驗中重點觀測的事件,即 event。對于每個病人,需要記錄他們發生該事件的具體時間。因此, 生存分析 可以抽象概述為,研究在不同條件下,特定事件發生與時間的關系是否存在差異。這些具體事件可以是死亡,也可以是腫瘤轉移、復發、病人出院、重新入院等任何可以明確識別的事件,而不同條件即為不同的分組依據,可以是年齡、性別、地域、某個基因表達量的高低、某個突變的攜帶與否等等。下圖是鐘南山院士在對歐洲呼吸學會針對 Covid-19 的報告中提到的研究結果,他們對湖北省內和省外的病人從開始癥狀到入院時間做了分析,從發生癥狀開始,入院則是我們剛才講的 event 事件,而湖北省內外則是不同的分組條件。圖中還提到,他們使用 Cox 模型對地理進行了校正,這也是我們在這篇文章中后續要講到的內容。對鐘南山報告感興趣的同學可以訪問此鏈接?進行查看。
上面對生存分析的使用場景做了簡單介紹,相信大家已經大概對生存分析有了基本的印象。接下來我們需要提前交待一下關于刪失數據的情況,即 censored data.?
刪失數據,字面意思是刪除丟失的數據,它在生存分析里面實際指的是在實驗過程中丟失的、失去跟蹤的數據。舉例來說,對于腫瘤治療藥物的臨床試驗,關注事件為從服藥到死亡,但是有一部分病人在試驗過程中會無法觀測到死亡事件的發生,比如無法聯系到、或主動退出、或其他需要緊急處理退出臨床試驗的情況、以及試驗結束時還未發生死亡等,這些數據就稱作刪失數據。考慮到這種類型的刪失保留了從一開始到刪失前的進展,而丟失了后續的結局,我們將這類刪失稱作右刪失。相對應的,還有一種類型叫做左刪失,比如我們要統計從初次患病到最終死亡的生存時間的分析,有些病人已知患有疾病且知道其死亡時間,但無法確定初次患病的時間,這樣的刪失則成為左刪失。對于左刪失數據,有一些對應的方法進行處理,我們這里不做討論(有時間的話可以加進來)。本文后續主要對右刪失的情況進行考慮。
開始之前,我們再明確兩個概念。
1,生存概率,即 Survival probability,指的是研究對象從試驗開始直到某個特定時間點仍然存活的概率,可見它是一個對時間t的函數,我們定義之為 S(t);
2,風險概率,即 Hazard probability ,指的是研究對象從試驗開始到某個特定時間 t 之前存活,但在 t 時間點發生觀測事件如死亡的概率,它也是對時間 t 的函數,定義為 H(t)。接下來要講的 Kaplan-Meier 方法主要關注 S(t),而后面講到的 Cox 風險比例模型則關注 H(t)。
下面進入正題,引入 Kaplan–Meier 方法,該方法是由 Kaplan 和 Meier 與 1958 年共同提出的,為理解方法的細節,我們先看下一張表(原文鏈接)。本例中我們以死亡作為觀測事件,這張表也叫做 life table.
?A 列是從試驗開始起,持續的觀測時間,星號代表在該時間有刪失數據發生;B 列是指在 A 列對應的時間開始之前所有存活的研究對象個數,也可以叫做 at risk 的人數,表示當前具有死亡風險的有效人群,是排除了已經死亡和刪失的數據之后剩余的人數;C 列為恰好在 A 列對應的時間死亡的人數,D 列即表明在該時間點刪失的個數。第一行則可以解讀為,在 0.909 年這個時間點之前,本來有 10 個患者,在 0.909 這個時間點(或其之后的一小段時間區間)死亡了一個人,沒有刪失數據,意味著還剩 9 人;隨后,只要有新增死亡或刪失數據,則在表中新建一行,記錄時間和人數。
我們先不引入 Kaplan–Meier 公式,大家可以先嘗試自己去思考下如何計算每個時間節點的生存概率,即 S(t)。比如在 1.536 年這個時間點,即表中的第五行,病人在該點的生存概率是多少呢?很容易可以想到,要想在 1.536 這個時間點存活,他/她必須在 1.536 之前的所有時間點存活才行,也就是說在 0.909、1.112、1.322、1.328 這幾個時間點,病人都必須存活。那么在 1.536 這個時間點的生存概率 P 實際上就等于在包括 1.536 在內的所有之前的時間點都不死亡的概率乘積,即:
P(存活至1.536) = P(0.909時不死亡) * P(1.112時不死亡) * P(1.322時不死亡) * P(1.328時不死亡) * P(1.536時不死亡)
對于某個特定時間點不死亡的概率,可以用 1 – 死亡概率 來估算,舉個例子:
P(0.909時不死亡) = 1 – P(0.909時死亡) = 1 – (0.909時死亡的人數)/(0.909之前的所有人數) = 1 – 1/10 = 0.9
P(1.112時不死亡) = 1 – P(1.112時死亡) = 1 – (1.112時死亡的人數)/(1.112之前的所有人數) = 1 – 1/9 = 0.89
需要注意的是,刪失數據發生時,由于當前時間點沒有發生死亡人數,該時間點對累計的生存概率不產生貢獻。但由于總人數減少,會對下一個時間點的生存概率產生影響。如:
P(1.322時不死亡) = 1 – P(1.322時死亡) = 1 – (1.322時死亡的人數)/(1.322之前的所有人數) = 1 – 0/9 = 1
當我們計算出每個時間點不死亡的概率之后,我們就可以通過連續乘積算出每個時間點的生存概率,即存活至該時間點的概率。如下表所示:
該表中? E 列即不死亡概率,F 列則表示累積的生存概率,可以看到隨著時間增加,死亡人數增多,越到后期,生存概率越低,這是符合常理的。另外需要注意,在刪失發生時,生存概率時沒有變化的。
其實我們剛才的思路就是 Kaplan–Meier 方法的主要思路,基于剛才的表格,我們也可以用數學公式來表示。一共有 m 個時間點,每個時間點用下標 i 來表示, i 為從 1 到 m 的整數, 生存概率 S(ti) 可以表示為:
其中,ti?表示第 i 個時間點,ni?表示在 ti?之前的有效人數,di?表示在 ti?死亡的人數,S(ti-1) 表示在上一個時間點 i-1 的生存概率。
根據這一公式,我們可以畫圖來展示生存率的變化情況,即 Kaplan-Meier 生存曲線,如下圖所示:
圖中橫軸即時間軸,縱軸是累積存活比例,也就是生存概率,加號表示刪失數據。一般來說,生存分析是要比較不同組之間的一個生存情況,因此 Kaplan-Meier 生存曲線一般不止一條曲線,如下圖所示:
圖中不同顏色表示不同的兩組病人,在時間軸上生存情況的不同表現。該圖中,紅色和藍色的線基本上重疊在一起,后期紅色線稍微高一點,也就是說紅色組的后期生存概率更高,病人死亡的相對慢一點。可以想象,如果某一組的生存情況特別差,那么它的生存曲線應該是一條極速下降的階梯狀。然而我們知道,在統計學中必須要有量化的指標來衡量差異及其顯著性,不能僅通過觀測來確定兩組之間是否存在差異。
最直觀的是來統計中位生存時間,即生存率在 50% 時所對應的生存時間,如下圖所示:
不同組別對應的中位生存時間不同,可以一定程度上反應出不同組別死亡風險的不同。如果想比較整體生存時間分布是否存在統計學差異,一般我們可以采用 Logrank 統計方法來對生存數據進行統計分析。p值顯著性計算方法
Logrank 方法是由 Nathan Mantel 最初提出的,它是一種非參數檢驗,中文翻譯為對數秩檢驗,主要用來比較兩組樣本的生存時間分布的差異。Logrank 實際計算形式可能有不同的變體,我們這里介紹一種版本,實際上是卡方檢驗的一種應用場景。Logrank 檢驗的零假設是指兩組的生存時間分布完全一致,當我們通過計算拒絕零假設時,就可以認為兩組的生存時間分布存在統計學差異。我們可以通過以下公式計算某組病人在某個時間點的期望死亡人數:
E1t?= N1t*(Ot/Nt)
其中 E1t?是指第一組中,在時刻 t,期望死亡人數;N1t?指第一組中 t 時刻 at risk的人數,即 t 之前的存活人數;Ot?則指兩組(第一組和第二組)總的觀測到的實際死亡人數;Nt?指兩組總的 at risk 的人數,或 t 時間之前兩組的總人數。如果你認真觀察了公式,你就會覺得它其實淺顯易懂,因為兩組生存概率分布一致,因此兩組總的 at risk 人數和兩組總的死亡人數的比例,應該和單組的 at risk 人數和總死亡人數的比例是一致的,這也就是為什么通過兩組總的比例和其中一組總的 at risk 的人數,就可以得到這一組期望死亡的人數,也就是上面公式所講的內容。
有了每個時間點的死亡期望值之后,我們構造如下的卡方值:
在該公式中,外層的 Σ 是對不同組的一個疊加,內層的三個 Σ 都是對不同時間點的疊加;j 代表的是第 j 組,比如服藥組和對照組就可以分別對應 j=1 和 j=2 ;這里分子上的 ΣOjt?是指在 j 組所有時間點的觀測死亡人數相加之和,是對不同時間點 t 對應的觀測值的一個累加,比如 t 分別對應 1 天、2 天、3 天等等;ΣEjt?是指在 j 組所有時間點期望死亡人數相加之和。觀測人數和期望人數的差值,就代表了實際情況與我們假設情況是否一致,如果假設是對的,即不同組的生存時間分布是完全一致的,那么觀測人數和期望人數的差值會是非常小的。因為差值有正有負,所以對它取平方,這樣就不會出現抵消的情況。另外,由于 100 和 120 之間相差的 20,和 1000 和 1020 之間相差的 20,情況并不完全一樣,100 和 120 之間的 20 占比達到 20%,而 1000 和 1020 之間相差的 20 占比只達到了 2%,為了讓這兩種情況可比較,再加一個分母即 ΣEjt,相當于轉換成百分比;最后把不同組別得到的值加起來,就得到 X2?值。通過查表可根據 X2?值來判斷是否需要拒絕零假設。具體的一個手動計算流程可以參考:鏈接.
除 Logrank 檢驗之外,一種生存時間分布的常用檢驗包括 Breslow 檢驗,其實也就是 Wilcoxon 檢驗,與 Logrank 不同的是,在每個時間點統計觀測人數和期望人數時,他會給它們乘以一個權重因子,即當前時間點的 at risk 的總人數,然后再把所有時間點加起來去統計卡方值。可以想象隨著時間點越靠后,at risk 的總人數會越小,因此權重越少,對 X2?值的貢獻就越小。因此 Breslow 檢驗對試驗前期的差異要更加敏感,而相對來說 Logrank 對后期相對更敏感一些,因為它的所有時間點的權重參數都是1. 在實際使用中,我們可以使用不同的方法從多個角度對數據去進行探究。
說到這里,Kaplan–Meier 的多數知識我們已經覆蓋到了。但還有一個方面可能會引起同學們的注意,如下圖所示:
大家可能會問,上圖中生存曲線周圍的淺色區間是什么?實際上,上圖中生存曲線周圍的淺色區間即其對應的 95% 置信區間。首先我們需要理解為什么每個節點的生存概率會存在置信區間,因為我們假設每個時間點的生存概率是符合一種特定的分布,那么每次觀測到某個時間點的結果就相當于是一次隨機抽樣,因為我們已經知道了生存概率對于時間 t 的函數 S(t),通過估算標準誤,我們就可以估算出某個時間點的誤差范圍 (Margin of Error) ,從而得到一個特定概率的置信區間。
針對生存概率分布數據的置信區間估計,一種基于 Greenwood 提出的公式為:
其中 S(t) 即為生存概率函數,是我們之前解釋過的不死亡概率的累計乘積。Za/2?是 正態分布的 α/2-th 分位數,可以查表得到。
除了上面公式提到的置信區間計算方法,還有一種指數型 Greenwood 公式,可以解決之前計算的置信區間可能不在 (0,1) 區間的問題,兩個公式的具體內容和推導都可以參考鏈接.
到目前為止,我們已經講了生存分析的基礎知識,包括生存分析應用場景、刪失數據說明、生存概率和風險概率、Kaplan–Meier 曲線、LogRank 和 Breslow 檢驗以及置信區間估計。但我們以上講解的內容都是只針對單變量的,也就是說 Kaplan-Meier、LogRank 只能針對單一的變量進行分析,要么按性別分組,要么按不同藥物分組,但無法同時考察多個因素,或對某些可能有影響的因素進行調整。比如我們要考察新冠病毒在湖北省內外的預后差異,假設我們不知道任何其他信息,但有理由懷疑湖北省和其他省份的人口成分可能存在差異,比如湖北省老人更多、兒童更多(假設),那我們就不能直接簡單的拿湖北的病例和其他省的病例去比較,必須同時考慮年齡、性別的影響,也就是說要對年齡、性別做出調整,這是之前用 LogRank無法做到的,此時 Cox 比例風險回歸模型就要閃亮登場了。
多因素 多因子回歸模型
Cox model
下面我們講解 Cox 比例風險回歸模型,英文名叫 Proportional Hazards Regression analysis 或 Cox Proportional-Hazards Model, 是由 Cox 于 1972 年提出的。我們這里簡稱其為 Cox 模型。
Cox 模型是一種半參數模型,因為它的公式中既包括參數模型又包括非參數模型。簡單說下參數模型和非參數模型的相同與區別。相同點是它們都是用來描述某種數據分布情況的;不同點在于,參數模型的參數是有限維度的,即有限個參數就可以表示模型分布,比如正態分布里的均值和標準差;而非參數模型的參數則屬于某個無限維的空間,無法用有限參數來表示,不同的數據會得到不同的分布估計,比如決策樹、隨機森林等等,我們無法用有限的參數來表示所有可能的分布情況。來看看 Cox 模型的公式就知道為什么 Cox 模型是一種半參數模型了。
或者寫成? 回歸系數??
?
1? 其中 t 是生存時間
2? ?x1, x2?到 xp?指的是具有預測效應的多個變量(即協變量),
3? ?b1, b2?到 bp?則是每個變量對應的 effect size 即效應量(parameter estimate),可以理解為結果的影響程度,后面會解釋。
4? ?h(t) 就是不同時間 t 的 hazard,即風險值。
5? ?而 h0(t) 是基準風險函數,也就是說在其他協變量 x1, x2,?…, xp(協變量代表其他的影響因素)?都為 0 時,即不起作用時,衡量風險值的函數。
根據公式我們可以看到指數部分是參數模型,因為其參數個數有限,即b1, b2?到 bp,而基準風險函數 h0(t) 由于其未確定性,可根據不同數據來使用不同的分布模型,因此是非參數模型。所以說, Cox 模型是一種半參數模型。
一個需要注意的地方在于,并不是所有的生存分析數據都可以用 Cox 模型來分析,它是需要滿足一定的假設的,大家可以帶著這個疑問繼續閱讀,我們在文章最后對此會進行討論。
現在我們知道了風險函數 h(t) 的公式,先解讀一下這個公式。h(t) 首先是基于時間變化的,t 是自變量;對于某個病人,不同時間的死亡風險是不一樣的,這非常好理解,腫瘤病人肯定是隨著病程的進展,復發率、死亡率都會不斷提高。我們可以回憶以下之前做 Kaplan-Meier 的那個表格,在最后的時間點生存率也越來越低,意味著風險越來越高。其次除了時間,不同年齡、性別、血壓等指征不同的病人,死亡風險也不一樣。比如這次的新冠病毒 Covid-19,年紀越大致死率越高,這也就是為什么 Cox 模型要把諸多可能影響生存率的因素都當作協變量引入到公式中去,在該公式中即?x1, x2, …, xp。我們的主要目標是通過一定方法來找到合適的 h0(t),以及所有協變量的系數 b1, b2,?…, bp。實際上cox 模型是需要用到極大似然估計等計算方法,首先構建特定的似然函數,通過梯度下降等方法來求解模型的參數,使得函數求解值最大。這里不對細節進行解讀,感興趣的讀者可以參考以下文章:鏈接1,?鏈接2,?鏈接3.
假設我們已經通過計算得到了合適的 h0(t) 和協變量系數,如何去解讀結果呢?我們可以比較某個協變量 x1?在不同值時對應的不同風險比(hazard ratio),這里比較 x1?和 x1+1,即若 x1?增加 1 個單位,增加前后的風險比是:
上式中,我們對 x1+1 和 x1?這兩個不同的值對應的風險比進行了計算,通過化簡可知x1+1 和 x1?對應的風險比實際上等于 exp(b1),也就是 e 的 b1?次方;簡單的講,假如 x1?指的是年齡,那么對于年齡 51歲 (x+1) 和年齡 50 歲 (x) 的人,可能死亡的風險比為 exp(b1)。如果 b1>0,則 exp(b1)>1,意味著年齡 +1,死亡風險增加;如果 b1<0, 則 exp(b1)<1,意味著年齡 +1,死亡風險降低;如果 b1=0,exp(b1)=1,意味著年齡變化對死亡風險不起作用。
因此,我們知道,對于每一個協變量(即x1 x2 x3 x4 ..... xp),如果它的系數(b1? b2? b3 ..... bp 即下面表格的parameter estimate)為正,表明對應的變量增加時,會增加病人的死亡風險(或其他事件風險,如復發、轉移等);如果它的系數為負,表明對應的變量值增加時,會降低病人的死亡風險。一個具體的計算例子可以查看鏈接,?一個使用R進行計算的例子可以查看:鏈接。
下面的表格是一個計算結果: 結果解讀 實戰 參數估計 統計方法 檢驗方法 p值
1? ? ?某個協變量的風險因子|風險比? ?HR?(hazard ratio)=exp( bp參數估計系數???乘以??xp協變量 )
2? ? ?參數估計系數大于0則表示風險增加,小于0則表示風險減少
3? ? ?HR 大于1則表明風險增加,小于1則表示風險降低
可以看到該表格中,一些風險因子包括年齡、性別、血壓(收縮壓)、是否抽煙、血清總膽固醇以及是否患有糖尿病,經過 Cox 模型計算,得到各個風險因子的參數估計,如年齡對應的參數為 0.11691,也就是之前公式中的系數為 0.11691,大于 0 表示年齡增加會增加風險,風險比HR?(hazard ratio) 為 exp(0.11691) = 1.124 ,即表格最后一列,該數值大于 1,同樣表明年齡增加會導致風險增加。對于二分類變量,即只有 0 和 1,比如男性為 1,女性為 0,這樣的變量與連續變量在 Cox 模型中的結果解讀是一致的,如果性別對應的協變量系數(即parameter estimate)大于 0,表明性別值越高風險越大,也就是說男性的風險高與女性。除了關注系數外,同時需要關注的是 p value,即該參數估計是否具有統計學顯著性,常用來統計的方法是 Likelihood ratio test,同時也有使用 Wald test, 和 score logrank statistics。簡單介紹一下 Likelihood ratio test,中文名叫似然比檢驗,核心思想是:為了判斷都某個新變量的引入是否對于模型有效,比較變量加入前和加入后,似然函數最大值的比較,如果沒有出現最大值的降低,那么則可能對模型有效,進而統計其顯著性。但這三種統計方法感興趣的可以查看鏈接.?
我們之前提到過,使用 Cox 模型是需要滿足一定的條件的。相信大家看到這里應該已經有了答案,最重要的一個假設條件是:任意兩人的風險比例是不隨事件變化的,這也是為什么 Cox 模型全名叫 Cox 比例風險回歸模型。舉例來說,如果某個人的死亡風險比另一個人高兩倍(如果一直都是高兩倍 那么K-M線就不會相交),那么不論什么時候,這個人的死亡風險都是另一個人的兩倍。這樣的假設我們可以從之前的公式中看到,hazard ratio 推導的結果是不包括時間 t 的。這是 Cox 模型可用的一個基本假設。實際情況并非一定如此,對吧?因此我們在做 Cox 模型之前,最好對數據進行一個解讀,看看是否滿足當前假設。既然不同人之間的風險比例固定,那么一個最簡單的例子就是任意分組情況下,兩組的 Kaplan–Meier 曲線不應該相交叉,如果曲線相交叉,說明兩組的生存概率關系隨事件發生了變化,亦即風險比隨時間發生變化,與假設相悖。然而,在實際應用中,由于樣本量較小時,生存曲線會引入較大的誤差,因此該判斷方法有可能失效。一個更加復雜的方法為 complementary log-log plot,即橫軸為 ln(t),縱軸為 ln(-ln(S(t)))。經過推導:
我們可知,不同組中,log(-log(S(t))) 對于 t的曲線,只有 βX 不同,而其與時間 t 無關,所以兩條曲線應該近似平行或等距。參考(檢查Cox模型比例風險假定的幾種圖示法_余紅梅,鏈接).
除了畫生存曲線觀察數據之外,我們還可以通過 Schoenfeld 殘差來檢查風險是否成比例。具體可以參考鏈接,?以及檢驗變量與時間的交互來作用來衡量風險比例是否固定(?鏈接?),這里不做展開。對于不符合固定風險比例的數據,可以使用時依協變量或分層Cox模型來計算(鏈接).
對于 生存分析 ,除了 Cox 模型外,還有一些其他可用的參數模型。與 Cox 模型不同,這些參數模型往往給定了可能的風險函數分布,比如 指數分布、Weibull 和 Gompertz 分布,然后進一步去估計對應的模型參數。如下圖所示,a 為指數分布,其 hazard ratio 為恒定值,在實際中很少應用;b 為 Weibull 分布,可通過不同的參數調整分布的走向;c 為 Gompertz 分布。相對于 Cox 模型,使用這些模型的優點在于分布曲線可根據參數推斷,可得到更多信息,比如:前期死亡率高后期死亡率低,也就是說可以得到更多關于風險分布的信息,而 Cox 模型只能得到有限信息,如風險比及其顯著性。使用這些全參數模型的缺點也是明顯的,即固定的分布不一定能滿足實際的數據情況,可能帶來更多的誤差。再實際使用情況中,可根據不同情況進行選擇。Weibull 模型的簡單介紹可參考鏈接.
以上, 是對 生存分析 中主要知識的一個大概介紹, 相信大家對于生存分析中的多數概念都有了直觀的人數。但由于筆者水平有限,文章可能有表述不清楚、甚至錯誤的地方,希望讀者可以多多提供建議和批評,或者有什么問題可以多多留言討論,謝謝!
推薦閱讀
openpbs centos 7 配置手把手教程
理解 Z-Score 標準分數的含義和用法
PyTorch 簡明樣例:蛋白質序列預測模型構建、數據載入、抽樣、訓練、評估
wxPython 教程 (譯)
Chrome 更新出錯?換個思路解決問題!
總結
以上是生活随笔為你收集整理的生存分析原理简明教程 单因素生存分析 Kaplan-Meier、LogRank 只能针对单一的变量进行 多因素cox回归分析的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 哪个linux桌面有电池显示,(求助!!
- 下一篇: 驰骋表单设计器 设计表单案例演示