研究設計中常見的風險測量

在寫Paper或者做Study的過程中,我們常常將所觀察的結果(依變項Dependent Variable / Outcome)定義為二元變項。常見的二元變項有死亡與否,疾病發生與否;或者我們去定義的結果,如LVEF < 60%、eGFR < 60%。

如此二分法可以簡化闡述結果。

「糖尿病病人比較容易會有eGFR異常,其相對風險(relative risk, RR)為3.7倍」
「飯前血糖每高20,則病人的eGFR異常的勝算比(odds ratio, OR)會低1.5%」

常常在Journal Reading時聽到的台詞,但在風險測量時,何時該選擇相對風險?何時該選擇勝算比呢?


在介紹風險測量之前,要先了解研究設計(Study Design)為何,簡言之可分成前瞻性研究(Prospective Study)及回溯性研究(Retrospective Study)兩個大類。

Relative Risk, RR 相對風險



實驗把受試者分成暴露組(Exposed group)與非暴露組(Unexposed group),然後向前追蹤一段時間,直到人數達到原先規劃的結果(Outcome),此時暴露組發生事件的風險比例為A/N1,非暴露組發生事件的風險比例為C/N2,兩者相除即為相對風險(RR)

相對風險顯著地大於1就代表暴露組的風險顯著地比非暴露組增加;相對風險顯著地小於1就代表暴露組的風險顯著地比非暴露組減少

例如抽煙與肺癌的世代研究(Cohort study),抽煙組發生肺癌的比例為3%而未抽煙組罹患肺癌比例為1%,此時相對風險即為3%/1% = 3,代表抽煙罹患肺癌的風險是沒有抽煙者的3倍之多,也可說抽煙罹患肺癌的風險相較於沒有抽煙者多出2倍(3-1=2)。

然而,相對風險有其使用時機限制。

只能用在前瞻性研究(Prospective study)

假使我們進行的是回溯性研究( Retrospective study ),那麼使用相對風險(Relative Risk)會得到錯誤的結論。

因為在回溯性研究中,我們要先選定疾病組與非疾病組(而不是選定暴露組與非暴露組),然後去回溯(查病歷、健保資料庫等等)他們暴露的狀況,也就說此時「疾病的機率是由研究者所決定」,因此不直接以A/N1去除以C/N2,因為A跟C都是一開始就決定的疾病組。

Odds Ratio, OR 勝算比



何謂「勝算」(odds),勝算定義是「兩個機率相除的比值」

常出現於Retrospective study,常見為Case-Control Study,也就是一開始就已知病人有無疾病或死亡(Outcome)(依變項),再回溯找尋暴露因子(自變項,譬如說有無抽菸)

因病人的outcome比例可以挑選樣本時就決定,這類的研究去算機率是沒有意義的,因此就會用OR去計算曝露組與非曝露組發生死亡或疾病(outcome)的相對比例來做估計。

A/N3表示疾病組中有暴露的機率,C/N3指的是健康組中有暴露的機率,因此此兩者相除即為疾病組中有暴露的勝算(A/C);同樣地,B/D即為健康組中有暴露的勝算,此時將A/C再除以B/D即為「疾病組相對於健康組,其暴露的勝算比」,也就是說兩個勝算相除就叫做勝算比。

很多人在解釋勝算比的時候都會有錯誤,最常見的錯誤就是誤把勝算比當成相對風險來解釋。

OR不是機率,OR不是機率,OR不是機率。因為很重要,所以說三次

以抽煙跟肺癌的病例對照研究為例,50位肺癌組中有70%曾經抽煙而150位健康組中(即對照組)僅有40%曾經抽過煙,此時勝算比即為70%*60%/30%*40% = 3.5。

OR = 3.5的意義不容易解釋,它並非表示抽煙組罹患肺癌的風險是未抽煙組的3.5倍,而是肺癌組有抽煙的勝算(注意,不是機率!)是健康組的3.5倍,而這個勝算指的又是「有抽煙的機率除以沒有抽煙的機率」。

總而言之,可以說「肺癌跟抽煙具有相關性」,或者「抽煙的人比較容易會有肺癌罹患風險」,但是不要提到多出多少倍的風險或機率。

在常見Journal 中,OR出現比RR多,一部份原因是大家較少採用費時又耗力的前瞻性研究(只能用RR),另外一個原因是勝算比可用在前瞻性研究也可用在回溯性研究,而且它的統計性質(Property)比較好。



統計就是每個字都懂,合起來就看不懂的學問。

2 則留言:

  1. 謝謝分享 很清楚的解釋

    回覆刪除
  2. 寫得很清楚
    不知可否也分享一下hazard ratio 感謝

    回覆刪除