各種類料類別和檢定 中,有一個在一般統計學上比較少用到的方式叫「勝算比」。

勝算比雖然是一種統計手法,但它比較常被用在生物統計學上,尤其是醫學相關。它的結果來自比例的比,就結果直接去解釋沒有意義。就邏輯上勝算比可以當做一個定量或是一個有效的力量。

在類別交叉分析上,通常會利用卡方檢定或費雪精確檢定,而在醫學界則常會計算出所謂的 RR (reletive risk) 和 OR (odds ratio)。

讓我們先從生物統計學往回談起,會比較容易了解勝算比。

為了闡述上的方便,生醫領域裡往往把變項定義為二元變項。
例如:腎絲球過濾率 (
eGFR) < 60% 的人定義為腎功能異常,而非定義成好/一般/差/極差。左心室射血分數 (LVEF) < 40% 的人視為異常。
這種定義方式可以讓研究得到一個比較直接的結論,像是「糖尿病患者 eGFR 異常的相對風險為3.7倍」,讓研究者可以直接針對相關因子做討論。

之前講費雪精確檢定時沒有特別提過,其實費雪在生物統計上的貢獻十分大。他在一戰後以統計工作者的身份進入 Pearson 的實驗室,但費雪和他之間的很多觀點和立場都不相同,加上 Pearson 強勢又霸道,費雪在 1919 年轉入了生物研究中心工作 (RES),在RES,他才開始在統計學上展現出其地位來。
1925年,費雪的早期代表作 Statistical Methods for Research Workers 便開創了現今 ANOVA 統計模型的基礎。
1938年,費雪和葉茲則共同發表了生物統計學上名典 Statistical Tables for Biological, Agricultural and Medical Research。
不難理解,為什麼費雪和葉茲都專注在二維交叉表上,因為這是生醫領域的一項特色。

說回相對風險和勝算比,可以從下面舉的一個例子來進行了解。
將 cancer A 和環境曝險因素 B 的研究資料以二維聯表顯示如下

研究資料二維表

則相對風險為曝險組發生的比例除以未曝險組發生的比例。

其意義十分直接明白,即曝險組的風險為非曝險組的 1.5 倍。
但這只能用在前瞻性研究中 (先預設好研究對象及研究方法,再開始做研究追蹤),而非用在回溯性研究中。因為同樣的主題要進行回溯性研究時,必須先選定發生 cancer A 和未發生的病人,再去比對他們的曝險條件。然而,疾病的發生機率是被研究者選定的,而非自然機率,因此相對風險的結果可能是全盤錯誤。

勝算比在很多時候會被誤解為相對風險。
在回溯研究中,不使用相對風險,而使用勝算比。從前面的解釋,大致上就可以了解二者的差異在選定研究的方向和對象不同。
也就是在已知病人有無 cancer A 的狀況下,去對比其曝險條件,所以勝算比的公式可以寫成

由於這是一個邏輯結果,所以比的順序並不重要,只要解讀方向正確即可。因此我並沒有在這裡特別定義 P和 P各代表什麼。
以同一個例子來說,就是有 cancer A 的病人中的曝險比例除以無 cancer A 樣本的曝險比例。

這個勝算比的算式是由「患病者曝險比」除以「非患病者曝險比」來得到結果為 1.77。
以算式來解讀,可以說患病者經過曝險因素的比例相較於非患病組多了 77%,但這個解讀方式的不具足夠的代表性。

勝算比是一種檢定結果,比較適當的解讀方式是「cancer A 和曝險因子 B 有相當的正相關性」。
如果算出來的勝算比是低於 1,例如 0.6,那表示 cancer A 和曝險因子 B 仍有相關性,只是反過來變負相關,也就是經過曝險因子 B 後,反而 cancer A 發生的機會減少了。

當然算式也可以反過來,解讀方式也相反即可。

因此勝算比檢定結果越接近 1,表示二維資料間的比對結果相關的可能性越低,勝算比 = 1 就表示無法判斷二個元素間確實存在互相影響的關係。

數年前我帶著一個新人出差到大陸,那時一出差就是三十天起跳,四開頭是剛好,五十多天才回台是算有點久而已。不過這位新人才出第二次差就遇到長達 52天的白金行程,因為當時一個新產品的反覆在兩個測試間失效,研發人員無論怎麼改善都找不到平衡點。

當時的兩個測試都是針對 LCD、其支撐和內部結構間的設計及可靠度。
一項是動態壓力測試 (dynamic stress),在 LCD 上的不同點反覆施予固定壓力。另一項是耗損模擬測試 (scuff),以設備振動摸擬產品在受壓下持續耗損的可靠度。

最初測試的結果顯示 LCD 受到內部結構干涉的影響,在經過任何一項測試後導光板 (Light guide) 都會損傷使得 LCD 的顯示出現問題。
因此工程人員在 LCD 和內部結構二者之間加上緩衝用的發泡材來解決問題。
這個解決方向基本上不會有錯,只是在反覆測試後發現,緩衝材偏硬的時候在動態壓力測試上會失效,緩衝材偏軟的時候又會在耗損模擬測試上失效。由於 LCD 後方的空間只有0.5mm,也無法塞一些特殊吸收材,所以工程人員陷入束手無策的狀態,而我的新人也在反覆無解的測試又無法回台的壓力下幾乎崩潰。

測試資料

仔細分析每一次測試的結果發現,LCD 顯示出現失效的點對應內部結構位置略有差異,為了分析方便,把它們分類為出現在結構邊角處和結構面兩大類。
重新整理資料後成為:

將失效點二維化後的測試結果

同樣為了分析方便,把緩衝的發泡材分為軟硬兩種,>35%發泡率的為軟,反之則為硬的。
由於這兩項測試雖施加能量的方式和情境不同,但基本上考驗的都是 LCD 本身、其支撐及內部結構間的交互設計可靠度,因此在分析上先將兩者的資料合併。然後來針對失效點對應緩衝材間的關係進行一個檢定。

結構面失效資料整理

計算失效對軟質緩衝材間關係的勝算比為 0.5,也就是二者間呈現負相關,緩衝材越軟越容易在結構面處失效。

結構邊角失效資料整理

同樣計算失效對軟質緩衝材間關係的勝算比為 2,表示邊角處用軟材質越不易失效。

所以原本看似相互矛盾且不易看出脈絡的資料,經過二元變項的處理,將資料先簡單化,用勝算比找出類別間的相關性,其實結論就很明顯了。
把緩衝材分成兩部份,在邊角度和平面處分別貼上軟硬不同的緩衝材質,再試個兩三次就找到最佳組合,解決這個問題。我家的新人也終於能結束長達52天的白金出差行程,再解不了,可能我們兩個都要升級到黃金套餐行程了。

文章標籤
創作者介紹

生活的希格斯實驗室

Yashi Yang 發表在 痞客邦 PIXNET 留言(0) 人氣()