2026年3月8日 星期日

以指標加權移動平均法(EWMA)評估稀少事件指標表現是否惡化

 我虛構的例子是這樣的:

Gemini_Generated_Image_2pktze2pktze2pkt
圖片由Gemini 生成,示意用。

有位北漂族偶而會開車回屏東老家坐坐,有時1季回去10幾次或20幾次或30幾次不等。假設從2025/1開始記錄,創建一個excel檔,第一欄為停車案例序,第二欄為停車位置。

在1/3回屏東,車停家門口 (表示事件發生,註記為1),第1筆觀察值註記為1(第一欄)和1(第二欄); 在1/8回屏東,車停較遠處的農田小路 (表示事件未發生,註記為0),走路約3-5分鐘吧,第2筆觀察值註記為2(第一欄)和0(第二欄),長期監測下來的資料長這樣: .

此例不考慮1/3回來和1/8回來隔了5天壓力會隨時間消退的情形。

No    event

1          1

2          0

3          0

4          0

5          1

6          0

......

依此類推。只要車停家門口,對面的老太婆就會探頭出來看一下,若看到車停在路邊,壓力值就會上升;若後續有回來,但車未停門口,壓力值就會依時間而消退。此例我們想知道若每次回家車都停家門口和回來偶而停家門口,看她老人家壓力值曲線波動情形,並估算出閾值以衡量這支指標「車停家門口」表現是否顯著過高 (定義: 老太婆出來趕人表示車真的太常停家門口了,此時壓力值超過閾值)。


統計圖如下:

統計圖要表達的資訊已完美呈現就不再額外陳述。因為我的指標為1/0有或無,故也可稱為Bernoulli EWMA方法(EWMA, Exponentially Weighted Moving Average),關於Bernoulli分布,可見先前寫過的文章

而閾值估算過程簡易說明(我沒有精算,總之概算就是這樣)如下:

無標題
修正用字:為求整數再加為求盡早偵測到惡化訊號的結果

上圖中的0.00135即對應到下圖最右邊的0.13% (做指標監測的人,請永遠記住這個數字)

補充說明:

記得,X軸資料均得依發生先後序排列,因為是用時間序列方法來分析。

1.其它例子:X軸為每日,紅點位置就是班上小明(特大號問題學生)該日有否惹事,藍線就是國小導師的壓力值,當藍線超過黑線,就該判定「老師敵對凶惡分數」指標表現顯著過高,該日老師的心情非常不好,隨時會爆炸。

2..其它例子:X軸為每日,紅點位置就是上班途中是否被車撞,當藍線超過黑線就該判定「上班日出車禍事件數」指標表現顯著過高,小明應擬定改善措施(i.g., 盡早去廟宇點光明燈XD)。

3.這種模型也能輕易應用於醫療場域以衡量臨床或管理指標表現是否異常,專門對付那些發生機率較低的指標。第1件正常或不正常,再來第2件正常或不正常,案件依時間序一件一件來並標定為正常(0)或不正常(1),最後就會得到一個時間序列(i.g., 0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,1,1,0,0,1,0,0,1,0,0,0,0....),這類指標千萬別用傳統管制圖方法衡量表現是否正常(以過往的表現水準來衡量當下的表現正不正常)。我用機率論與管制圖假設理論來說明,可以更清楚理解原因。傳統管制圖(e.g., p chart, u chart, x bar chart, c chart)都有一項最核心假設,即資料必須來自具有變異的隨機過程。若指標值畫出來,該率值線幾乎貼在天花板上(100%)或躺在地上(0%),表示變異極小,資料分布呈極端偏態,此時統計假設就失效。

若從機率分布角度來看,若資料像1,1,1,1,1,1,1,1,1,0.97,1,1,1 這樣,機率分布會變成P(X=1) =0.95,  資料卡在上界,這時透過 p chart公式,可以算出LCL和UCL都落在100%,你的值只要稍稍低於100%就異常,但它實際是偽陽性,因為它只是在正常波動。

監測這種稀少事件,有種管制圖叫g chart (分布是不對稱的),在品質工程界常被使用(我說常被使用就是常被使用,不要質疑我的Ref,我本身就是Ref),它適合偵測指標是否改善(上界限可以無限,即由你的資料數據分布決定),但不適合偵測是否惡化(下界限受限於0,只要小於0,一律視為0,不視為0沒有意義),統計界其實早就知道這問題 (有沒有覺得我很強?但不知為何,醫策會就是不願找我去教課)。

基於此,故剩CUSUM chart和EWMA chart可用 (t chart在這種案例不適用,基於某些原因)。不可否認,CUSUM chart對「群聚事件」偵測非常敏感,事件接二連三(它只是形容詞)出現真的會「立即警報」給你看!而EWMA chart偵測的是平均率上升,雖然不如CUSUM chart靈敏,但可透過閾值訂定來改善。只要算出的值超過閾值,就可以很有信心的下結論:指標表現已顯著性惡化,請單位擬定改善措施因應。因為CUSUM chart我有正式應用於醫療場域中,所以本篇文章使用 (或稱測試) EWMA chart來評估稀少事件指標表現是否異常,所以CUSUM chart可以下去領便當了。

沒有留言: