2022年12月29日 星期四

淺談伯努利+二項+卜瓦松+幾何等機率分布概念

做品管的,大都使用過管制圖。P管制圖和NP管制圖係依據二項分布之假設,而 C管制圖和U管制圖則依據卜瓦松分布之假設繪製而成(關於管制圖與這些統計分布的關聯性描述,以後有時間再開另篇文章談,這須用到數學公式說明)。二項分布和卜瓦松分布在特定條件下可藉由常態分布來近似,故將平均數+3個標準差作為管制圖管制上限及平均數-3個標準差作為管制圖管制下限。至於為何是3個標準差,這議題日後有機會再開另一篇文章來描述。

這篇文章的談論主角是「卜瓦松分布」(順便為日後的卜瓦松迴歸模型議題留伏筆),既然要談論它,它的知識來源,包含伯努利分布和二項分布就一起在此篇文章說明。這些分布描述的對象都屬離散型資料(所以能見度很高的幾何分布也拉進來一起談),例如藥物不良反應件數指標,本月23件,上月為18件。18~23間無法無限制分割,例如分割線落在21.56件(該月是幾件就幾件,不會有21.56件這種帶小數位的件數);相對來說,本次監測血壓值為88.5mmHg,上次監測為92.4mmHg,88.5~92.4間可無限制分割,例如分割線落在91.026mmHg(測出來的血壓值可以是這樣,如果機器夠靈敏的話),這種可無限制分割下去的資料型態就叫連續型資料。平日小弟傳授管制圖課程,不會帶入以上機率分布概念(學員會倒一片,且不學不會防礙管制圖類別選擇,但因無機率分配概念,故小弟提的判圖原則須謹記於心),至於離散型和連續型資料判別,則會於課程中加以說明(這有助於管制圖類別選擇)。而下表內的統計公式,只是本文章的裝潢物件(這樣看起來很有學問,是不是?),不是本篇文章的說明重點。


這兩張圖的出處:拯救 IT 人的一天