minitab怎么算西格玛水平_西格玛和西格玛水平
西格瑪和西格瑪水平 - Jeff
很多人經常將“西格瑪”和“西格瑪水平”這兩個概念給混淆,在學習六西格瑪時,這兩個概念必須明確區分開來,并掌握好。
在解釋這兩個術語之前,先說說正態分布。正態分布(Normal Distribution)概念最早是由德國數學家棣莫弗De Moivre和拉普拉斯Laplace在1733年首次提出,但由于高斯在研究最小二乘法時將正態分布和統計誤差結合在一起使用,1809年發表了最小二乘法后,該理論被廣泛使用。于是,正態分布也被稱為高斯分布(Gauss Distribution)。
[德國馬克貨幣上的高斯頭像以及正態分布曲線]
正態分布的特點是對稱的鐘形曲線,分布的中心位置度由μ決定,分布的寬窄散布程度由σ來決定,同時分布曲線下面總的概率面積為1。
其概率密度函數為:
當μ = 0,σ = 1時,正態分布為標準正態分布,其概率密度函數簡化為:
累積概率面積函數為:
- 西格瑪:也即標準偏差,用來衡量一組數據偏離均值程度的統計量,用希臘字符σ來表示,?其計算公式為:
其中:
N :總體樣本數
i :總體樣本序號,i = 1, 2, 3 … N
μ :總體樣本的平均值
如果樣本來源總體中的一部分,標準偏差則由s來表示,計算公式為:
其中:
n :樣本數
i :樣本序號,i = 1, 2, 3 … n
xbar :樣本的平均值
由于樣本在取樣時,我們都難以取得總體樣本的所有數據,都是通過對樣本數據進行分析,再以統計推論的手法來對總體分布進行估計和預測。
所以在統計分析中,我們常用的標準偏差估計是按照第二個公式來計算。這公式里還包含了下面四個概念:
2. 離差Deviation (d):測量值與均值間的偏差。
離差是一個很重要的統計偏差量,后期涉及到的模型和殘差分析都跟這個有關。
3. 離差平方和Sum of Square (SS):也叫偏差平方和,大家在做方差分析、回歸分析甚至DOE的時候都經常見到的,其計算公式就是,
4. 自由度Degree of Freedom (df):樣本中可以自由選擇或變化的個數或機會。在這里起到樣本計算與總體之間的無偏估計作用。公式是:df = n - 1
聽起來有點拗口,我們換一種方式來理解:
地主王老五拿了3個分別是肉餡,白菜餡和沒有餡的燒餅出來,打算施舍給甲、乙、丙三個乞丐。地主讓甲、乙、丙排著隊來挑選,
這里面具有選擇的機會次數就是自由度df = 3 – 1 = 2 (甲和乙有選擇權)。
- 西格瑪水平Sigma Level:過程能力的一種衡量指標,將過程分布的平均值、標準偏差與質量特性的目標值、規格線結合起來。有時也用Z值來表示,
也可以理解為規格線與目標值間的距離最少能容納k個標準偏差σ,當k = 6時,我們稱之為六西格瑪水平。
- 在規格線LSL以下的不合格率為:
Excel的計算公式為:=NormDist(LSL, μ ,σ, 1)
- 在規格線USL以上的不合格率為:
Excel的計算公式為:= 1 - NormDist(USL, μ ,σ, 1)
- 在規格線USL與LSL之間區域的累積概率面積為:
Excel的計算公式為:= NormDist(USL, μ ,σ, 1) - NormDist(LSL, μ ,σ, 1)
根據上面的公式,我們可以計算出西格瑪水平所對應的合格率與DPPM為:
大家可能會說六西格瑪能力的過程對應的DPPM不應該是3.4嗎?上表其實是在分布沒有產生偏移的情況下進行計算的,也就是平均值與目標值重合。但摩托羅拉前輩們的實踐總結得出:通常來說,長期數據分布(總體數據)與短期數據分布(樣本數據)間存在1.5的σ偏移,或許偏大、或許偏小。也就是說正態分布偏移為N ~ (μ ± 1.5σ, σ2),下面我們假定偏移為+1.5σ,再來計算一下合格率與DPPM:
在分布產生1.5σ偏移后,分布左側在LSL以下的概率就<<0.001PPM,分布右側超出USL的概率約為3.4PPM,所以總的DPPM值為3.4PPM。
總而言之,西格瑪描述的是數據分布的散布程度的統計量;而西格瑪水平是過程能力高低水平的衡量指標。
[注1] 黑色字體為綠帶需掌握的內容
[注2] 灰色字體為黑帶需掌握的內容
- Jeff整理于2019/11/12
[完]
轉載請注明出處,微信公眾號:
總結
以上是生活随笔為你收集整理的minitab怎么算西格玛水平_西格玛和西格玛水平的全部內容,希望文章能夠幫你解決所遇到的問題。
 
                            
                        - 上一篇: python类的调用关系_JAVA 查找
- 下一篇: python模块cv2人脸识别_pyth
