95% CI, 置信区间 Confidence Interval
什么是置信區間
置信區間又稱估計區間,是用來估計參數的取值范圍的。常見的52%-64%,或8-12,就是置信區間(估計區間)。
?
置信區間的概述
1、對于具有特定的發生概率的隨機變量,其特定的價值區間:一個確定的數值范圍(“一個區間”)。 ???
2、在一定置信水平時,以測量結果為中心,包括總體均值在內的可信范圍。?????????????????????????????????????
3、該區間包含了參數θ真值的可信程度。???????????????????????????????
4、參數的置信區間可以通過點估計量構造,也可以通過假設檢驗構造。
?
關于置信區間的寬窄
窄的置信區間比寬的置信區間能提供更多的有關總體參數的信息。
假設全班考試的平均分數為65分,則置信區間、間隔、寬窄度、表達的意思是:
0-100分?100?寬?等于什么也沒告訴你
30-80分?50?較窄?你能估出大概的平均分了(55分)
60-70分?10?窄?你幾乎能判定全班的平均分了(65分)
?
置信區間與置信水平、樣本量的關系
1、樣本量對置信區間的影響:在置信水平固定的情況下,樣本量越多,置信區間越窄。
實例分析:
經過實踐計算的樣本量與置信區間關系的變化表(假設置信水平相同):
| 樣本量 | 置信區間 | 間隔 | 寬窄度 |
| 100 | 50%-70% | 20 | 寬 |
| 800 | 56.2%-63.2% | 7 | 較窄 |
| 1,600 | 57.5%-63% | 5.5 | 較窄 |
| 3,200 | 58.5%-62% | 3.5 | 更窄 |
由上表得出:
1、在置信水平相同的情況下,樣本量越多,置信區間越窄。
2、置信區間變窄的速度不像樣本量增加的速度那么快,也就是說并不是樣本量增加一倍,置信區間也變窄一倍(實踐證明,樣本量要增加4倍,置信區間才能變窄一倍),所以當樣本量達到一個量時(通常是1,200,如上例三個國家各抽了1,200個消費者),就不再增加樣本了。
通過置信區間的計算公式來驗證置信區間與樣本量的關系
置信區間=樣本的推斷值±(可靠程度系數×?)
從上述公式中可以看出:
1、在其他因素不變的情況下,樣本量越多(大),置信區間越窄(小)。
2、置信水平對置信區間的影響:在樣本量相同的情況下,置信水平越高,置信區間越寬。
實例分析:
美國做了一項對總統工作滿意度的調查。在調查抽取的1,200人中,有60%的人贊揚了總統的工作,抽樣誤差為±3%,置信水平為95%;如果將抽樣誤差減少為±2.3%,置信水平降到為90%。則兩組數字的情況比較如下:
| 抽樣誤差 | 置信水平 | 置信區間 | 間隔 | 寬窄度 |
| ±3% | 95% | 60%±3%=57%-63% | 6 | 寬 |
| ±2.3% | 90% | 60%±2.3%=57.7%-62.3% | 4.6 | 窄 |
由上表得出:
在樣本量相同的情況下(都是1,200人),置信水平越高(95%),置信區間越寬。
?
通俗的講:OR值是點估計,可信區間是區間估計。可信區間包含1,表示該因素對疾病的發生不起作用;可信區間大于1,表示該因素是一個“危險”因素。例如天氣預報預計在10-20'C及15-16'C之間(95%可行度),則后者較前者可信度高。實際測定若為15.5'C,均落在2個可行度之間,說明可靠;若為25'C,落95%可行度之外,說明不可靠,處于5%的幾率。95%上線位于左,下線位于右。
?
來源:http://wiki.mbalib.com/wiki/置信區間
轉載于:https://www.cnblogs.com/nkwy2012/p/9239584.html
總結
以上是生活随笔為你收集整理的95% CI, 置信区间 Confidence Interval的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 认证与Shiro安全框架
- 下一篇: BZOJ.3277.串(广义后缀自动机)