《统计学:从数据到结论》学习笔记(part3)--任何统计量,只要人们觉得合适就可以当成估计量
學習筆記
學習書籍:《統計學:從數據到結論》-吳喜之;
參考書目:《統計學》-賈俊平
用估計量估計總體參數
我們都知道樣本的函數稱之為統計量,而用于估計的統計量則被稱為估計量。由于統計量對于不同的樣本取值不同,所以估計量就是隨機變量,并有其分布。如果樣本已經得到,把數據帶入后,估計量就有了一個數值,也就不是隨機的了,這個數值就是該估計量的一個實現或取值,也稱為一個估計值。
點估計和區間估計
這里介紹兩種估計,一種是點估計,也就是用估計量的實現值來近似相應的總體參數。另一種是區間估計,它是包括估計量在內的一個區間,該區間很有可能包含總體參數。
點估計
任何統計量,只要人們覺得合適就可以當成估計量。我們知道的最常用的估計量就是:樣本均值、樣本標準差等。
那么什么是好估計量的標準呢?一種統計量稱為無偏估計量。所謂無偏性,就是:雖然每個樣本產生的估計量的取值不一定等于參數,但當抽取大量樣本時,那些樣本產生的估計量的均值會接近真正要估計的假定分布的參數。嚴格來說,如果估計量的數學期望等于欲估計的總體參數,則該估計量稱為該參數的無偏估計量。因此,無偏性僅僅是非常多次重復抽樣時的一個漸進概念。在無偏估計量中,人們還希望找尋方差最小的估計量,稱為最小方差無偏估計量,方差小則說明反復抽樣產生的許多估計值差別不大,因此更加精確。
區間估計
當描述一個人的身高時,我們不會說,某人高180.2cm,而可能會說,某人身高在175 ~ 185之間,這時,我們提供的這個范圍就是某種區間估計。在抽樣調查中,我們也常用到點估計加區間估計的說法。比如:某人的支持率為80%,誤差為±4\pm 4±4 %,置信度為95%.
這種說法意味著:支持率為80%是樣本比例作為總體比例ppp的點估計; 估計范圍在80%±4\pm 4±4%,即區間為(76%, 84%); 如果以類似的方式,重復大量抽取樣本,產生的大量區間中,有些會覆蓋真正的總體比例ppp,而有些則不會,但這些區間中大約有95%會覆蓋真正的總體比例。
這樣得到的區間,被稱為總體比例ppp的置信度為95%的置信區間,這里的置信度又稱為置信水平或置信系數。顯然,置信度又是一個大量重復抽樣時的漸進概念。
在這里,我們得到的區間(76%, 84%)是固定的,而總體比例ppp也是固定的,只不過未知而已。因此只有兩種可能,要么這個區間包含總體比例ppp,要么不總體比例ppp,這當中沒有概率可言。
事實上,置信區間都是由統計量來確定的,依樣本而變,是隨機變量。因此,可以說,構造置信度為100*(1-α\alphaα)%的隨機區間,以1-α\alphaα的概率覆蓋待估參數,但該區間相應于一個樣本的實現值,就是固定的了,無法知道其是否真正覆蓋需要估計的參數。
總結
以上是生活随笔為你收集整理的《统计学:从数据到结论》学习笔记(part3)--任何统计量,只要人们觉得合适就可以当成估计量的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: R语言与数据的概括性度量
- 下一篇: 散步的正确走路方法 散步走路的正确姿势方