统计学基础知识梳理(一)
1 樣本與總體的定義: N是總體元素個數(shù),n是樣本元素個數(shù)
樣本均值 ? Sample mean ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?? 總體均值? Population mean ?
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?
2 總體方差:離中趨勢的
3 樣本方差: 當(dāng)出現(xiàn)下圖的情況(總體均值不在樣本內(nèi),即所取的樣本實際不包含總體均值)時,樣本方差實際上低估了總體方差,也就是這個公式實際會低估總體方差。
下面給出總體方差的無偏估計:
4. 標(biāo)準(zhǔn)差:方差的平方根
5. 隨機變量:實際上并不是傳統(tǒng)意義上的變量,更像是隨機過程映射到數(shù)值的函數(shù),通過隨機試驗來賦值;可分為連續(xù)和離散型隨機變量
6. 概率密度函數(shù):主要解釋什么是連續(xù)型隨機變量,及其對應(yīng)的概率分布
?
7. 二項分布
假設(shè)某個試驗是伯努利試驗,其成功概率用p表示,那么失敗的概率為q=1-p。進(jìn)行n次這樣的試驗,成功了x次,則失敗次數(shù)為n-x,發(fā)生這種情況的概率可用下面公式來計算:
我們稱上面的公式為二項分布(Binomial distribution)的概率質(zhì)量函數(shù)。其中
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?
是組合公式,表示從n個不同元素中取出x個元素的所有組合的個數(shù)。
從二項分布公式可知,概率分布由試驗次數(shù)n和"成功"概率p決定,因此二項分布的概率質(zhì)量函數(shù)可以簡寫為X~B(n, p)。
性質(zhì):二項分布的均值和方差分別為np和npq
隨機變量期望值的計算等同于總體(無窮總體)均值的計算,期望值就是總體均值。
隨機變量期望值的計算方法:每個隨機變量的實例乘以對應(yīng)出現(xiàn)的頻率。
為什么采用這種方法計算無窮總體的均值:因為無窮總體無法除以數(shù)據(jù)點的個數(shù),因此用頻率做權(quán)重,計算所有結(jié)果的加權(quán)平均值。
求隨機變量無窮總體的均值,隨機變量總體無窮是因為隨機變量可以無止境的試驗
注:隨機變量離散的情況得到二項分布,隨機變量連續(xù)的情況得到正太分布
?
8. 泊松分布:累計隨機發(fā)生的次數(shù)增量過程
9. 大數(shù)定律:
在數(shù)學(xué)與統(tǒng)計學(xué)中,大數(shù)定律又稱大數(shù)法則、大數(shù)律,是描述相當(dāng)多次數(shù)重復(fù)實驗的結(jié)果的定律。根據(jù)這個定律知道,樣本數(shù)量越多,則其平均就越趨近期望值。
大數(shù)定律很重要,因為它“保證”了一些隨機事件的均值的長期穩(wěn)定性。 人們發(fā)現(xiàn),在重復(fù)試驗中,隨著試驗次數(shù)的增加,事件發(fā)生的頻率趨于一個穩(wěn)定值;人們同時也發(fā)現(xiàn),在對物理量的測量實踐中,測定值的算術(shù)平均也具有穩(wěn)定性。 比如,我們向上拋一枚硬幣,硬幣落下后哪一面朝上是偶然的,但當(dāng)我們上拋硬幣的次數(shù)足夠多后,達(dá)到上萬次甚至幾十萬幾百萬次以后,我們就會發(fā)現(xiàn),硬幣每一面向上的次數(shù)約占總次數(shù)的二分之一,亦即偶然之中包含著必然。
10. 正太分布
特性:
1)集中性:曲線的最高峰位于正中央,且位置為均數(shù)所在的位置。
2)對稱性:正態(tài)分布曲線以均數(shù)所在的位置為中心左右對稱且曲線兩段無線趨近于橫軸。
3)均勻變動性:正態(tài)分布曲線以均數(shù)所在的位置為中心均勻向左右兩側(cè)下降。
4)曲線與橫軸間的面積總等于1。
正態(tài)分布函數(shù)公式如下:
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??
公式解釋:其中μ為均數(shù),σ為標(biāo)準(zhǔn)差。μ決定了正態(tài)分布的位置,與μ越近,被取到的概率就越大,反之越小。σ描述的是正態(tài)分布的離散程度。σ越大,數(shù)據(jù)分布越分散曲線越扁平;σ越小,數(shù)據(jù)分布越集中曲線越陡峭 ?
?
?
?
?
?
總結(jié)
以上是生活随笔為你收集整理的统计学基础知识梳理(一)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 企业网站 源码 服务邮箱:_公司企业邮箱
- 下一篇: 清华大学《操作系统》(十二):临界区与锁