概率论的学习和整理12: 正态分布
生活随笔
收集整理的這篇文章主要介紹了
概率论的学习和整理12: 正态分布
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
1 問題: 什么是正態分布,為什么這么出名和重要?
1.1 名氣大
- 正態分布的大名,如雷貫耳
- 很多人一說到概率,除了想到丟骰子的古典概型,第二個會想到的就是正態分布了
- 下圖就是正態分布和標準正態分布曲線的圖
- 甚至大部分有區分度的考試(選拔篩選考試,而不是資格水平考試)
- 學生成績沒呈現正態分布,可以說是試卷出卷和教學有問題
1.2?正態分布從哪兒來? 誰發明的?
名字:
- 正態分布(Normal distribution)
- 正常分布!一般的分布,完全可以這么翻譯
- 高斯分布(Gaussian distribution)
- 鐘形曲線? (bell curve)
- 正態分布(Normal distribution)又名高斯分布(Gaussian distribution),是一個極其常見的連續概率分布。因為正態分布的概率密度函數曲線呈鐘形,因此人們又經常稱之為鐘形曲線。
- 高斯、拉普拉斯、棣莫弗、勒讓德很多大神的作用一步步發展而來,高斯是發明了最小二乘方法
- 正態分布最初是從二項分布發展而來的,二項分布的pmf確實很像正態分布
- 后來推廣到其他概率分布,當樣本量極大時接近無限,所有的分布都可以認為趨向于正態分布?
- 哪些情況可以用正態分布?一般來說,據說是只要是針對同一類型的變量的試驗,次數足夠大的情況,都會趨向正態分布的
1.3 正態分布是概率論,還是統計?
- 我覺得更多的是統計學
- 因為都是從觀測的數據,去反推這些數據服從什么? 隨機變量--概率的規律--也就是? 概率密度曲線pdf,也就是概率的分布!
2 正態分布的基本概念內容介紹
2.1? 正態分布
- 正態分布,
- 正態分布概率函數?
- f(x)=[1/(√2π)δ]*e^[-(x-u)^2/2(δ^2)]?
- 正態分布的平均值? u,是理想的假設知道所有值之后的算術平均值?
- 正態分布的期望? 就是均值吧
- 正態分布的標準差??δ=np(1-p)
- 正態分布的方差? 就是標準差的平方吧?δ^2
2.2 標準正態分布
- 正態分布概率函數?f(x)=[1/(√2π)δ]*e^[-(x-u)^2/2(δ^2)]
- 當u=0,δ=1 時,就是標準正態分布
- 標準正態分布的概率公式更簡潔
2.3 正態分布曲線? 和 各種標準的意思
- 第1置信區間: [-δ,δ] 之間,68.3%
- 第2置信區間: [-2δ,2δ] 之間,95.4%
- 第3置信區間: [-3δ,3δ] 之間,99.7%
2.4 正態分布的特點
- 3個置信區間的
- 第1置信區間: [-δ,δ] 之間,68.3%
- 第2置信區間: [-2δ,2δ] 之間,95.4%
- 第3置信區間: [-3δ,3δ] 之間,99.7%
- 平均值就是期望
- 極端值很少,在 [-3δ,3δ] 之外的數很少
- 標準差小,則數據集中,鐘形曲線瘦高個,如果是標準差大,那么鐘形曲線就扁和矮。
2.5 正態分布的推論
- 正態分布變量的和,一般也是正態分布
- 正態分布相加,一般期望就等于2者期望之和,標準差等于2者標準差之和
- 也就是正態分布相加,正態分布會變扁(因為標準差是求和變大了!越大越扁)
- 正態分布還和柯西分布,k2分布有關系
3 哪些情況符合正態分布呢?
3.1 正態分布的適用范圍
- 正態分布,名字叫正常分布,適用面積非常的廣
- 常見的正態分布舉例,比如WHO統計的兒童身高體重不就是正態分布的3個區間的數字么
- 也就是一般就看 [-2δ,2δ] 之間,95.4% 就夠了
3.2 哪些情況適合正態分布呢?
正態分布最初是從二項分布發展而來的,二項分布的pmf確實很像正態分布,后來推廣到其他概率分布,當樣本量極大時接近無限都可以認為趨向于正態分布?
哪些情況可以用正態分布?一般來說,據說是只要是針對同一類型的變量的試驗,次數足夠大的情況,都會趨向正態分布的
- 正態分布,從離散的二項分布出發
- 但是正態分布本身是一種連續分布
- 正態分布是連續的,意味著單個點的概率p=0,只能關注區間概率
- 哪些情況可以用正態分布?
- 一般來說,據說是只要是針對同一類型的變量的試驗,次數足夠大的情況,都會趨向正態分布的,也就是正態分布具有普適性。。。
- 生活中到處都是正態分布,試驗次數很多的結果
- 人們認為正態分布完美地詮釋了講到的“同質”和“變異”這兩個概念。
- 正是因為我們研究的對象具有同質性,所以其特征往往是趨同的,也即存在一個基準(均數),但由于個體變異的存在,這些特征又不是完全一致,
幾個關鍵點
- 只要是針對同一類型的變量的試驗,這個說法,意味著一般是類伯努利試驗,每次試驗之間是獨立的,互不影響
- 也就是說這些隨機元素,影響因素之間要獨立
- 而且一般說,影響的因素要比較多
- 這些隨機元素對結果的影響,一般是使用加法原理,用加和的方法求得。也就是這些因素對完成隨機試驗的結果,是并行的關系。
- 舉例子,用身高舉例,遺傳因素,環境因素,飲食因素,鍛煉因素都是獨立的(或者相關程度很低,不是強相關),他們對身高的影響都是可以用加法原理加和的。這樣的就符合正態分布
3.3 哪些不適合正態分布呢?
- 隨機元素之間,不是獨立的,而是有互相影響則可能不正態分布
- 如果一些因素作用還可能有前后步驟,乘法原理的關系,就可能不是正態分布
- 如果影響的因素畢竟少,不多,原因太單一可能不是正態分布
?
?
?
正態分布變成標準正態分布
我能不能理解標準化就是把圖形σ倍縮小然后移動μ個位置啊
?
?
?
4? 為什么呢?
4.1 極大似然估計
4.2 中心極限定理
4.3 最小二乘法
樣本足夠大則近似認為服從正態分布
樣本量一般至少要超過30才可以認為可以近似正態分布
5 具體例題舉例,還需要查表
查表
6 另外幾個分布
- k2分布
- f分布
- t分布等等
7? 一些有趣的研究
- 牛人們根據這個研究出,不同XX的人組合,就是正態分布的疊加,因此標準差會變大。。。。
- 第一次看到這種角度,理解他們的想法了,腦洞好大啊
?
?
?
總結
以上是生活随笔為你收集整理的概率论的学习和整理12: 正态分布的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: COGS 827. [Tyvj Feb1
- 下一篇: PS课程读书笔记