斯皮尔 皮尔森 肯德尔_一起来学应用统计学(全部)(二)持续更新
應用統計基本內容(簡略版)
描述統計:統計圖表,集中趨勢(平均數,中數,眾數),離散趨勢(極差,離均差,平均差,方差,標準差,差異系數,z分數)
數學基礎(概率論基礎,抽樣分布理論)
推斷統計:參數估計,假設檢驗(參數檢驗(t檢驗,z檢驗,方差分析),非參數檢驗(卡方檢驗)),協方差分析,線性回歸
相關系數(皮爾遜積差相關,斯皮爾曼等級相關,肯德爾等級,點二列等)
當我看到如此繁多的內容,內心是多么的崩潰,當我嘗試去學習,一遍一遍的翻完,學完一遍,才發現并不是想象中的困難。為了鞏固,理解,激勵自己繼續學下去。希望自己能夠堅持下去。
當我們完成數據的收集之后,結果往往是包含許多繁雜的,雜亂無章的數據。隨之而來的問題就是如何讓數據變得更加清晰,容易理解呢。這就是描述統計的工作了。我們需要把大量的數據轉換成圖表的形式。這樣就方便我們更進一步的分析數據了。直方圖
在學習圖表之前有必要知道一些關于測量方面的概念,我們收集的大部分數據都是通過測量得到的,測量是通過一定的法則用測量工具對事物屬性的定量描述,生活中涉及比較多的測量方式有物理測量(長度,身高,體重),生理測量(血壓,心率),心理測量(智力,情緒,性格)等,每種測量的得到的數據就可以形成不同的量表,量表按照測量尺度可以分為四類,分別是稱名量表,順序量表,等距量表以及等比量表。量表按照數據的連續性可以分為二類,分別是連續型數據和離散型數據。
稱名量表:里面包括的數據是不同名稱的種類,是對我們測量的數據進行標注和分類,比如動漫的種類(魔幻,耽美,愛情),但是不做任何數量的區別。關鍵字:種類
順序量表:按照一定的順序組織的種類組成,比如成績的評分(優秀,良好,及格),根據事物的大小和順序進行排列。關鍵字:種類?順序
等距量表:是由間距大小相等的有順序的類別組成,間距相等指的是單位的間隔相等。但是等距量表的零點是任意的不是0,比如溫度,海拔高度,考試分數,單位與單位之間都是相等的距離,并且海拔為0,溫度為0,分數為0,并不是指沒有海拔,溫度,分數,0是我們規定的0,并不是真正的沒有。好比你數學成績考試0分,不代表你數學能力為0,只說明你考試的那部分內容不懂罷了。關鍵字:種類 順序?等距 ?沒有零點 ? 可以加減運算 不可乘除
等比數據:目前最高級的量表,具有以上量表的全部特點,而且有零點,比如身高,體重,長度。當他們為0時,就是沒有。種類 順序?等距 ?有零點 ?可乘除
連續型數據:指在一定區間內可以任意取值、數值是連續不斷的、相鄰兩個數值可作無限分割(即可取無限個數值)的數據。比如50--55之間包含無數的數值。
離散型數據:離散數據是指其數值只能用自然數或整數單位計算的數據。例如:企業個數、職工人數,班級人數等。
我們知道了這些量表,就可以學習接下來的圖表了。
1.頻數分布表
簡單的頻數分布表通過列出從小到大的測量分數來表示測量尺度。
頻數分布表
2.分組頻數分布表
當數據特別多的時候,簡單的頻數分布看似并不是太有效了,你能想象出一張紙還不夠你寫完數據。分組頻數分布表,需要把數據進行分組。分組需要遵循一定的步驟以及原則;
我們以一個簡單的例子說明一下(原則并不絕對,目的只是讓這些數據整理起來更加方便,看起來更加清晰。給我們提供了方向。)
例:一位教師獲得了一組N=25(一共有25名學生)的考試成績。為了整理這些數據,將他們列入頻數分布表中,這些分數是:
82 ?75 ?88 ?93 ?53 ?84 ?87 ?58 ?72 ?94 ?69 ?84 ?61 ?91 ?64 ?87 ?84 ?70 ?76 ?89 ?75 ?80 ?73 ?78 ?60
第一步計算行數(最大值-最小值+1),在這組數據中,最小值是53,最大值是94,所以如果在分布表中列出每個分數,則需要42行.因為42行過于繁瑣,我們要對其進行分組。
分組頻數分布表應該包括大約10個分組區間(10行),這樣就給我們提供組距的選擇(一般組距有四種選擇 2,5,10,20),我們去嘗試每一個,最后發現當組距為5的時候,行數為9,正好滿足。
下一步就是確定分組區間值(比如50--54),因為最小的值為53,所以最小的區間應該包含這個值。因為每個分組區間的下限為5的倍數(分組下限應該為組距的倍數),所以分組區間下限為50。區間的寬度為5,所以最小的區間應該包含5個值。50 ?51 ?52 ?53 ?54 ?。下一個分組區間下限為55,上限為59.以此類推。
一旦你列好了分組區間值,在加上頻數,就完成了分組頻數分布表的編寫。例題答案
值得注意的,分組頻數分布表有一個缺陷,就是容易丟失具體的信息,比如數據中包含54.5,但是分組區間(50--55)中你并不能看出有54.5。還有區間(50--55)的區間界限是49.5和55.5。兩個界限之間的距離(6點)是區間寬度。注意:(連續型數據之間可以有無限的可能值。這個適用于分組頻數分布表中。而頻數分布表則不適用,只能離散型。)
總結
以上是生活随笔為你收集整理的斯皮尔 皮尔森 肯德尔_一起来学应用统计学(全部)(二)持续更新的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: java比赛用多重for_关于 Java
- 下一篇: 如何占用计算机内存,电脑内存占用太高怎么