R语言与数据的概括性度量
生活随笔
收集整理的這篇文章主要介紹了
R语言与数据的概括性度量
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
參考書目:《統計學》-賈俊平;《統計學:從數據到結論》-吳喜之;
理論部分:數據的概括性度量
以下例子會用到的數據(這些數據被放在一個叫data5.txt的文件里):
74.3 78.8 68.8 78.0 70.4 80.5 80.5 69.7 71.2 73.5 79.5 75.6 75.0 78.8 72.0 72.0 72.0 74.3 71.2 72.0 75.0 73.5 78.8 74.3 75.8 65.0 74.3 71.2 69.7 68.0 73.5 75.0 72.0 64.3 75.8 80.3 69.7 74.3 73.5 73.5讀取數據:
Tdata <- read.table("data5.txt", header = F) new_data <- as.vector(as.matrix(Tdata))- 眾數
注意:眾數可以有多個,也可以沒有。
- 中位數
- 四分位數
- 五位數總括(最小值、下四分位數、中位數、上四分位數、最大值)
- 簡單平均數
因為平均數易受數據極端值的影響,所以我們可以刪除極端值,過濾掉一部分比例的數據,再計算均值
> #過濾掉極小和極大各10%的極端值 > (mean_data2 <- mean(new_data, trim = 0.1)) [1] 73.70937trim的參數值可以在0~0.5之間進行選擇,如果大于等于0.5則會選擇中位數作為均值。
比如:
> mean(c(-30, -20, -10, 1:10, 50, 100), trim = 3/15) [1] 5 > mean(c(-30, -20, -10, 1:10, 50, 100), trim = 2/15) [1] 4.090909 > mean(c(-30, -20, -10, 1:10, 50, 100), trim = 1) [1] 5 > mean(c(-30, -20, -10, 1:10, 50, 100, 200), trim = 1) [1] 5.5- 極差
- 四分位差
- 平均差
- 方差標準差(這里計算的是樣本的方差標準差,分母為n-1)
- 標準誤
- 標準得分
- 偏度與峰度
總結
以上是生活随笔為你收集整理的R语言与数据的概括性度量的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: R语言与数据的图表展示(part1)--
- 下一篇: 《统计学:从数据到结论》学习笔记(par