【R】【纽约人口数量分析】
文章目錄
- 1)實(shí)驗(yàn)說明
- 2)實(shí)驗(yàn)環(huán)境
- 3)實(shí)驗(yàn)?zāi)康?/li>
- 4)實(shí)驗(yàn)內(nèi)容
- 5)實(shí)驗(yàn)步驟
- ① 下載并導(dǎo)入數(shù)據(jù)
- ② 對(duì)生成的時(shí)間序列對(duì)象可視化
- a. 思考
- b. 由上述三種變量查看各個(gè)波動(dòng)趨勢(shì)數(shù)據(jù)
- c. 由上述結(jié)果可知:
- ③ 使用 plot()函數(shù)
- ④ 修正數(shù)據(jù)
- 6)實(shí)驗(yàn)分析
- 7)ps
1)實(shí)驗(yàn)說明
從網(wǎng)址(http://robjhyndman.com/tsdldata/data/nybirths.dat)中下載數(shù)據(jù)到指定位置(D:\),然后解壓到當(dāng)前文件夾。
導(dǎo)入下載的數(shù)據(jù) bank-additional-full.csv 到 R 軟件。
通過時(shí)間序列分析方法對(duì) 1946 年 1 月到 1959 年 12 月的紐約每月出生人口數(shù)量進(jìn)行時(shí)間序列分析,預(yù)測(cè)紐約每月人口數(shù)量的影響因素及相關(guān)規(guī)律。
2)實(shí)驗(yàn)環(huán)境
R-3.6.0
3)實(shí)驗(yàn)?zāi)康?/h1>
① 學(xué)會(huì)并理解 R 語言中 decompose 函數(shù)的使用;
② 理解季節(jié)指數(shù)預(yù)測(cè)法分析數(shù)據(jù)的基本原理過程。
4)實(shí)驗(yàn)內(nèi)容
① 從網(wǎng)站下載數(shù)據(jù),read_csv 函數(shù)讀取數(shù)據(jù),并用 ts 函數(shù)重采樣獲得時(shí)間序列對(duì)象;
② 使用 R 中的 decompose 函數(shù)觀察分析一個(gè)時(shí)間序列數(shù)據(jù)的季節(jié)、趨勢(shì)以及隨機(jī)變化這三種波動(dòng)趨勢(shì),這三種趨勢(shì)被存儲(chǔ)在變量 ‘seasonal’,‘trend’ 和 ‘random’ 中;
③ 對(duì)數(shù)據(jù)進(jìn)行季節(jié)修正。用原始數(shù)據(jù)減去 ‘seasonal’ 變量。
5)實(shí)驗(yàn)步驟
① 下載并導(dǎo)入數(shù)據(jù)
births<-read.csv("~bank-additional-full.csv") birthstimeseries <- ts(births, frequency=12, start=c(1946,1)) #創(chuàng)建時(shí)間序列對(duì)象,單位時(shí)間內(nèi)觀測(cè)值的頻數(shù)為 12,從 1946 年的 1 月份開始。生成時(shí)間序列對(duì)象,指定 frequency,以及 start。
② 對(duì)生成的時(shí)間序列對(duì)象可視化
plot(birthstimeseries) #畫出生成的時(shí)間序列數(shù)據(jù)的折線圖,得到時(shí)間序列曲線
從上圖可以看到:
這個(gè)時(shí)間序列在一定月份存在季節(jié)性變動(dòng):在每年的夏天都有一個(gè)出生峰值,在冬季的時(shí)候進(jìn)入波谷。同樣,這樣的時(shí)間序列也可能是一個(gè)相加模型,隨著時(shí)間推移,季節(jié)性波動(dòng)是大致穩(wěn)定的而不是依賴于時(shí)間序列水平,且對(duì)于時(shí)間的變化,隨機(jī)波動(dòng)看起來也是大致穩(wěn)定的。
a. 思考
紐約每月出生人口數(shù)量是在夏季有峰值、冬季有低谷的時(shí)間序列,當(dāng)季節(jié)性和隨機(jī)變動(dòng)在整個(gè)時(shí)間段內(nèi)看起來基本不變,此模型很有可能是用相加模型來描述。
為了估計(jì)時(shí)間序列的趨勢(shì)性、季節(jié)性和不規(guī)則部分,使用 decompose 函數(shù)分解時(shí)間序列
的波動(dòng)趨勢(shì)。
估計(jì)出的季節(jié)性、趨勢(shì)的和不規(guī)則部分現(xiàn)在被存儲(chǔ)在變量seasonal,trend 和random 中。
b. 由上述三種變量查看各個(gè)波動(dòng)趨勢(shì)數(shù)據(jù)
birthstimeseriescomponents$seasonal
c. 由上述結(jié)果可知:
這里給出了估計(jì)出的每年 1-12 月的季節(jié)性因素,每年都一樣。季節(jié)性因素最大值在七月(約 1.46),最小值在二月(約-2.08),標(biāo)志著每年的峰值在七月,低谷在二月份。
③ 使用 plot()函數(shù)
畫出時(shí)間序列中估計(jì)的趨勢(shì)的、季節(jié)性的和不規(guī)則的部分,更直觀的觀察結(jié)果。
plot(birthstimeseriescomponents) #對(duì)生成時(shí)間序列數(shù)據(jù)的趨勢(shì)的、季節(jié)性和不規(guī)則部分可視化。
上圖展現(xiàn)出了原始的時(shí)間序列圖(頂部),估計(jì)出的趨勢(shì)部分圖(第二行),估計(jì)出的季節(jié)性部分(第三行),估計(jì)得不規(guī)則部分(底部)。可以看到估計(jì)出的趨勢(shì)部分從 1947年的 24 下降到 1948 年的 22,緊隨著是一個(gè)穩(wěn)定的增加,直到 1949 年的 27。
④ 修正數(shù)據(jù)
對(duì)紐約每月出生人口數(shù)量進(jìn)行季節(jié)性修正,可以用“decompose()”估計(jì)季節(jié)性部分,也可以把這個(gè)部分從原始時(shí)間序列中去除。
birthstimeseriescomponents <- decompose(birthstimeseries) birthstimeseriesseasonallyadjusted <- birthstimeseries - birthstimeseriescomponents$seasonal #去除原始時(shí)間序列中的季節(jié)性 plot(birthstimeseriesseasonallyadjusted) #可視化季節(jié)修正后的數(shù)據(jù)
上圖顯示結(jié)果是去除掉季節(jié)性變動(dòng)的修正序列,這個(gè)季節(jié)性修正后的時(shí)間序列現(xiàn)在僅包含趨勢(shì)部分和不規(guī)則變動(dòng)部分。可以看出 1947 年-1949 年是人口的下降區(qū),1950 年開始是穩(wěn)定的增長,與修正數(shù)據(jù)前的結(jié)論一致。
6)實(shí)驗(yàn)分析
一個(gè)季節(jié)性時(shí)間序列包含趨勢(shì)部分、季節(jié)性部分和不規(guī)則部分。分解時(shí)間序列是要把時(shí)間序列分解成這三個(gè)部分,并進(jìn)行估計(jì)。若時(shí)間序列是相加模型,在 R 語言中使用 decompose()函數(shù),可以達(dá)到估計(jì)的目的。通過本次實(shí)驗(yàn),得出了紐約人口數(shù)量分析的相關(guān)規(guī)律,隨季節(jié)性波動(dòng),并呈現(xiàn)上升趨勢(shì)。也可以將本實(shí)驗(yàn)在其他的數(shù)據(jù)集上進(jìn)行相關(guān)的時(shí)間序列分析。
本實(shí)驗(yàn)主要對(duì)時(shí)間序列數(shù)據(jù)進(jìn)行了季節(jié)調(diào)整分析,運(yùn)用 decompose 函數(shù)將數(shù)據(jù)分成趨勢(shì)、季節(jié)、不規(guī)則波動(dòng)三部分觀察,并進(jìn)一步對(duì)數(shù)據(jù)進(jìn)行修正,剔除季節(jié)影響,以便更好地揭示數(shù)據(jù)本身的基本趨勢(shì),發(fā)現(xiàn)數(shù)據(jù)中隱藏的信息。
7)ps
因數(shù)據(jù)丟失,該實(shí)驗(yàn)暫未復(fù)現(xiàn),暫未精讀
總結(jié)
以上是生活随笔為你收集整理的【R】【纽约人口数量分析】的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: pandas 学习汇总17 - 计算(
- 下一篇: Jmeter获取当前时间、历史时间、未来