r语言electricity数据集_R语言实战学习
《R語言實戰》中文電子版
提取碼:lx35
已經學習打卡R語言22天了,可以說是初窺真容——基本了解R的數據和函數;作為程序語言,就是要多練習,多領悟,在實戰中發現問題并解決問題。
所以,就以《R語言實戰》為基礎,開始R語言實戰學習,爭取再過一個月,能夠熟練掌握科研中所需的基本繪圖代碼和統計學計算,并且熟悉ggplot2包。
同時,之后的所有運行代碼都在R-script腳本文件中寫,不直接在運行框中寫
加油!!!
Day 1
第一章 R語言的介紹R語句由函數和賦值組成。
使用
#表示注釋符號。#后出現的所有文本都會被R解釋器忽略,因此在書寫復雜邏輯時,可靈活利用#進行說明。
獲取幫助:help()或?***
工作目錄:getwd()獲取當前工作目錄;setwd(“ ”)設定當前工作目錄。
R包:包是R函數、數據、預編譯代碼以一種定義完善的格式組成的集合。計算機上存儲包的目錄稱為庫(library);函數 .libPaths( ) 能夠顯示庫所在的位置,函數library( )則可以顯示庫中有哪些包。
包的安裝:install.packages("");加載包library( )。
R將反斜杠\視作一個轉義字符。
批處理:想要以一種重復的、標準化的、無人值守的方式執行某個R程序。
R可以處理GB級到TB級的數據分析問題,但需要專門的手段。
將輸出用為輸入——結果的重用:將計算結果賦值給新的對象,之后就可以利用前一步的計算結果;如
lift
summary(lift)
Day 2
第二章 創建數據集
R分析前,需要根據個人需求的來創建含有數據的數據集,要求選擇一種存儲數據的數據結構,再將數據輸入或導入到該數據結構中。
2.1、數據集
1、數據集
通常是由數據構成的一個矩形數組,行表示觀測,列表示變量。
統計學家稱它們為觀測-observation和變量-variable,數據庫分析師則稱其為記錄-record和字段-field,數據挖掘/機器學習學科的研究者則把它們叫做示例- example和屬性-attribut e。在本書中通篇使用術語觀測和變量。
2、數據結構與數據類型
R中存儲數據的結構:包括標量、向量、數組、數據框和列表。
R中數據類型:數值型、字符型、邏輯型(TRUE/FALSE)、復數型(虛數)和原生型(字節)。
R將實例標識符稱為rownames(行名),將類別型(包括名義型和有序型)變量稱為因子( factors)。
2.2 數據結構在R中,對象( object)是指可以賦值給變量的任何事物,包括常量、數據結構、函數,
甚至圖形。對象都擁有某種模式,描述了此對象是如何存儲的,以及某個類,像print這樣的泛型函數表明如何處理此對象。
(1)向量向量是用于存儲數值型、字符型或邏輯型數據的一維數組。
函數c()可用來創建向量
單個向量中的數據必須擁有相同的類型或模式(數值型、字符型或邏輯型)。
注意:標量是只含一個元素的向量,例如f
索引:a[c()]
(2)矩陣矩陣是一個二維數組,只是每個元素都擁有相同的模式-只能包含一種數據類型(數值型、字符型或邏輯型)。
函數matrix()用來創建矩陣。
索引:X[i,]指矩陣X中的第i行,X[,j]指第j列, X[i, j]指第i行第j個元素。選擇多行或多列時,下標i 和j 可為數值型向量。
(3)數組數組( array)與矩陣類似,但是維度可以大于2。
函數array()用來創建數組。
數組中的數據也只能擁有一種數據類型。
索引:X[i,]指矩陣X中的第i行, X[,j]指第j列, X[i, j]指第i行第j個元素。選擇多行或多列時,下標i 和j 可為數值型向量。
(4)數據框數據框的不同的列可以包含不同模式(數值型、字符型等)的數據。
數據框將是你在R中最常處理的數據結構。
函數data.frame()用于創建數據框。
索引:[]或$-被用來選取一個給定數據框中的某個特定變量。
在每個變量名前都鍵入一次patientdata$可能會讓人生厭,所以不妨走一些捷徑。可以聯合使用函數attach()和detach()或單獨使用函數with()來簡化代碼。函數attach()可將數據框添加到R的搜索路徑中;函數detach()將數據框從搜索路徑中移除。
實例標識符:實例標識符(case identifier)可通過數據框操作函數中的rowname選項指定。
(5)因子(factor)類別(名義型)變量和有序類別(有序型)變量在R中稱為因子( factor)。
函數factor()以一個整數向量的形式存儲類別值,整數的取值范圍是[1... k ](其中k 是名義型變量中唯一值的個數),同時一個由字符串(原始值)組成的內部向量將映射到這些整數上。
(6)列表列表就是一些對象(或成分,component)的有序集合。列表允許你整合若干(可能無關的)對象到單個對象名下。某個列表中可能是若干向量、矩陣、數據框,甚至其他列表的組合。
函數list()用于創建列表。
2.3 數據的輸入
(1)使用鍵盤輸入數據:edit()函數
(2)從帶分隔符的文本文件導入數據:read.table()函數,讀入為數據框格式
(3)導入Excel數據:讀入為數據框格式讀取一個Excel文件的最好方式,就是在Excel中將其導出為一個逗號分隔文件( csv),再用read.csv()讀入。
xlsx包:函數read.xlsx()讀入。
(4)導入XML數據
(5)從網頁抓取數據
(6)導入SPSS數據:SPSS數據集可以通過foreign包中的函數read.spss()導入到R中,也可以使用Hmisc包中的spss.get()函數。
(7)導入SAS數據/導入Stata數據/導入netCDF數據/導入HDF5 數據/訪問數據庫管理系統/通過Stat/Transfer導入數據。
2.4 數據集的標注
通常這種標注包括為變量名添加描述性的標簽,以及為類別型變量中的編碼添加值標簽。
(1)變量標簽
(2)值標簽
2.5 處理數據對象的使用函數
Day 3
第三章 圖形初階
可以應用于所有圖形的通用方法:如何創建和保存圖形,然后關注如何修改那些存在于所有圖形中的特征,包括圖形的標題、坐標軸、標簽、顏色、線條、符號和文本標注。
3.1 使用圖形在R通常的交互式會話中,你可以通過逐條輸入語句構建圖形,逐漸完善圖形特征,直至得到想要的效果。
通過執行如plot()、 hist()(繪制直方圖)或boxplot()這樣的高級繪圖命令來創建一幅新圖形時,通常會覆蓋掉先前的圖形。可在圖形窗口查看歷史圖形。
3.2 舉個栗子
3.3 圖形參數通過修改稱為圖形參數的選項來自定義一幅圖形的多個特征(字體、顏色、坐標軸、標題)。
修改圖形參數方法1:函數par()——以這種方式設定的參數值除非被再次修改,否則將在會話結束前一直有效。添加參數no.readonly=TRUE可以生成一個可以修改的當前圖形參數列表;(先設置參數,再繪制圖形)
opar
> par(pch=17) #設置圖形參數par()
> plot(cyl,wt) #繪制圖形修改圖形參數方法2:高級繪圖函數直接提供optionname=value的鍵值對。 這種情況下,指定的選項僅對這幅圖形本身有效。(并不是所有的高級繪圖函數都允許指定全部可能的圖形參數)
plot(dose, drugA,type="b",lty=2,pch=17)
(1)符號和線條對于符號21~25,還可以指定邊界顏色( col=)和填充色( bg=)選項lty=用于指定想要的線條類型
(2)顏色在R中,可以通過顏色下標、顏色名稱、十六進制的顏色值、 RGB值或HSV值來指定顏色。
函數rgb()可基于紅—綠—藍三色值生成顏色,而hsv()則基于色相—飽和度—亮度值來生成顏色。
函數colors()可以返回所有可用顏色的名稱。
R中也有多種用于創建連續型顏色向量的函數,包括rainbow()、 heat.colors()、terrain.colors()、 topo.colors()以及cm.colors()。
多階灰度色可使用gray()函數生成。
(3)文本屬性
圖形參數同樣可以用來指定字號、字體和字樣。
字體:
<1>在Windows系統中,等寬字體映射為TTCourier New,襯線字體映射為TT Times New Roman,無襯線字體則映射為TT Arial( TT代表TrueType)。
par(family="TT Times New Roman") #設置為襯線字體
<2>創建新的映射:在Windows中,可以通過函數windowsFont()來創建這類映射。
windowsFonts(A=windowsFont("Arial Black"),B=("Bookman Old Style"))
par(family="A")
(4)圖形尺寸與邊界尺寸
3.4 添加文本、自定義坐標軸和圖例
(1)標題
title()函數為圖形添加標題和坐標軸標簽。
title(main="main title",col.main="red",sub="My Sub-title",col.sub="blue"
,xlab="My X label",ylab="My Y label",col.lab="green",cex.lab=0.75) #title()函數可以
設置如顏色、文本大小等圖形參數。
(2)坐標軸函數axis()來創建自定義的坐標軸,而非使用R中的默認坐標軸。
創建自定義坐標軸時,你應當禁用高級繪圖函數自動生成的坐標軸。參數axes=FALSE將禁用全部坐標軸(包括坐標軸框架線,除非你添加了參數frame.plot=TRUE)。參數xaxt="n"和yaxt="n"將分別禁用X軸或Y軸(會留下框架線,只是去除了刻度)。
axis(side,at=,labels=,pos=,lty=,col=,las=,tck=,...)
(3)參考線
函數abline()可以用來為圖形添加參考線。
abline(h=yvalues,v=xvalues)
函數abline()中也可以指定其他圖形參數(如線條類型、顏色和寬度)。
如:abline(h=c(1,5,7)) #在y的1/5/7位置添加了水平實線。
(4)圖例當圖形中包含的數據不止一組時,圖例可以幫助你辨別出每個條形、扇形區域或折線各代表哪一類數據。
函數legend()用來添加圖例。
其他常用的圖例選項包括用于指定盒子樣式的bty、指定背景色的bg、指定大小的cex,以及指定文本顏色的text.col。指定horiz=TRUE將會水平放置圖例,而不是垂直放置。
legend(location,title,legend,...)
(5)文本標注通過函數text()和mtext()將文本添加到圖形上。
text()可向繪圖區域內部添加文本;text()函數也通常用來標示圖形中的點。
mtext()則向圖形的四個邊界之一添加文本。
其他常用的選項有cex、 col和font(分別用來調整字號、顏色和字體樣式)
text(location,"text to place",pos,...)
mtext("text to place",side,line=n,...)
3.5 圖形的組合在R中使用函數par()或layout()可以容易地組合多幅圖形為一幅總括圖形。
在par()函數中使用圖形參數mfrow=c(nrows, ncols)來創建按行填充的、行數為nrows、列數為ncols的圖形矩陣。另外,可以使用nfcol=c(nrows, ncols)按列填充矩陣。
栗子:
attach(mtcars)
opar
par(mfrow=c(2,2))
plot(wt,mpg,main="Scatterplot of wt vs. mpg")
plot(wt,disp,main="Scatterplot of wt vs disp")
hist(wt,main="Boxplot of wt")
boxplot(wt,main="Boxplot of wt")
par(opar)
detach(mtcars)函數layout()的調用形式為layout(mat),其中的mat是一個矩陣,它指定了所要組合的多個圖形的所在位置。
為了更精確地控制每幅圖形的大小,可以有選擇地在layout()函數中使用widths=和heights=兩個參數;widths = 各列寬度值組成的一個向量;heights = 各行高度值組成的一個向量。
參考help(layout)以了解更多細節。
attach(mtcars)
layout(matrix(c(1,1,2,3),2,2,byrow=T),widths=c(3,1),heights=c(1,2))
hist(wt)
hist(mpg)
hist(disp)
detach
總結
以上是生活随笔為你收集整理的r语言electricity数据集_R语言实战学习的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: android访问百度新闻,百度新闻(c
- 下一篇: rocketmq 几种队列_关于Rock