R语言数据分析过程
R語言數據分析前期:預處理過程,供自己查閱,歡迎大家指正。
?
利用R語言導入數據:
taobao<-read.csv("taobao.csv",stringsAsFactors = F)
我最常用到就是read.csv,其中stringsAsFactors=F很重要,不可缺少,否則會大大降低讀入效率。
除此外還有read.table,他們分割符不同。
read.table(file(讀入的數據名,不在默認路徑下的要添加工作路徑,注意使用雙引號),
header = FALSE(是否將第一行作為每一列的標題),
sep = ""(分割符是什么,table默認“空”,csv默認“,”),
row.names(行名稱), col.names(列名稱),
as.is = !stringsAsFactors,
na.strings = "NA", colClasses = NA, nrows = -1,
skip = 0, check.names = TRUE, fill = !blank.lines.skip,
strip.white = FALSE, blank.lines.skip = TRUE,
comment.char = "#",
allowEscapes = FALSE, flush = FALSE,
stringsAsFactors = default.stringsAsFactors(),
fileEncoding = "", encoding = "unknown", text, skipNul = FALSE)
導入之后對數據以窗口形式進行查看:
View(taobao)
對導入的表格進行一個基本的統計:
summary(taobao)
?
?將數據中無用的字段刪除:
taobao1<-taobao[c("買家應付貨款","買家應付郵費","買家支付積分"
,"總金額","返點積分","買家實際支付金額"
,"買家實際支付積分","買家留言字數"
,"收貨地址","運送方式","訂單創建時間"
,"訂單付款時間","寶貝標題","訂單備注"
,"寶貝種類","物流公司","寶貝總數量")]
?
轉載于:https://www.cnblogs.com/mianbizhe/p/7909610.html
總結
- 上一篇: vue技术栈
- 下一篇: PHP汉字转化为拼音