03数据预处理
數據預處理
1.為什么數據預處理
2.數據為什么臟
3.為什么數據預處理是重要的
4.數據質量
5.數據預處理的主要任務
6.數據預處理的形式
?
數據清理
1.如何處理缺失數據
2.如何處理噪音數據
?
數據集成
1.模式集成、沖突數據值、冗余數據
?
數據變換
規范化數據的方法 :最小-最大規范化、Z-score 規范化、小數定標規范化
?
數據歸約
1.數據歸約策略
2.數據立方體聚集
3.數據壓縮
4.維度規約-特征選擇
5.唯獨規約-決策樹歸約
6.維度歸約=屬性/特征產生
7.主成分分析
6.回歸和對數線性模型
?
離散化和概念分層產生
?
?
?
?
?
?
?
?
?
?
?
# dataArr = []# lebalArr = []# line = open("data/horseColic.txt","r")# b = line.readlines()# for i in line:#? ? ? b = line.strip("\n").split("\t")#? ? ? dataArr.append(b.pop())#? ? ? lebalArr.append(b)# print(dataArr)# print(lebalArr)
轉載于:https://www.cnblogs.com/Firesun/p/10800888.html
總結
- 上一篇: 七猫小说怎么盈利(如何看待七猫中文网千字
- 下一篇: nikeapp如何定制(在哪个APP买n