根据历史数据预测未来数据_未来销量预测——Kaggle基础方案(一):赛题背景和数据字段分析...
生活随笔
收集整理的這篇文章主要介紹了
根据历史数据预测未来数据_未来销量预测——Kaggle基础方案(一):赛题背景和数据字段分析...
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
筆者將分享一次kaggle數據競賽的實例,包括了數據競賽的基本套路流程:賽題業務背景分析,數據探索(EDA),特征工程,單模預測(特征重要性分析)以及stacking模型融合。
本次賽題的鏈接:
Predict Future Sales | Kaggle?www.kaggle.com賽題任務是對未來的銷量進行預測,屬于時間序列挖掘的一類問題,數據由俄羅斯最大的軟件公司:1C Company提供。
文件說明
數據集下載:
Predict Future Sales | Kaggle?www.kaggle.comsales_train.csv為訓練集,包括字段:date、date_block_num、shop_id、item_id、item_price、item_cnt_day。items.csv、shops.csv、item_categories.csv均為對數據的補充信息,可以構造更加多維的特征,附加了item_name、item_id、item_category_id、item_category_name、item_category_id、shop_name、shop_id等字段,測試集僅包含ID、shop_id、item_id三個字段。各字段的解釋如下:
摸清楚各個字段和原始數據的意義是進行數據挖掘的第一步,方便于結合個人的業務理解去處理數據和特征工程的構造。下一篇介紹如何探索原始數據和EDA可視化分析。
作者CSDN博客:
https://blog.csdn.net/wlx19970505?blog.csdn.net總結
以上是生活随笔為你收集整理的根据历史数据预测未来数据_未来销量预测——Kaggle基础方案(一):赛题背景和数据字段分析...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python为什么用linux_为何Py
- 下一篇: python添加系统环境win7_pyt