當(dāng)前位置：首頁 > 运维知识 > windows >内容正文

windows

ML之FE：Kaggle比赛之根据城市自行车共享系统数据进行FE+预测在某个时间段自行车被租出去的个数

發(fā)布時間：2025/3/21 windows 14 豆豆

生活随笔收集整理的這篇文章主要介紹了 ML之FE：Kaggle比赛之根据城市自行车共享系统数据进行FE+预测在某个时间段自行车被租出去的个数小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

Kaggle比賽之根據(jù)城市自行車共享系統(tǒng)數(shù)據(jù)預(yù)測在某個時間段自行車被租出去的個數(shù)

一、FE整體設(shè)計思路

二、FE分步驟處理

相關(guān)代碼

輸出結(jié)果

一、FE整體設(shè)計思路

二、FE分步驟處理

輸出結(jié)果

# 處理時間字段：把datetime域切成日期、時間兩個字段。 temp = pd.DatetimeIndex(data['datetime']) data['date'] = temp.date data['time'] = temp.time data.head()

#特征向量化 #打算用scikit-learn來建模。對于pandas的dataframe我們有方法/函數(shù)可以直接轉(zhuǎn)成python中的dict #還要對離散值和連續(xù)值特征區(qū)分一下了，以便之后分開做不同的特征處理。from sklearn.feature_extraction import DictVectorizer# 我們把連續(xù)值的屬性放入一個dict中 featureConCols = ['temp','atemp','humidity','windspeed','dateDays','hour'] dataFeatureCon = dataRel[featureConCols] dataFeatureCon = dataFeatureCon.fillna( 'NA' ) #in case I missed any X_dictCon = dataFeatureCon.T.to_dict().values() # 把離散值的屬性放到另外一個dict中 featureCatCols = ['season','holiday','workingday','weather','Saturday', 'Sunday'] dataFeatureCat = dataRel[featureCatCols] dataFeatureCat = dataFeatureCat.fillna( 'NA' ) #in case I missed any X_dictCat = dataFeatureCat.T.to_dict().values() # 向量化特征 vec = DictVectorizer(sparse = False) X_vec_cat = vec.fit_transform(X_dictCat) X_vec_con = vec.fit_transform(X_dictCon)

總結(jié)

以上是生活随笔為你收集整理的ML之FE：Kaggle比赛之根据城市自行车共享系统数据进行FE+预测在某个时间段自行车被租出去的个数的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇： ML之FE：数据处理—特征工程之特征选择
下一篇： ML之FE：结合Kaggle比赛的某一案

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

windows

ML之FE：Kaggle比赛之根据城市自行车共享系统数据进行FE+预测在某个时间段自行车被租出去的个数

一、FE整體設(shè)計思路

二、FE分步驟處理

相關(guān)代碼

輸出結(jié)果

總結(jié)