2021科大讯飞_环境空气质量评价挑战赛_LineRegression_baseline0.04385
                                                            生活随笔
收集整理的這篇文章主要介紹了
                                2021科大讯飞_环境空气质量评价挑战赛_LineRegression_baseline0.04385
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.                        
                                文章目錄
- 前言
- 一、環境空氣質量評價挑戰賽
- 二、源碼
- 1.LineRegression
 
- 總結
前言
沒事的話就也來參加一下這些比賽吧,只要進入前20%就有證書發啦,以后說不定有用噢
一、環境空氣質量評價挑戰賽
 數據預覽:
 
參賽鏈接
 這是一個時間序列問題,數據是沒有缺失的,是一個典型的回歸問題,后續可能考慮提升樹啊,XGBoost,lightGBM,DNN,LSTM等等
好吧,更一下這里有個XGBoost的鏈接,不過只有0.08的分數。
 https://blog.csdn.net/qq_44694861/article/details/118240970
二、源碼
1.LineRegression
代碼如下(示例):
import numpy as np import pandas as pd from sklearn.linear_model import LinearRegression from sklearn.model_selection import KFold from sklearn.metrics import mean_squared_errordef rmse(y_true, y_pred):return mean_squared_error(y_true=y_true, y_pred=y_pred) ** 0.5train = pd.read_csv('C:/Usersx/Desktop/環境空氣質量評價挑戰賽/初賽_訓練集/保定2016年.csv') test = pd.read_csv('C:/Usersx/Desktop/環境空氣質量評價挑戰賽/初賽_測試集/石家莊20160701-20170701.csv')data = pd.concat([train, test]).reset_index(drop=True) data['month'] = data['日期'].apply(lambda x: str(x).split('/')[1]) data_onehot = pd.get_dummies(data['質量等級']) data = pd.concat([data, data_onehot], axis=1)feature = ['AQI', 'PM2.5', 'PM10', 'SO2', 'CO', 'NO2', 'O3_8h','month', '嚴重污染', '中度污染', '優', '良', '輕度污染', '重度污染' ] label = 'IPRC'train = data[:train.shape[0]] test = data[train.shape[0]:]oof_train = np.zeros((train.shape[0],)) oof_test = np.zeros((test.shape[0],))kf = KFold(n_splits=2, random_state=66, shuffle=True) for index, (tr_index, vl_index) in enumerate(kf.split(train)):X_train, X_valid = train.iloc[tr_index][feature].values, train.iloc[vl_index][feature].valuesy_train, y_valid = train.iloc[tr_index][label], train.iloc[vl_index][label]lf = LinearRegression()lf.fit(X_train, y_train)oof_train[vl_index] = lf.predict(X_valid)oof_test = oof_test + lf.predict(test[feature].values) / kf.n_splitsr = rmse(train[label], oof_train) print('RMSE:%f'%r)submit = test[['日期']] submit = submit.reset_index() submit.drop('index', axis=1, inplace=True)temp = pd.DataFrame(oof_test) submit = pd.concat([submit,temp],axis=1)submit.columns = ['date', 'IPRC'] submit.to_csv('C:/Usersx/Desktop/環境空氣質量評價挑戰賽/submit.csv', index=False)總結
提示:返回分數一般是0.04左右啦。
 
總結
以上是生活随笔為你收集整理的2021科大讯飞_环境空气质量评价挑战赛_LineRegression_baseline0.04385的全部內容,希望文章能夠幫你解決所遇到的問題。
 
                            
                        - 上一篇: 使用ClientID
- 下一篇: 怎样把html成mp3,如何将OGG文件
