实验报告-python文库_python程序设计与实践大作业
python程序設計與實踐大作業實驗報告陸陽孫勇裘升明.doc
還剩
28頁未讀,
繼續閱讀
下載文檔到電腦,馬上遠離加班熬夜!
親,很抱歉,此頁已超出免費預覽范圍啦!
如果喜歡就下載吧,馬上遠離加班熬夜!
內容要點:
python程序設計與實踐大作業實驗報告陸陽孫勇裘升明,浙江工商大學計算機與信息工程學院《Python 程序設計與實踐》大作業報告專 業: 計科 班 級: 1404 學 號:1412190416、1412190415、1412190413 姓 名: 陸陽,孫勇,裘昇明 指導教師: 題目介紹:在真實的業務場景下,我們往往需要對所有商品的一個子集構建個性化推薦模型。在完成這件任務的過程中,我們不僅需要利用用戶在這個商品子集上的行為數據,往往還需要利用更豐富的用戶行為數據。定義如下的符號:U——用戶集合I——商品全集P——商品子集, P ? ID——用戶對商品全集的行為數據集合那么我們的目標是利用 D 來構造 U 中用戶對 P 中商品的推薦模型。數據說明:競賽數據包含兩個部分。第第二個部分是商品子集(P), 表名為 tianchi_mobile_recommend_train_item,包含如下字段:字段 字段說明 提取說明item_id 商品標識 抽樣&字段脫敏item_ geohash 商品位置的空間標識,可以為空 由經緯度通過保密的算法生成item_category 商品分類標識 字段脫敏訓練數據包含了抽樣出來的一定量用戶在一個月時間(11.18~12.還有,在給出的用戶行為數據中,有些用戶在整個 11-18 日至 12-18 日對商品有瀏覽行為記錄,但是從未產生過購買行為,這些用戶會否在 12 月 19 號購買商品實難預測,因此,我們去除這些無購買行為的用戶信息,認為這些用戶在 12 月 19 號還是不會購買任何商品。貼關鍵代碼import timeimport pandas as pdstart=time.time()df_items=pd.read_csv("tianchi_mobile_recommend_train_item.csv")df_items2=pd.read_csv("tianchi_mobile_recommend_train_user.csv")df_items3=pd.DataFrame()df_items4=pd.DataFrame()df_itemsprint ''商品子集中商品類型數為:'',item_categories_numprint ''商品子集中帶 geohash 信息的商品個數為:'',item_geohash_numprint ''用戶數一共有:'',user_numprint ''商品全集中商品個數為:'',item_full_numprint ''商品全集中商品種類數數為:'',item_categories_full_numprint ''商 entry_time=datetime.strptime(str_time,"%Y-%m-%d %H")datatime_delta=(entry_time-begin_time).daysreturn int(datatime_delta)df_train_user=pd.read_csv("tianchi_mobile_recommend_train_user.csv")print "訓練集樣本示例測試集樣本示例訓練集樣本示例中的 user_id, brand_id(item_id)用于表示唯一的樣本id,而特征 feature_1, feature_2 則用 31 天的數據構建而來。本次比賽中,我們劃分訓練集和測試集所用的分割日期是每 10 天。第 0-9 天為一個訓練集,用第 10 天的數據
發表評論
暫無評論,趕快搶占沙發吧。
總結
以上是生活随笔為你收集整理的实验报告-python文库_python程序设计与实践大作业的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Ubuntu安装screen
- 下一篇: broken pipe怎么解决 数据太大