16个推荐系统开放公共数据集整理分享
(本文由深度學習與NLP編譯)
本文主要整理了一些與推薦系統相關的高質量的數據集。整理自Stack Overflow、一些文章、推薦站點和學術實驗。其中,大多數數據集都是免費、開放的,但有些不是,需要獲得許可或引用作者的工作才能使用。此外,其中也包含一些預處理數據,可用于學術實驗。鏈接和數據集描述。
?
Book
· 1. Book Crossing
BookCrossing(BX)數據集由Cai-Nicolas花了的4周(2004年8月/ 9月)從Book-Crossing社區中爬取得到的。
·?下載鏈接:http://www2.informatik.uni-freiburg.de/~cziegler/BX/
?
電子商務
· 2. Amazon
該數據集包括自1996年5月至2014年7月,來自亞馬遜上的1.428億產品的評論和metadata。
·?下載鏈接:http://jmcauley.ucsd.edu/data/amazon/
?
· 3. Retailrocket推薦系統數據集
該數據集由三個文件組成:一個行為數據集(events.csv),一個屬性數據集(item_properties.сsv)和一個類目樹數據集(category_tree.сsv)。該數據來自現實世界的電子商務網站。
·?下載鏈接:https://www.kaggle.com/retailrocket/ecommerce-dataset
?
音樂
· 4. Amazon Music
該數字音樂數據集包含來自亞馬遜的評論和元數據
· 下載鏈接:http://jmcauley.ucsd.edu/data/amazon/
?
·?5. Yahoo Music
該數據集是一個快照,收集了音樂社區對各種音樂藝術家的偏好。
·?下載鏈接:https://webscope.sandbox.yahoo.com/catalog.php?datatype=r
?
·?6. LastFM(Implicit)
該數據集收集了Last.fm網站上2千名用戶的社交網絡、tagging和music artist listening信息。
·?下載鏈接:https://grouplens.org/datasets/hetrec-2011/
?
· 7. Milion Song Dataset
Million Song數據集是一個免費的數據集,提供了一百萬條當代流行音樂曲目相關的的audio features和metadata。
·?下載鏈接:https://labrosa.ee.columbia.edu/millionsong/
?
電影
· 8. MovieLens
GroupLens Research已經從他們的電影網站收集整理的rating數據集。
·?下載鏈接:https://grouplens.org/datasets/movielens/
?
· 9. Yahoo Movies
該數據集包含從兩個不同來源收集的歌曲的rating數據集。第一個來源是用戶在與Yahoo上使用音樂服務是產生的rating數據。
· 下載鏈接:https://webscope.sandbox.yahoo.com/catalog.php?datatype=r
?
· 10. CiaoDVD
CiaoDVD是2013年12月從http://dvd.ciao.co.uk網站上抓取的DVD類別數據集。
· 下載鏈接:https://webscope.sandbox.yahoo.com/catalog.php?datatype=r
?
·11. FilmTrust
FilmTrust是2011年6月從整個FilmTrust網站上抓取的一個小型數據集。
· 下載鏈接:https://www.librec.net/datasets.html
?
· 12. Netflix
這是Netflix獎競賽中使用的官方數據集。
· 下載鏈接:http://academictorrents.com/details/9b13183dc4d60676b773c9e2cd6de5e5542cee9a
?
游戲
· 13. Steam Video Games
這是一個用戶行數據集,包含:user-id,game-title,behavior-name,value。包括“purchase”和“play”數據集。購買了,puchase的值為1,而“play”的值表示用戶播放音樂的時長。
·?下載鏈接:https://www.kaggle.com/tamber/steam-video-games/data
?
Jokes
· 14. Jester
該笑話數據集包含來自73,496個用戶,關于100個笑話的410萬連續rating數據(-10.00到+10.00)
· 下載鏈接:http://www.ieor.berkeley.edu/~goldberg/jester-data/
?
餐飲
·15. Chicago Entree
該數據集包含用戶與Entree Chicago餐廳推薦系統交互的記錄數據。
· 下載鏈接:http://archive.ics.uci.edu/ml/datasets/Entree+Chicago+Recommendation+Data
?
動漫
·16. 動漫推薦數據庫
該數據集包含來自12,294個動漫的73,516個用戶的用戶偏好數據。每個用戶都可以將動畫添加到已完成的列表中并為其評分,該數據集把這些評級整理起來。
· 下載鏈接:https://www.kaggle.com/CooperUnion/anime-recommendations-database
?
其他數據集
· GroupLens數據集
· 下載鏈接:https://grouplens.org/datasets/
?
· LibRec數據集
· 下載鏈接:https://www.librec.net/datasets.html
?
· Yahoo Research數據集
· 下載鏈接:https://webscope.sandbox.yahoo.com/catalog.php?datatype=r
?
· 斯坦福大型網絡數據集匯編
· 下載鏈接:https://snap.stanford.edu/data/
總結
以上是生活随笔為你收集整理的16个推荐系统开放公共数据集整理分享的全部內容,希望文章能夠幫你解決所遇到的問題。
 
                            
                        - 上一篇: Java多线程(十)之Reentrant
- 下一篇: Linux nginx 会话保持(ses
