转:UCI数据集和源代码数据挖掘的数据集资源
《UCI數(shù)據(jù)集和源代碼》
UCI數(shù)據(jù)集是一個常用的標準測試數(shù)據(jù)集,下載地址在
http://www.ics.uci.edu/~mlearn/MLRepository.html
我的主頁上也有整理好的一些UCI數(shù)據(jù)集(arff格式):
http://lamda.nju.edu.cn/yuy/files/download/UCI_arff.zip
在看別人的論文時,別人使用的數(shù)據(jù)集會給出數(shù)據(jù)集的出處或下載地址(除非是很機密的數(shù)據(jù),例如與國家安全有關(guān))。如果你看的論文沒有給出數(shù)據(jù)集的出處,請立即停止看這篇論文,并且停止看刊發(fā)這篇論文的期刊上的所有文章。因為可以斷定這些文章質(zhì)量很差。
關(guān)于源代碼,網(wǎng)上有很多公開源碼的算法包,例如最為著名的Weka,MLC++等。Weka還在不斷的更新其算法,下載地址:
http://www.cs.waikato.ac.nz/ml/weka/
很多的機器學習的經(jīng)典算法都在里面。而且公布源程序,易于修改。
如果作者沒有公布源程序,可以到作者主頁找找,也可以寫信給作者要,一般論文開頭都會有作者的email地址。寫信的時候要注意要很有禮貌,否則作者,尤其是著名學者,很有可能不會理睬。如果算法簡單,可以自己實現(xiàn)。
關(guān)于論文的下載,如果能夠訪問電子圖書館是最好的,很多學校都買了IEEE,?Elsevier,?Kluwer等,上面的期刊都不錯。有一些很好的期刊是免費的,像JAIR和JMLR,分別在:
http://www.cs.washington.edu/research/jair/home.html
http://www.jmlr.org/
如果能訪問的免費期刊太少,可以到CiteSeer上搜索(http://citeseer.ist.psu.edu/?),上面搜集了很多免費論文(但是要注意,論文的質(zhì)量參差不齊),或者用Googlewww.google.com?)搜索。
再囑咐兩點,要做研究,首先要打好基礎(chǔ),例如數(shù)學基礎(chǔ)和程序設(shè)計能力,要學會熟練使用google等搜索引擎,還有一定要看高質(zhì)量的論文。
《數(shù)據(jù)挖掘的數(shù)據(jù)集資源》
大家做數(shù)據(jù)挖掘研究時,常常為找不到合適的數(shù)據(jù)而發(fā)愁。在KDNuggets上有Datasets欄目,提供一些數(shù)據(jù)集,網(wǎng)址為:http://www.kdnuggets.com/datasets/
還有另外一個很好的資源網(wǎng)址為:http://kdd.ics.uci.edu/?,里面包含的數(shù)據(jù)資源如下(按應(yīng)用領(lǐng)域劃分):
Direct Marketing
? KDD CUP 1998 Data
GIS
? Forest CoverType
Indexing
? Corel Image Features
? Pseudo Periodic Synthetic Time Series
Intrusion Detection
? KDD CUP 1999 Data
Process Control
? Synthetic Control Chart Time Series
Recommendation Systems
? Entree Chicago Recommendation Data
Robots
? Pioneer-1 Mobile Robot Data
? Robot Execution Failures
Sign Language Recognition
? Australian Sign Language Data
? High-quality Australian Sign Language Data
Text Categorization
? 20 Newsgroups Data
? Reuters-21578 Text Categorization Collection
? NSF Research Awards Abstracts 199 0-2003
World Wide Web
? Microsoft Anonymous Web Data
? MSNBC Anonymous Web Data
? Syskill Webert Web Data
?轉(zhuǎn):http://blogger.org.cn/blog/more.asp?name=DMman&id=24043
1、氣候監(jiān)測數(shù)據(jù)集?http://cdiac.ornl.gov/ftp/ndp026b
2、幾個實用的測試數(shù)據(jù)集下載的網(wǎng)站
http://www.cs.toronto.edu/~roweis/data.html
http://www.cs.toronto.edu/~roweis/data.html
http://kdd.ics.uci.edu/summary.task.type.html
http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-20/www/data/
http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-11/www/wwkb/
http://www.phys.uni.torun.pl/~duch/software.html
在下面的網(wǎng)址可以找到reuters數(shù)據(jù)集http://www.research.att.com/~lewis/reuters21578.html
以下網(wǎng)址上有各種數(shù)據(jù)集:
http://kdd.ics.uci.edu/summary.data.type.html
進行文本分類,還有一個數(shù)據(jù)集是可以用的,即rainbow的數(shù)據(jù)集
http://www-2.cs.cmu.edu/afs/cs/project/theo-11/www/naive-bayes.html
3、找了很多測試數(shù)據(jù)集,寫論文的同志們肯定需要的,至少能用來檢驗算法的效果
可能有一些不能訪問,但是總有能訪問的吧:
UCI收集的機器學習數(shù)據(jù)集
ftp://pami.sjtu.edu.cn/
http://www.ics.uci.edu/~mlearn//MLRepository.htm
statlib
http://liama.ia.ac.cn/SCILAB/scilabindexgb.htm
http://lib.stat.cmu.edu/
樣本數(shù)據(jù)庫
http://kdd.ics.uci.edu/
http://www.ics.uci.edu/~mlearn/MLRepository.html
關(guān)于基金的數(shù)據(jù)挖掘的網(wǎng)站
http://www.gotofund.com/index.asp
http://lans.ece.utexas.edu/~strehl/
reuters數(shù)據(jù)集
http://www.research.att.com/~lewis/reuters21578.html
各種數(shù)據(jù)集:
http://kdd.ics.uci.edu/summary.data.type.html
http://www.mlnet.org/cgi-bin/mlnetois.pl/?File=datasets.html
http://lib.stat.cmu.edu/datasets/
http://dctc.sjtu.edu.cn/adaptive/datasets/
http://fimi.cs.helsinki.fi/data/
http://www.almaden.ibm.com/software/quest/Resources/index.shtml
http://miles.cnuce.cnr.it/~palmeri/datam/DCI/
進行文本分類&WEB
http://www-2.cs.cmu.edu/afs/cs/project/theo-11/www/naive-bayes.html
http://www.w3.org/TR/WD-logfile-960221.html
http://www.w3.org/Daemon/User/Config/Logging.html#AccessLog
http://www.w3.org/1998/11/05/WC-workshop/Papers/bala2.html
http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-11/www/wwkb/
http://www.web-caching.com/traces-logs.html
http://www-2.cs.cmu.edu/webkb
http://www.cs.auc.dk/research/DP/tdb/TimeCenter/TimeCenterPublications/TR-75.pdf
http://www.cs.cornell.edu/projects/kddcup/index.html
時間序列數(shù)據(jù)的網(wǎng)址
http://www.stat.wisc.edu/~reinsel/bjr-data/
apriori算法的測試數(shù)據(jù)
http://www.almaden.ibm.com/cs/quest/syndata.html
數(shù)據(jù)生成器的鏈接
http://www.cse.cuhk.edu.hk/~kdd/data_collection.html
http://www.almaden.ibm.com/cs/quest/syndata.html
關(guān)聯(lián):
http://flow.dl.sourceforge.net/sourceforge/weka/regression-datasets.jar
http://www.almaden.ibm.com/software/quest/Resources/datasets/syndata.html#assocSynData
WEKA:
http://flow.dl.sourceforge.net/sourceforge/weka/regression-datasets.jar
1。A jarfile containing 37 classification problems, originally obtained from the UCI repository
http://prdownloads.sourceforge.net/weka/datasets-UCI.jar
2。A jarfile containing 37 regression problems, obtained from various sources
http://prdownloads.sourceforge.net/weka/datasets-numeric.jar
3。A jarfile containing 30 regression datasets collected by Luis Torgo
http://prdownloads.sourceforge.net/weka/regression-datasets.jar
癌癥基因:
http://www.broad.mit.edu/cgi-bin/cancer/datasets.cgi
金融數(shù)據(jù):
http://lisp.vse.cz/pkdd99/Challenge/chall.htm
?
另一個人提供的
http://www.cs.toronto.edu/~roweis/data.html
http://kdd.ics.uci.edu/summary.task.type.html
http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-20/www/data/
http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-11/www/wwkb/
http://www.phys.uni.torun.pl/~duch/software.html
在下面的網(wǎng)址可以找到reuters數(shù)據(jù)集
http://www.research.att.com/~lewis/reuters21578.html
以下網(wǎng)址上有各種數(shù)據(jù)集:
http://kdd.ics.uci.edu/summary.data.type.html
進行文本分類,還有一個數(shù)據(jù)集是可以用的,即rainbow的數(shù)據(jù)集
http://www-2.cs.cmu.edu/afs/cs/project/theo-11/www/naive-bayes.html
Download the Financial Data (~17.5M zipped file, ~67M unzipped data)
Download the Medical Data (~2M zipped file, ~6M unzipped data)
http://lisp.vse.cz/pkdd99/Challenge/chall.htm
kdnuggets 相關(guān)鏈接數(shù)據(jù)集(借花獻佛了):
http://www.kdnuggets.com/datasets/index.html
你也可以到http://blogger.org.cn/blog/more.asp?name=idmer&id=24017
察看kdnuggets 數(shù)據(jù)集資源的詳細介紹。
數(shù)據(jù)挖掘相關(guān)比賽以及數(shù)據(jù)集
2005 University of California data mining contest?, predicting bad accounts and their churn date using real-world CRM data, deadline June 30, 2005.
ILP 2005 Challenge?, on the prediction of functional classes of genes.?KDD Cup 2005?, on classifying internet user search queries, deadline July 8.?Data Mining Cup 2005 (Chemnitz, Germany)?, for students; topic: How data mining can ascertain the risk of loss of payments and reduce this risk.?KDD Cup 2004?, focuses on data-mining for a several performance criteria using datasets from bioinformatics and quantum physics.?InfoVis 2004 Contest?, The History of InfoVis.?DATA MINING CUP 2004 (Chemnitz, Germany)?, for students.?InfoVis 2003 Contest: Visualization and Pair Wise Comparison of Trees?, results announced Sep 5, 2003.?KDD Cup 2003?, focuses on problems motivated by network mining and the analysis of usage logs.?DATA MINING CUP 2003 (Chemnitz, Germany)?. The task is to identify spam emails before they reach the user′s mailbox.?KDD Cup 2002?, focus on data mining in molecular biology.?Student Data Mining Cup (2002)?, Chemnitz University and Prudential Systems. 下載?k-means聚類(使用數(shù)據(jù)集:iris)
12-29 使用java語言在數(shù)據(jù)集iris上實現(xiàn)k-means聚類 下載?UCI數(shù)據(jù)集(數(shù)據(jù)挖掘)
11-14 很全的uci數(shù)據(jù)集,格式為arff,希望有用從0到1學好區(qū)塊鏈開發(fā),一年編程經(jīng)驗學完月薪可達40K+
立即申請試學,成為時代顛覆者
UCI數(shù)據(jù)集整理(附論文常用數(shù)據(jù)集)
?2.7萬
摘要:UCI數(shù)據(jù)集作為標準測試數(shù)據(jù)集經(jīng)常出現(xiàn)在許多機器學習的論文中,為了更方便使用這些數(shù)據(jù)集有必要對其進行整理,這里整理了論文中經(jīng)常出現(xiàn)的數(shù)據(jù)集,并詳細介紹如何使用MATLAB將數(shù)據(jù)集文件整...來自: 橋上風景樓上的你
優(yōu)化機器學習不平衡數(shù)據(jù)集的八大策略
?2642
什么是不平衡數(shù)據(jù)不平衡對于分類問題來說是指數(shù)據(jù)集中樣本的類別不平均。比如, 對于一個樣本總數(shù)為100的二分類問題來說,80個樣本被標為類別1,剩下的20個樣本被標為類別2.這是一個不平衡的數(shù)據(jù)集,因為...來自: lime1991的專欄
下載?常見聚類數(shù)據(jù)集人工數(shù)據(jù)和UCI數(shù)據(jù)都有
01-26 這里面是機器學習里面聚類所需的數(shù)據(jù)集,分為人工的二維數(shù)據(jù)集,如月牙形,雙螺旋型等,和UCI真實數(shù)據(jù)集,是我搜集好久才弄出來的,有一些二維數(shù)據(jù)集是自己生成的,提供給大家做算法實驗。一些用于聚類和分類問題的數(shù)據(jù)集
?150
畢業(yè)設(shè)計時簡單研究了聚類和分類問題,整理了一下用到的數(shù)據(jù)集,有需要的可以參考一下。。。 聚類數(shù)據(jù)集信息 序號 數(shù)據(jù)集 記錄數(shù) 特征數(shù) 類別 簡單分布 是否有ove...來自: 繩子的博客
下載?聚類分析常用數(shù)據(jù)集
03-26 聚類分析常用的人工數(shù)據(jù)集,包括:UCI:wine、Iris、yeast,還有4k2_far、leuk72_3k等數(shù)據(jù)集。它們在聚類分析、數(shù)據(jù)挖掘、機器學習、模式識別領(lǐng)域經(jīng)常用到。聚類算法之K-means算法-UCI數(shù)據(jù)集上的java實現(xiàn)
?3473
本文主要分析了K-means聚類算法的基本原理,時間復(fù)雜度以及優(yōu)缺點,最后用UCI數(shù)據(jù)集進行了測試,包含java實現(xiàn)代碼,適合初學者參考。...來自: 笑*容的博客
下載?聚類分析、機器學習及數(shù)據(jù)挖掘中常用數(shù)據(jù)集
09-02 在聚類分析、機器學習、數(shù)據(jù)挖掘中常用到的數(shù)據(jù)集,包括:UCI的數(shù)據(jù)集wine,yeast,iris等,還有USPS數(shù)據(jù)集,4k2_far,leuk72_3k數(shù)據(jù)集等。Weka訓練數(shù)據(jù)集.arff大合集
?6712
Weka是機器學習中的一個非常好的開源工具,對于熟悉Java的同學們來說是一個非常好的選擇。Weka幾乎包含了所有常見機器學習算法的Java實現(xiàn),Weka中支持的數(shù)據(jù)格式主要是arff,雖然weka官...來自: jiajia333666的博客
文章熱詞
數(shù)據(jù)挖掘模型是什么 數(shù)據(jù)挖掘算法大全 excel 實現(xiàn)數(shù)據(jù)挖掘 數(shù)據(jù)挖掘數(shù)據(jù)缺失 數(shù)據(jù)挖掘的功能分類相關(guān)熱詞
uci數(shù)據(jù)?uci端口?uci軟件包?uci打不開?uci使用說明博主推薦
換一批wonder4
關(guān)注?639篇文章
Eastmount
關(guān)注?310篇文章
fengbingchun
關(guān)注?729篇文章
uci聚類測試數(shù)據(jù)集
下載
09-15
該文件有六百條數(shù)據(jù),每100條是一類??捎糜诰垲惖臏y試。... *詳細原因: 取??消 提??交 uci聚類測試數(shù)據(jù)集 3積分 立即下載 ...
UCI數(shù)據(jù)集數(shù)據(jù)的分析 ——葡萄酒數(shù)據(jù)
?1485
1、前言? ? ?葡萄酒是一種成分復(fù)雜的酒精飲料,不同產(chǎn)地、年份和品種的葡萄酒成分不同,這也是導致質(zhì)量差異過大的重要因素。至今,質(zhì)量評價主要還是依靠專家的感官。味道是最難理解的一種感官,因此用味蕾評價...來自: X_dmword的博客
UCI數(shù)據(jù)集
下載
09-19
是arff 格式的數(shù)據(jù),應(yīng)該非常有用,可以測試一些數(shù)據(jù)挖掘分類算法的準確度,對學習...常見聚類數(shù)據(jù)集人工數(shù)據(jù)和UCI數(shù)據(jù)都有 97 2018-01-26 chenguangchun1993 VIP...
如何使用UCI數(shù)據(jù)集
?4865
UCI數(shù)據(jù)集是一個常用的機器學習標準測試數(shù)據(jù)集。 地址: http://www.ics.uci.edu/~mlearn 以Iris鳶尾花數(shù)據(jù)集為例: 1.Iris數(shù)據(jù)集在右邊方框【Most...來自: 繩子的博客
UCI數(shù)據(jù)集使用
?2.1萬
UCI數(shù)據(jù)庫目前共有187個數(shù)據(jù)集,其數(shù)目還在不斷增加,UCI數(shù)據(jù)集是一個常用的標準測試數(shù)據(jù)集。 UCI數(shù)據(jù)可以使用Matlab的dlmread或textread讀取,不過,需要先將不是數(shù)字的類別用...來自: 小倔驢
寶貴數(shù)據(jù)集——用于數(shù)據(jù)挖掘、機器學習、文本挖掘
?2328
1、氣候監(jiān)測數(shù)據(jù)集 http://cdiac.ornl.gov/ftp/ndp026b2、幾個實用的測試數(shù)據(jù)集下載的網(wǎng)站 http://www.cs.toronto.edu/~roweis/data...來自: XingLiu's Blog
開放數(shù)據(jù)集
?5697
商業(yè)敏感數(shù)據(jù)雖然難以獲取,但好在仍有相當多有用數(shù)據(jù)可公開訪問。它們中的不少常用來作為特定機器學習問題的基準測試數(shù)據(jù)。常見的有以下幾個: UCL機器學習知識庫 包括近300個不同大小和類...來自: ForestCat的專欄
zz 數(shù)據(jù)挖掘, 機器學習的測試數(shù)據(jù)集 - 美國UCI數(shù)據(jù)集
?974
UCI數(shù)據(jù)集是一個常用的標準測試數(shù)據(jù)集,下載地址在 http://www.ics.uci.edu/~mlearn/MLRepository.html 我的主頁上也有整理好的一些UCI數(shù)據(jù)集: h...來自: 精力極有限,人生極短暫
數(shù)據(jù)挖掘常用的心臟病數(shù)據(jù)(From UCI)
?3001
http://archive.ics.uci.edu/ml/machine-learning-databases/statlog/heart/?該數(shù)據(jù)經(jīng)常作為數(shù)據(jù)挖掘的示例。?This databas...來自: wonder的地下室
UCI數(shù)據(jù)集與相關(guān)論文和源代碼
?1427
UCI 數(shù)據(jù)集是一個常用的標準測試數(shù)據(jù)集,下載地址在 ? http://www.ics.uci.edu/~mlearn/MLRepository.html ?? 我的主頁上也有整理好...來自: mayanyun2013的專欄
下載?用機器學習算法對UCI上的三個數(shù)據(jù)集做預(yù)測
02-07 1. 在UC Irvine Machine Learning數(shù)據(jù)集上選擇三個數(shù)據(jù) 2. 編寫一種機器學習算法預(yù)測結(jié)果,并使用十次、十折交叉驗證 3. 撰寫報告,包含對數(shù)據(jù)集、算法、結(jié)果的描述以及源代碼《UCI數(shù)據(jù)集和源代碼》
?1076
UCI數(shù)據(jù)集是一個常用的標準測試數(shù)據(jù)集,下載地址在 http://www.ics.uci.edu/~mlearn/MLRepository.html 我的主頁上也有整理好的一些UCI數(shù)據(jù)集(arf...來自: Mittens 的專欄
下載?arff數(shù)據(jù)集全集
08-25 目錄列表: 2dplanes.arff abalone.arff ailerons.arff Amazon_initial_50_30_10000.arff anneal.arff anneal.ORpython中使用k-means對鳶尾花數(shù)據(jù)集聚類
?5695
代碼和結(jié)果:import matplotlib.pyplot as plt import numpy as np from sklearn.cluster import KMeans from...來自: masbbx123的博客
下載?聚類測試數(shù)據(jù)
08-15 two_cluster、three_cluster、five_cluster為不同簇數(shù)的點集,適用于Kmeans聚類 spiral、Twomoons、ThreeCircles分別為螺旋分布、月牙分布、ML:教你聚類并構(gòu)建學習模型處理數(shù)據(jù)(附數(shù)據(jù)集)
?309
本文將根據(jù)41個描述性分類特征的維度,運用無監(jiān)督主成分分析(PCA)和層次聚類方法對觀測進行分組。將數(shù)據(jù)聚類可以更好地用簡單的多元線性模型描述數(shù)據(jù)或者識別更適合其他模型的異常組。此方法被編寫在pyth...來自: weixin_40581617的博客
下載?數(shù)據(jù)挖掘聚類分析技術(shù)實驗常用真實數(shù)據(jù)集
03-19 全部為txt文檔數(shù)據(jù),數(shù)據(jù)挖掘聚類分析技術(shù),算法實驗過程中,經(jīng)常用到的經(jīng)典UCI、UPSP等真實數(shù)據(jù)集,常用于算法的實驗驗證。文檔中注有相應(yīng)的數(shù)據(jù)量、屬性等信息,可直接進行使用。UCI數(shù)據(jù)集和源代碼
?5703
UCI數(shù)據(jù)集是一個常用的標準測試數(shù)據(jù)集,下載地址在 http://www.ics.uci.edu/~mlearn/MLRepository.html 我的主頁上也有整理好的一些UCI數(shù)據(jù)集: h...來自: 學習亦游戲
UCI數(shù)據(jù)集數(shù)據(jù)的分析(補充)——葡萄酒數(shù)據(jù)
?505
1、提出問題? ? ?在前面,我們已經(jīng)學了影響紅白葡萄酒質(zhì)量的相關(guān)因素以及兩種酒的物理化學性質(zhì)的差異。那么我們該怎么運用物理化學性質(zhì)來確定一種酒是紅葡萄酒還是白葡萄酒呢?2、分析問題? ? 根據(jù)前面的...來自: X_dmword的博客
對adult數(shù)據(jù)集建立樸素貝葉斯模型評估并可視化(awk+hive+java+mysql+echarts)
?1609
總結(jié)下這段時間的收獲 分為三部分 linux echarts 數(shù)據(jù)挖掘 最近做了個課設(shè),要給adult數(shù)據(jù)集建立合適的分類器,并對分類器評估 分享一下成果,有好多問題完成后才知道,僅供和我一樣的初學...來自: 呵少俠的博客
聚類算法實踐(五)——真實Dataset測試
?2927
在之前的文章里,討論了一些聚類算法的基本思路,并針對人為構(gòu)造的數(shù)據(jù)進行了測試。然而,真實的數(shù)據(jù)畢竟不同于人工數(shù)據(jù)。在對現(xiàn)實數(shù)據(jù)進行聚類的時候,有時候不知道哪些特征才是最關(guān)鍵的,因此多少會摻雜一些無關(guān)的...來自: Entropy
下載?K-means聚類數(shù)據(jù).rar
11-16 詳見博文:http://blog.csdn.net/hujingshuang/article/details/49867455 下載?二維聚類數(shù)據(jù)集
09-30 用于聚類方法的數(shù)據(jù)集,包括不同數(shù)目的塊狀聚類、月牙形、同心環(huán)形及螺旋形分布,可用于Kmeans、譜聚類等聚類方法的測試。 下載?常用聚類分析數(shù)據(jù)集
07-01 聚類分析常用的人工數(shù)據(jù)集,包括:UCI:wine、Iris、yeast,還有4k2_far、leuk72_3k等數(shù)據(jù)集。它們在聚類分析、數(shù)據(jù)挖掘、機器學習、模式識別領(lǐng)域經(jīng)常用到。 下載?adult數(shù)據(jù)集分析
02-15 adult數(shù)據(jù)集數(shù)據(jù)挖掘,基于python語言的決策樹算法,源碼+數(shù)據(jù)adult數(shù)據(jù)集數(shù)據(jù)挖掘,基于python語言的決策樹算法,源碼+數(shù)據(jù)adult數(shù)據(jù)集數(shù)據(jù)挖掘,基于python語言的決策樹算法,源碼+數(shù)據(jù)adult數(shù)據(jù)集數(shù)據(jù)挖掘,基...[035]Java實現(xiàn)SVM對乳腺癌檢測數(shù)據(jù)分類分析
?1679
背景簡介:最近在做SVM分類的學習,查看網(wǎng)上大多相關(guān)內(nèi)容都是SVM原理介紹、推導和用終端命令行使用svm-train,svm-predict。具體數(shù)據(jù)分析實現(xiàn)很少。通過查找資料發(fā)現(xiàn)了一個很好的開發(fā)庫L...來自: friendpengyou的專欄
【Python數(shù)據(jù)挖掘課程】五.線性回歸知識及預(yù)測糖尿病實例
?1.3萬
今天主要講述的內(nèi)容是關(guān)于一元線性回歸的知識,Python實現(xiàn),包括以下內(nèi)容: 1.機器學習常用數(shù)據(jù)集介紹 2.什么是線性回顧 3.LinearRegre...來自: 楊秀璋的專欄
機器學習案例——鳶尾花數(shù)據(jù)集分析
?1655
????前幾天把python基礎(chǔ)知識過了一遍,拿了這個小例子作為練手項目,這個案例也有師兄的幫助,記錄完,發(fā)現(xiàn)代碼貼的很多,文章有點長,為了節(jié)省篇幅,有一些說明就去掉了,畢竟鳶尾花數(shù)據(jù)集比較經(jīng)典,網(wǎng)上...來自: 劉小緒同學的博客
聚類
?1.5萬
4、聚類 聚類分析提供由個別數(shù)據(jù)對象到數(shù)據(jù)對象所指派到簇的抽象。此外,一些聚類技術(shù)使用簇原型(即代表簇中其他對象的數(shù)據(jù)對象)來刻畫簇的特征。聚類分析是研究發(fā)現(xiàn)最具有代表性的簇原型的技術(shù)?;貧w和P...來自: rosenor1的博客
下載?多視圖聚類數(shù)據(jù)集mfeat
09-08 該mfeat數(shù)據(jù)集主要用于多視圖聚類算法研究,其中已經(jīng)有標簽,可以用于對最終聚類算法分出來的類簇進行評估。四種主流聚類方法
?3.4萬
四種聚類方法之比較 2015-07-29?SOTON數(shù)據(jù)分析 聚類分析是一種重要的人類行為,早在孩提時代,一個人就通過不斷改進下意識中的聚類模式來學會如何區(qū)分貓狗、動物植物。目前在許多領(lǐng)域都...來自: Alex_luodazhi的博客
【分享】聯(lián)合聚類算法標準測試數(shù)據(jù)集
?1533
該數(shù)據(jù)集為A. Lomet等人提供的,可作為聯(lián)合聚類算法的標準測試數(shù)據(jù)集,可針對不同的聚類數(shù)目、規(guī)模、聚類任務(wù)難度等進行對比驗證分析,可應(yīng)用于協(xié)同過濾算法等的測試。 ? ?數(shù)據(jù)堂免費提供數(shù)據(jù)...來自: 數(shù)據(jù)堂-科研數(shù)據(jù)共享平臺
下載?聚類常用數(shù)據(jù)集
12-29 聚類常用數(shù)據(jù)集 下載?常用UCI數(shù)據(jù)集
06-04 常用的UCI數(shù)據(jù)集,可直接用于機器學習,數(shù)據(jù)挖掘,直接實現(xiàn)機器學習UCI數(shù)據(jù)庫
?1.6萬
http://archive.ics.uci.edu/ml/ ? 數(shù)據(jù)庫是加州大學歐文分校(UniversityofCaliforniaIrvine)提出的用于機器學習的數(shù)據(jù)庫,這個數(shù)據(jù)庫目前共有...來自: loadstar_kun的專欄
UCI 機器學習數(shù)據(jù)集(分類)
?7758
113 Data SetsUCI數(shù)據(jù)集NameData TypesDefault TaskAttribute Types# Instances# AttributesYear來自: BeachBOY的完美世界
用樸素貝葉斯對wine數(shù)據(jù)集分類
?7766
該實驗的數(shù)據(jù)集是MostPopular Data Sets(hits since 2007)中的wine數(shù)據(jù)集,這是是對在意大利同一地區(qū)生產(chǎn)的三種不同品種的酒,做大量分析所得出的數(shù)據(jù)。這些數(shù)據(jù)包括了三...來自: 圖像處理與模式識別
UCI 數(shù)據(jù)集
?1781
filename='.\iris\iris.data';%使用 , 分割符分割每列數(shù)據(jù); ‘'headerlines’:表示忽略前N行,從N+1行開始讀取數(shù)據(jù)集 [attrib1, attrib2, ...來自: dataningwei的博客
下載?重疊聚類數(shù)據(jù)集
07-28 可直接在matlab中用,已經(jīng)處理好! 20Newsgroup.mat emotions.mat scene.mat yeast2417.mat movie_taa.mat …… 下載?聚類、分類所用數(shù)據(jù)集
09-06 做聚類、分類時很經(jīng)典的測試數(shù)據(jù)集,可以很好的檢測你所設(shè)計的算法。我所上傳的數(shù)據(jù)集格式是.mat格式,用load命令就可以加載。沒有更多推薦了,返回首頁
轉(zhuǎn)載于:https://www.cnblogs.com/lm3306/p/9798572.html
總結(jié)
以上是生活随笔為你收集整理的转:UCI数据集和源代码数据挖掘的数据集资源的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【hdoj】3007 Buried me
- 下一篇: 微信小程序组件间通信(二)