【Spark机器学习速成宝典】模型篇01支持向量机【SVM】(Python版)
生活随笔
收集整理的這篇文章主要介紹了
【Spark机器学习速成宝典】模型篇01支持向量机【SVM】(Python版)
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
目錄
支持向量機(jī)原理
支持向量機(jī)代碼(Spark Python)
?
| 支持向量機(jī)原理 |
? 詳見博文:http://www.cnblogs.com/itmorn/p/8011587.html
?
?返回目錄
?
| 支持向量機(jī)代碼(Spark Python)? |
代碼里數(shù)據(jù):https://pan.baidu.com/s/1jHWKG4I 密碼:acq1
?
# -*-coding=utf-8 -*- from pyspark import SparkConf, SparkContext sc = SparkContext('local')from pyspark.mllib.classification import SVMWithSGD, SVMModel from pyspark.mllib.regression import LabeledPoint# Load and parse the data 加載和解析數(shù)據(jù),將每一個(gè)數(shù)轉(zhuǎn)化為浮點(diǎn)數(shù)。每一行第一個(gè)數(shù)作為標(biāo)記,后面的作為特征 def parsePoint(line):values = [float(x) for x in line.split(' ')]return LabeledPoint(values[0], values[1:])data = sc.textFile("data/mllib/sample_svm_data.txt") print data.collect()[0] #1 0 2.52078447201548 0 0 0 2.004684436494304 2.00034729926846..... parsedData = data.map(parsePoint) print parsedData.collect()[0] #(1.0,[0.0,2.52078447202,0.0,0.0,0.0,2.00468.... # Build the model 建立模型 model = SVMWithSGD.train(parsedData, iterations=100)# Evaluating the model on training data 評估模型在訓(xùn)練集上的誤差 labelsAndPreds = parsedData.map(lambda p: (p.label, model.predict(p.features))) trainErr = labelsAndPreds.filter(lambda lp: lp[0] != lp[1]).count() / float(parsedData.count()) print("Training Error = " + str(trainErr))# Save and load model 保存模型和加載模型 model.save(sc, "pythonSVMWithSGDModel") sameModel = SVMModel.load(sc, "pythonSVMWithSGDModel")print sameModel.predict(parsedData.collect()[0].features) #1?
?
?返回目錄
?
轉(zhuǎn)載于:https://www.cnblogs.com/itmorn/p/8006473.html
總結(jié)
以上是生活随笔為你收集整理的【Spark机器学习速成宝典】模型篇01支持向量机【SVM】(Python版)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 线程调用同步方法
- 下一篇: matplotlib的下载和安装方法