4-3 数据离散化(无error版本)
生活随笔
收集整理的這篇文章主要介紹了
4-3 数据离散化(无error版本)
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
#-*- coding: utf-8 -*-
#數(shù)據(jù)規(guī)范化
import pandas as pd
if __name__=="__main__":datafile = '../data/discretization_data.xls' #參數(shù)初始化data = pd.read_excel(datafile) #讀取數(shù)據(jù)data = data[u'肝氣郁結(jié)證型系數(shù)'].copy()k = 4d1 = pd.cut(data, k, labels = range(k)) #等寬離散化,各個類比依次命名為0,1,2,3#等頻率離散化w = [1.0*i/k for i in range(k+1)]w = data.describe(percentiles = w)[4:4+k+1] #使用describe函數(shù)自動計算分位數(shù)w[0] = w[0]*(1-1e-10)d2 = pd.cut(data, w, labels = range(k))from sklearn.cluster import KMeans #引入KMeanskmodel = KMeans(n_clusters = k, n_jobs = 4) #建立模型,n_jobs是并行數(shù),一般等于CPU數(shù)較好kmodel.fit(data.values.reshape((len(data), 1))) #訓(xùn)練模型c = pd.DataFrame(kmodel.cluster_centers_).sort_values(0) #輸出聚類中心,并且排序(默認是隨機序的)w = pd.rolling_mean(c, 2).iloc[1:] #相鄰兩項求中點,作為邊界點w = [0] + list(w[0]) + [data.max()] #把首末邊界點加上d3 = pd.cut(data, w, labels = range(k))def cluster_plot(d, k): #自定義作圖函數(shù)來顯示聚類結(jié)果import matplotlib.pyplot as pltplt.rcParams['font.sans-serif'] = ['SimHei'] #用來正常顯示中文標簽plt.rcParams['axes.unicode_minus'] = False #用來正常顯示負號plt.figure(figsize = (8, 3))for j in range(0, k):plt.plot(data[d==j], [j for i in d[d==j]], 'o')plt.ylim(-0.5, k-0.5)return pltcluster_plot(d1, k).show()cluster_plot(d2, k).show()cluster_plot(d3, k).show()
使用python3.5,數(shù)據(jù)集(discretization_data.xls)為:
| 肝氣郁結(jié)證型系數(shù) |
| 0.056 |
| 0.488 |
| 0.107 |
| 0.322 |
| 0.242 |
| 0.389 |
| 0.246 |
| 0.330 |
| 0.257 |
| 0.205 |
| 0.330 |
| 0.235 |
| 0.267 |
| 0.281 |
| 0.184 |
| 0.271 |
| 0.100 |
| 0.173 |
| 0.302 |
| 0.176 |
| 0.172 |
| 0.195 |
| 0.281 |
| 0.245 |
| 0.156 |
| 0.168 |
| 0.211 |
| 0.255 |
| 0.279 |
| 0.341 |
| 0.230 |
| 0.266 |
| 0.252 |
| 0.227 |
| 0.277 |
| 0.329 |
| 0.320 |
| 0.053 |
| 0.152 |
| 0.269 |
| 0.042 |
| 0.179 |
| 0.239 |
| 0.167 |
| 0.209 |
| 0.432 |
| 0.354 |
| 0.247 |
| 0.328 |
| 0.215 |
| 0.433 |
| 0.294 |
| 0.237 |
| 0.244 |
| 0.199 |
| 0.286 |
| 0.219 |
| 0.261 |
| 0.316 |
| 0.221 |
| 0.326 |
| 0.284 |
| 0.242 |
| 0.268 |
| 0.257 |
| 0.174 |
| 0.251 |
| 0.237 |
| 0.298 |
| 0.288 |
| 0.263 |
| 0.273 |
| 0.233 |
| 0.243 |
| 0.299 |
| 0.202 |
| 0.229 |
| 0.348 |
| 0.369 |
| 0.186 |
| 0.270 |
| 0.302 |
| 0.216 |
| 0.320 |
| 0.167 |
| 0.228 |
| 0.108 |
| 0.253 |
| 0.303 |
| 0.274 |
| 0.225 |
| 0.180 |
| 0.195 |
| 0.219 |
| 0.169 |
| 0.234 |
| 0.279 |
| 0.114 |
| 0.225 |
| 0.169 |
| 0.175 |
| 0.170 |
| 0.223 |
| 0.166 |
| 0.217 |
| 0.256 |
| 0.252 |
| 0.299 |
| 0.247 |
| 0.344 |
| 0.272 |
| 0.159 |
| 0.219 |
| 0.240 |
| 0.187 |
| 0.278 |
| 0.227 |
| 0.280 |
| 0.285 |
| 0.388 |
| 0.134 |
| 0.230 |
| 0.195 |
| 0.220 |
| 0.448 |
| 0.323 |
| 0.104 |
| 0.102 |
| 0.196 |
| 0.176 |
| 0.229 |
| 0.199 |
| 0.278 |
| 0.241 |
| 0.207 |
| 0.163 |
| 0.253 |
| 0.222 |
| 0.277 |
| 0.290 |
| 0.211 |
| 0.186 |
| 0.418 |
| 0.175 |
| 0.238 |
| 0.160 |
| 0.198 |
| 0.329 |
| 0.180 |
| 0.242 |
| 0.287 |
| 0.216 |
| 0.318 |
| 0.308 |
| 0.211 |
| 0.129 |
| 0.285 |
| 0.139 |
| 0.218 |
| 0.177 |
| 0.209 |
| 0.386 |
| 0.137 |
| 0.193 |
| 0.302 |
| 0.350 |
| 0.323 |
| 0.102 |
| 0.198 |
| 0.110 |
| 0.173 |
| 0.417 |
| 0.123 |
| 0.109 |
| 0.111 |
| 0.166 |
| 0.303 |
| 0.128 |
| 0.157 |
| 0.134 |
| 0.314 |
| 0.288 |
| 0.107 |
| 0.295 |
| 0.300 |
| 0.171 |
| 0.057 |
| 0.504 |
| 0.102 |
| 0.316 |
| 0.251 |
| 0.383 |
| 0.243 |
| 0.323 |
| 0.271 |
| 0.200 |
| 0.346 |
| 0.251 |
| 0.266 |
| 0.295 |
| 0.200 |
| 0.267 |
| 0.100 |
| 0.184 |
| 0.294 |
| 0.174 |
| 0.188 |
| 0.193 |
| 0.291 |
| 0.264 |
| 0.168 |
| 0.169 |
| 0.208 |
| 0.267 |
| 0.295 |
| 0.346 |
| 0.235 |
| 0.269 |
| 0.259 |
| 0.228 |
| 0.287 |
| 0.339 |
| 0.324 |
| 0.054 |
| 0.159 |
| 0.273 |
| 0.055 |
| 0.181 |
| 0.238 |
| 0.164 |
| 0.210 |
| 0.432 |
| 0.363 |
| 0.247 |
| 0.330 |
| 0.211 |
| 0.427 |
| 0.296 |
| 0.247 |
| 0.257 |
| 0.212 |
| 0.285 |
| 0.216 |
| 0.271 |
| 0.328 |
| 0.219 |
| 0.332 |
| 0.294 |
| 0.246 |
| 0.282 |
| 0.272 |
| 0.173 |
| 0.250 |
| 0.242 |
| 0.313 |
| 0.296 |
| 0.274 |
| 0.281 |
| 0.237 |
| 0.249 |
| 0.303 |
| 0.193 |
| 0.227 |
| 0.347 |
| 0.373 |
| 0.197 |
| 0.276 |
| 0.304 |
| 0.235 |
| 0.325 |
| 0.166 |
| 0.226 |
| 0.115 |
| 0.253 |
| 0.306 |
| 0.277 |
| 0.223 |
| 0.176 |
| 0.205 |
| 0.238 |
| 0.173 |
| 0.243 |
| 0.292 |
| 0.122 |
| 0.224 |
| 0.177 |
| 0.176 |
| 0.183 |
| 0.229 |
| 0.158 |
| 0.221 |
| 0.250 |
| 0.252 |
| 0.308 |
| 0.247 |
| 0.355 |
| 0.282 |
| 0.155 |
| 0.226 |
| 0.247 |
| 0.190 |
| 0.282 |
| 0.228 |
| 0.288 |
| 0.296 |
| 0.389 |
| 0.140 |
| 0.231 |
| 0.198 |
| 0.235 |
| 0.456 |
| 0.322 |
| 0.108 |
| 0.110 |
| 0.205 |
| 0.179 |
| 0.245 |
| 0.206 |
| 0.287 |
| 0.254 |
| 0.215 |
| 0.155 |
| 0.254 |
| 0.227 |
| 0.280 |
| 0.305 |
| 0.214 |
| 0.188 |
| 0.420 |
| 0.177 |
| 0.254 |
| 0.169 |
| 0.193 |
| 0.345 |
| 0.174 |
| 0.253 |
| 0.289 |
| 0.232 |
| 0.324 |
| 0.318 |
| 0.216 |
| 0.142 |
| 0.281 |
| 0.144 |
| 0.217 |
| 0.183 |
| 0.217 |
| 0.400 |
| 0.147 |
| 0.191 |
| 0.309 |
| 0.345 |
| 0.319 |
| 0.110 |
| 0.210 |
| 0.115 |
| 0.185 |
| 0.435 |
| 0.138 |
| 0.119 |
| 0.111 |
| 0.173 |
| 0.310 |
| 0.132 |
| 0.168 |
| 0.134 |
| 0.329 |
| 0.303 |
| 0.104 |
| 0.300 |
| 0.298 |
| 0.187 |
| 0.034 |
| 0.474 |
| 0.085 |
| 0.304 |
| 0.231 |
| 0.377 |
| 0.226 |
| 0.304 |
| 0.247 |
| 0.184 |
| 0.325 |
| 0.218 |
| 0.258 |
| 0.273 |
| 0.181 |
| 0.263 |
| 0.083 |
| 0.169 |
| 0.288 |
| 0.158 |
| 0.161 |
| 0.186 |
| 0.258 |
| 0.233 |
| 0.146 |
| 0.149 |
| 0.195 |
| 0.247 |
| 0.275 |
| 0.326 |
| 0.213 |
| 0.251 |
| 0.233 |
| 0.209 |
| 0.253 |
| 0.308 |
| 0.303 |
| 0.042 |
| 0.135 |
| 0.253 |
| 0.026 |
| 0.158 |
| 0.229 |
| 0.158 |
| 0.198 |
| 0.411 |
| 0.337 |
| 0.226 |
| 0.312 |
| 0.191 |
| 0.417 |
| 0.283 |
| 0.219 |
| 0.239 |
| 0.191 |
| 0.275 |
| 0.204 |
| 0.247 |
| 0.312 |
| 0.208 |
| 0.318 |
| 0.270 |
| 0.229 |
| 0.251 |
| 0.250 |
| 0.155 |
| 0.228 |
| 0.219 |
| 0.293 |
| 0.270 |
| 0.243 |
| 0.265 |
| 0.214 |
| 0.230 |
| 0.277 |
| 0.182 |
| 0.215 |
| 0.341 |
| 0.366 |
| 0.170 |
| 0.251 |
| 0.274 |
| 0.216 |
| 0.305 |
| 0.161 |
| 0.212 |
| 0.091 |
| 0.235 |
| 0.279 |
| 0.250 |
| 0.199 |
| 0.169 |
| 0.186 |
| 0.210 |
| 0.149 |
| 0.214 |
| 0.254 |
| 0.106 |
| 0.213 |
| 0.157 |
| 0.166 |
| 0.163 |
| 0.202 |
| 0.144 |
| 0.207 |
| 0.240 |
| 0.232 |
| 0.290 |
| 0.226 |
| 0.328 |
| 0.245 |
| 0.140 |
| 0.198 |
| 0.232 |
| 0.166 |
| 0.257 |
| 0.202 |
| 0.266 |
| 0.266 |
| 0.366 |
| 0.126 |
| 0.206 |
| 0.175 |
| 0.215 |
| 0.429 |
| 0.298 |
| 0.094 |
| 0.087 |
| 0.180 |
| 0.155 |
| 0.216 |
| 0.175 |
| 0.267 |
| 0.233 |
| 0.193 |
| 0.151 |
| 0.238 |
| 0.198 |
| 0.258 |
| 0.270 |
| 0.188 |
| 0.173 |
| 0.397 |
| 0.166 |
| 0.217 |
| 0.145 |
| 0.178 |
| 0.326 |
| 0.173 |
| 0.239 |
| 0.277 |
| 0.216 |
| 0.298 |
| 0.294 |
| 0.190 |
| 0.122 |
| 0.273 |
| 0.125 |
| 0.203 |
| 0.162 |
| 0.204 |
| 0.368 |
| 0.118 |
| 0.165 |
| 0.289 |
| 0.324 |
| 0.312 |
| 0.092 |
| 0.195 |
| 0.089 |
| 0.161 |
| 0.400 |
| 0.118 |
| 0.101 |
| 0.095 |
| 0.164 |
| 0.288 |
| 0.124 |
| 0.147 |
| 0.122 |
| 0.306 |
| 0.284 |
| 0.087 |
| 0.272 |
| 0.286 |
| 0.151 |
| 0.045 |
| 0.487 |
| 0.089 |
| 0.304 |
| 0.232 |
| 0.375 |
| 0.229 |
| 0.317 |
| 0.248 |
| 0.193 |
| 0.317 |
| 0.226 |
| 0.254 |
| 0.277 |
| 0.184 |
| 0.263 |
| 0.089 |
| 0.169 |
| 0.290 |
| 0.165 |
| 0.163 |
| 0.180 |
| 0.268 |
| 0.240 |
| 0.150 |
| 0.154 |
| 0.205 |
| 0.252 |
| 0.270 |
| 0.328 |
| 0.215 |
| 0.254 |
| 0.243 |
| 0.211 |
| 0.269 |
| 0.319 |
| 0.308 |
| 0.045 |
| 0.144 |
| 0.262 |
| 0.033 |
| 0.173 |
| 0.229 |
| 0.158 |
| 0.202 |
| 0.417 |
| 0.342 |
| 0.236 |
| 0.317 |
| 0.206 |
| 0.424 |
| 0.279 |
| 0.233 |
| 0.241 |
| 0.193 |
| 0.276 |
| 0.207 |
| 0.252 |
| 0.304 |
| 0.216 |
| 0.314 |
| 0.264 |
| 0.228 |
| 0.263 |
| 0.249 |
| 0.163 |
| 0.242 |
| 0.223 |
| 0.289 |
| 0.278 |
| 0.260 |
| 0.260 |
| 0.224 |
| 0.232 |
| 0.292 |
| 0.191 |
| 0.212 |
| 0.333 |
| 0.362 |
| 0.173 |
| 0.263 |
| 0.291 |
| 0.214 |
| 0.312 |
| 0.156 |
| 0.210 |
| 0.105 |
| 0.238 |
| 0.289 |
| 0.264 |
| 0.208 |
| 0.165 |
| 0.179 |
| 0.218 |
| 0.155 |
| 0.228 |
| 0.266 |
| 0.105 |
| 0.210 |
| 0.163 |
| 0.159 |
| 0.163 |
| 0.214 |
| 0.151 |
| 0.215 |
| 0.238 |
| 0.245 |
| 0.292 |
| 0.243 |
| 0.337 |
| 0.262 |
| 0.147 |
| 0.211 |
| 0.234 |
| 0.177 |
| 0.272 |
| 0.210 |
| 0.265 |
| 0.269 |
| 0.375 |
| 0.125 |
| 0.218 |
| 0.183 |
| 0.212 |
| 0.432 |
| 0.311 |
| 0.094 |
| 0.092 |
| 0.188 |
| 0.157 |
| 0.217 |
| 0.191 |
| 0.270 |
| 0.238 |
| 0.198 |
| 0.144 |
| 0.237 |
| 0.209 |
| 0.271 |
| 0.285 |
| 0.206 |
| 0.179 |
| 0.411 |
| 0.165 |
| 0.232 |
| 0.143 |
| 0.184 |
| 0.326 |
| 0.166 |
| 0.233 |
| 0.275 |
| 0.216 |
| 0.309 |
| 0.299 |
| 0.197 |
| 0.120 |
| 0.268 |
| 0.129 |
| 0.211 |
| 0.166 |
| 0.200 |
| 0.383 |
| 0.134 |
| 0.175 |
| 0.292 |
| 0.337 |
| 0.314 |
| 0.093 |
| 0.195 |
| 0.097 |
| 0.162 |
| 0.408 |
| 0.117 |
| 0.099 |
| 0.098 |
| 0.162 |
| 0.294 |
| 0.126 |
| 0.145 |
| 0.130 |
| 0.304 |
| 0.283 |
| 0.103 |
| 0.283 |
| 0.287 |
| 0.161 |
| 0.049 |
| 0.488 |
| 0.098 |
| 0.313 |
| 0.237 |
| 0.381 |
| 0.239 |
| 0.323 |
| 0.254 |
| 0.195 |
| 0.326 |
| 0.233 |
| 0.259 |
| 0.277 |
| 0.184 |
| 0.266 |
| 0.098 |
| 0.171 |
| 0.293 |
| 0.171 |
| 0.171 |
| 0.188 |
| 0.276 |
| 0.244 |
| 0.153 |
| 0.164 |
| 0.208 |
| 0.253 |
| 0.277 |
| 0.336 |
| 0.221 |
| 0.256 |
| 0.247 |
| 0.217 |
| 0.273 |
| 0.327 |
| 0.317 |
| 0.049 |
| 0.146 |
| 0.268 |
| 0.041 |
| 0.177 |
| 0.232 |
| 0.163 |
| 0.202 |
| 0.426 |
| 0.344 |
| 0.243 |
| 0.322 |
| 0.207 |
| 0.425 |
| 0.284 |
| 0.236 |
| 0.242 |
| 0.193 |
| 0.283 |
| 0.213 |
| 0.256 |
| 0.313 |
| 0.217 |
| 0.323 |
| 0.274 |
| 0.236 |
| 0.264 |
| 0.254 |
| 0.167 |
| 0.246 |
| 0.233 |
| 0.293 |
| 0.285 |
| 0.263 |
| 0.267 |
| 0.225 |
| 0.237 |
| 0.294 |
| 0.192 |
| 0.219 |
| 0.341 |
| 0.366 |
| 0.178 |
| 0.264 |
| 0.293 |
| 0.216 |
| 0.317 |
| 0.163 |
| 0.219 |
| 0.106 |
| 0.247 |
| 0.297 |
| 0.268 |
| 0.217 |
| 0.172 |
| 0.188 |
| 0.218 |
| 0.163 |
| 0.231 |
| 0.272 |
| 0.107 |
| 0.217 |
| 0.166 |
| 0.167 |
| 0.166 |
| 0.217 |
| 0.156 |
| 0.217 |
| 0.248 |
| 0.247 |
| 0.293 |
| 0.244 |
| 0.341 |
| 0.264 |
| 0.153 |
| 0.216 |
| 0.236 |
| 0.183 |
| 0.277 |
| 0.22 |
| 0.273 |
| 0.277 |
| 0.383 |
| 0.133 |
| 0.226 |
| 0.193 |
| 0.218 |
| 0.439 |
| 0.317 |
| 0.098 |
| 0.098 |
| 0.192 |
| 0.166 |
| 0.227 |
| 0.194 |
| 0.278 |
| 0.238 |
| 0.205 |
| 0.153 |
| 0.247 |
| 0.216 |
| 0.273 |
| 0.289 |
| 0.207 |
| 0.183 |
| 0.415 |
| 0.171 |
| 0.237 |
| 0.152 |
| 0.192 |
| 0.327 |
| 0.173 |
| 0.239 |
| 0.284 |
| 0.216 |
| 0.311 |
| 0.302 |
| 0.206 |
| 0.127 |
| 0.277 |
| 0.135 |
| 0.214 |
| 0.173 |
| 0.205 |
| 0.384 |
| 0.134 |
| 0.184 |
| 0.294 |
| 0.341 |
| 0.317 |
| 0.098 |
| 0.195 |
| 0.102 |
| 0.172 |
| 0.415 |
| 0.122 |
| 0.106 |
| 0.107 |
| 0.165 |
| 0.302 |
| 0.127 |
| 0.152 |
| 0.131 |
| 0.311 |
| 0.284 |
| 0.103 |
| 0.287 |
| 0.296 |
| 0.169 |
總結(jié)
以上是生活随笔為你收集整理的4-3 数据离散化(无error版本)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 5-8 离散点检测(改进版无error)
- 下一篇: 5-1 逻辑回归代码(含warning解