keras (一)
Pima Indians數據集為糖尿病患者醫療記錄數據,是一個二分類問題。本代碼采用80%數據訓練,20%數據測試的方法。若數據不做歸一化處理,最終模型的分類精度為 79.17%;而數據進行歸一化以后,最終模型的分類精度為81.38%。
""" 數據集中的feature解釋: Number of times pregnent: 懷孕次數 Plasma glucose concentration a 2 hours in an oral glucose tolerance test: 2小時口服葡萄糖耐量試驗中血漿葡萄糖濃度 Diastolic blood pressure(mm Hg): 舒張壓 Triceps skin fold thickness(mm): 三頭肌皮褶皺厚度 2-hour serum insulin(mu U/ml): 2小時血清胰島素 Body mass index(weight in kg/(height in m)^2): 身體質量指數 Diabetes pedigree function: 糖尿病譜系功能 Age(years): 年齡 Class variable(0 or 1): 是否是糖尿病 """ from keras.models import Sequential from keras.layers import Dense import numpy as np import pandas as pd from sklearn import preprocessing from sklearn.model_selection import train_test_split# 選用初始化隨機數種子,確保輸出結果的可重復 seed = 4 np.random.seed(seed) # 避免第一行變為列名 dataset = pd.read_csv('../data/pima-indians-diabetes.csv', header=None, names=list(np.arange(9)))總結
- 上一篇: 段永平的四大门徒是谁 个个都打造了知名企
- 下一篇: keras小结