获取数据 - 将Excel文件读入矩阵matrix中 - Python代码
生活随笔
收集整理的這篇文章主要介紹了
获取数据 - 将Excel文件读入矩阵matrix中 - Python代码
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
機器學習中,很多算法的計算邏輯是基于數學的,免不了求特征值和特征向量這種事情,因此,在數據預處理的時候,將數據源中的數據轉儲成矩陣格式是很有必要的。
原數據:
代碼:?
import numpy as np import pandas as pd import xlrd from sklearn import preprocessingdef excel_to_matrix(path):table = xlrd.open_workbook(path).sheets()[0]#獲取第一個sheet表row = table.nrows # 行數col = table.ncols # 列數datamatrix = np.zeros((row, col))#生成一個nrows行ncols列,且元素均為0的初始矩陣for x in range(col):cols = np.matrix(table.col_values(x)) # 把list轉換為矩陣進行矩陣操作datamatrix[:, x] = cols # 按列把數據存進矩陣中#數據歸一化 min_max_scaler = preprocessing.MinMaxScaler()datamatrix = min_max_scaler.fit_transform(datamatrix)return datamatrixdatafile = u'E:\\pythondata\\test.xlsx' excel_to_matrix(datafile)運行結果:
array([[1. , 0.13209733, 1. ],[0.43478261, 0.16917729, 0.26420934],[0.5942029 , 0.87949015, 0.4372538 ],[0.60869565, 0.50405562, 0. ],[0.11594203, 1. , 0.51547552],[0. , 0. , 0.87070906]])代碼中min_max_scaler = preprocessing.MinMaxScaler()是做數據歸一化用的,MinMaxScaler()默認將數據歸一到? [0, 1],這是比較常用的,但是也有一些時候是歸一到 [-1, 1],有時候是需要做數據標準化,而這些東西都在另外一篇文章中說過了,下面是鏈接,參考著學習吧,一起成長!
Python數據預處理 - 歸一化與標準化
總結
以上是生活随笔為你收集整理的获取数据 - 将Excel文件读入矩阵matrix中 - Python代码的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: mysql new map_使用构造器模
- 下一篇: cpython 标准库_Python r