机器学习数据导入方法总结
生活随笔
收集整理的這篇文章主要介紹了
机器学习数据导入方法总结
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
1、通過標準Python庫導入CSV文件
? ? ? ? python提供了一個標準類庫CSV,用來處理CSV文件。其中reader()函數用來讀入CSV.
? ? ? ??
from csv import reader import numpy as np #使用標準的Python類庫導入CSV文件 filename='iris.csv' with open(filename, 'rt') as raw_materials:readers=reader(raw_marerials,delimiter=',')x=list(readers)data=np.array(x).astype('float')print (data.shape)2、通過Numpy導入CSV文件
? ? ? ? ?使用Numpy的loadtxt()函數導入數據。使用這個函數處理的數據沒有文件頭,所有的數據結構(數據類型,例如:不能有的是float,有的是string)是一樣的。
from numpy import loadtxt filename='iris.csv' with open(filename,'rt') as raw_data:data=loadtxt(raw_data,delimiter=',')print(data.shape)3、通過Pandas導入CSV文件
通過pandas來導入csv文件要使用pandas.read_csv()函數。這個函數的返回值是DataFrame,可以方便的進行下一步的處理。這個函數名非常直觀,便于代碼的閱讀和后續對數據的處理工作。在機器學習項目中,經常使用pandas來做數據的清洗和數據準備工作。
from pandas import read_csv filename='iris.csv' names=['separ-length','separ-width','petal-length','petal-width','class'] dataset=read_csv(filename,names=names) print(dataset.shape)?
總結
以上是生活随笔為你收集整理的机器学习数据导入方法总结的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Oracle 11g安装步骤(超详细)
- 下一篇: pyhive数据库连接池使用