當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

【神经网络八股扩展】：自制数据集

發布時間：2023/12/1 编程问答 30 豆豆

生活随笔收集整理的這篇文章主要介紹了【神经网络八股扩展】：自制数据集小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

課程來源：人工智能實踐:Tensorflow筆記2

文章目錄

前言
1、文件一覽
2、將load_data()函數替換掉
2、調用generateds函數
4、效果
總結

前言

本講目標:自制數據集，解決本領域應用
將我們手中的圖片和標簽信息制作為可以直接導入的npy文件。

1、文件一覽

首先看看我們的文件長什么樣：
路徑：D:\python code\AI\class4\MNIST_FC\mnist_image_label\mnist_test_jpg_10000
圖片文件：(黑底白字的灰度圖，大小：28x28,每個像素點都是0~255之間的整數)

標簽文件：(圖片名和對應的標簽，中間用空格隔開)

2、將load_data()函數替換掉

之前我們導入數據集的方式是(以mnist數據集為例)：

fashion = tf.keras.datasets.mnist (x_train, y_train),(x_test, y_test) = mnist.load_data()

導入后變量的數據類型和形狀：

x_train.shape(60000,28,28) ，3維數組，60000個28行28列的圖片灰度值

y_train.shape	(60000,) ，60000張圖片對應的標簽，是1維數組
x_test.shape	(10000,28,28) ，3維數組，10000個28行28列的圖片灰度值
y_test.shape	(10000,) ，10000張圖片對應的標簽，是1維數組

我們需要自己寫個函數generateds(圖片路徑，標簽文件)：
觀察數據集：

我們需要做的：把圖片灰度值數據拼接到圖片列表，把標簽數據拼接到標簽列表。

函數代碼如下：

def generateds(path, txt):f = open(txt, 'r') #只讀形式讀取文本數據contents = f.readlines() # 按行讀取，讀取所有行f.close() #關閉文件x, y_ = [], [] #建立空列表for content in contents: #逐行讀出value = content.split() # 以空格分開，存入數組圖片名為value0 標簽為value1img_path = path + value[0] #圖片路徑+圖片名->拼接出索引路徑img = Image.open(img_path) #讀入圖片img = np.array(img.convert('L'))img = img / 255. #歸一化數據x.append(img) #將歸一化的數據貼到列表xy_.append(value[1]) #標簽貼到列表y_print('loading : ' + content) #打印狀態提示x = np.array(x)y_ = np.array(y_)y_ = y_.astype(np.int64)return x, y_

2、調用generateds函數

使用函數代碼：

'''添加了：訓練集圖片路徑訓練集標簽文件訓練集輸入特征存儲文件訓練集標簽存儲文件測試集圖片路徑測試集標簽文件測試集輸入特征存儲文件測試集標簽存儲文件''' train_path = 'D:/python code/AI/class4/FASHION_FC/fashion_image_label/fashion_train_jpg_60000/' train_txt = 'D:/python code/AI/class4/FASHION_FC/fashion_image_label/fashion_train_jpg_60000.txt' x_train_savepath = 'D:/python code/AI/class4/FASHION_FC/fashion_image_label/fashion_x_train.npy' y_train_savepath = 'D:/python code/AI/class4/FASHION_FC/fashion_image_label/fahion_y_train.npy'test_path = 'D:/python code/AI/class4/FASHION_FC/fashion_image_label/fashion_test_jpg_10000/' test_txt = 'D:/python code/AI/class4/FASHION_FC/fashion_image_label/fashion_test_jpg_10000.txt' x_test_savepath = 'D:/python code/AI/class4/FASHION_FC/fashion_image_label/fashion_x_test.npy' y_test_savepath = 'D:/python code/AI/class4/FASHION_FC/fashion_image_label/fashion_y_test.npy' #觀察測試集訓練集文件是否存在，如果存在直接讀取，如果不存在調用generate datasets函數 if os.path.exists(x_train_savepath) and os.path.exists(y_train_savepath) and os.path.exists(x_test_savepath) and os.path.exists(y_test_savepath):print('-------------Load Datasets-----------------')x_train_save = np.load(x_train_savepath)y_train = np.load(y_train_savepath)x_test_save = np.load(x_test_savepath)y_test = np.load(y_test_savepath)x_train = np.reshape(x_train_save, (len(x_train_save), 28, 28))x_test = np.reshape(x_test_save, (len(x_test_save), 28, 28)) else:print('-------------Generate Datasets-----------------')x_train, y_train = generateds(train_path, train_txt)x_test, y_test = generateds(test_path, test_txt)print('-------------Save Datasets-----------------')x_train_save = np.reshape(x_train, (len(x_train), -1))x_test_save = np.reshape(x_test, (len(x_test), -1))np.save(x_train_savepath, x_train_save)np.save(y_train_savepath, y_train)np.save(x_test_savepath, x_test_save)np.save(y_test_savepath, y_test)model = tf.keras.models.Sequential([tf.keras.layers.Flatten(),tf.keras.layers.Dense(128, activation='relu'),tf.keras.layers.Dense(10, activation='softmax') ])model.compile(optimizer='adam',loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=False),metrics=['sparse_categorical_accuracy'])model.fit(x_train, y_train, batch_size=32, epochs=5, validation_data=(x_test, y_test), validation_freq=1) model.summary()

4、效果

制作完數據集之后開始用神經網絡訓練：

可以發現原本的文件夾中出現了你所需要的npy文件。

完整代碼：

import tensorflow as tf from PIL import Image import numpy as np import ostrain_path = 'D:/python code/AI/class4/FASHION_FC/fashion_image_label/fashion_train_jpg_60000/' train_txt = 'D:/python code/AI/class4/FASHION_FC/fashion_image_label/fashion_train_jpg_60000.txt' x_train_savepath = 'D:/python code/AI/class4/FASHION_FC/fashion_image_label/fashion_x_train.npy' y_train_savepath = 'D:/python code/AI/class4/FASHION_FC/fashion_image_label/fahion_y_train.npy'test_path = 'D:/python code/AI/class4/FASHION_FC/fashion_image_label/fashion_test_jpg_10000/' test_txt = 'D:/python code/AI/class4/FASHION_FC/fashion_image_label/fashion_test_jpg_10000.txt' x_test_savepath = 'D:/python code/AI/class4/FASHION_FC/fashion_image_label/fashion_x_test.npy' y_test_savepath = 'D:/python code/AI/class4/FASHION_FC/fashion_image_label/fashion_y_test.npy'def generateds(path, txt):f = open(txt, 'r')contents = f.readlines() # 按行讀取f.close()x, y_ = [], []for content in contents:value = content.split() # 以空格分開，存入數組img_path = path + value[0]img = Image.open(img_path)img = np.array(img.convert('L'))img = img / 255.x.append(img)y_.append(value[1])print('loading : ' + content)x = np.array(x)y_ = np.array(y_)y_ = y_.astype(np.int64)return x, y_if os.path.exists(x_train_savepath) and os.path.exists(y_train_savepath) and os.path.exists(x_test_savepath) and os.path.exists(y_test_savepath):print('-------------Load Datasets-----------------')x_train_save = np.load(x_train_savepath)y_train = np.load(y_train_savepath)x_test_save = np.load(x_test_savepath)y_test = np.load(y_test_savepath)x_train = np.reshape(x_train_save, (len(x_train_save), 28, 28))x_test = np.reshape(x_test_save, (len(x_test_save), 28, 28)) else:print('-------------Generate Datasets-----------------')x_train, y_train = generateds(train_path, train_txt)x_test, y_test = generateds(test_path, test_txt)print('-------------Save Datasets-----------------')x_train_save = np.reshape(x_train, (len(x_train), -1))x_test_save = np.reshape(x_test, (len(x_test), -1))np.save(x_train_savepath, x_train_save)np.save(y_train_savepath, y_train)np.save(x_test_savepath, x_test_save)np.save(y_test_savepath, y_test)model = tf.keras.models.Sequential([tf.keras.layers.Flatten(),tf.keras.layers.Dense(128, activation='relu'),tf.keras.layers.Dense(10, activation='softmax') ])model.compile(optimizer='adam',loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=False),metrics=['sparse_categorical_accuracy'])model.fit(x_train, y_train, batch_size=32, epochs=5, validation_data=(x_test, y_test), validation_freq=1) model.summary()

總結

課程鏈接:MOOC人工智能實踐：TensorFlow筆記2

總結

以上是生活随笔為你收集整理的【神经网络八股扩展】：自制数据集的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。