获取png格式的MNIST数据集
生活随笔
收集整理的這篇文章主要介紹了
获取png格式的MNIST数据集
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
# 原始數據來自:
# https://github.com/myleott/mnist_png
# 但是這個數據的放置效果是這樣的:
顯然不好用.
于是進行轉化,目標是所有圖片都放在一起,然后生成一個"圖片和類別名字對應"的train.csv
這樣,MNIST數據格式就和kaggle比賽中的一致了.
新建一個origin文件夾,把train中上述所有文件夾剪切放入origin
然后運行以下代碼,得到train.csv
import os import pandas as pd from pandas.core.frame import DataFrame#根據每個文件夾分別生成一個csv文件用來記錄png圖片和類別之間的關系 path="./origin/"train_df = pd.DataFrame(columns = ["pic_name", "label"]) for folder in os.listdir(path):sub_folder=path+folder#獲得某個類別下面的所有文件列表,然后存入一個csvfile_lists=[f for f in os.listdir(sub_folder) if os.path.isfile(os.path.join(sub_folder, f))]# print("file_lists=",file_lists)labels=list(folder)*len(file_lists)#生成類別c={"pic_name":file_lists,"label":labels}data=DataFrame(c)train_df=pd.concat([train_df,data],ignore_index=True)# data.to_csv(folder+".csv",index=False)train_df.to_csv("train.csv",index=False) #合并所有的csv,得到train.csv然后所有文件從origin下面剪切到train中混合在一起,命令如下:
mv origin/*/*.png train/由于MNIST中的test是驗證集的意思,所以需要把上述步驟對test也操作一遍.
?
好了,最終結果如下:
https://github.com/appleyuchi/MNIST_PNG
?
創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎總結
以上是生活随笔為你收集整理的获取png格式的MNIST数据集的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: EIGENVECTORS FROM EI
- 下一篇: 狗书第二章笔记