深度学习数据增强方法-内含(亮度增强,对比度增强,旋转图图像,翻转图像,仿射变化扩充图像,错切变化扩充图像,HSV数据增强)七种方式进行增强-每种扩充一张实现7倍扩)+ 图像缩放代码-批量
? ? ? ?在進(jìn)行深度學(xué)習(xí)訓(xùn)練的時(shí)候,我們往往會(huì)面臨數(shù)據(jù)集不夠的情況,需要進(jìn)行數(shù)據(jù)集的擴(kuò)充,數(shù)據(jù)集的擴(kuò)充有多種多樣的方式,在這里總結(jié)了7種數(shù)據(jù)擴(kuò)充的方法對(duì)數(shù)據(jù)進(jìn)行數(shù)據(jù)增強(qiáng),包括:亮度增強(qiáng),對(duì)比度增強(qiáng),翻轉(zhuǎn)圖像,仿射變化擴(kuò)充圖像,錯(cuò)切變化擴(kuò)充圖像,HSV數(shù)據(jù)增強(qiáng)7種方法對(duì)數(shù)據(jù)進(jìn)行增強(qiáng)。
前四種方式很好理解,仿射變化和錯(cuò)切變化的原理請(qǐng)參考:
數(shù)據(jù)增廣:旋轉(zhuǎn),縮放,平移以及錯(cuò)切_太陽花的小綠豆的博客-CSDN博客
HSV數(shù)據(jù)增強(qiáng)的原理請(qǐng)參考:
HSV模型簡(jiǎn)介以及利用HSV模型隨機(jī)增強(qiáng)圖像_太陽花的小綠豆的博客-CSDN博客_hsv模型
廢話少說,我們直接貼代碼:以下代碼的操作均為批量操作
在我們進(jìn)行數(shù)據(jù)擴(kuò)充之前,我們面臨一個(gè)問題就是,我們收集的圖片可能存在不同種格式的例如:png jpg bmp等,為了更好的進(jìn)行數(shù)據(jù)擴(kuò)充,我們首先需要將圖片統(tǒng)一調(diào)整為jpg格式的。
代碼如下:
import cv2 as cv import osdata = ('begin')#輸入放置圖片的文件夾,當(dāng)前文件夾下 新建個(gè)文件夾,放入即可這里寫文件夾的名字 daddir = './'old_path = daddir + data + '\\' new_path = 'jpg'#新文件夾用來存儲(chǔ)轉(zhuǎn)換之后的圖片的 當(dāng)前文件夾下 新建個(gè)文件夾,放入即可這里寫文件夾的名字 if not os.path.exists(new_path):os.mkdir(new_path) print('開始轉(zhuǎn)換' ) print('轉(zhuǎn)換后的文件存入 ' + new_path + '文件夾中')path_list = os.listdir(old_path) path_list.sort() for filename in path_list:portion = os.path.splitext(filename)src = cv.imread(old_path + filename)cv.imwrite(new_path + '\\' + portion[0] + '.jpg', src)print('轉(zhuǎn)換完畢,文件已經(jīng)存入 ' + new_path + ' 中')在代碼的當(dāng)前文件夾下,新建一個(gè)名為begin的文件夾用于存放需要轉(zhuǎn)換的圖片,新建一個(gè)名為jpg的文件夾用于存放轉(zhuǎn)換后的圖片。
當(dāng)我們將所有圖片都轉(zhuǎn)換為jpg格式之后,我們就可以開始進(jìn)行數(shù)據(jù)擴(kuò)充了,我們根據(jù)七種數(shù)據(jù)擴(kuò)充方法,對(duì)數(shù)據(jù)集進(jìn)行擴(kuò)充,每種方法擴(kuò)充一張相當(dāng)于七種方法可以使得原來的數(shù)據(jù)集擴(kuò)充七倍。
代碼如下:
import math import cv2 import numpy from PIL import ImageEnhance import os import numpy as np from PIL import Imagedef brightnessEnhancement(root_path,img_name):#亮度增強(qiáng)image = Image.open(os.path.join(root_path, img_name))enh_bri = ImageEnhance.Brightness(image)# brightness = 1.1+0.4*np.random.random()#取值范圍1.1-1.5brightness = 1.5image_brightened = enh_bri.enhance(brightness)return image_brighteneddef contrastEnhancement(root_path, img_name): # 對(duì)比度增強(qiáng)image = Image.open(os.path.join(root_path, img_name))enh_con = ImageEnhance.Contrast(image)# contrast = 1.1+0.4*np.random.random()#取值范圍1.1-1.5contrast = 1.5image_contrasted = enh_con.enhance(contrast)return image_contrasteddef rotation(root_path, img_name):img = Image.open(os.path.join(root_path, img_name))random_angle = np.random.randint(-2, 2)*90if random_angle==0:rotation_img = img.rotate(-90) #旋轉(zhuǎn)角度else:rotation_img = img.rotate( random_angle) # 旋轉(zhuǎn)角度# rotation_img.save(os.path.join(root_path,img_name.split('.')[0] + '_rotation.jpg'))return rotation_imgdef flip(root_path,img_name): #翻轉(zhuǎn)圖像img = Image.open(os.path.join(root_path, img_name))filp_img = img.transpose(Image.FLIP_LEFT_RIGHT)# filp_img.save(os.path.join(root_path,img_name.split('.')[0] + '_flip.jpg'))return filp_imgdef fangshe_bianhuan(root_path,img_name): #仿射變化擴(kuò)充圖像img = Image.open(os.path.join(root_path, img_name))img = cv2.cvtColor(numpy.asarray(img) , cv2.COLOR_RGB2BGR)h, w = img.shape[0], img.shape[1]m = cv2.getRotationMatrix2D(center=(w // 2, h // 2), angle=-30, scale=0.5)r_img = cv2.warpAffine(src=img, M=m, dsize=(w, h), borderValue=(0, 0, 0))r_img = Image.fromarray(cv2.cvtColor(r_img, cv2.COLOR_BGR2RGB))return r_imgdef cuoqie(root_path,img_name): #錯(cuò)切變化擴(kuò)充圖像img = Image.open(os.path.join(root_path, img_name))img = cv2.cvtColor(numpy.asarray(img) , cv2.COLOR_RGB2BGR)h, w = img.shape[0], img.shape[1]origin_coord = np.array([[0, 0, 1], [w, 0, 1], [w, h, 1], [0, h, 1]])theta = 30 # shear角度tan = math.tan(math.radians(theta))# x方向錯(cuò)切m = np.eye(3)m[0, 1] = tanshear_coord = (m @ origin_coord.T).T.astype(np.int)shear_img = cv2.warpAffine(src=img, M=m[:2],dsize=(np.max(shear_coord[:, 0]), np.max(shear_coord[:, 1])),borderValue=(0, 0, 0))c_img = Image.fromarray(cv2.cvtColor(shear_img, cv2.COLOR_BGR2RGB))return c_imgdef hsv(root_path,img_name):#HSV數(shù)據(jù)增強(qiáng)h_gain , s_gain , v_gain = 0.5 , 0.5 , 0.5img = Image.open(os.path.join(root_path, img_name))img = cv2.cvtColor(numpy.asarray(img) , cv2.COLOR_RGB2BGR)r = np.random.uniform(-1, 1, 3) * [h_gain, s_gain, v_gain] + 1 # random gainshue, sat, val = cv2.split(cv2.cvtColor(img, cv2.COLOR_BGR2HSV))dtype = img.dtype # uint8x = np.arange(0, 256, dtype=np.int16)lut_hue = ((x * r[0]) % 180).astype(dtype)lut_sat = np.clip(x * r[1], 0, 255).astype(dtype)lut_val = np.clip(x * r[2], 0, 255).astype(dtype)img_hsv = cv2.merge((cv2.LUT(hue, lut_hue), cv2.LUT(sat, lut_sat), cv2.LUT(val, lut_val))).astype(dtype)aug_img = cv2.cvtColor(img_hsv, cv2.COLOR_HSV2BGR)aug_img = Image.fromarray(cv2.cvtColor(aug_img, cv2.COLOR_BGR2RGB))return aug_imgdef createImage(imageDir,saveDir):#主函數(shù),7種數(shù)據(jù)擴(kuò)充方式,每種擴(kuò)充一張i=0for name in os.listdir(imageDir):i=i+1saveName="cesun"+str(i)+".jpg"saveImage=contrastEnhancement(imageDir,name)saveImage.save(os.path.join(saveDir,saveName))saveName1 = "flip" + str(i) + ".jpg"saveImage1 = flip(imageDir,name)saveImage1.save(os.path.join(saveDir, saveName1))saveName2 = "brightnessE" + str(i) + ".jpg"saveImage2 = brightnessEnhancement(imageDir, name)saveImage2.save(os.path.join(saveDir, saveName2))saveName3 = "rotate" + str(i) + ".jpg"saveImage = rotation(imageDir, name)saveImage.save(os.path.join(saveDir, saveName3))saveName4 = "fangshe" + str(i) + ".jpg"saveImage = fangshe_bianhuan(imageDir, name)saveImage.save(os.path.join(saveDir, saveName4))saveName5 = "cuoqie" + str(i) + ".jpg"saveImage = cuoqie(imageDir, name)saveImage.save(os.path.join(saveDir, saveName5))saveName6 = "hsv" + str(i) + ".jpg"saveImage = hsv(imageDir, name)saveImage.save(os.path.join(saveDir, saveName6))imageDir="jpg" #要改變的圖片的路徑文件夾 在當(dāng)前文件夾下,建立文件夾即可 saveDir="kuochong" #數(shù)據(jù)增強(qiáng)生成圖片的路徑文件夾 print('文件的初始文件夾為:' + imageDir) print('----------------------------------------') print('文件的轉(zhuǎn)換后存入的文件夾為:' + saveDir) print('----------------------------------------') print('開始轉(zhuǎn)換') print('----------------------------------------') createImage(imageDir,saveDir) print('----------------------------------------') print("數(shù)據(jù)擴(kuò)充完成")在代碼的當(dāng)前文件夾下,新建一個(gè)名為kuochong的文件夾用來存放擴(kuò)充之后的數(shù)據(jù)集。轉(zhuǎn)換成功之后即可得到增強(qiáng)之后的數(shù)據(jù)集。
圖像縮放,我們采集的數(shù)據(jù)圖片大小很多時(shí)候是不固定尺度的,但是神經(jīng)網(wǎng)絡(luò)的輸入一般都是固定尺度的,因此我們需要將所有的圖片縮放到統(tǒng)一大小的才能打入網(wǎng)絡(luò)進(jìn)行訓(xùn)練。
圖片縮放代碼:
import os import cv2# 原圖片存放文件夾 olapath = r'resize_begin' # 修改后存放文件夾 newpath = r'resize_end\\' # 讀文件夾下所有圖片名稱 data = os.listdir(olapath)print('----------------------------------------') print("開始修改尺寸!") print('----------------------------------------') for image in data:img = cv2.imread(olapath + "\\" + image)H, W = img.shape[0], img.shape[1]width = 120 #需要縮放成多大,這里直接修改就行,我這里是縮放成120*120,根據(jù)自己的需要修改成響應(yīng)的數(shù)值即可height = 120img = cv2.resize(img, (width, height), interpolation=cv2.INTER_AREA)# 保存圖片cv2.imwrite(newpath + image, img)print("尺寸修改完畢!") print('----------------------------------------')代碼下載鏈接:
鏈接:https://pan.baidu.com/s/1CIu1QkNvNsR_7W5LE2Mgbg?
提取碼:kp2r
有用的話麻煩點(diǎn)一下關(guān)注,博主后續(xù)會(huì)開源更多代碼,非常感謝支持!
總結(jié)
以上是生活随笔為你收集整理的深度学习数据增强方法-内含(亮度增强,对比度增强,旋转图图像,翻转图像,仿射变化扩充图像,错切变化扩充图像,HSV数据增强)七种方式进行增强-每种扩充一张实现7倍扩)+ 图像缩放代码-批量的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 超级 乞丐
- 下一篇: Java 岗史上最全八股文面试真题汇总,