【Pytorch神经网络实战案例】24 基于迁移学习识别多种鸟类(CUB-200数据集)
1 遷移學習
在實際開發中,常會使用遷移學習將預訓練模型中的特征提取能力轉移到自己的模型中。
1.1 遷移學習定義
遷移學習指將在一個任務上訓練完成的模型進行簡單的修改,再用另一個任務的數據繼續訓練,使之能夠完成新的任務。
1.1.1 遷移學習舉例
在ImageNet數據集上訓練過的ResNet模型,其任務是進行圖片分類,可以對其進行修改使用在目標定位任務上。
1.2 遷移學習的分類
遷移學習是機器學習的分支,按照學習方式可以分為基于樣本的遷移、基于特征的遷移、基于模型的遷移,以及基于關系的遷移。
1.2 遷移學習的目的
節省人工標注樣本的時間,讓模型可以通過一個已有的標記數據領域向未標記數據領域進行遷移,從而訓練出適用于該領域的模型。
簡而言之,即運用已有的相關知識來輔助盡快地學習新知識。
1.3 遷移學習的優勢
1.4?遷移學習與微調的關系
微調更常用于形容遷移學習的后期微調,微調應該是遷移學習中的組成部分,即微調是一個技巧。
2 CUB-200數據集簡介
2.1 細粒度
簡單理解細粒度分類:識別出一張圖片是狗的情況下還需要得知狗的品種;這里識別出是狗就用到粗粒度分類,識別出狗的種類就用到細 粒度分類
細粒度分類的關鍵:提取有辨識力的特征(類似人眼對狗的品種的分類,提取出狗的最有特點的區域進行品種分類,類比到卷積神經網絡,卷積網絡提取出自己感興趣的區域)是提升效果 的關鍵
2.2 CUB-200數據集組成
CUB-200數據集由加州理工學院在2010年提出的細粒度數據集,也是目前細粒度分類識別研究的基準圖像數據集,共有11788張鳥類圖像,包含200類鳥類子類,其中訓練數據集有5994張圖像,測試集有5794張圖像,每張圖像均提供圖像類標記信息。
3 本節案例
3.1 案例簡介
使用遷移學習對預訓練模型進行微調,讓其學習鳥類數據集,實現對多種鳥類進行識別。
3.2 代碼實現:load_data函數加載圖片名稱與標簽的加載----Transfer_bird.py(第1部分)
import glob import numpy as np from PIL import Image import matplotlib.pyplot as plt #plt 用于顯示圖片 import torch import torch.nn as nn import torch.optim as optim from torch.optim import lr_scheduler from torch.utils.data import Dataset,DataLoader import torchvision import torchvision.models as model from torchvision.transforms import ToPILImage import torchvision.transforms as transforms import os os.environ['KMP_DUPLICATE_LIB_OK'] = 'True'# 1.1 實現load_data函數加載圖片名稱與標簽的加載,并使用torch.utils.data接口將其封裝成程序可用的數據集類OwnDataset。 def load_dir(directory,labstart=0): # 獲取所有directory中的所有圖與標簽# 返回path指定的文件夾所包含的文件或文件名的名稱列表strlabels = os.listdir(directory)# 對標簽進行排序,以便訓練和驗證按照相同的順序進行:在不同的操作系統中,加載文件夾的順序可能不同。目錄不同的情況會導致在不同的操作系統中,模型的標簽出現串位的現象。所以需要對文件夾進行排序,保證其順序的一致性。strlabels.sort()# 創建文件標簽列表file_labels = []for i,label in enumerate(strlabels):print(label)jpg_names = glob.glob(os.path.join(directory,label,"*.jpg"))print(jpg_names)# 加入列表file_labels.extend(zip(jpg_names, [i + labstart] * len(jpg_names)))return file_labels,strlabelsdef load_data(dataset_path): # 定義函數load_data函數完成對數據集中圖片文件名稱和標簽的加載。# 該函數可以實現兩層文件夾的嵌套結構。其中,外層結構使用load_data函數進行遍歷,內層結構使用load_dir函進行遍歷。sub_dir = sorted(os.listdir(dataset_path)) # 跳過子文件夾:在不同的操作系統中,加載文件夾的順序可能不同。目錄不同的情況會導致在不同的操作系統中,模型的標簽出現串位的現象。所以需要對文件夾進行排序,保證其順序的一致性。start = 1 # 第0類是nonetfile_lables,tstrlabels = [],['none'] # 在制作標簽時,人為地在前面添加了一個序號為0的none類。這是一個訓練圖文類模型的技巧,為了區分模型輸出值是0和預測值是0這兩種情況。for i in sub_dir:directory = os.path.join(dataset_path,i)if os.path.isdir(directory) == False: # 只處理文件夾中的數據print(directory)continuefile_labels,strlables = load_dir(directory,labstart=start)tfile_lables.extend(file_labels)tstrlabels.extend(strlables)start = len(strlables)# 將數據路徑與標簽解壓縮,把數據路徑和標簽解壓縮出來filenames,labels = zip(*tfile_lables)return filenames, labels, tstrlabels3.3 代碼實現:自定義數據集類OwnDataset----Transfer_bird.py(第2部分)
# 1.2 實現自定義數據集OwnDataset def default_loader(path) : # 定義函數加載圖片return Image.open(path).convert('RGB')class OwnDataset(Dataset): # 復用性較強,可根據自己的數據集略加修改使用# 在PyTorch中,提供了一個torch.utis.data接口,可以用來對數據集進行封裝。在實現時,只需要繼承torch.utis.data.Dataset類,并重載其__gettem__方法。# 在使用時,框架會向__gettem__方法傳入索引index,在__gettem__方法內部根據指定index加載數據,并返回。def __init__(self,img_dir,labels,indexlist=None,transform=transforms.ToTensor(),loader=default_loader,cache=True): # 初始化self.labels = labels # 存放標簽self.img_dir = img_dir # 樣本圖片文件名self.transform = transform # 預處理方法self.loader = loader # 加載方法self.cache = cache # 緩存標志if indexlist is None: # 要加載的數據序列self.indexlist = list(range(len(self.img_dir)))else:self.indexlist = indexlistself.data = [None] * len(self.indexlist) # 存放樣本圖片def __getitem__(self, idx): # 加載指定索引數據if self.data[idx] is None: # 第一次加載data = self.loader(self.img_dir[self.indexlist[idx]])if self.transform:data = self.transform(data)else:data = self.data[idx]if self.cache: # 保存到緩存里self.data[idx] = datareturn data,self.labels[self.indexlist[idx]]def __len__(self): # 計算數據集長度return len(self.indexlist)3.4 代碼實戰:測試數據集----Transfer_bird.py(第3部分)
# 1.3 測試數據集:在完成數據集的制作之后,編寫代碼對其進行測試。 data_transform = { #定義數據的預處理方法'train':transforms.Compose([transforms.RandomResizedCrop(224),transforms.RandomHorizontalFlip(),transforms.ToTensor(),transforms.Normalize([0.485,0.456,0.406],[0.229,0.224,0.225])]),'val':transforms.Compose([transforms.Resize(256),transforms.CenterCrop(224),transforms.ToTensor(),transforms.Normalize([0.485,0.456,0.406],[0.229,0.224,0.225])]), } def Reduction_img(tensor,mean,std): #還原圖片,實現了圖片歸一化的逆操作,顯示數據集中的原始圖片。dtype = tensor.dtypemean = torch.as_tensor(mean,dtype=dtype,device=tensor.device)std = torch.as_tensor(std,dtype=dtype,device=tensor.device)tensor.mul_(std[:,None,None]).add_(mean[:,None,None]) # 還原操作dataset_path = r'./data/cub200/' # 加載數據集路徑 filenames,labels,classes = load_data(dataset_path) # 調用load_data函數對數據集中圖片文件名稱和標簽進行加載,其返回對象classes中包含全部的類名。 # 打亂數據順序 # 110-115行對數據文件列表的序號進行亂序劃分,分為測試數據集和訓練數集兩個索引列表。該索引列表會傳入OwnDataset類做成指定的數據集。 np.random.seed(0) label_shuffle_index = np.random.permutation(len(labels)) label_train_num = (len(labels)//10) * 8 # 劃分訓練數據集和測試數據集 train_list = label_shuffle_index[0:label_train_num] test_list = label_shuffle_index[label_train_num:] # 沒帶:train_dataset = OwnDataset(filenames,labels,train_list,data_transform['train'])# 實例化訓練數據集 val_dataset = OwnDataset(filenames,labels,test_list,data_transform['val']) # 實例化測試數據集 # 實例化批次數據集:OwnDataset類所定義的數據集,其使用方法與PyTorch中的內置數據集的使用方法完全一致,配合DataLoader接口即可生成可以進行訓練或測試的批次數據。具體代碼如下。 train_loader = DataLoader(dataset=train_dataset,batch_size=32,shuffle=True) val_loader = DataLoader(dataset=val_dataset,batch_size=32,shuffle=True)sample = iter(train_loader) # 獲取一批次數據,進行測試 images,labels = sample.next() print("樣本形狀",np.shape(images)) print("標簽個數",len(classes)) mulimgs = torchvision.utils.make_grid(images[:10],nrow=10) # 拼接多張圖片 Reduction_img(mulimgs,[0.485,0.456,0.406],[0.229,0.224,0.225]) _img = ToPILImage()(mulimgs) # 將張量轉化為圖片 plt.axis('off') plt.imshow(_img) # 顯示 plt.show() print(','.join('%5s' % classes[labels[j]] for j in range(len(images[:10]))))輸出:
樣本形狀 torch.Size([32, 3, 224, 224])
標簽個數 6
輸出數據集中的10個圖片
3.5 代碼實戰:獲取并改造ResNet模型----Transfer_bird.py(第4部分)
# 1.4 獲取并改造ResNet模型:獲取ResNet模型,并加載預訓練模型的權重。將其最后一層(輸出層)去掉,換成一個全新的全連接層,該全連接層的輸出節點數與本例分類數相同。 # 指定設備 device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu") print(device) # get_ResNet函數,獲取預訓練模型,可指定pretrained=True來實現自動下載預訓練模型,也可指定loadfile來從本地路徑加載預訓練模型。 def get_ResNet(classes,pretrained=True,loadfile=None):ResNet = model.resnet101(pretrained) # 自動下載官方的預訓練模型if loadfile != None:ResNet.load_state_dict(torch.load(loadfile)) # 加載本地模型# 將所有的參數層進行凍結:設置模型僅最后一層可以進行訓練,使模型只針對最后一層進行微調。for param in ResNet.parameters():param.requires_grad = False# 輸出全連接層的信息print(ResNet.fc)x = ResNet.fc.in_features # 獲取全連接層的輸入ResNet.fc = nn.Linear(x,len(classes)) # 定義一個新的全連接層print(ResNet.fc) # 最后輸出新的模型return ResNet ResNet = get_ResNet(classes) # 實例化模型 ResNet.to(device=device)3.6 代碼實戰:定義損失函數、訓練函數及測試函數,對模型的最后一層進行微調----Transfer_bird.py(第5部分)
# 1.5 定義損失函數、訓練函數及測試函數,對模型的最后一層進行微調。 criterion = nn.CrossEntropyLoss() # 指定新加的全連接層的學習率 optimizer = torch.optim.Adam([{'params':ResNet.fc.parameters()}],lr=0.01) def train(model,device,train_loader,epoch,optimizer): # 定義訓練函數model.train()allloss = []for batch_idx,data in enumerate(train_loader):x,y = datax = x.to(device)y = y.to(device)optimizer.zero_grad()y_hat = model(x)loss = criterion(y_hat,y)loss.backward()allloss.append(loss.item())optimizer.step()print('Train Epoch:{}\t Loss:{:.6f}'.format(epoch,np.mean(allloss))) # 輸出訓練結果def test(model,device,val_loader): # 定義測試函數model.eval()test_loss = []correct = []with torch.no_grad(): # 使模型在運行時不進行梯度跟蹤,可以減少模型運行時對內存的占用。for i,data in enumerate(val_loader):x, y = datax = x.to(device)y = y.to(device)y_hat = model(x)test_loss.append(criterion(y_hat,y).item()) # 收集損失函數pred = y_hat.max(1,keepdim=True)[1] # 獲取預測結果correct.append(pred.eq(y.view_as(pred)).sum().item()/pred.shape[0]) # 收集精確度print('\nTest:Average loss:{:,.4f},Accuracy:({:,.0f}%)\n'.format(np.mean(test_loss),np.mean(correct)*100)) # 輸出測試結果# 遷移學習的兩個步驟如下 if __name__ == '__main__': # 遷移學習步驟①:固定預訓練模型的特征提取部分,只對最后一層進行訓練,使其快速收斂。firstmodepth = './data/cub200/firstmodepth_1.pth' # 定義模型文件的地址if os.path.exists(firstmodepth) == False:print("—————————固定預訓練模型的特征提取部分,只對最后一層進行訓練,使其快速收斂—————————")for epoch in range(1,2): # 迭代兩次train(ResNet,device,train_loader,epoch,optimizer)test(ResNet,device,val_loader)# 保存模型torch.save(ResNet.state_dict(),firstmodepth)3.7 代碼實戰:使用退化學習率對模型進行全局微調----Transfer_bird.py(第6部分)
# 1.6 使用退化學習率對模型進行全局微調 #遷移學習步驟②:使用較小的學習率,對全部模型進行訓練,并對每層的權重進行細微的調節,即將模型的每層權重都設為可訓練,并定義帶有退化學習率的優化器。(1.6部分)secondmodepth = './data/cub200/firstmodepth_2.pth'optimizer2 = optim.SGD(ResNet.parameters(),lr=0.001,momentum=0.9) # 第198行代碼定義帶有退化學習率的SGD優化器。該優化器常用來對模型進行手動微調。有實驗表明,使用經過手動調節的SGD優化器,在訓練模型的后期效果優于Adam優化器。exp_lr_scheduler = lr_scheduler.StepLR(optimizer2,step_size=2,gamma=0.9) # 由于退化學習率會在訓練過程中不斷地變小,為了防止學習率過小,最終無法進行權重需要對其設置最小值。當學習率低于該值時,停止對退化學習率的操作。for param in ResNet.parameters(): # 所有參數設計為可訓練param.requires_grad = Trueif os.path.exists(secondmodepth):ResNet.load_state_dict(torch.load(secondmodepth)) # 加載本地模型else:ResNet.load_state_dict(torch.load(firstmodepth)) # 加載本地模型print("____使用較小的學習率,對全部模型進行訓練,定義帶有退化學習率的優化器______")for epoch in range(1,100):train(ResNet,device,train_loader,epoch,optimizer2)if optimizer2.state_dict()['param_groups'][0]['lr'] > 0.00001:exp_lr_scheduler.step()print("___lr:",optimizer2.state_dict()['param_groups'][0]['lr'])test(ResNet,device,val_loader)# 保存模型torch.save(ResNet.state_dict(),secondmodepth)4 代碼總覽Transfer_bird.py
import glob import numpy as np from PIL import Image import matplotlib.pyplot as plt #plt 用于顯示圖片 import torch import torch.nn as nn import torch.optim as optim from torch.optim import lr_scheduler from torch.utils.data import Dataset,DataLoader import torchvision import torchvision.models as model from torchvision.transforms import ToPILImage import torchvision.transforms as transforms import os os.environ['KMP_DUPLICATE_LIB_OK'] = 'True'# 1.1 實現load_data函數加載圖片名稱與標簽的加載,并使用torch.utils.data接口將其封裝成程序可用的數據集類OwnDataset。 def load_dir(directory,labstart=0): # 獲取所有directory中的所有圖與標簽# 返回path指定的文件夾所包含的文件或文件名的名稱列表strlabels = os.listdir(directory)# 對標簽進行排序,以便訓練和驗證按照相同的順序進行:在不同的操作系統中,加載文件夾的順序可能不同。目錄不同的情況會導致在不同的操作系統中,模型的標簽出現串位的現象。所以需要對文件夾進行排序,保證其順序的一致性。strlabels.sort()# 創建文件標簽列表file_labels = []for i,label in enumerate(strlabels):print(label)jpg_names = glob.glob(os.path.join(directory,label,"*.jpg"))print(jpg_names)# 加入列表file_labels.extend(zip(jpg_names, [i + labstart] * len(jpg_names)))return file_labels,strlabelsdef load_data(dataset_path): # 定義函數load_data函數完成對數據集中圖片文件名稱和標簽的加載。# 該函數可以實現兩層文件夾的嵌套結構。其中,外層結構使用load_data函數進行遍歷,內層結構使用load_dir函進行遍歷。sub_dir = sorted(os.listdir(dataset_path)) # 跳過子文件夾:在不同的操作系統中,加載文件夾的順序可能不同。目錄不同的情況會導致在不同的操作系統中,模型的標簽出現串位的現象。所以需要對文件夾進行排序,保證其順序的一致性。start = 1 # 第0類是nonetfile_lables,tstrlabels = [],['none'] # 在制作標簽時,人為地在前面添加了一個序號為0的none類。這是一個訓練圖文類模型的技巧,為了區分模型輸出值是0和預測值是0這兩種情況。for i in sub_dir:directory = os.path.join(dataset_path,i)if os.path.isdir(directory) == False: # 只處理文件夾中的數據print(directory)continuefile_labels,strlables = load_dir(directory,labstart=start)tfile_lables.extend(file_labels)tstrlabels.extend(strlables)start = len(strlables)# 將數據路徑與標簽解壓縮,把數據路徑和標簽解壓縮出來filenames,labels = zip(*tfile_lables)return filenames, labels, tstrlabels# 1.2 實現自定義數據集OwnDataset def default_loader(path) : # 定義函數加載圖片return Image.open(path).convert('RGB')class OwnDataset(Dataset): # 復用性較強,可根據自己的數據集略加修改使用# 在PyTorch中,提供了一個torch.utis.data接口,可以用來對數據集進行封裝。在實現時,只需要繼承torch.utis.data.Dataset類,并重載其__gettem__方法。# 在使用時,框架會向__gettem__方法傳入索引index,在__gettem__方法內部根據指定index加載數據,并返回。def __init__(self,img_dir,labels,indexlist=None,transform=transforms.ToTensor(),loader=default_loader,cache=True): # 初始化self.labels = labels # 存放標簽self.img_dir = img_dir # 樣本圖片文件名self.transform = transform # 預處理方法self.loader = loader # 加載方法self.cache = cache # 緩存標志if indexlist is None: # 要加載的數據序列self.indexlist = list(range(len(self.img_dir)))else:self.indexlist = indexlistself.data = [None] * len(self.indexlist) # 存放樣本圖片def __getitem__(self, idx): # 加載指定索引數據if self.data[idx] is None: # 第一次加載data = self.loader(self.img_dir[self.indexlist[idx]])if self.transform:data = self.transform(data)else:data = self.data[idx]if self.cache: # 保存到緩存里self.data[idx] = datareturn data,self.labels[self.indexlist[idx]]def __len__(self): # 計算數據集長度return len(self.indexlist)# 1.3 測試數據集:在完成數據集的制作之后,編寫代碼對其進行測試。 data_transform = { #定義數據的預處理方法'train':transforms.Compose([transforms.RandomResizedCrop(224),transforms.RandomHorizontalFlip(),transforms.ToTensor(),transforms.Normalize([0.485,0.456,0.406],[0.229,0.224,0.225])]),'val':transforms.Compose([transforms.Resize(256),transforms.CenterCrop(224),transforms.ToTensor(),transforms.Normalize([0.485,0.456,0.406],[0.229,0.224,0.225])]), } def Reduction_img(tensor,mean,std): #還原圖片,實現了圖片歸一化的逆操作,顯示數據集中的原始圖片。dtype = tensor.dtypemean = torch.as_tensor(mean,dtype=dtype,device=tensor.device)std = torch.as_tensor(std,dtype=dtype,device=tensor.device)tensor.mul_(std[:,None,None]).add_(mean[:,None,None]) # 還原操作dataset_path = r'./data/cub200/' # 加載數據集路徑 filenames,labels,classes = load_data(dataset_path) # 調用load_data函數對數據集中圖片文件名稱和標簽進行加載,其返回對象classes中包含全部的類名。 # 打亂數據順序 # 110-115行對數據文件列表的序號進行亂序劃分,分為測試數據集和訓練數集兩個索引列表。該索引列表會傳入OwnDataset類做成指定的數據集。 np.random.seed(0) label_shuffle_index = np.random.permutation(len(labels)) label_train_num = (len(labels)//10) * 8 # 劃分訓練數據集和測試數據集 train_list = label_shuffle_index[0:label_train_num] test_list = label_shuffle_index[label_train_num:] # 沒帶:train_dataset = OwnDataset(filenames,labels,train_list,data_transform['train'])# 實例化訓練數據集 val_dataset = OwnDataset(filenames,labels,test_list,data_transform['val']) # 實例化測試數據集 # 實例化批次數據集:OwnDataset類所定義的數據集,其使用方法與PyTorch中的內置數據集的使用方法完全一致,配合DataLoader接口即可生成可以進行訓練或測試的批次數據。具體代碼如下。 train_loader = DataLoader(dataset=train_dataset,batch_size=32,shuffle=True) val_loader = DataLoader(dataset=val_dataset,batch_size=32,shuffle=True)sample = iter(train_loader) # 獲取一批次數據,進行測試 images,labels = sample.next() print("樣本形狀",np.shape(images)) print("標簽個數",len(classes)) mulimgs = torchvision.utils.make_grid(images[:10],nrow=10) # 拼接多張圖片 Reduction_img(mulimgs,[0.485,0.456,0.406],[0.229,0.224,0.225]) _img = ToPILImage()(mulimgs) # 將張量轉化為圖片 plt.axis('off') plt.imshow(_img) # 顯示 plt.show() print(','.join('%5s' % classes[labels[j]] for j in range(len(images[:10]))))# 1.4 獲取并改造ResNet模型:獲取ResNet模型,并加載預訓練模型的權重。將其最后一層(輸出層)去掉,換成一個全新的全連接層,該全連接層的輸出節點數與本例分類數相同。 # 指定設備 device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu") print(device) # get_ResNet函數,獲取預訓練模型,可指定pretrained=True來實現自動下載預訓練模型,也可指定loadfile來從本地路徑加載預訓練模型。 def get_ResNet(classes,pretrained=True,loadfile=None):ResNet = model.resnet101(pretrained) # 自動下載官方的預訓練模型if loadfile != None:ResNet.load_state_dict(torch.load(loadfile)) # 加載本地模型# 將所有的參數層進行凍結:設置模型僅最后一層可以進行訓練,使模型只針對最后一層進行微調。for param in ResNet.parameters():param.requires_grad = False# 輸出全連接層的信息print(ResNet.fc)x = ResNet.fc.in_features # 獲取全連接層的輸入ResNet.fc = nn.Linear(x,len(classes)) # 定義一個新的全連接層print(ResNet.fc) # 最后輸出新的模型return ResNet ResNet = get_ResNet(classes) # 實例化模型 ResNet.to(device=device)# 1.5 定義損失函數、訓練函數及測試函數,對模型的最后一層進行微調。 criterion = nn.CrossEntropyLoss() # 指定新加的全連接層的學習率 optimizer = torch.optim.Adam([{'params':ResNet.fc.parameters()}],lr=0.01) def train(model,device,train_loader,epoch,optimizer): # 定義訓練函數model.train()allloss = []for batch_idx,data in enumerate(train_loader):x,y = datax = x.to(device)y = y.to(device)optimizer.zero_grad()y_hat = model(x)loss = criterion(y_hat,y)loss.backward()allloss.append(loss.item())optimizer.step()print('Train Epoch:{}\t Loss:{:.6f}'.format(epoch,np.mean(allloss))) # 輸出訓練結果def test(model,device,val_loader): # 定義測試函數model.eval()test_loss = []correct = []with torch.no_grad(): # 使模型在運行時不進行梯度跟蹤,可以減少模型運行時對內存的占用。for i,data in enumerate(val_loader):x, y = datax = x.to(device)y = y.to(device)y_hat = model(x)test_loss.append(criterion(y_hat,y).item()) # 收集損失函數pred = y_hat.max(1,keepdim=True)[1] # 獲取預測結果correct.append(pred.eq(y.view_as(pred)).sum().item()/pred.shape[0]) # 收集精確度print('\nTest:Average loss:{:,.4f},Accuracy:({:,.0f}%)\n'.format(np.mean(test_loss),np.mean(correct)*100)) # 輸出測試結果# 遷移學習的兩個步驟如下 if __name__ == '__main__': # 遷移學習步驟①:固定預訓練模型的特征提取部分,只對最后一層進行訓練,使其快速收斂。firstmodepth = './data/cub200/firstmodepth_1.pth' # 定義模型文件的地址if os.path.exists(firstmodepth) == False:print("—————————固定預訓練模型的特征提取部分,只對最后一層進行訓練,使其快速收斂—————————")for epoch in range(1,2): # 迭代兩次train(ResNet,device,train_loader,epoch,optimizer)test(ResNet,device,val_loader)# 保存模型torch.save(ResNet.state_dict(),firstmodepth) # 1.6 使用退化學習率對模型進行全局微調 #遷移學習步驟②:使用較小的學習率,對全部模型進行訓練,并對每層的權重進行細微的調節,即將模型的每層權重都設為可訓練,并定義帶有退化學習率的優化器。(1.6部分)secondmodepth = './data/cub200/firstmodepth_2.pth'optimizer2 = optim.SGD(ResNet.parameters(),lr=0.001,momentum=0.9) # 第198行代碼定義帶有退化學習率的SGD優化器。該優化器常用來對模型進行手動微調。有實驗表明,使用經過手動調節的SGD優化器,在訓練模型的后期效果優于Adam優化器。exp_lr_scheduler = lr_scheduler.StepLR(optimizer2,step_size=2,gamma=0.9) # 由于退化學習率會在訓練過程中不斷地變小,為了防止學習率過小,最終無法進行權重需要對其設置最小值。當學習率低于該值時,停止對退化學習率的操作。for param in ResNet.parameters(): # 所有參數設計為可訓練param.requires_grad = Trueif os.path.exists(secondmodepth):ResNet.load_state_dict(torch.load(secondmodepth)) # 加載本地模型else:ResNet.load_state_dict(torch.load(firstmodepth)) # 加載本地模型print("____使用較小的學習率,對全部模型進行訓練,定義帶有退化學習率的優化器______")for epoch in range(1,100):train(ResNet,device,train_loader,epoch,optimizer2)if optimizer2.state_dict()['param_groups'][0]['lr'] > 0.00001:exp_lr_scheduler.step()print("___lr:",optimizer2.state_dict()['param_groups'][0]['lr'])test(ResNet,device,val_loader)# 保存模型torch.save(ResNet.state_dict(),secondmodepth)總結
以上是生活随笔為你收集整理的【Pytorch神经网络实战案例】24 基于迁移学习识别多种鸟类(CUB-200数据集)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【Pytorch神经网络理论篇】 11
- 下一篇: IDEA初次使用Tomcat运行项目(如