當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

浅谈Label Smoothing技术

發布時間：2023/12/29 编程问答 30 豆豆

生活随笔收集整理的這篇文章主要介紹了浅谈Label Smoothing技术小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

一、從 One-Hot 到 Label Smoothing

考慮單個樣本的交叉熵損失

$H(p,q)=?∑i=1Cpilog?qiH(p,q)=-\sum_{i=1}^C p_i\log q_i$

其中 $C$ 代表類別個數， $p_i$ 是真實分布（即 target）， $q_i$ 是預測分布（即神經網絡輸出的 prediction）。

如果真實分布采用傳統的 One-Hot 向量，則其分量非 $0$ 即 $1$ 。不妨設第 $k$ 個位置是 $1$ ，其余位置是 $0$ ，此時交叉熵損失變為

$H(p,q)=-\log q_k$

從上面的表達式不難發現一些問題：

真實標簽跟其他標簽之間的關系被忽略了，一些有用的知識無法學到；
One-Hot 傾向于讓模型過度自信（Overconfidence），容易造成過擬合，進而導致泛化性能降低；
誤標注的樣本（即 target 錯誤）更容易對模型的訓練產生影響；
One-Hot 對 “模棱兩可” 的樣本表征較差。

緩解這些問題的方法就是采用 Label Smoothing 的技術，它也是一種正則化的技巧，具體如下：

$pi:={1??,i=k?/(C?1),i≠kp_i:= \begin{cases} 1-\epsilon,& i=k \\ \epsilon/(C-1),&i\neq k\\ \end{cases}$

其中 $?\epsilon$ 是一個小正數。

例如，設原始 target 為 $[0, 0, 1, 0, 0, 0]$ ，取 $?=0.1\epsilon=0.1$ ，則經過 Label Smoothing 后 target 變為 $[0.02, 0.02, 0.9, 0.02, 0.02, 0.02]$ 。

📌 原始的 One-Hot 向量通常稱為 Hard Target（或 Hard Label），經過標簽平滑后通常稱為 Soft Target（或 Soft Label）

二、Label Smoothing 的簡單實現

import torchdef label_smoothing(label, eps):label[label == 1] = 1 - epslabel[label == 0] = eps / (len(label) - 1)return labela = torch.tensor([0, 0, 1, 0, 0, 0], dtype=torch.float) print(label_smoothing(a, 0.1)) # tensor([0.0200, 0.0200, 0.9000, 0.0200, 0.0200, 0.0200])

三、Label Smoothing 的優缺點

優點：

一定程度上可以緩解模型 Overconfidence 的問題，此外也具有一定的抗噪能力；
提供了訓練數據中類別之間的關系（數據增強）；
可能在一定程度上增強了模型的泛化能力。

缺點：

單純地添加隨機噪音，也無法反映標簽之間的關系，因此對模型的提升有限，甚至有欠擬合的風險；
某些場景下 Soft Label 并不能幫助我們構建更好的神經網絡（表現不如 Hard Label）。

四、什么時候使用 Label Smoothing？

龐大的數據集難免存在噪音（即標注錯誤），為了避免模型學到這些噪音可以加入 Label Smoothing；
對于模糊的 case 而言可以引入 Label Smoothing（比如貓狗分類任務中，可能存在一些圖片既像狗又像貓）；
防止模型 Overconfidence。

總結

以上是生活随笔為你收集整理的浅谈Label Smoothing技术的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： js 手机摇一摇
下一篇： Mysql : 对于表数据处理增删改的内

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

生活随笔

生活随笔

编程问答

浅谈Label Smoothing技术

目錄

一、從 One-Hot 到 Label Smoothing

二、Label Smoothing 的簡單實現

三、Label Smoothing 的優缺點

四、什么時候使用 Label Smoothing？

總結

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

编程问答

浅谈Label Smoothing技术

目錄

一、從 One-Hot 到 Label Smoothing

二、Label Smoothing 的簡單實現

三、Label Smoothing 的優缺點

四、什么時候使用 Label Smoothing？

總結

二、Label Smoothing 的簡單實現

三、Label Smoothing 的優缺點