DeepHSV:号称可以商用的计算机笔迹鉴别算法
點擊上方“AI搞事情”關注我們
?
「論文名稱」:《DeepHSV: User-Independent Offline Signature Verification Using Two-Channel CNN》
「開源代碼」:https://github.com/dlutkaka/DeepHSV
介紹
堪稱是世界上第一個可以在GPDS手寫簽名數據庫(世界最新、最大的手寫簽名數據庫,也是鑒定最為困難的數據庫)上鑒定準確率達到“可用”級別的算法。
簽字識別:分為在線簽字識別,和離線簽字識別,本文針對離線的靜態圖像進行筆跡識別。
用戶依賴:分為依賴于用戶和不依賴用戶,本文對簽字數據集訓練用戶無關的識別模型,可以對新用戶簽字進行字跡鑒別。
主要創新在于將2-ChannelCNN(雙通道卷積神經網絡)模型引入到筆跡對比中,比原來的CNN-Siamese(孿生卷積網絡)模型在EER(等錯率)從22.24%降到了9.95%,推斷速度提高了2倍,訓練效率提高了4倍,且具有更好的魯棒性。
2-ChannelCNN(左) ?CNN-Siamese(右)基礎模型
「孿生網絡」:度量學習方式,包含兩個特征提取的分支,分支共享一個網絡結構與權重,兩個分支的輸出用來衡量兩個輸入的相似度,通常用距離進行度量,比如歐式距離,訓練損失采用對比損失(Contrastive Loss)。
「雙通道網絡」:兩個輸入被合并為一個雙通道圖像,作為一個單網絡的輸入,網絡一開始就學習兩個輸入的相似度,而不是通過最后進行特征相似度比較。同時,達到了減少參數搜索空間,提升收斂速度的效果。傳統雙通道網絡經過全局平均池化,只輸出兩個輸入數據的相似度得分。運用以下的損失函數進行訓練模型權重。第一項為正則項,第二項是label(匹配為1、不匹配為-1),為網絡輸出。
本文模型
「2-Channel-2-Logit Network」:基于雙通道網絡,作者提出了輸出兩個logit的雙通道雙logit網絡,將兩個輸出的距離作為兩個輸入圖像的相似度。
采用常用的softmax損失對距離進行監督學習:
主干網絡采用「Inception-V3」結構(整個網絡就是一個Inception-V3),為避免過擬合,增加了3個dropout層,網絡結構如下:
網絡結構「預處理」:考慮一般簽字圖像的比例與書寫方向,利用雙線性插值將圖像縮放到高度為155,寬度為220的固定大小。未做裁剪、對齊,像素反轉,背景去除,二值化等預處理操作。
「模型訓練」:在簽名數據集中存在樣本不均衡問題,同一個用戶的仿寫數據對數量遠大于真實數據對,假設一個用戶有M個真實簽字樣本,N個冒寫數據樣本,那么真實簽字樣本有對,
冒寫數據對有個:
作者采用對冒寫數據下采樣的方式,保持正負樣本對保持在均衡的狀態。
「實驗細節」:
Tensorflflow 1.7(年代久遠????),優化器:AdamOptimizer,未使用BN,Xavier方法進行權重初始化,batch size:192,初始學習率:1e-4,衰減系數decay:0.9。
「實驗數據」:
CEDAR: ?55個人,24次真實簽字,24次專業仿寫簽字,掃描為PNG圖像格式
BHSig260: ?100人孟加拉語,160人印度語,20次真實簽字,30次專業仿寫數據,TIFF圖像格式
GPDS-Synthetic:?4000用戶,每個人24次真實簽字,30次仿寫簽字,JPEG圖像格式
實驗結果總的來說,本文借鑒了雙通道做圖像相似度比較的思想(2015年CVPR文章),采用了Inception-V3作為backbone,為防止過擬合加入了dropout,然后輸出兩個logit分數,并將差值作為距離進行監督學習,最后效果很好,據說在中國金融認證中心(CFCA)已經投入使用,用于自動審核客戶在電子合同中手寫簽字的有效性。
推薦閱讀
CVPR 2019筆跡識別論文:逆鑒別網絡+八路Attention
PolarMask:單階段實例分割框架,FCOS進階!
真正意義的Anchor-Free,FCOS目標檢測算法了解一下
論文創新,可以看看這幾篇去雨文章是怎么做的
眨眼算什么,讓蒙娜麗莎像你一樣嘮上嗑才算硬核
抖音同款白眼特效,DeepWarp讓蒙拉麗莎對你眨眨眼
長按二維碼關注我們
有趣的靈魂在等你
總結
以上是生活随笔為你收集整理的DeepHSV:号称可以商用的计算机笔迹鉴别算法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【opencv系列08】OpenCV4.
- 下一篇: 利用python分析了下乘风破浪的姐姐