OpenCV进阶篇视频
OpenCV進階篇01
第14章 視頻處理
OpenCV不僅能夠處理圖像,還能夠處理視頻。視頻是由大量的圖像構成的,這些圖像以固定的時間間隔從視頻中獲取。這樣,就能夠使用圖像處理的方法對這些圖像進行處理,進而達到處理視頻的目的。要處理視頻,需要先對視頻進行讀取、顯示和保存等相關操作。為此,OpenCV提供了VideoCapture類和VideoWriter類的相關方法。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-flqLumsh-1639056600119)(OpenCV進階篇01.assets/image-20211128195439971.png)]
14.1 讀取并顯示攝像頭視頻
攝像頭視頻指的是從攝像頭(見圖14.1)中實時讀取到的視頻。為了讀取并顯示攝像頭視頻,OpenCV提供了VideoCapture類的相關方法,這些方法包括攝像頭的初始化方法、檢驗攝像頭初始化是否成功的方法、從攝像頭中讀取幀的方法和關閉攝像頭的方法等。下面依次對這些方法進行講解。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-FhdOlx82-1639056600120)(OpenCV進階篇01.assets/image-20211128195512490.png)]
? 圖14.1 攝像頭說明
視頻是由大量的圖像構成的,把這些圖像稱作幀。
14.1.1 VideoCapture類
VideoCapture類提供了構造方法VideoCapture(),用于完成攝像頭的初始化工作。VideoCapture()的語法格式如下:
capture = cv2.VideoCapture(index)參數說明:
capture:要打開的攝像頭。
index:攝像頭的設備索引。
注意
攝像頭的數量及其設備索引的先后順序由操作系統決定,因為OpenCV沒有提供查詢攝像頭的數量及其設備索引的任何方法。
當index的值為0時,表示要打開的是第1個攝像頭;對于64位的Windows 10筆記本,當index的值為0時,表示要打開的是筆記本內置攝像頭,關鍵代碼如下:
當index的值為1時,表示要打開的是第2個攝像頭;對于64位的Windows 10筆記本,當index的值為1時,表示要打開的是一個連接筆記本的外置攝像頭,關鍵代碼如下:
capture = cv2.VideoCapture(1)為了檢驗攝像頭初始化是否成功,VideoCapture類提供了isOpened()方法。isOpened()方法的語法格式如下:
retval = cv2.VideoCapture.isOpened()參數說明:
retval:isOpened()方法的返回值。如果攝像頭初始化成功,retval的值為True;否則,retval的值為False。
說明
在VideoCapture()的語法格式基礎上,isOpened()方法的語法格式可以簡寫為retval = capture.isOpened()
攝像頭初始化后,可以從攝像頭中讀取幀,為此VideoCapture類提供了read()方法。read()方法的語法格式如下:
參數說明:
retval:是否讀取到幀。如果讀取到幀,retval的值為True;否則,retval的值為False。
image:讀取到的幀。因為幀指的是構成視頻的圖像,所以可以把“讀取到的幀”理解為“讀取到的圖像”。
OpenCV官網特別強調,在不需要攝像頭時,要關閉攝像頭。為此,VideoCapture類提供了release()方法。release()方法的語法格式如下:
cv2.VideoCapture.release() # 可以簡寫為capture.release()14.1.2 如何使用VideoCapture類
在14.1.1節中,介紹了VideoCapture類中的VideoCapture()方法、isOpened()方法、read()方法和release()方法。那么,在程序開發的過程中,如何使用這些方法呢?本節將通過3個實例進行講解。
【實例14.1】 讀取并顯示攝像頭視頻。
編寫一個程序,打開筆記本內置攝像頭實時讀取并顯示視頻。當按下空格鍵時,關閉筆記本內置攝像頭,銷毀顯示攝像頭視頻的窗口,代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-Zu4htrrv-1639056600121)(OpenCV進階篇01.assets/image-20211128200517716.png)]
上述代碼的運行結果如圖14.2所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-S3x2StrA-1639056600122)(OpenCV進階篇01.assets/image-20211128200557699.png)]
? 圖14.2 讀取并顯示攝像頭視頻說明
圖14.2是筆者用筆記本內置攝像頭實時讀取并顯示公司天花板的視頻。
在實例14.1運行期間,如果按下空格鍵,筆記本內置攝像頭將被關閉,顯示攝像頭視頻的窗口也將被銷毀。此外,PyCharm控制臺將輸出如圖14.3所示的警告信息。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-Et4TKT9V-1639056600123)(OpenCV進階篇01.assets/image-20211128200630928.png)]
? 圖14.3 PyCharm控制臺輸出的警告信息
為了消除圖14.3所示的警告信息,需要將實例14.1第3行代碼:
修改為如下代碼:
capture = cv2.VideoCapture(0, cv2.CAP_DSHOW) # 打開筆記本內置攝像頭如果想打開的是一個連接筆記本的外置攝像頭,那么需要將實例14.1第3行代碼:
capture = cv2.VideoCapture(0) # 打開筆記本內置攝像頭
修改為如下代碼:
實例14.1已經成功地讀取并顯示了攝像頭視頻,那么如何對這個視頻進行處理呢?其實,處理視頻所用的方法與處理圖像所用的方法是相同的。實例14.2將使用處理圖像的相關方法把實例14.1讀取并顯示的彩色視頻轉換為灰度視頻。
【實例14.2】 將攝像頭視頻由彩色視頻轉換為灰度視頻。
編寫一個程序,使用圖像處理的相關方法把實例14.1讀取并顯示的彩色視頻轉換為灰度視頻。當按下空格鍵時,關閉筆記本內置攝像頭,銷毀顯示攝像頭視頻的窗口,代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-wZbc21i3-1639056600123)(OpenCV進階篇01.assets/image-20211128200727172.png)]
上述代碼的運行結果如圖14.4所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-0zNghqOZ-1639056600124)(OpenCV進階篇01.assets/image-20211128200757312.png)]
圖14.4 把彩色視頻轉換為灰度視頻實例14.1和實例14.2都用到了按鍵指令。當按下空格鍵時,關閉筆記本內置攝像頭,銷毀顯示攝像頭視頻的窗口。那么,能否通過按鍵指令,保存并顯示攝像頭視頻某一時刻的圖像?帶著這個疑問,請讀者朋友繼續閱讀實例14.3。
【實例14.3】 顯示并保存攝像頭視頻某一時刻的圖像。
編寫一個程序,打開筆記本內置攝像頭實時讀取并顯示視頻。當按下空格鍵時,關閉筆記本內置攝像頭,保存并顯示此時攝像頭視頻中的圖像,代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-SWCR3A9A-1639056600124)(OpenCV進階篇01.assets/image-20211128200847208.png)]
上述代碼的運行結果如圖14.5所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-bOQinG4E-1639056600124)(OpenCV進階篇01.assets/image-20211128200934953.png)]
? 圖14.5 顯示攝像頭視頻某一時刻的圖像
實例14.3除能夠顯示攝像頭視頻某一時刻的圖像外(見圖14.5),還能夠把圖14.5保存為D盤根目錄下的copy.png文件,如圖14.6所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-jHynPLNJ-1639056600125)(OpenCV進階篇01.assets/image-20211128201000098.png)]
? 圖14.6 把圖14.5保存為D盤根目錄下的copy.png
實例14.1~實例14.3打開的都是筆記本內置攝像頭,如果在打開筆記本內置攝像頭的同時,再打開一個連接筆記本的外置攝像頭,應該如何實現呢?
【實例14.4】 讀取并顯示2個攝像頭視頻。
編寫一個程序,在打開筆記本內置攝像頭實時讀取并顯示視頻的同時,再打開一個連接筆記本的外置攝像頭。當按下空格鍵時,關閉筆記本內置攝像頭和連接筆記本的外置攝像頭,銷毀顯示攝像頭視頻的窗口。代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-CsYWK3qB-1639056600125)(OpenCV進階篇01.assets/image-20211128201055804.png)]
上述代碼的運行結果如圖14.7和圖14.8所示。其中,圖14.7是讀取并顯示筆記本內置攝像頭視頻,圖14.8是讀取并顯示連接筆記本的外置攝像頭視頻。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-8rny1w1T-1639056600126)(OpenCV進階篇01.assets/image-20211128201118623.png)]
? 圖14.7 讀取并顯示筆記本內置攝像頭視頻
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-Ut2593Nl-1639056600126)(OpenCV進階篇01.assets/image-20211128201143279.png)]
? 圖14.8 讀取并顯示連接筆記本的外置攝像頭視頻
14.2 播放視頻文件
VideoCapture類及其方法除了能夠讀取并顯示攝像頭視頻外,還能夠讀取并顯示視頻文件。當窗口根據視頻文件的時長顯示視頻文件時,便實現了播放視頻文件的效果。
14.2.1 讀取并顯示視頻文件
VideoCapture類的構造方法VideoCapture()不僅能夠完成攝像頭的初始化工作,還能夠完成視頻文件的初始化工作。當VideoCapture()用于初始化視頻文件時,其語法格式如下:
video = cv2.VideoCapture(filename)
參數說明:
video:要打開的視頻。
filename:打開視頻的文件名。例如,公司宣傳.avi等。
注意
OpenCV中的VideoCapture類雖然支持各種格式的視頻文件,但是這個類在不同的操作系統中,支持的視頻文件格式不同。盡管如此,VideoCapture類能夠在不同的操作系統中支持后綴名為.avi的視頻文件。
【實例14.5】 讀取并顯示視頻文件。
編寫一個程序,讀取并顯示PyCharm當前項目路徑下名為“公司宣傳.avi”的視頻文件。當按Esc鍵時,關閉視頻文件并銷毀顯示視頻文件的窗口,代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-0RujO8DJ-1639056600126)(OpenCV進階篇01.assets/image-20211128201246445.png)]
上述代碼的運行結果如圖14.9所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-8xA2soV1-1639056600131)(OpenCV進階篇01.assets/image-20211128201314133.png)]
圖14.9 讀取并顯示名為“公司宣傳.avi”的視頻文件說明調整waitKey()方法中的參數值可以控制視頻文件的播播放速度。例如,當代碼為cv2.waitKey(1)時,等待用戶按下鍵盤的時間為1ms,視頻文件的播放速度非常快;當代碼為cv2.waitKey(50)時,等待用戶按下鍵盤的時間為50ms,能夠減緩視頻文件的播放速度。
使用處理圖像的相關方法,能夠將攝像頭視頻由彩色視頻轉換為灰度視頻。那么,使用相同的方法,也能夠將視頻文件由彩色視頻轉換為灰度視頻。
【實例14.6】 將視頻文件由彩色視頻轉換為灰度視頻。
編寫一個程序,使用處理圖像的相關方法,先將PyCharm當前項目路徑下名為“公司宣傳.avi”的視頻文件由彩色視頻轉換為灰度視頻,再顯示轉換后的灰度圖像,代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-7OtfFzc2-1639056600132)(OpenCV進階篇01.assets/image-20211128201410162.png)]
上述代碼的運行結果如圖14.10所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-rOwHke9Q-1639056600132)(OpenCV進階篇01.assets/image-20211128201434739.png)]
? 圖14.10 將“公司宣傳.avi”由彩色視頻轉換為灰度視頻
14.2.2 視頻的暫停播放和繼續播放
實例14.5使用VideoCapture類及其相關方法實現了在窗口中播放視頻文件的效果。那么,能否在實例14.5的基礎上,通過按鍵指令,在播放視頻的過程中,實現視頻的暫停播放和繼續播放呢?答案是肯定的。
【實例14.7】 視頻的暫停播放和繼續播放。
編寫一個程序,讀取并顯示PyCharm當前項目路徑下名為“公司宣傳.avi”的視頻文件。在播放視頻文件的過程中,當按空格鍵時,暫停播放視頻;當再次按空格鍵時,繼續播放視頻;當按Esc鍵時,關閉視頻文件并銷毀顯示視頻文件的窗口,代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-dculEzq5-1639056600132)(OpenCV進階篇01.assets/image-20211128201543614.png)]
上述代碼的運行結果如圖14.11和圖14.12所示(其中,圖14.11是暫停播放視頻的效果,圖14.12是繼續播放視頻的效果)。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-4Xw26rsV-1639056600133)(OpenCV進階篇01.assets/image-20211128202037480.png)]
? 圖14.11 暫停播放視頻
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-T7YIJzv5-1639056600133)(OpenCV進階篇01.assets/image-20211128202102795.png)]
? 圖14.12 繼續播放視頻
14.2.3 獲取視頻文件的屬性
在實際開發中,有時需要獲取視頻文件的屬性。為此,VideoCapture類提供了get()方法。get()方法的語法格式如下:
retval = cv2.VideoCapture.get(propId)參數說明:
retval:獲取與propId對應的屬性值。
propId:視頻文件的屬性值。
VideoCapture類提供視頻文件的屬性值及其含義如表14.1所示。
? 表14.1 視頻文件的屬性值及其含義
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-F3Tt5xP9-1639056600133)(OpenCV進階篇01.assets/image-20211128202208827.png)]
說明
(1)視頻是由大量的、連續的圖像構成的,把其中的每一幅圖像稱作一幀。
(2)幀數指的是視頻文件中含有的圖像總數,幀數越多,視頻播放時越流暢。
(3)在播放視頻的過程中,把每秒顯示圖像的數量稱作幀速率(FPS,單位:幀/s)。
(4)幀寬度指的是圖像在水平方向上含有的像素總數。
(5)幀高度指的是圖像在垂直方向上含有的像素總數。
【實例14.8】 獲取并輸出視頻文件的指定屬性值。
編寫一個程序,使用VideoCapture類get()方法,先獲取“公司宣傳.avi”的幀速率、幀數、幀寬度和幀高度,再把上述4個屬性值輸出在PyCharm的控制臺上,代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-CMVvRcmt-1639056600134)(OpenCV進階篇01.assets/image-20211128202243529.png)]
上述代碼的運行結果如圖14.13所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-ZRWvaFvb-1639056600134)(OpenCV進階篇01.assets/image-20211128202327955.png)]
? 圖14.13 獲取并輸出“公司宣傳.avi”的幀速率、幀數、幀寬度和幀高度
實例14.8演示了初始化視頻文件后,獲取并輸出視頻文件的指定屬性值。那么,能否使得窗口在播放視頻的同時,動態顯示當前視頻文件的屬性值呢?例如,當前視頻播放到第幾幀,該幀對應著視頻的第幾秒等。
【實例14.9】 動態顯示視頻文件的屬性值。
編寫一個程序,窗口在播放“公司宣傳.avi”視頻文件的同時,動態顯示當前視頻播放到第幾幀和該幀對應視頻的第幾秒,代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-6WrTj9MW-1639056600134)(OpenCV進階篇01.assets/image-20211128202356380.png)]
上述代碼的運行結果如圖14.14所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-GZcquZ4m-1639056600134)(OpenCV進階篇01.assets/image-20211128202452972.png)]
? 圖14.14 動態顯示視頻文件的屬性值
說明
圖14.14中的185和7.4s的含義是當前視頻播放到第185幀,第185幀對應著“公司宣傳.avi”視頻文件中的第7.4s。
14.3 保存視頻文件
在實際開發過程中,很多時候希望保存一段視頻。為此,OpenCV提供了VideoWriter類。下面先來熟悉一下VideoWriter類中的常用方法。
14.3.1 VideoWriter類
VideoWriter類中的常用方法包括VideoWriter類的構造方法、write()方法和release()方法。其中,VideoWriter類的構造方法用于創建VideoWriter類對象,其語法格式如下:
<VideoWriter object> = cv2.VideoWriter(filename, fourcc, fps, frameSize)參數說明:
VideoWriter object:VideoWriter類對象。
filename:保存視頻時的路徑(含有文件名)。
fourcc:用4個字符表示的視頻編碼格式。
fps:幀速率。
frameSize:每一幀的大小。
在OpenCV中,使用cv2.VideoWriter_fourcc()來確定視頻編碼格式。表14.2列出了幾個常用的視頻編碼格式。
? 表14.2 常用的視頻編碼格式
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-D1BjmSHG-1639056600135)(OpenCV進階篇01.assets/image-20211128202614177.png)]
根據上述內容,即可創建一個VideoWriter類對象。
例如,在Windows操作系統下,fourcc的值為cv2.VideoWriter_fourcc(‘X’, ‘V’, ‘I’, ‘D’),幀速率為20,幀大小為640×480。如果想把一段視頻保存為當前項目路徑下的output.avi,那么就要創建一個VideoWriter類對象output,關鍵代碼如下:
fourcc = cv2.VideoWriter_fourcc('X', 'V', 'I', 'D')output = cv2.VideoWriter("output.avi", fourcc, 20, (640, 480))上述代碼也可以寫作:
fourcc = cv2.VideoWriter_fourcc(* 'XVID')output = cv2.VideoWriter("output.avi", fourcc, 20, (640, 480))為了保存一段視頻,除需要使用VideoWriter類的構造方法外,還需要使用VideoWriter類提供的write()方法。write()方法的作用是在創建好的VideoWriter類對象中寫入讀取到的幀,其語法格式如下:
cv2.VideoWriter.write(frame)參數說明:
frame:讀取到的幀。
注意
使用write()方法時,需要由VideoWriter類對象進行調用。例如,在創建好的VideoWriter類對象output中寫入讀取到的幀frame,關鍵代碼如下:
當不需要使用VideoWriter類對象時,需要將其釋放掉。為此,VideoWriter類提供了release()方法,其語法格式如下:
cv2.VideoWriter.release()
例如,完成保存一段視頻后,需要釋放VideoWriter類對象output。關鍵代碼如下:
14.3.2 如何使用VideoWriter類
使用VideoWriter類保存一段視頻需要經過以下幾個步驟:創建VideoWriter類對象、寫入讀取到的幀、釋放VideoWriter類對象等。而且,這段視頻既可以是攝像頭視頻,也可以是視頻文件。本節將使用VideoWriter類以實例的方式分別對保存攝像頭視頻和保存視頻文件進行講解。
【實例14.10】 保存一段攝像頭視頻。
編寫一個程序,首先打開筆記本內置攝像頭,實時讀取并顯示視頻;然后按Esc鍵,關閉筆記本內置攝像頭,銷毀顯示攝像頭視頻的窗口,并且把從打開攝像頭到關閉攝像頭的這段視頻保存為PyCharm當前項目路徑下的output.avi,代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-TpyezTBT-1639056600135)(OpenCV進階篇01.assets/image-20211128202745833.png)]
說明
在Windows操作系統下,fourcc的值為cv2.VideoWriter_fourcc(‘X’, ‘V’, ‘I’, ‘D’),幀速率為20,幀大小為640×480。
在上述代碼運行的過程中,按Esc鍵后,會在PyCharm當前項目路徑(D:\PyCharm\PythonDevelop)下生成一個名為“output.avi”的視頻文件,如圖14.15所示。雙擊打開D:
PyCharm\PythonDevelop路徑下的“output.avi”視頻文件,即可瀏覽被保存的攝像頭視頻,如圖14.16所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-KYij0Tio-1639056600135)(OpenCV進階篇01.assets/image-20211128202856720.png)]
? 圖14.15 PyCharm當前項目路徑下的output.avi
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-tTjVHUdj-1639056600135)(OpenCV進階篇01.assets/image-20211128202918741.png)]
? 圖14.16 瀏覽被保存的攝像頭視頻說明
這里是使用筆記本內置攝像頭錄制的手機秒表的視頻,讀者可以根據自己的喜好錄制其他視頻。
實例14.10可以重復運行,由于output.avi已經存在于PyCharm當前項目路徑下,因此新生成的output.avi會覆蓋已經存在的output.avi。
從圖14.16中能夠發現,筆者使用筆記本內置攝像頭錄制的視頻時長為26s。也就是說,從打開攝像頭、到關閉攝像頭的這段時間間隔為26s,并且這段時間間隔由是否按Esc鍵決定。那么,能否對這段時間間隔進行設置呢?例如,打開攝像頭并顯示10s的攝像頭視頻?如果能,又該如何編寫具有如此功能的代碼呢?
【實例14.11】 保存一段時長為10s的攝像頭視頻。
編寫一個程序,首先打開筆記本內置攝像頭,實時讀取并顯示視頻;然后錄制一段時長為10s的攝像頭視頻;10s后,自動關閉筆記本內置攝像頭,同時銷毀顯示攝像頭視頻的窗口,并且把這段時長為10s的攝像頭視頻保存為PyCharm當前項目路徑下的ten_Seconds.avi,代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-T7GFATdq-1639056600136)(OpenCV進階篇01.assets/image-20211128203038547.png)]
運行上述代碼10s后,會在PyCharm當前項目路徑下生成一個名為“ten_Seconds.avi”的視頻文件。雙擊打開D:\PyCharm\PythonDevelop路徑下的“ten_Seconds.avi”視頻文件,即可瀏覽被保存的攝像頭視頻,如圖14.17所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-pt90Msfs-1639056600136)(OpenCV進階篇01.assets/image-20211128203057475.png)]
? 圖14.17 瀏覽被保存的、時長為10s的攝像頭視頻
實例14.10和實例14.11演示了如何使用VideoWriter類保存攝像頭視頻。VideoWriter類不僅能保存攝像頭視頻,還能保存視頻文件,而且保存視頻文件與保存攝像頭視頻的步驟是相同的。接下來,仍以實例的方式演示如何使用VideoWriter類保存視頻文件。
【實例14.12】 保存視頻文件。
編寫一個程序,首先讀取PyCharm當前項目路徑下名為“公司宣傳.avi”的視頻文件,然后將“公司宣傳.avi”視頻文件保存為PyCharm當前項目路徑下的copy.avi,代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-mCaAwZTh-1639056600136)(OpenCV進階篇01.assets/image-20211128203126554.png)]
由于要以幀為單位,一邊讀取視頻文件,一邊保存視頻文件,因此運行上述代碼后,PyCharm控制臺沒有立即輸出代碼中的提示信息,如圖14.18所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-5cdqLRfA-1639056600136)(OpenCV進階篇01.assets/image-20211128203221855.png)]
? 圖14.18 PyCharm控制臺沒有立即輸出代碼中的提示信息
大約1min后,會在PyCharm當前項目路徑下生成一個名為“copy.avi”的視頻文件,如圖14.19所示。這時,PyCharm控制臺也將輸出如圖14.20所示的提示信息。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-U2lJ4ljQ-1639056600137)(OpenCV進階篇01.assets/image-20211128203239999.png)]
? 圖14.19 PyCharm當前項目路徑下生成的copy.avi
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-JDHW90we-1639056600137)(OpenCV進階篇01.assets/image-20211128203302454.png)]
? 圖14.20 PyCharm控制臺將輸出提示信息
雙擊打開D:\PyCharm\PythonDevelop路徑下的“copy.avi”視頻文件,即可瀏覽被保存的視頻文件,如圖14.21所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-Cly0iSLz-1639056600137)(OpenCV進階篇01.assets/image-20211128203324502.png)]
? 圖14.21 瀏覽被保存的“copy.avi”視頻文件
從圖14.21中能夠發現,保存后的“copy.avi”視頻文件的時長為49s。那么,能否縮短“copy.avi”視頻文件的時長?例如,只保存“公司宣傳.avi”視頻文件中的前10s視頻?這是可以實現的,實現邏輯與實例14.11是相同的。
【實例14.13】 保存視頻文件中的前10s視頻。
編寫一個程序,首先讀取PyCharm當前項目路徑下名為“公司宣傳.avi”的視頻文件,然后將“公司宣傳.avi”視頻文件中的前10s視頻保存為PyCharm當前項目路徑下的ten_Seconds.avi,代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-ZUcxf5F9-1639056600138)(OpenCV進階篇01.assets/image-20211128203418911.png)]
運行上述代碼10s后,不僅會在PyCharm當前項目路徑下生成一個名為“ten_Seconds.avi”視頻文件,而且會在PyCharm控制臺輸出提示信息。雙擊打開D:\PyCharm\PythonDevelop路徑下的“ten_Seconds.avi”視頻文件,即可瀏覽被保存的視頻文件,如圖14.22所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-8coQjsKg-1639056600138)(OpenCV進階篇01.assets/image-20211128203447064.png)]
? 圖14.22 保存“公司宣傳.avi”視頻文件中的前10s視頻
14.4 小結
視頻是由一系列連續的圖像構成的,這一系列連續的圖像被稱作幀,幀是以固定的時間間隔從視頻中獲取的。因為視頻播放的速度就是獲取幀的速度,所以把視頻播放的速度稱作幀速率,其單位是幀/s(即1s內出現的圖像數)。所謂視頻處理,處理的對象就是從視頻中獲取的幀,而后使用圖像處理的方法對獲取的幀進行處理。OpenCV提供了VideoCapture類和VideoWriter類處理視頻,雖然這2個類在不同的操作系統中支持的視頻文件的格式不同,但是這2個類在不同的操作系統中都支持AVI格式的視頻文件。
第15章 人臉檢測和人臉識別
人臉識別是基于人的臉部特征信息進行身份識別的一種生物識別技術,也是計算機視覺重點發展的技術。機器學習算法誕生之后,計算機可以通過攝像頭等輸入設備自動分析圖像中包含的內容信息,隨著技術的不斷發展,現在已經有了多種人臉識別的算法。本章將介紹OpenCV自帶的多種圖像跟蹤技術和3種人臉識別技術的用法。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-61xijGpt-1639056600138)(OpenCV進階篇01.assets/image-20211128203604892.png)]
15.1 人臉檢測
人臉檢測是讓計算機在一幅畫面中找出人臉的位置。畢竟計算機還達不到人類的智能水平,所以計算機在檢測人臉的過程中實際上是在做“分類”操作,例如,計算機發現圖像中有一些像素組成了眼睛的特征,那這些像素就有可能是“眼睛”;如果“眼睛”旁邊還有“鼻子”和“另一只眼睛”的特征,那這3個元素所在的區域就很有可能是人臉區域;但如果“眼睛”旁邊缺少必要的“鼻子”和“另一只眼睛”,那就認為這些像素并沒有組成人臉,它們不是人臉圖像的一部分。
檢測人臉的算法比較復雜,但OpenCV已經將這些算法封裝好,本節將介紹如何利用OpenCV自帶的功能進行人臉檢測。
15.1.1 級聯分類器
將一系列簡單的分類器按照一定順序級聯到一起就構成了級聯分類器,使用級聯分類器的程序可以通過一系列簡單的判斷來對樣本進行識別。例如,依次滿足“有6條腿”“有翅膀”“有頭、胸、腹”這3個條件的樣本就可以被初步判斷為昆蟲,但如果任何一個條件不滿足,則不會被認為是昆蟲。
OpenCV提供了一些已經訓練好的級聯分類器,這些級聯分類器以XML文件的方式保存在以下路徑中:
...\Python\Lib\site-packages\cv2\data\路徑說明: “…\Python\”:Python虛擬機的本地目錄。 “\Lib\site-packages\”:pip安裝擴展包的默認目錄。 “\cv2\data\”:OpenCV庫的data文件夾。
例如,這里的Python虛擬機安裝在C:\Program Files\Python\目錄下,級聯分類器文件所在的位置如圖15.1所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-TpJmm6jg-1639056600138)(OpenCV進階篇01.assets/image-20211128203651374.png)]
? 圖15.1 OpenCV自帶的級聯分類器XML文件
不同版本的OpenCV自帶的級聯分類器XML文件可能會有差別,data文件夾中缺少的XML文件可以到OpenCV的源碼托管平臺下載,地址為:https://github.com/opencv/opencv/tree/master/data/haarcascades。
每一個XML文件都對應一種級聯分類器,但有些級聯分類器的功能是類似的(正面人臉識別分類器就有3個),表15.1是部分XML文件對應的功能,
? 表15.1 部分級聯分類器XML的功能
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-XYP1IBib-1639056600139)(OpenCV進階篇01.assets/image-20211128203757228.png)]
想要實現哪種圖像檢測,就要在程序啟動時加載對應的級聯分類器。下一節將介紹如何加載并使用這些XML文件。
15.1.2 方法
OpenCV實現人臉檢測需要做兩步操作:加載級聯分類器和使用分類器識別圖像。這兩步操作都有對應的方法。
首先是加載級聯分類器,OpenCV通過CascadeClassifier()方法創建了分類器對象,其語法如下:
參數說明:
filename:級聯分類器的XML文件名。
返回值說明:
object:分類器對象。
然后使用已經創建好的分類器對圖像進行識別,這個過程需要調用分類器對象的detectMultiScale()方法,其語法如下:
對象說明:
cascade:已有的分類器對象。
參數說明:
image:待分析的圖像
scaleFactor:可選參數,掃描圖像時的縮放比例。
minNeighbors:可選參數,每個候選區域至少保留多少個檢測結果才可以判定為人臉。該值越大,分析的誤差越小。
flags:可選參數,舊版本OpenCV的參數,建議使用默認值。
minSize:可選參數,最小的目標尺寸。
maxSize:可選參數,最大的目標尺寸。
返回值說明:
objects:捕捉到的目標區域數組,數組中每一個元素都是一個目標區域,每一個目標區域都包含4個值,分別是:左上角點橫坐標、左上角點縱坐標、區域寬、區域高。object的格式為:[[244 203 111 111] [432 81 133 133]]。
下一節將介紹如何在程序中使用這2個方法。
15.1.3 分析人臉位置
haarcascade_frontalface_default.xml是檢測正面人臉的級聯分類器文件,加載該文件就可以創建出追蹤正面人臉的分類器,調用分類器對象的detectMultiScale()方法,得到的objects結果就是分析得出的人臉區域的坐標、寬和高。下面通過一個實例介紹如何實現此功能。【實例15.1】 在圖像的人臉位置繪制紅框。
將haarcascade_frontalface_default.xml文件放到項目根目錄下的cascades文件夾中,加載此級聯分類器之后,檢測出所有可能是人臉的區域,通過for循環在這些區域上繪制紅色邊框,具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-QZfLofZT-1639056600139)(OpenCV進階篇01.assets/image-20211128203902576.png)]
上述代碼的運行結果如圖15.2所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-WJgxYeFT-1639056600139)(OpenCV進階篇01.assets/image-20211128203949284.png)]
? 圖15.2 檢測出的人臉位置
【實例15.2】 戴墨鏡特效。
手機拍照軟件自帶各種各樣的貼圖特效,實際上這些貼圖特效就是先定位了人臉位置,然后在人臉相應位置覆蓋素材實現的。OpenCV也可以實現此類功能,例如為人臉添加戴墨鏡的特效,需要執行以下3個步驟:
(1)編寫一個覆蓋圖片的overlay_img()方法。因為素材中可能包含透明像素,這些透明像素不可以遮擋人臉,所以在覆蓋背景圖像時要做判斷,忽略所有透明像素。判斷一個像素是否為透明像素,只需將圖像從3通道轉為4通道,判斷第4通道的alpha值,alpha值為1表示完全不透明,0表示完全透明。
(2)創建人臉識別級聯分類器,分析圖像中人臉的區域。
(3)把墨鏡圖像按照人臉寬度進行縮放,并覆蓋到人臉區域約1/3的位置。
實現以上功能的具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-Fi4CEBd2-1639056600139)(OpenCV進階篇01.assets/image-20211128204015841.png)]
上述代碼的運行效果如圖15.3所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-cJSiaiWc-1639056600140)(OpenCV進階篇01.assets/image-20211128204055080.png)]
? 圖15.3 戴墨鏡特效
15.2 檢測其他內容
OpenCV提供的級聯分類器除了可以識別人臉以外,還可以識別一些其他具有明顯特征的物體,如眼睛、行人等。本節將介紹幾個OpenCV自帶的級聯分類器的用法。
15.2.1 眼睛檢測
haarcascade_eye.xml是檢測眼睛的級聯分類器文件,加載該文件就可以追蹤眼睛的分類器,下面通過一個實例來介紹如何實現此功能。【實例15.3】 在圖像的眼睛位置繪制紅框。
將haarcascade_eye.xml文件放到項目根目錄下的cascades文件夾中,加載此級聯分類器之后,檢測出所有可能是眼睛的區域,通過for循環在這些區域上繪制紅色邊框,具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-gfP6GF7b-1639056600140)(OpenCV進階篇01.assets/image-20211128204131328.png)]
上述代碼的運行結果如圖15.4所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-PSlrFOlX-1639056600140)(OpenCV進階篇01.assets/image-20211128204151205.png)]
? 圖15.4 檢測出的眼睛位置
15.2.2 貓臉檢測
OpenCV還提供了2個訓練好的檢測貓臉的級聯分類器,分別是haarcascade_frontalcatface.xml和haarcascade_frontalcatface_extended.xml,前者的判斷標準比較高,較為精確,但可能有些貓臉識別不出來;后者的判斷標準比較低,只要類似貓臉就會被認為是貓臉。使用貓臉分類器不僅可以判斷貓臉的位置,還可以識別圖像中有幾只貓。
下面通過一個實例來介紹如何實現此功能。
【實例15.4】 在圖像里找到貓臉的位置。
為了得到比較理想的檢測結果,建議使用haarcascade_frontalcatface_extended.xml。將haarcascade_frontalcatface_extended.xml文件放到項目根目錄下的cascades文件夾中,加載此級聯分類器之后,檢測出所有可能是貓臉的區域,通過for循環在這些區域上繪制紅色邊框,具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-p4Q1akwE-1639056600141)(OpenCV進階篇01.assets/image-20211128204247078.png)]
上述代碼的運行結果如圖15.5所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-eA7THiMr-1639056600141)(OpenCV進階篇01.assets/image-20211128204308682.png)]
? 圖15.5 檢測出貓臉的位置
15.2.3 行人檢測
haarcascade_fullbody.xml是檢測人體(正面直立全身或背面直立全身)的級聯分類器文件,加載該文件就可以追蹤人體的分類器,下面通過一個實例介紹如何實現此功能。
【實例15.5】 在圖像中找到行人的位置。
將haarcascade_fullbody.xml文件放到項目根目錄下的cascades文件夾中,加載此級聯分類器之后,檢測出所有可能是人形的區域,通過for循環在這些區域上繪制紅色邊框,具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-9Kbv4N0m-1639056600141)(OpenCV進階篇01.assets/image-20211128204421178.png)]
上述代碼的運行結果如圖15.6所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-JkjW6lM9-1639056600141)(OpenCV進階篇01.assets/image-20211128204440594.png)]
? 圖15.6 檢測出的行人位置
15.2.4 車牌檢測
haarcascade_russian_plate_number.xml是檢測汽車車牌的級聯分類器文件,加載該文件就可以追蹤圖像中的車牌,下面通過一個實例來介紹如何實現此功能。
【實例15.6】 標記圖像中車牌的位置。
將haarcascade_russian_plate_number.xml文件放到項目根目錄下的cascades文件夾中,加載此級聯分類器之后,檢測出所有可能是車牌的區域,通過for循環在這些區域上繪制紅色邊框,具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-HJT0G7zG-1639056600142)(OpenCV進階篇01.assets/image-20211128204518734.png)]
上述代碼的運行結果如圖15.7所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-3AGDpozV-1639056600142)(OpenCV進階篇01.assets/image-20211128204601073.png)]
? 圖15.7 檢測出的車牌位置
15.3 人臉識別
OpenCV提供了3種人臉識別方法,分別是Eigenfaces、Fisherfaces和LBPH。這3種方法都是通過對比樣本的特征最終實現人臉識別。因為這3種算法提取特征的方式不一樣,側重點不同,所以不能分出孰優孰劣,只能說每種方法都有各自的識別風格。
OpenCV為每一種人臉識別方法都提供了創建識別器、訓練識別器和識別3種方法,這3種方法的語法非常相似。本節將簡單介紹如何使用這些方法。
15.3.1 Eigenfaces人臉識別器
Eigenfaces也叫作“特征臉”。Eigenfaces通過PCA(主成分分析)方法將人臉數據轉換到另外一個空間維度做相似性計算。在計算過程中,算法可以忽略一些無關緊要的數據,僅識別一些具有代表性的特征數據,最后根據這些特征識別人臉。
開發者需要通過以下3種方法完成人臉識別操作。
(1)通過cv2.face.EigenFaceRecognizer_create()方法創建Eigenfaces人臉識別器,其語法如下:
參數說明:
num_components:可選參數,PCA方法中保留的分量個數,建議使用默認值。
threshold:可選參數,人臉識別時使用的閾值,建議使用默認值。
返回值說明:
recognizer:創建的Eigenfaces人臉識別器對象。
(2)創建識別器對象后,需要通過對象的train()方法訓練識別器。建議每個人都給出2幅以上的人臉圖像作為訓練樣本。train()方法的語法如下:
recognizer.train(src, labels)對象說明:
recognizer:已有的Eigenfaces人臉識別器對象。
參數說明:
src:用來訓練的人臉圖像樣本列表,格式為list。樣本圖像必須寬、高一致。
labels:樣本對應的標簽,格式為數組,元素類型為整數。數組長度必須與樣本列表長度相同。樣本與標簽按照插入順序一一對應。
(3)訓練識別器后可以通過識別器的predict()方法識別人臉,該方法對比樣本的特征,給出最相近的結果和評分,其語法如下:
對象說明:
recognizer:已有的Eigenfaces人臉識別器對象。
參數說明:
src:需要識別的人臉圖像,該圖像寬、高必須與樣本一致。
返回值說明:
label:與樣本匹配程度最高的標簽值。
confidence:匹配程度最高的信用度評分。評分小于5000匹配程度較高,0分表示2幅圖像完全一樣。
下面通過一個實例來演示Eigenfaces人臉識別器的用法。
【實例15.7】 使用Eigenfaces識別人臉。
現以兩個人的照片作為訓練樣本,第一個人的照片如圖15.8~圖15.10所示,第二個人的照片如圖15.11~圖15.13所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-iECdDaVw-1639056600142)(OpenCV進階篇01.assets/image-20211128204741974.png)]
? 圖15.8 Summer 1
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-sxw1keLJ-1639056600142)(OpenCV進階篇01.assets/image-20211128204805362.png)]
? 圖15.9 Summer 2
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-mEzTNsvY-1639056600144)(OpenCV進階篇01.assets/image-20211128204824476.png)]
? 圖15.10 Summer 3
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-wHdp9ObP-1639056600145)(OpenCV進階篇01.assets/image-20211128204847564.png)]
? 圖15.11 Elvis 1
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-xoAsLaYC-1639056600145)(OpenCV進階篇01.assets/image-20211128204943018.png)]
? 圖15.12 Elvis 2
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-LFfkWZkZ-1639056600145)(OpenCV進階篇01.assets/image-20211128205000900.png)]
? 圖15.13 Elvis 3
待識別的照片如圖15.14所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-A3At0MQV-1639056600145)(OpenCV進階篇01.assets/image-20211128205024760.png)]
? 圖15.14 待識別照片
創建Eigenfaces人臉識別器對象,訓練以上樣本后,判斷圖15.13所示是哪一個人,具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-ebySwVQ2-1639056600146)(OpenCV進階篇01.assets/image-20211128205102240.png)]
上述代碼的運行結果如下:
confidence = 18669.728291380223Summer程序對比樣本特征分析得出,被識別的人物特征最接近的是Summer。
15.3.2 Fisherfaces人臉識別器
Fisherfaces是由Ronald Fisher最早提出的,這也是Fisherfaces名字的由來。Fisherfaces通過LDA(線性判別分析技術)方法將人臉數據轉換到另外一個空間維度做投影計算,最后根據不同人臉數據的投影距離判斷其相似度。
開發者需要通過以下3種方法完成人臉識別操作。
(1)通過cv2.face.FisherFaceRecognizer_create()方法創建Fisherfaces人臉識別器,其語法如下:
參數說明:
num_components:可選參數,通過Fisherface方法進行判斷分析時保留的分量個數,建議使用默認值。
threshold:可選參數,人臉識別時使用的閾值,建議使用默認值。
返回值說明:
recognizer:創建的Fisherfaces人臉識別器對象。
(2)創建識別器對象后,需通過對象的train()方法訓練識別器。建議每個人都給出2幅以上的人臉圖像作為訓練樣本。train()方法的語法如下:
對象說明:
recognizer:已有的Fisherfaces人臉識別器對象。
參數說明:
src:用來訓練的人臉圖像樣本列表,格式為list。樣本圖像必須寬、高一致。
labels:樣本對應的標簽,格式為數組,元素類型為整數。數組長度必須與樣本列表長度相同。樣本與標簽按照插入順序一一對應。
(3)訓練識別器后可以通過識別器的predict()方法識別人臉,該方法對比樣本的特征,給出最相近的結果和評分,其語法如下:
label, confidence = recognizer.predict(src)對象說明:
recognizer:已有的Fisherfaces人臉識別器對象。
參數說明:
src:需要識別的人臉圖像,該圖像寬、高必須與樣本一致。
返回值說明:
label:與樣本匹配程度最高的標簽值。
confidence:匹配程度最高的信用度評分。評分小于5000程度較高,0分表示2幅圖像完全一樣。
下面通過一個實例演示Fisherfaces人臉識別器的用法。
【實例15.8】 使用Fisherfaces識別人臉。
現以2個人的照片作為訓練樣本,第一個人的照片如圖15.15~圖15.17所示,第二個人的照片如圖15.18~圖15.20所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-MqOOL3ZG-1639056600146)(OpenCV進階篇01.assets/image-20211128205304341.png)]
? 圖15.15 Mike 1
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-fD0p7MfX-1639056600146)(OpenCV進階篇01.assets/image-20211128205346389.png)]
? 圖15.16 Mike 2
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-z68Kgd8h-1639056600146)(OpenCV進階篇01.assets/image-20211128205403358.png)]
? 圖15.17 Mike 3
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-Ks2JfSMO-1639056600147)(OpenCV進階篇01.assets/image-20211128205425662.png)]
? 圖15.18 KaiKai 1
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-yU9rs4qz-1639056600147)(OpenCV進階篇01.assets/image-20211128205446503.png)]
? 圖15.19 KaiKai 2
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-mKhOVEVm-1639056600147)(OpenCV進階篇01.assets/image-20211128205509193.png)]
? 圖15.20 KaiKai 3
待識別的照片如圖15.21所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-j5lfyJm0-1639056600147)(OpenCV進階篇01.assets/image-20211128205529188.png)]
? 圖15.21 待識別照片
創建Fisherfaces人臉識別器對象,訓練以上樣本后,判斷圖15.21是哪一個人,具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-2K5HBRcj-1639056600148)(OpenCV進階篇01.assets/image-20211128205614870.png)]
上述代碼的運行結果如下:
confidence = 2327.170867892041Mike程序對比樣本特征分析得出,被識別的人物特征最接近的是KaiKai。
15.3.3 Local Binary Pattern Histogram人臉識別器
Local Binary Pattern Histogram簡稱LBPH,即局部二進制模式直方圖,這是一種基于局部二進制模式算法,這種算法善于捕獲局部紋理特征。
開發者需要通過以下3種方法來完成人臉識別操作。
(1)通過cv2.face. LBPHFaceRecognizer_create()方法創建LBPH人臉識別器,其語法如下:
recognizer = cv2.face.LBPHFaceRecognizer_create(radius, neighbors, grid_x, grid_y, threshold)參數說明:
radius:可選參數,圓形局部二進制模式的半徑,建議使用默認值。
neighbors:可選參數,圓形局部二進制模式的采樣點數目,建議使用默認值。
返回值說明:
grid_x:可選參數,水平方向上的單元格數,建議使用默認值。
grid_y:可選參數,垂直方向上的單元格數,建議使用默認值。
threshold:可選參數,人臉識別時使用的閾值,建議使用默認值。
(2)創建識別器對象后,需要通過對象的train()方法訓練識別器。建議每個人都給出2幅以上的人臉圖像作為訓練樣本。train()方法的語法如下:
recognizer.train(src, labels)對象說明:
recognizer:已有的LBPH人臉識別器對象。
參數說明:
src:用來訓練的人臉圖像樣本列表,格式為list。樣本圖像必須寬、高一致。
labels:樣本對應的標簽,格式為數組,元素類型為整數。數組長度必須與樣本列表長度相同。樣本與標簽按照插入順序一一對應。
(3)訓練識別器后就可以通過識別器的predict()方法識別人臉,該方法對比樣本的特征,給出最相近的結果和評分,其語法如下:
label, confidence = recognizer.predict(src)對象說明:
recognizer:已有的LBPH人臉識別器對象。
參數說明:
src:需要識別的人臉圖像,該圖像寬、高必須與樣本一致。
返回值說明:
label:與樣本匹配程度最高的標簽值。
confidence:匹配程度最高的信用度評分。評分小于50匹配程度較高,0分表示2幅圖像完全一樣。
下面通過一個實例來演示LBPH人臉識別器的用法。
【實例15.9】 使用LBPH識別人臉。
現以2個人的照片作為訓練樣本,第一個人的照片如圖15.22~圖15.24所示,第二個人的照片如圖15.25~圖15.27所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-u1IaYb3Z-1639056600148)(OpenCV進階篇01.assets/image-20211128205807097.png)]
? 圖15.22 lxe 1
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-z07uWpmp-1639056600148)(OpenCV進階篇01.assets/image-20211128205827725.png)]
? 圖15.23 lxe 2
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-ut9gAr3g-1639056600148)(OpenCV進階篇01.assets/image-20211128205853204.png)]
? 圖15.24 lxe 3
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-oGZIVUbG-1639056600149)(OpenCV進階篇01.assets/image-20211128205910674.png)]
? 圖15.25 RuiRui 1
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-rRf0oFFj-1639056600149)(OpenCV進階篇01.assets/image-20211128205956685.png)]
? 圖15.26 RuiRui 2
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-auO4l6Tq-1639056600149)(OpenCV進階篇01.assets/image-20211128210013982.png)]
? 圖15.27 RuiRui 3
待識別的照片如圖15.28所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-DvKB4tRS-1639056600149)(OpenCV進階篇01.assets/image-20211128210039659.png)]
? 圖15.28 待識別照片
創建LBPH人臉識別器對象,訓練以上樣本之后,判斷圖15.27是哪一個人,具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-lkJPhXra-1639056600150)(OpenCV進階篇01.assets/image-20211128210105190.png)]
上述代碼的運行結果如下:
confidence = 45.082326535640014RuiRui程序對比樣本特征分析得出,被識別的人物特征最接近的是RuiRui。
15.4 小結
人臉檢測和人臉識別是相輔相成的,這是因為在進行人臉識別前,要先判斷當前圖像內是否出現了人臉,這個判斷過程需要由人臉檢測完成。只有在當前圖像內檢測到人臉,才能判斷出這張人臉屬于哪個人,這個判斷是由人臉識別器完成的。因此,人臉識別指的是程序先在圖像內檢測人臉,再識別這張人臉屬于哪個人的過程。本章講解了3種人臉識別器,讀者要熟練掌握這3種人臉識別器的實現方法和實現原理。
第16章 MR智能視頻打卡系統
很多公司都使用打卡機或打卡軟件進行考勤。傳統的打卡方式包括點名、簽字、刷卡和指紋等。隨著技術的不斷發展,計算機視覺技術越來越強大,已經可以實現人臉打卡功能。打卡軟件通過攝像頭掃描人臉特征,利用人臉的差異識別人員。人臉打卡的準確性不輸于指紋打卡,甚至安全性和便捷性都高于指紋打卡。本章將介紹一個由Python OpenCV開發的智能視頻打卡系統。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-AF8PpIXz-1639056600150)(OpenCV進階篇01.assets/image-20211128210226814.png)]
16.1 需求分析
打卡系統有3個核心功能:錄入打卡人的資料、員工打卡和查看打卡記錄,在滿足核心功能的基礎上需要完善一些附加功能和功能細節。在開發MR智能視頻打卡系統前,先對本系統的一些需求進行如下拆解和分析。
1.數據模型
本系統不使用第三方數據庫,所有數據都以文本的形式保存在文件中,因此要規范數據內容和格式,建立統一模型。
若把軟件的使用者設定為“公司”,那么打卡者身份可設定為“員工”,程序中數據模型就應該是員工數據類。
每一位員工都有姓名,“姓名”就作為員工類中必備的數據之一。
因為員工可能會重名,所以必須使用另一種標記作為員工身份的認證,即為每一位員工添加不重復的員工編號。員工編號的格式為從1開始遞增數字,每添加一位新員工,員工編號就+1。員工類中添加“員工編號”。
系統中必須保存所有員工的照片用于人臉識別。為了區分每位員工的照片文件,程序使用“員工特征碼+隨機值.png”的規則為照片文件命名。如果使用員工編號作為特征碼,1號員工和11號員工的文件名容易發生混淆,所以特征碼不能使用員工編號,而是一種長度一致、復雜性高、不重復的字符串。員工類中添加“特征碼”。
員工與編號、姓名、特征碼是一對一的關系,但員工與打卡記錄是一對多的關系,所以打卡記錄可以放在員工類中保存,而不是單獨保存在打卡記錄模型中。打卡記錄需要記錄每一位員工的具體打卡時間,并能以報表的形式體現。可以使用字段保存打卡記錄模型,員工姓名作為key,該員工的打卡記錄列表作為value。
2.打卡功能
人臉打卡依賴于人臉識別功能。本程序可以使用OpenCV提供的人臉識別器實現此功能,建議使用正確率較高的LBPH識別器,其他識別器也可以考慮,但需要做好測試驗證。
系統通過拍照保存員工的照片樣本。當員工面對攝像頭時,按Enter鍵就可以生成一張正面特寫照片文件。為了增加識別準確率,每位員工應拍3張照片,也就是按3次Enter鍵才能完成錄入操作。
OpenCV提供的人臉識別器有一個缺陷:必須比對2種不同樣本才能進行判斷。如果公司第一次使用打卡系統,系統中沒有錄入任何員工,缺少比對樣本,OpenCV提供的人臉識別器就會報錯。因此本系統應該給出幾個無人臉的默認樣本,保證即使只錄入一個員工,該員工也能順利打卡。
每次員工打卡成功后,都應該記錄該員工的打卡時間,然后保存到文件中。
3.數據維護
數據維護總結起來就是增、刪、改、查4種操作。簡化版的打卡系統可以忽略“改”的操作,由先刪除,再新增的方式代替。
本系統除了提供錄入新員工的功能之外,也提供刪除已有員工的功能。刪除員工之前應輸入驗證碼進行驗證,以防用戶操作失誤,誤刪重要數據。確認執行刪除操作后,不僅要刪除員工的信息,也要同時刪除員工的打卡記錄和照片文件。完成刪除操作后,所有數據文件中不再存有被刪員工的任何數據。
4.考勤報表
每個公司的考勤制度都不同,很多公司都主動設置s“上班時間”和“下班時間”來做考勤的標準。員工要在“上班時間”之前打卡才算正常到崗,在“下班時間”之后打卡才算正常離崗。未在規定時間內打卡的情況屬于“打卡異常”,“打卡異常”通常分為3種情況:遲到、早退或缺席(或缺勤)。
本系統分析每一位員工在某一天的打卡記錄,如果該員工在“上班時間”前和“下班時間”后都有打卡記錄,則認為該員工當天全勤,該員工當天的其他打卡記錄會被忽略。但如果該員工在“上班時間”前未能打卡,而是在“上班時間”后到中午12點前打卡,這種情況被視為遲到。如果該員工在“下班時間”后未能打卡,而是在中午12點之后到“下班時間”前打卡,這種情況被視為早退。當天沒有打卡記錄被視為缺席。
16.2 系統設計
16.2.1 開發環境
本系統開發使用的環境如下:
Python版本:3.8.2
OpenCV版本:4.2.0
numpy版本:1.18.1
IED:PyCharm 2019.3.3 (Community Edition)
操作系統:Windows 7/Windows 10
16.2.2 功能結構
MR智能視頻打卡系統的功能結構如圖16.1所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-O9pV9M7R-1639056600150)(OpenCV進階篇01.assets/image-20211128210408201.png)]
? 圖16.1 功能結構
16.2.3 業務流程
MR智能視頻打卡系統的總體業務流程如圖16.2所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-6BybXRQJ-1639056600150)(OpenCV進階篇01.assets/image-20211128210435530.png)]
? 圖16.2 總體業務流程
打卡功能業務流程如圖16.3所示。
查看記錄功能業務流程如圖16.4所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-JF5XYgoi-1639056600151)(OpenCV進階篇01.assets/image-20211128210456043.png)]
? 圖16.3 打卡功能的業務流程
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-1MOSll7F-1639056600151)(OpenCV進階篇01.assets/image-20211128210539359.png)]
? 圖16.4 查看記錄功能的業務流程
員工管理功能業務流程如圖16.5所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-sCO8tmjW-1639056600151)(OpenCV進階篇01.assets/image-20211128210604201.png)]
? 圖16.5 員工管理功能的業務流程
考勤報表功能業務流程如圖16.6所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-vPysFV37-1639056600152)(OpenCV進階篇01.assets/image-20211128210648098.png)]
? 圖16.6 考勤報表功能的業務流程
員工管理、查看記錄和考勤報表這3個功能中都涉及權限管理業務。如果用戶要使用這3個功能,需要登錄管理員賬號,只有登錄成功后才有權使用。權限管理業務流程如圖16.7所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-xiYgrT7E-1639056600152)(OpenCV進階篇01.assets/image-20211128210720411.png)]
? 圖16.7 權限管理業務流程
16.2.4 項目結構
MR智能視頻打卡系統的項目結構如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-VQbSsmUZ-1639056600152)(OpenCV進階篇01.assets/image-20211128210741943.png)]
16.3 文件系統設計
本程序沒有使用任何數據庫保存數據,而是采用直接讀寫文件的方式來保存數據。項目中的所有數據文件都保存在data文件夾中。
程序使用的數據文件及文件夾信息如表16.1所示。
? 表16.1 程序使用的數據文件及文件夾信息
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-MIQ2aYAG-1639056600152)(OpenCV進階篇01.assets/image-20211128210902635.png)]
下面詳細介紹每種數據文件的內容格式。
(1)employee_data.txt文件以字符串的形式保存所有員工的數據,數據之間用英文逗號隔開,一行保存一個員工。其格式如下:
例如,employee_data.txt文件保存的實際內容可能如下:
1,張三,5263802,李四,5710963,王五,381609(2)lock_record.txt文件以字符串的形式保存數據,數據格式為打卡記錄字典的字符串內容,其格式如下:
{姓名a: [日期list], 姓名b: [日期list], ... , 姓名n:[日期list]}例如,lock_record.txt文件保存的實際內容可能如下:
{‘張三’: [‘2020-04-15 14:59:54’], ‘李四’: [‘2020-04-15 15:02:08’], ‘王五’: [‘2020-04-15 15:11:02’, ‘2020-04-15
15:35:49’]}
(3)work_time.txt文件以字符串的形式保存數據,其格式如下:
前一個時間為上班時間,后一個時間為下班時間,格式均為%H:%M:%S。系統以這2個時間為標準判斷員工是否出現遲到、早退。
(4)user_password.txt文件以字符串的形式保存數據,數據格式為管理員賬號密碼字典的字符串內容,其格式如下:
例如,user_password.txt文件保存的實際內容可能如下:
{'mr': 'mrsoft', '123456': '123456'}用戶可以在這個文件中手動修改管理員賬號和密碼。
(5)/data/face/文件夾下保存的是所有員工的照片文件,格式為PNG。每張照片的大小都是640×480。每名員工需保存3張照片。
該文件夾下還有2個默認的圖像文件,文件名分別為1000000000.png和2000000000.png。這是2幅純色圖像,用于輔助訓練人臉識別器。
人臉識別器使用樣本進行訓練時,至少要有2個以上的標簽分類。如果程序中僅保存了一位員工的照片,人臉識別器無法拿此員工照片與其他樣本做對比,人臉識別器就會報錯,此時2幅默認圖像文件就充當了對比樣本,以防止人臉識別器無法完成訓練。當程序錄入了足夠多的員工信息后,這2幅默認圖像雖然喪失了功能,但也不會影響識別器的識別能力。
16.4 數據實體模塊設計
entity包下的organizations.py文件用于封裝數據模型。該文件中設計了員工類,并提供一些維護數據的方法。接下來將詳細介紹organizations.py中的代碼。
1.構建員工類
創建Employee類作為員工類,并創建包含3個參數的構造方法。3個參數分別是員工編號、員工姓名和員工特征碼。員工類將作為系統的最重要的數據模型,以對象的方式保存每一位員工的信息。
員工類的代碼如下(代碼位置:資源包\TM\sl\16\clock\entity\organizations.py):
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-QQx8nkgH-1639056600153)(OpenCV進階篇01.assets/image-20211128211042060.png)]
2.全局變量
organizations.py中的全局變量較多,主要用來當作系統緩存保存所有數據。這些全局代碼包括:
LOCK_RECORD 實時保存員工的打卡記錄。
EMPLOYEES 實時保存所有員工信息。
MAX_ID 記錄當前最大ID,可在錄入新員工時,為新員工分配新ID。
CODE_LEN 開發者可以通過修改CODE_LEN的值來控制員工特征碼的長度,默認長度為6位。
WORK_TIME 上班時間,用來判斷員工打卡情況。程序啟動時由IO流模塊為其賦值。
CLOSING_TIME 下班時間,功能同WORK_TIME。
USERS 系統所有管理員的賬號和密碼字典,用于校驗用戶輸入的管理員賬號和密碼。
這些全局代碼如下
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-pNBeFauM-1639056600153)(OpenCV進階篇01.assets/image-20211128211155281.png)]
3.增刪員工
organizations.py提供了添加新員工和刪除員工的方法,其他模塊需要調用這些方法來進行增刪操作,不應直接修改EMPLOYEES列表中的數據。
add()方法用于向組織中增加新員工,因為不需要對數據做校驗,所以方法中的代碼非常少。該方法代碼如下:
remove()方法用于刪除組織中的員工,參數為員工編號。方法遍歷員工列表,找到該員工之后,將該員工刪除,如果該員工有過打卡記錄,同時將其打卡記錄刪除,該方法代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-TH0LIhit-1639056600153)(OpenCV進階篇01.assets/image-20211128211222751.png)]
4.分配ID
員工編號是員工的唯一標識,有新員工加入時,應為其分配最新編號。
get_new_id()方法用于生成新員工編號,其生成規則為“當前最大的員工編號+1”,這樣可以保證所有編號都不重復,該方法代碼如下):
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-EmXA5YeM-1639056600153)(OpenCV進階篇01.assets/image-20211128211305025.png)]
16.5 工具模塊設計
本系統的工具模塊包含3個文件:public_tools.py、io_tools.py和camera.py。本節將詳細介紹這3個文件中的代碼。
16.5.1 公共工具模塊
uitl文件夾下的public_tools.py就是本程序的公共工具模塊,該模塊提供了以下功能。 生成隨機數和隨機特征碼。 校驗時間字符串格式。
下面詳細介紹public_tools.py中的代碼。
1.導入模塊
公共工具涉及隨機數和日期格式,所以導入random和datetime兩個服務模塊。生成隨機特征碼需要通過organizations.py獲取特征碼長度,所以也要導入數據實體模塊,代碼如下:
特征碼、照片文件名和驗證碼都用到了隨機數,公共工具模塊提供了一個生成指定位數數字的randomNumber()方法,其參數就是數字的位數。例如,參數為4,生成的參數就是4位數,且不會以0開頭。該方法最后返回的是字符串類。
randomNumber()方法的具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-hdI6LOsQ-1639056600154)(OpenCV進階篇01.assets/image-20211128211436263.png)]
特征碼實際上是長度固定的隨機碼,特征碼的程度保存在數據實體模塊的CODE_LEN變量中,可以直接調用randomNumber(CODE_LEN)創建特征碼。特征碼最好保持6位以上,這樣才能降低特征碼重復的概率。
randomCode()就是生成特征碼的方法,該方法代碼如下# 隨機生成與特征碼長度相等的數字
def randomCode():
return randomNumber(o.CODE_LEN) # 特征碼的長度
3.校驗時間格式
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-bMk9If3u-1639056600154)(OpenCV進階篇01.assets/image-20211128211533748.png)]
16.5.2 IO流模塊
uitl文件夾下的io_tools.py是本程序的IO流工具模塊,該模塊提供了以下功能。
封裝所有對文件的讀寫操作,包括加載員工信息、加載打卡記錄、加載照片文件、刪除員工信息、刪除打卡記錄等。 文件自檢功能。 創建CSV文件。
下面詳細介紹io_tools.py中的代碼。
1.導入模塊
IO流工具將文件中的數據保存到數據實體模塊中,需導入os模塊和organizations.py文件。因為刪除圖片需要員工特征碼,所以需要人事服務模塊提供相關功能,代碼如下:
2.全局變量
全局變量中保存了各個數據文件配置,包含文件路徑、文件名和照片的寬和高。這里使用了os模塊提供的os.getcwd()方法來獲取項目根目錄。全局變量的代碼如下(代碼位置:資源包\TM\sl\16\clock\util\io_tools.py):
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-IKXPHmeu-1639056600154)(OpenCV進階篇01.assets/image-20211128211636692.png)]
3.文件自檢方法
為了防止用戶誤刪數據文件而導致程序無法正常運行,公共工具模塊提供了checking_data_files()文件自檢方法。該方法在程序啟動時執行,然后自動檢查所有數據文件的狀態,如果發現丟失文件(或文件夾),就會自動創建新的空數據文件(或文件夾)。該方法代碼如下(代碼位置:資源包\TM\sl\16\clock\util\io_tools.py):
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-MDetmbz7-1639056600155)(OpenCV進階篇01.assets/image-20211128211707043.png)]
4.從文件中加載數據。
本系統中的所有數據都保存在文本文件中,當程序啟動時,需要加載所有數據,包括員工信息、員工打卡記錄和員工照片。這3類數據都有各自的加載方法。
load_employee_info()是加載員工信息的方法,該方法讀取全局變量指定的員工信息文件,將文件中的內容逐行讀取,然后通過英文逗號分隔,根據分隔出的數據創建員工對象,最后把員工對象保存在員工列表中。這樣就完成了員工信息的加載。
在讀取員工數據的同時,該方法也會記錄出現過的最大員工編號,并將最大員工編號賦值給數據實體模塊。
load_employee_info()方法的具體代碼如下(代碼位置:資源包\TM\sl\16\clock\util\io_tools.py):
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-XrfZXnz6-1639056600156)(OpenCV進階篇01.assets/image-20211128211741820.png)]
load_lock_record()是加載員工打卡記錄的方法。該方法讀取全局變量指定的打卡記錄文件,因為文件保存的是打卡記錄字典的字符串內容,所以直接將文件中所有文本讀出,然后轉換成字典類型,最后將轉換后的字典對象直接賦值數據實體模塊即可。
load_lock_record()方法的具體代碼如下(代碼位置:資源包\TM\sl\16\clock\util\io_tools.py):
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-LA6Zg5GY-1639056600156)(OpenCV進階篇01.assets/image-20211128211758371.png)]
load_employee_pic()是加載員工照片文件的方法,該方法首先遍歷全局變量指定的照片文件夾,讀取每一張照片文件并封裝成OpenCV中的圖像對象,然后從文件名中截取特征碼,將特征碼作為人臉識別的標簽,最后將圖像、標簽統一提交人臉識別器進行訓練。load_employee_pic()方法的具體代碼如下(代碼位置:資源包\TM\sl\16\clock\util\io_tools.py):
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-S1NTIKgW-1639056600156)(OpenCV進階篇01.assets/image-20211128211819740.png)]
load_work_time_config()是上下班時間配置文件的方法。因為配置文件中保存的數據格式非常簡單,所以該方法直接將文件中所有內容讀取出來,按照“/”字符截取,并將截取的數據賦值數據實體的全局變量。
load_work_time_config()方法的具體代碼如下(代碼位置:資源包\TM\sl\16\clock\util\io_tools.py):
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-3uxijjXQ-1639056600156)(OpenCV進階篇01.assets/image-20211128212248428.png)]
load_users()是加載管理員賬號密碼文件的方法。因為文件保存的是管理員賬號和密碼字典的字符串內容,所以直接將文件中所有文本讀出來,然后轉換成字典類型,最后將轉換之后的字典對象直接賦值數據實體模塊即可
load_users()方法的具體代碼如下(代碼位置:資源包\TM\sl\16\clock\util\io_tools.py):
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-KVH58PdC-1639056600157)(OpenCV進階篇01.assets/image-20211128212304806.png)]
5.將數據保存到文件中
既然有加載數據的方法,也就應該有保存數據的方法。當數據發生變化時,程序應立即將變化后的數據保存到本地硬盤上。公共工具模塊提供了2種將數據保存到文件中的方法(保存新員工照片的方法由攝像頭工具模塊提供)。
save_employee_all()方法可以將員工列表中的數據保存到員工數據文件中。該方法首先打開文件的寫權限,以覆蓋的方式替換文件中的內容,然后遍歷所有員工,將員工信息通過英文逗號和換行符拼接到一起,最后將拼接的文本寫入文件中。
save_employee_all()方法的具體代碼如下(代碼位置:資源包\TM\sl\16\clock\util\io_tools.py):
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-e8HPTmPH-1639056600157)(OpenCV進階篇01.assets/image-20211128212324236.png)]
save_lock_record()方法可以將打卡記錄字典中的數據保存到打卡記錄數據文件中,其邏輯與保存員工數據的方法類似,只不過不需要拆分或拼接數據,而是直接把字典對象轉換成字符串,將轉換得到的字符串覆蓋到打卡記錄數據文件中。
save_lock_record()方法的具體代碼如下(代碼位置:資源包\TM\sl\16\clock\util\io_tools.py):
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-VZE4qyxB-1639056600157)(OpenCV進階篇01.assets/image-20211128211903408.png)]
save_work_time_config()方法可以將數據實體中的上班時間和下班時間保存到文件中。先按照“上班時間/下班時間”格式拼接2個時間的字符串,然后將拼接好的內容寫入上下班配置文件中。
save_work_time_config ()方法的具體代碼如下(代碼位置:資源包\TM\sl\16\clock\util\io_tools.py):
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-sc3BortO-1639056600157)(OpenCV進階篇01.assets/image-20211128212417032.png)]
6.刪除照片
當一名員工被刪除,該員工的照片就成了系統的垃圾文件,若不及時清除不僅會占用空間,還會加重人臉識別器的訓練成本。
remove_pics()方法就是公共工具模塊提供的刪除指定員工照片的方法,參數為被刪除的員工編號。該方法首先通過員工編號獲取該員工的特征碼,然后到照片文件夾中遍歷所有文件,只要文件名以此員工的特征碼開頭,就將文件刪除。刪除后在控制臺打印刪除日志以提醒用戶。
remove_pics()方法的具體代碼如下(代碼位置:資源包\TM\sl\16\clock\util\io_tools.py):
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-iHBMp6L1-1639056600158)(OpenCV進階篇01.assets/image-20211128212439429.png)]
7.生成CSV文件
考勤月報是一個內容非常多的報表,不適合在控制臺中展示,但很適合生成Excel報表來展示。因為使用Python技術創建Excel文件需要下載并導入第三方模塊,會加重讀者的學習壓力,所以這里使用更簡單的CSV格式文件來展示報表。Excel可以直接打開CSV文件。
CSV文件實際上是一個文本文件,每一行文字都對應Excel中的一行內容。CSV文件將每一行文字內容用英文逗號分隔,Excel根據這些英文逗號自動將文字內容分配到每一列中。
create_CSV()方法專門用來創建CSV文件,第一個參數是CSV文件的文件名,這個名稱不包含后綴;第二個參數是CSV文件寫入的文本內容。方法會將CSV文件生成在/data/文件夾下,因為大部分電腦都是用Windows系統,所以按照gbk字符編碼寫入內容,這樣可以保證Windows系統下使用Excel打開CSV文件不會發生亂碼。
create_CSV()方法的具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-dTetFLFc-1639056600158)(OpenCV進階篇01.assets/image-20211128212514367.png)]
16.5.3 攝像頭工具模塊
uitl文件夾下的camera.py是本程序的攝像頭工具模塊,該模塊提供了以下功能: 開啟攝像頭打卡。 開啟攝像頭為員工拍照。
下面詳細介紹camera.py中的代碼。
1.導入模塊
攝像頭模塊需要調用OpenCV和人臉識別服務的方法來實現拍照和視頻打卡功能。因為打卡成功后要顯示員工姓名,所以還需調用人事服務模塊提供的方法,代碼如下(代碼位置:資源包\TM\sl\16\clock\util\camera.py):
2.全局變量
錄入新用戶時需為新用戶拍照,用戶通過按鍵盤按鍵完成拍照。全局變量保存了鍵盤上Esc鍵和Enter鍵的ASCII碼,OpenCV對比這2個變量來判斷用戶按了哪個按鍵,代碼如下(代碼位置:資源包\TM\sl\16\clock\util\camera.py):
執行register()方法開啟本地默認攝像頭,方法參數是被拍照員工的特征碼,當用戶按Enter鍵時,該方法把攝像頭的當前幀畫面保存成圖像文件,文件名以該員工特征碼開頭。每名新員工需要拍3張圖片,也就是需要按3次Enter鍵,該方法才會結束。最后員工拍攝的照片都保存在/data/face/文件夾中,如圖16.8所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-BJwCKBTy-1639056600158)(OpenCV進階篇01.assets/image-20211128212615823.png)]
圖16.8 /data/face/文件夾中員工照片文件
register()方法的具體代碼如下
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-9oViS48u-1639056600158)(OpenCV進階篇01.assets/image-20211128212655013.png)]
4.開啟攝像頭打卡
執行clock_in()方法開啟本地默認攝像頭,程序掃描攝像頭每一幀畫面里是否有人臉,如果有人臉,就將這一幀畫面與所有員工照片樣本做比對,判斷當前畫面里的人臉屬于哪位員工。人臉識別服務給出識別成功的特征碼,通過特征碼獲得員工姓名,最后將識別成功的員工姓名返回。如果屏幕中沒有出現人臉或者識別不成功,攝像頭會一直處于開啟狀態。
clock_in()方法的具體代碼如下(代碼位置:資源包\TM\sl\16\clock\util\camera.py):
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-Ja7Csmk2-1639056600159)(OpenCV進階篇01.assets/image-20211128212713423.png)]
16.6 服務模塊設計
本系統的服務模塊包含2個文件:hr_service.py和recognize_service.py。前者提供所有人事管理的相關功能,例如增減員工、查詢員工數據;后者提供人臉識別服務。本節將詳細介紹這2個文件中的代碼。
16.6.1 人事服務模塊
service文件夾下的hr_service.py就是本程序的人事服務模塊,該模塊專門處理所有人事管理方面的業務,包含以下功能。
添加新員工。
刪除某員工。
為指定員工添加打卡記錄。
多種獲取員工信息的方法。
生成考勤日報。
生成考勤月報(CSV文件)。
下面詳細介紹hr_service.py中的代碼。
1.導入模塊
人事服務需要管理員工類列表、記錄打卡時間,還要計算、對比負責的日期和時間數值,所以要導入數據實體模塊、公共工具模塊、時間模塊和日歷模塊。代碼如下(代碼位置:資源包\TM\sl\16\clock\service\hr_service.py):
2.加載所有數據
程序啟動的首要任務就是加載數據,人事服務模塊將所有加載數據的方法封裝成load_emp_data()方法,程序啟動時運行此方法就可以一次性載入所有保存在文件中的數據。該方法依次進行文件自檢,載入管理員賬號密碼、打卡記錄、員工信息和員工照片。
load_emp_data()方法的具體代碼如下(代碼位置:資源包\TM\sl\16\clock\service\hr_service.py):
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-eL5xG93C-1639056600159)(OpenCV進階篇01.assets/image-20211128212820407.png)]
3.添加新員工
add_new_employee()方法用于添加新員工,參數為新員工的姓名。該方法通過公共工具模塊創建隨機特征碼,通過數據實體模塊創建新員工編號,然后結合姓名參數創建新
員工對象,在員工列表中添加新員工對象,并將最新的員工列表寫入員工數據文件中,最后將該員工的特征碼返回,攝像頭服務根據此特征碼為員工創建照片文件。
add_new_employee()方法的具體代碼如下(代碼位置:資源包\TM\sl\16\clock\service\hr_service.py):
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-x41vlsDG-1639056600159)(OpenCV進階篇01.assets/image-20211128212859144.png)]
4.刪除員工
remove_employee()方法用來刪除已有的員工資料,參數為被刪除員工的編號。該方法首先刪除該員工的所有照片文件,然后在員工列表中清除該員工的所有信息,包括打卡記錄,最后將當前員工列表和打卡記錄覆蓋到數據文件中。這樣數據文件里不會再有該員工的任何信息了。
remove_employee()方法的具體代碼如下(代碼位置:資源包\TM\sl\16\clock\service\hr_service.py):
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-Z8fwr15P-1639056600160)(OpenCV進階篇01.assets/image-20211128212918378.png)]
5.添加打卡記錄
add_lock_record()方法用來為指定員工添加打卡記錄,參數為員工的姓名。如果某個員工打卡成功,該方法首先檢查該員工是否有已經存在的打卡記錄,如果沒有記錄就為其創建新記錄,如果有記錄就在原有記錄上追加新時間字符串。該方法最后把當前打卡記錄保存到數據文件中。
add_lock_record()方法的具體代碼如下(代碼位置:資源包\TM\sl\16\clock\service\hr_service.py):
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-uiDDwMB4-1639056600160)(OpenCV進階篇01.assets/image-20211128212933763.png)]
6.獲取員工數據
人事服務提供了多種獲取員工數據的方法,可以滿足多種業務場景,下面分別介紹。
get_employee_report()方法可以返回一個包含所有員工簡要信息的報表,可用于在前端展示員工列表,該方法的具體代碼如下(代碼位置:資源包\TM\sl\16\clock\service\hr_service.py):
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-07NQLvF8-1639056600160)(OpenCV進階篇01.assets/image-20211128213013377.png)]
刪除員工操作需輸入被刪除員工的編號,程序對用戶輸入的值進行校驗,如果用戶輸入的員工編號不在員工列表之中(即無效編號),就認為用戶操作有誤,程序中斷此業務。
check_id()方法用來判斷輸入的編號是否有效,編號如果有效就返回True,無效就返回False,該方法的代碼如下(代碼位置:資源包\TM\sl\16\clock\service\hr_service.py):
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-saZObEJD-1639056600160)(OpenCV進階篇01.assets/image-20211128213031342.png)]
通過員工特征碼獲取該員工姓名代碼如下(代碼位置:資源包\TM\sl\16\clock\service\hr_service.py):
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-9R50wUjH-1639056600161)(OpenCV進階篇01.assets/image-20211128213059725.png)]
通過員工編號獲取該員工特征碼的代碼如下(代碼位置:資源包\TM\sl\16\clock\service\hr_service.py):
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-HddPqFEA-1639056600161)(OpenCV進階篇01.assets/image-20211128213116746.png)]
7.驗證管理員賬號和密碼
valid_user()方法用來驗證管理員的賬號和密碼,第一個參數為管理員賬號,第二個參數為管理員密碼。該方法首先判斷輸入的管理員賬號是否存在,如果存在則再比對輸入的密碼,只有管理員賬號存在且密碼正確的情況下,該方法才返回True,其他情況返回False。
valid_user()方法的具體代碼如下(代碼位置:資源包\TM\sl\16\clock\service\hr_service.py):
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-CtS0htF5-1639056600161)(OpenCV進階篇01.assets/image-20211128213220573.png)]
8.保存上下班時間
save_work_time()方法用來保存用戶設置的上下班時間,第一個參數為上班時間,第二個參數為下班時間,2個參數均為字符串,且必須符合“%H:%M:%S”時間格式,例如08:00:00。該方法直接修改數據實體中的全局變量,所以用戶可以修改實時的上下班時間,即設置時間之后,日報和月報會立即使用新的時間分析考勤數據。
save_work_time()方法的具體代碼如下(代碼位置:資源包\TM\sl\16\clock\service\hr_service.py):
9.打印考勤日報
打印考勤日報的方法有2個:get_day_report()方法打印指定日期的日報,get_today_report()方法打印今天的日報。下面分別介紹。
get_day_report()方法打印哪一天的日報是由參數date決定的,參數d ate是一個字符串,且必須符合“%Y-%m-%d”時間格式,例如“2008-08-08”。該方法創建date指定的時間對象,分別計算這一天0點、12點和23點59分59秒的時間對象,并且會根據用戶設置的上下班時間計算這一天上班時間對象和下班時間對象,這些時間對象將用來分析員工的考勤情況。員工的打卡規則如表16.2所示。
? 表16.2 打卡規則
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-Y2ujSygr-1639056600161)(OpenCV進階篇01.assets/image-20211128213246503.png)]
方法中分別創建了遲到、早退和缺席名單3個列表,只要某員工出現不正常打卡記錄,就會將該員工姓名放到對應不正常打卡狀態的名單里,最后打印報表,給出各名單人數和明細。
get_day_report()方法的具體代碼如下(代碼位置:資源包\TM\sl\16\clock\service\hr_service.py):
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-7lQGqvzk-1639056600162)(OpenCV進階篇01.assets/image-20211128213913981.png)]
因為負責考勤的用戶最常查看的就是當天的打卡情況,所以將當天打卡日報單獨封裝成get_today_report()方法。該方法自動生成當天的date字符串,并將其作為參數調用get_day_report()方法。
get_today_report()方法的具體代碼如下(代碼位置:資源包\TM\sl\16\clock\service\hr_service.py):
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-oohNAeag-1639056600162)(OpenCV進階篇01.assets/image-20211128213952660.png)]
10.生成考勤月報
與考勤日報不同,考勤月報是一種匯總形式的報表,可以展示員工整個月的考勤狀況。因為月報表內容較多,所以不會在控制臺中展示,而是生成獨立的報表文件。
生成考勤月報的方法有2個:get_month_report ()方法生成指定月份的月報;get_pre_month_report ()方法打印上個月的月報。下面分別介紹。
考勤月報的校驗邏輯與考勤日報基本相同,相當于一次性統計了一個月的日報數據。唯一不同的是統計月報的時候不是創建異常打卡名單,而是統計每一位員工每一天的打卡情況。每個員工的打卡情況用一個字符串表示,如有正常打卡,就追加正常打卡的標記,如果遲到就追加遲到標記,以此類推。統計完所有員工一個月打卡情況之后再對每個字符串進行分析。
如果員工在×日有正常上下班打卡標記,則月報×日下不顯示任何內容。遲到或早退標記都被忽略,因為可能是員工誤打卡。
如果員工在×日沒有上班打卡標記,且有遲到標記,則在月報×日下顯示【遲到】。
如果員工在×日沒有下班打卡標記,且有早退標記,則月報×日下顯示【早退】。
如果員工在×日沒有上班打卡標記,也沒有遲到標記,則在月報×日下顯示【上班未打卡】。
如果員工在×日沒有下班打卡標記,也沒有早退標記,則在月報×日下顯示【下班未打卡】。
如果員工在×日沒有任何打卡標記,則在月報×日下顯示【缺席】。
月報采用CSV格式文件展示,CSV文件自動生成在項目的/data/文件夾下。CSV是文本文件,用換行符區分表格的行,用英文逗號區分表格的列。get_month_report()方法最后將生成的CSV格式月報用記事本打開,其效果如圖16.9所示,如果用Office Excel打開則可以看到正常的表格內容,效果如圖16.10所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-yL9nCVMB-1639056600162)(OpenCV進階篇01.assets/image-20211128225917095.png)]
? 圖16.9 用記事本打開CSV格式的月報
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-xyIK1dAd-1639056600162)(OpenCV進階篇01.assets/image-20211128225941244.png)]
? 圖16.10 用Office Excel打開CSV格式的月報
get_month_report()方法的具體代碼如下(代碼位置:資源包\TM\sl\16\clock\service\hr_service.py):
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-bXPYGowt-1639056600163)(OpenCV進階篇01.assets/image-20211128230016478.png)]
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-gwPZhZhD-1639056600163)(OpenCV進階篇01.assets/image-20211128230040789.png)]
因為負責考勤的用戶最常查看上個月的月報,所以將生成上個月月報單獨封裝成了get_pre_month_report()方法。該方法自動生成上個月的pre_month字符串,并將其作為參數調用get_month_report()方法。
get_pre_month_report()具體代碼如下(代碼位置:資源包\TM\sl\16\clock\service\hr_service.py):
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-jVte0XN3-1639056600163)(OpenCV進階篇01.assets/image-20211128230117420.png)]
16.6.2 人臉識別服務模塊
service文件夾下的recognize_service.py就是本程序的人臉識別服務模塊,該模塊提供人臉識別算法,其包含以下功能。 檢測圖像中是否有正面人臉。 判斷圖像中的人臉屬于哪個人。
下面詳細介紹recognize_service.py中的代碼。
1.導入包
人臉識別服務需要導入OpenCV相關模塊和os模塊,代碼如下(代碼位置:資源包\TM\sl\16\clock\service\recognize_service.py):
import cv2
import numpy as np
import os
2.全局變量
全局變量中創建了人臉識別器引擎和人臉識別級聯分類器對象,PASS_CONF為人臉識別的信用評分,只有低于這個值的人臉識別評分才認為相似度高。全局變量的代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-mVRKnYsa-1639056600163)(OpenCV進階篇01.assets/image-20211128230309914.png)]
3.訓練識別器
train()方法專門用來訓練人臉識別器,該方法僅封裝了識別器對象的訓練方法,方法參數為樣本圖像列表和標簽列表,其代碼如下(代碼位置:資源包\TM\sl\16\clock\service\recognize_service.py):
4.發現人臉
found_face()方法用來判斷圖像中是否有正面人臉,參數為灰度圖像。通過正面人臉級聯分類器對象檢測圖像中出現的人臉數量,最后返回人臉數量大于0的判斷結果,有人臉就返回True,沒有就返回False。
found_face()方法的具體代碼如下(代碼位置:資源包\TM\sl\16\clock\service\recognize_service.py):
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-yjnlSO3L-1639056600164)(OpenCV進階篇01.assets/image-20211128230328108.png)]
5.識別人臉
recognise_face()方法用來識別圖像中的人臉屬于哪位員工,方法參數為被識別的圖像。該方法必須在識別器接受完訓練之后被調用。識別器給出分析得出的評分,如果評分大于可信范圍,則認為圖像中不存在任何已有員工,返回-1,否則返回已有員工的特征碼。
recognise_face()方法的具體代碼如下(代碼位置:資源包\TM\sl\16\clock\service\recognize_service.py):
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-gcxmjFO5-1639056600164)(OpenCV進階篇01.assets/image-20211128230421418.png)]
16.7 程序入口設計
main.py是整個程序的入口文件,負責在控制臺中打印菜單界面,用戶通過指令可以使用系統中的全部功能,包括打卡、員工管理等,所以會有大量指令判斷邏輯。
main.py需要導入攝像頭工具模塊、公共工具模塊和人事服務模塊。代碼如下(代碼位置:資源包\TM\sl\16\clock\main.py):
下面詳細介紹main.py中的代碼
16.7.1 用戶權限管理
系統中除了打卡和退出2項功能可以隨意使用,其他菜單都需要管理員權限才能使用。用戶選中查看記錄、員工管理和考勤報表菜單,系統會驗證用戶身份,如果不是管理員身份就會彈出管理員登錄提示,用戶輸入正確的賬號和密碼才可以繼續使用這些功能。
main.py文件中定義了一個全局變量ADMIN_LOGIN,該變量表示管理員的登錄狀態,默認為False,即管理員未登錄。其代碼如下(代碼位置:資源包\TM\sl\16\clock\main.py):
login()為管理員登錄方法,該方法彈出輸入管理員賬號和密碼的提示,如果用戶輸入賬號為字符串“0”,則認為用戶取消了登錄操作。如果用戶輸入了正確的賬號和密碼,就將全局變量ADMIN_LOGIN的值改為True,即管理員已處于登錄狀態,這樣系統就會開放所有已設權限的功能,用戶可以隨意使用。
login()方法的具體代碼如下(代碼位置:資源包\TM\sl\16\clock\main.py):
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-EaeWbdAR-1639056600164)(OpenCV進階篇01.assets/image-20211128230514889.png)]
16.7.2 主菜單設計
start()方法是程序的啟動方法,在初始化方法執行完畢后執行。該方法在控制臺中打印程序的主功能菜單,效果如圖16.11所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-xe0gh9hT-1639056600164)(OpenCV進階篇01.assets/image-20211128230537548.png)]
? 圖16.11 主菜單
此時用戶需先輸入菜單對應的數字,再按Enter鍵進入具體功能菜單中。如果用戶輸入的數字不在功能菜單中,則提示指令有誤,請用戶重新輸入。
如果當前用戶沒有管理員權限,在選中查看記錄、員工管理和考勤報表菜單時會要求用戶先登錄管理員的賬號,效果如圖16.12所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-XMLp6D0P-1639056600165)(OpenCV進階篇01.assets/image-20211128230618875.png)]
? 圖16.12 用戶需登錄管理員賬號才能使用員工管理功能
start()方法的具體代碼如下(代碼位置:資源包\TM\sl\16\clock\main.py):
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-5D9SSIyP-1639056600165)(OpenCV進階篇01.assets/image-20211128230644783.png)]
16.7.3 人臉打卡功能
face_clock()是人臉打卡功能的執行方法,該方法調用攝像頭工具模塊提供的打卡方法,此時只要用戶面向攝像頭,攝像頭即可自動掃描人臉并識別特征,效果如圖16.13所示。如果鏡頭中的人臉符合某個員工的特征,則會返回該員工姓名,然后調用人事服務模塊為此員工添加打卡記錄,最后提示該員工打卡成功,過程如圖16.14所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-aDLJYRj4-1639056600165)(OpenCV進階篇01.assets/image-20211128230722320.png)]
? 圖16.13 打卡者需正向面對鏡頭
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-L7yLXJM4-1639056600165)(OpenCV進階篇01.assets/image-20211128230745651.png)]
? 圖16.14 員工王五打卡成功
face_clock()方法的具體代碼如下:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-H9n2YuCv-1639056600166)(OpenCV進階篇01.assets/image-20211128230807096.png)]
16.7.4 為新員工登記人臉照片樣本
employee_management()方法是員工管理功能的執行方法,該方法在控制臺打印員工管理功能菜單,如圖16.15所示。輸入菜單對應的數字,再按Enter鍵進入具體功能菜單中。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-84RvmE3O-1639056600166)(OpenCV進階篇01.assets/image-20211128230830763.png)]
? 圖16.15 員工管理功能菜單
錄入新員工的過程如圖16.16所示。如果用戶在員工管理功能菜單中輸入數字1并按Enter鍵,則開始執行新員工錄入操作。首先輸入新員工名稱,輸入完畢后程序打開默認攝像頭,此時讓新員工面對攝像頭,程序將攝像頭拍攝的照片展示在如圖16.17所示的register窗口中。在register窗口上按3次Enter鍵,自動保存3張攝像頭拍攝的照片文件,最后提示錄入成功。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-GwZLOuVG-1639056600166)(OpenCV進階篇01.assets/image-20211128230908335.png)]
? 圖16.16 錄入新員工的過程
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-sxbE4bHg-1639056600166)(OpenCV進階篇01.assets/image-20211128230931356.png)]
? 圖16.17 register窗口展示的員工照片
16.7.5 刪除員工全部數據
如果用戶在員工管理功能菜單中輸入數字2并按Enter鍵,則開始執行刪除員工操作。首先程序會將所有員工的名單打印到控制臺中,用戶輸入要刪除的員工編號并按Enter鍵,程序給出一個驗證碼讓用戶輸入,如果用戶輸入的驗證碼正確,該員工的員工信息、打卡記錄和照片文件都會被刪除,如果用戶輸入的驗證碼錯誤,則會取消刪除員工操作,員工數據不會丟失。刪除員工操作的過程如圖16.18所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-wTUX1EAG-1639056600167)(OpenCV進階篇01.assets/image-20211128230958321.png)]
? 圖16.18 刪除員工操作的過程
employee_management()方法的具體代碼如下(代碼位置:資源包\TM\sl\16\clock\main.py):
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-7iZ2pZFq-1639056600167)(OpenCV進階篇01.assets/image-20211128231025347.png)]
16.7.6 查詢員工打卡記錄
check_record()方法是查詢記錄功能的執行方法,該方法在控制臺打印查詢記錄功能菜單,效果如圖16.19所示。此時用戶需先輸入菜單對應的數字,再按Enter鍵進入具體功能菜單。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-OfLsa9wM-1639056600167)(OpenCV進階篇01.assets/image-20211128231100025.png)]
? 圖16.19 查看記錄功能菜單
如果用戶在查詢記錄功能菜單中輸入數字1并按Enter鍵,程序將所有員工列表打印到控制臺中,效果如圖16.20所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-YTqzNJCK-1639056600168)(OpenCV進階篇01.assets/image-20211128231120571.png)]
? 圖16.20 查看員工列表
如果用戶在查詢記錄功能菜單中輸入數字2并按Enter鍵,程序將所有員工的打卡記錄打印到控制臺中,效果如圖16.21所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-5lkLIEDX-1639056600169)(OpenCV進階篇01.assets/image-20211128231213893.png)]
? 圖16.21 查看打卡記錄
check_record()方法的具體的代碼如下(代碼位置:資源包\TM\sl\16\clock\main.py):
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-Z0aJnt9U-1639056600169)(OpenCV進階篇01.assets/image-20211128231247326.png)]
16.7.7 生成考勤報表
check_report()方法是考勤報表功能的執行方法,該方法在控制臺打印考勤報表功能菜單,效果如圖16.22所示。此時用戶需先輸入菜單對應的數字,再按Enter鍵進入具體功能菜單。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-eaGRRnCR-1639056600169)(OpenCV進階篇01.assets/image-20211128231405373.png)]
? 圖16.22 考勤報表功能菜單
如果用戶在考勤報表功能菜單中輸入數字1并按Enter鍵,則會提示用戶輸入日期。用戶按照指定格式輸入日期后即可看到該日期的考勤日報。如果用戶輸入數字0,可以打印當天的考勤日報。例如,打印2021年3月2日考勤日報的效果如圖16.23所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-QiA4MO20-1639056600169)(OpenCV進階篇01.assets/image-20211128231458581.png)]
? 圖16.23 打印2021年3月2日的考勤日報
如果用戶在考勤報表功能菜單中輸入數字2并按Enter鍵,則提示用戶輸入月份。用戶按照指定格式輸入月份后,即可生成該月考勤月報,并顯示生成的月報文件地址。如果用戶輸入數字0,可以生成上個月的考勤月報。例如,生成2021年3月考勤月報的效果如圖16.24所示。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-zAJIYh1q-1639056600170)(OpenCV進階篇01.assets/image-20211128231521785.png)]
? 圖16.24 生成2021年3月考勤月報
圖16.24中提示“2021年3月考勤月報.csv”文件保存在D:\clock\data\文件夾中,打開這個文件夾即可以看到月報文件,如圖16.25所示,用Office Excel打開月報即可以看到如圖16.26所示的表格內容。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-j5CR8QAB-1639056600170)(OpenCV進階篇01.assets/image-20211128231550636.png)]
? 圖16.25 CSV文件的位置
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-G6n3UUPC-1639056600170)(OpenCV進階篇01.assets/image-20211128231612666.png)]
? 圖16.26 使用Office Excel打開月報的效果
check_report()方法的具體代碼如下(代碼位置:資源包\TM\sl\16\clock\main.py):
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-n4KO3CWB-1639056600170)(OpenCV進階篇01.assets/image-20211128231638940.png)]
16.7.8 自定義上下班時間
report_config()方法是報表設置功能的執行方法,如果用戶在考勤報表功能菜單中輸入數字3并按Enter鍵,則進入報表設置功能菜單,效果如圖16.27所示,在這個菜單中可以設置用于分析考勤記錄的上下班時間。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-Poc9iD9t-1639056600171)(OpenCV進階篇01.assets/image-20211128231711120.png)]
? 圖16.27 報表設置功能菜單
如果用戶在報表設置功能菜單中輸入數字1并按Enter鍵,則分別提示用戶輸入上班時間和下班時間,效果如圖16.28所示。如果用戶輸入的時間格式錯誤,程序要求用戶重新輸入。當用戶設置完后,上下班時間立即生效,此時再打印考勤報表就會按照最新的上下班時間進行分析。
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-HtTtxdhx-1639056600171)(OpenCV進階篇01.assets/image-20211128231731240.png)]
? 圖16.28 用戶設置上班時間和下班時間
report_config()方法的具體代碼如下(代碼位置:資源包\TM\sl\16\clock\main.py):
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-r8zWP94T-1639056600171)(OpenCV進階篇01.assets/image-20211128231810922.png)]
16.7.9 啟動程序
main.py定義完所有全局變量和方法之后,代碼的最下方就是整個系統的啟動腳本:首先執行系統初始化操作,然后啟動系統。具體代碼如下(代碼位置:資源包\TM\sl\16\clock\main.py):
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-Z0ZJS5hi-1639056600171)(OpenCV進階篇01.assets/image-20211128231824542.png)]
16.8 小結
本章詳細介紹了一個完整小型項目的開發流程。這個項目主要包括5大功能:打卡、退出、查看記錄、員工管理和考勤報表。其中,查看記錄、員工管理和考勤報表3個功能需要管理員權限才能使用。這個項目采用命令提示符窗口實現與計算機之間的交互。雖然命令提示符窗口有些簡陋,但不影響這個項目的實用價值。如果讀者想制作一個絢麗的窗口界面運行這個項目,可以在掌握這個項目的功能結構、業務流程和實現原理后,嘗試用Python PyQt5的相關知識予以實現。
總結
以上是生活随笔為你收集整理的OpenCV进阶篇视频的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Windows服务器版本简介
- 下一篇: OpenCV进阶篇