Tensorfow_yolov3 Intel Realsense D435 图像整合(合并)输入GPU计算耗时测试
以前我們六個(gè)攝像頭輪詢(xún)依次輸入視頻幀給識(shí)別函數(shù),識(shí)別函數(shù)放到GPU計(jì)算,640×360下每幀識(shí)別耗時(shí)為60-80ms,輪一圈下來(lái)識(shí)別就很慢了,約360-480ms
后來(lái)我們討論這個(gè)問(wèn)題時(shí),我說(shuō)之前我測(cè)試時(shí),使用輸入不同分辨率的圖片,識(shí)別耗時(shí)是差不多的,hui工說(shuō),既然如此,為何我們不把圖片整合在一起再直接輸入給GPU計(jì)算呢?
我想想,有道理,據(jù)說(shuō)GPU比較喜歡大批量數(shù)據(jù)計(jì)算,這個(gè)方法值得一試,于是便有了以下的嘗試
顯示
耗時(shí)測(cè)試
0.1120765209197998 0.11573362350463867 0.13027596473693848 0.14565277099609375 0.14306235313415527 0.11908912658691406 0.12984681129455566 0.12005901336669922 0.12308144569396973 0.1360917091369629 0.13965153694152832 0.1135566234588623 0.11085724830627441可粗略看出,平均耗時(shí)在120ms左右
如果使用以前的不整合的來(lái)測(cè)試:
耗時(shí)約400ms左右
如果將顯示界面取消掉,再測(cè)試:
識(shí)別耗時(shí)約400ms左右,可看出,是否顯示界面對(duì)識(shí)別耗時(shí)影響不大
運(yùn)行時(shí),計(jì)算機(jī)GPU占用率也不高
存在問(wèn)題
用640×360合成1280×1080,不卡
用1280×720合成2560×2160,卡,總耗時(shí)約300ms
看來(lái)不同分辨率的圖片識(shí)別耗時(shí)不一樣的,
另外,這樣做還會(huì)存在“跨越識(shí)別”的風(fēng)險(xiǎn),這種風(fēng)險(xiǎn)對(duì)識(shí)別結(jié)果的影響還得進(jìn)一步評(píng)估
20200120
by hui工備注
參考文章:Tensorflow yolov3 Intel Realsense D435 識(shí)別時(shí)間測(cè)試
總結(jié)
以上是生活随笔為你收集整理的Tensorfow_yolov3 Intel Realsense D435 图像整合(合并)输入GPU计算耗时测试的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: pycharm提示 Method 'xx
- 下一篇: pycharm git 超详细教程