十行Python代码搞定图片中的物体检测
“Word is useless, show me the pic” -MR Lu
先看下原圖:
圖片表述的是一男一女在散步,后面有一輛車,現(xiàn)在來看下我們通過十行代碼實(shí)現(xiàn)的效果:
我們可以看到,在這幅圖中其實(shí)有三個(gè)“person”被識(shí)別出來,包括后面非常非常小的行人,還有一個(gè)“car”被識(shí)別出來,可以說模型能力基本達(dá)到了人眼的能力。現(xiàn)在就來介紹如何把這個(gè)識(shí)別結(jié)果用10行python代碼實(shí)現(xiàn)。
代碼
既然代碼用得少,必然是站在了巨人的肩膀上去做事,需要安裝大量第三方庫。
1.需要首先用pip3安裝以下庫:
pip3 install numpy、scipy、opencv-python、pillow、matplotlib、h5py、keras、注意:用到的是python3,有一些庫在國內(nèi)安裝很慢,可以使用豆瓣源
pip3 install 第三方庫名 -i https://pypi.doubanio.com/simple/ --trusted-host pypi.doubanio.com2.然后要安裝用到的識(shí)別庫,名字叫imageai:
pip3 install https://github.com/OlafenwaMoses/ImageAI/releases/download/2.0.1/imageai-2.0.1-py3-none-any.whl3.接著要下載訓(xùn)練好的模型,我們直接使用現(xiàn)成的模型做預(yù)測,模型地址(145MB):
https://github.com/OlafenwaMoses/ImageAI/releases/download/1.0/resnet50_coco_best_v2.0.1.h54.最后來看看代碼:
from imageai.Detection import ObjectDetection import osexecution_path = os.getcwd()detector = ObjectDetection() detector.setModelTypeAsRetinaNet() detector.setModelPath( os.path.join(execution_path , "resnet50_coco_best_v2.0.1.h5")) detector.loadModel() detections = detector.detectObjectsFromImage(input_image=os.path.join(execution_path , "image3.jpg"), output_image_path=os.path.join(execution_path , "image3new.jpg"))for eachObject in detections:print(eachObject["name"] + " : " + eachObject["percentage_probability"] )print("--------------------------------")clone代碼地址:https://github.com/OlafenwaMoses/ImageAI
其中模型要跟代碼放到統(tǒng)一路徑下,image2.jpg是輸入圖片,image2new.jpg是輸出圖片。一共有效行數(shù)為10,不是你來打我,哈哈。運(yùn)行這個(gè)文件就會(huì)生成標(biāo)記好的圖片。
是不是很簡單,謝謝大家~
總結(jié)
以上是生活随笔為你收集整理的十行Python代码搞定图片中的物体检测的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 图像拐点检测-原理以及代码实现
- 下一篇: 由《我不是药神》到互联网行业从业保障