當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

基于安卓手机的辅助驾驶APP开发

發(fā)布時間：2023/12/15 编程问答 25 豆豆

生活随笔收集整理的這篇文章主要介紹了基于安卓手机的辅助驾驶APP开发小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

目錄結(jié)構(gòu)：

? 1、項目介紹

? 2、網(wǎng)絡(luò)設(shè)計

? 3、數(shù)據(jù)采集

? 4、APP開發(fā)

? 5、APP下載

? 6、效果展示

1、項目介紹：

該項目主要在于探索是否能在通用的安卓手機上實現(xiàn)一個輔助駕駛功能的APP。

功能與性能：

能夠檢測行人、自行車、電瓶車、汽車、卡車、公交車等常規(guī)交通參與者。
在行人等數(shù)量較多的情況下，可以發(fā)出提醒。

在前車距離過小的情況下，可以發(fā)出提醒。
能夠檢測出車道線(下一版本增加)

在偏離車道線的時候能夠發(fā)出提醒(下一版本增加)
能在手機上較為實時的運行（>=10fps）

2、網(wǎng)絡(luò)設(shè)計

要實現(xiàn)車輛，行人等的檢測，需要一個常規(guī)的目標(biāo)檢測網(wǎng)絡(luò)（不考慮物體方向，否則手機性能不夠），實現(xiàn)車道線檢測需要一個車道線檢測網(wǎng)絡(luò)。如果使用串行方式，勢必會增加延時，導(dǎo)致手機端無法流暢運行。因此這里考慮將兩個網(wǎng)絡(luò)合并，共享backbone以及neck部分，目標(biāo)檢測頭和車道線檢測頭相互獨立。如下圖所示：

目標(biāo)檢測網(wǎng)絡(luò)：

輕量級的目標(biāo)網(wǎng)絡(luò)實際上有很多，例如mobilenetSSD，yolo-lite，yolo-fastest，nanodet，yolov5s等。綜合算力與精度，yolov5s是一個不錯的選擇?？偟膩碚f，yolov5在yolov3的基礎(chǔ)上，增加了一些降低計算量的模塊，例如FOCUS模塊，CSP模塊等，降低了yolo的計算量，另一方面，使用了PAN，SPP等，增加了網(wǎng)絡(luò)的精度。本次的目標(biāo)檢測就選擇yolov5s。

雖然yolov5s已經(jīng)是一個相對輕量級的通用目標(biāo)檢測框架，但是對于手機這樣的設(shè)備來說，想要實現(xiàn)實時的檢測，依然具有極大的挑戰(zhàn)。使用官方的yolov5s模型在手機上運行，檢測一張圖片的時間大約在800ms-1.5s之間，遠(yuǎn)遠(yuǎn)達(dá)不到實時。因此需要對yolov5s做一個精簡。如下圖所示為yolov5s的網(wǎng)絡(luò)結(jié)構(gòu)圖(輸入640*640)。

下面先簡單介紹一下網(wǎng)絡(luò)結(jié)構(gòu)。主要由backbne+neck+head組成，如圖中的三個灰色模塊。關(guān)于網(wǎng)絡(luò)中使用的各個模塊，其細(xì)節(jié)如圖中的米黃色模塊所示。其中CBH為yolov5中的基礎(chǔ)模塊，包含一個卷積，一個BN層以及一個Swish的激活層。FOCUS是一種快速降采樣的方式。在傳統(tǒng)的 CNN網(wǎng)絡(luò) 中，一般使用兩個大卷積7*7或者5*5進(jìn)行快速的降低輸入圖像的分辨率。但是大卷積核就意味著大計算量。FOCUS首先將輸入圖片進(jìn)行切片，然后在cat在一起，用一個卷積融合信息。極大的降低了網(wǎng)絡(luò)前期的計算量。再來看網(wǎng)絡(luò)的Neck部分。很明顯的是增加了另外一個分支，原來的FPN將小分辨率的特征圖上采樣之后融合進(jìn)行各個level的預(yù)測?，F(xiàn)在的PAN增加了從大分辨率下采樣到小分辨率的路徑，進(jìn)一步融合了各個level之間的信息，使得每個level能夠很好的保留空間信息與語義信息。

Yolov5s計算量

接下來分析一下yolov5s的計算量。如圖中的紅色字體已經(jīng)標(biāo)注了各個模塊的計算量占比。可以看到backbone大約占據(jù)了72%的計算量，而neck占據(jù)了27%的計算量。總的計算量大約為7.59G的計算量。這個計算量相對于手機來說還是非常巨大的。一般要想在手機上比較流暢的運行，計算量最好能降低到<1G的范圍。由于目前的計算量實在巨大，可以考慮降低輸入圖片的分辨率。我們知道CNN關(guān)于輸入圖片分辨率的計算復(fù)雜度可以表達(dá)為:O(H*W)，其中H為輸入圖片的高度，W為輸入圖片的寬度。因此降低圖像分辨率可以得到一個平方倍的計算復(fù)雜度降低，這個收益還是比較大的。例如將圖像的輸入分辨率降低到原來的一半，計算復(fù)雜度就變成了O(1/2H*1/2W) = 1/4O(H*W)。也就是說將分辨率降低一半，計算量減小為原來的1/4。通常輕量級分類網(wǎng)絡(luò)的。考慮到我們輔助駕駛只需要判斷車輛附近的對象，不需要對遠(yuǎn)處的小目標(biāo)進(jìn)行識別，那么選擇320*320的分辨率作為輸入。這樣計算量就大約變成了1/4*7.59G = 1.89G。

Yolov5s裁剪

繼續(xù)觀察網(wǎng)絡(luò)結(jié)構(gòu)，由于neck使用PAN,增加了一路數(shù)據(jù)通路，使得neck部分的計算量增加了一倍，那么可以考慮將PAN修改為FPN來降低計算量。如下圖所示：

還有一種方式就是減少輸出的level。Yolov5s默認(rèn)輸出3個level的特征圖分別對應(yīng)stride=8,16,32。由于輸入分辨率已經(jīng)被我們降低，且為了實現(xiàn)實時運行目標(biāo)，我們也可以考慮將stride=8的level刪除，這樣也能降低比較多的計算量。如下圖所示：

對過對比兩種方案，刪除PAN通路降低的計算量相對多一些，但是結(jié)合訓(xùn)練的最終精度（MAP），刪除PAN通路的方式精度下降的比較明顯，而刪除stride=8的方案，可以取得一個比較好的平衡。因此最終的精簡版本的網(wǎng)絡(luò)結(jié)構(gòu)為：

?

車道線檢測網(wǎng)絡(luò)：

輕量級的車道線檢測網(wǎng)絡(luò)并不是很多。因為大部分車道線檢測是基于分割任務(wù)來做的。大家都知道，分割任務(wù)的一個特點是需要保持一個較高的分辨率，因此對于計算量，內(nèi)存都是一個不小的挑戰(zhàn)。這里引用一篇比較創(chuàng)新的車道線檢測算法：《Ultra Fast Structure-aware Deep Lane Detection》，效果一般，并且官方網(wǎng)絡(luò)只支持4車道線檢測，但是特點就是快。論文的動機就是為了解決傳統(tǒng)基于分割方法檢測車道線的延時大的問題。下面來解讀一下這篇論文（論文地址：https://arxiv.org/abs/2004.11757）

核心方法

將車道線檢測定義為尋找車道線在圖像中某些行的位置的集合，即基于行方向上的位置選擇與分類（row-based classification）。這句話是整片論文的核心，如下圖所示。

基于分割任務(wù)的車道線檢測中，分類對象是每個像素點，對一個像素點進(jìn)行C+1個類別的分類（C為車道線的預(yù)設(shè)數(shù)目，+1表示背景類別，由于使用CE損失，所以需要增加一個背景類，如果不用CE損失，+1可以不需要）。而該方案是對一行進(jìn)行分類，分類的類別數(shù)為w+1（w表示圖片在寬度上被分割的數(shù)目，即grid_cell的數(shù)量，+1表示該行上面無車道線），表示的是行上面的哪個位置有車道。因此，兩種方案的分類含義不同。分割任務(wù)的分類是：H*W*(C+1), 該論文的分類是：C*h*（w+1）。由于該論文的這種分類方式，可以很方便的做一些先驗約束，例如相領(lǐng)行之間的平滑與剛性等。而基于原始分割任務(wù)的卻很難做這方面的約束。

如何解決速度慢

由于我們的方案是行向選擇，假設(shè)我們在h個行上做選擇，我們只需要處理h個行上的分類問題，只不過每行上的分類問題是W維的。因此這樣就把原來HxW個分類問題簡化為了只需要h個分類問題，而且由于在哪些行上進(jìn)行定位是可以人為設(shè)定的，因此h的大小可以按需設(shè)置，但一般h都是遠(yuǎn)小于圖像高度H的。（作者在博客中是這么說的，但是我認(rèn)為雖然該方案的分類問題變少了，但是每個分類的維度變大了由原來的C+1變成了w+1，即原來是H*W個分類問題，每個分類的維度是C+1, 現(xiàn)在是C*h個分類問題，每個分類的維度是w+1，所以最終的分類總維度是從 H*W*(C+1) 變成了 C*h*（w+1），所以變快的主要原因是h<<H且w<<W，而不是分類數(shù)目的減少。）

如何解決感受野小

局部感受野小導(dǎo)致的復(fù)雜車道線檢測困難問題。由于我們的方法不是分割的全卷積形式，是一般的基于全連接層的分類，它所使用的特征是全局特征。這樣就直接解決了感受野的問題，對于我們的方法，在檢測某一行的車道線位置時，感受野就是全圖大小。因此也不需要復(fù)雜的信息傳遞機制就可以實現(xiàn)很好的效果。（這也帶來了參數(shù)量大的問題，因為h和w不像分類網(wǎng)絡(luò)下降的那么多，所以對于最后的全連接層來說，參數(shù)量將會很大）

先驗約束

平滑性約束：

剛性約束：

整體網(wǎng)絡(luò)結(jié)構(gòu)

整體網(wǎng)絡(luò)結(jié)構(gòu)如下圖所示（分割模塊作為訓(xùn)練負(fù)責(zé)模塊，推理的時候不需要）

3、數(shù)據(jù)采集

通常來說，深度學(xué)習(xí)依賴大量的訓(xùn)練數(shù)據(jù)。好在對于交通場景，已經(jīng)有比較多的開源數(shù)據(jù)集存在。例如kitti，bdd100k，apploscape，cityscapes，tuSimple Lane，Culane等。由于手頭上只有mocrosoft的coco數(shù)據(jù)集，且coco數(shù)據(jù)集中包含了常規(guī)的行人，非機動車（自行車），機動車（car，bus,trunk），信號燈等。于是筆者準(zhǔn)備先使用coco數(shù)據(jù)集進(jìn)行訓(xùn)練。

COCO數(shù)據(jù)集篩選

由于原生的coco數(shù)據(jù)集有80類別，對于我們的輔助駕駛來說很多都是沒有意義的，因此需要從里面選出帶有交通類別的數(shù)據(jù)。這里筆者寫了一個python腳本來進(jìn)行自動化的篩選工作。

from pycocotools.coco import COCOimport numpy as npimport skimage.io as ioimport matplotlib.pyplot as pltimport osfrom PIL import Imagefrom PIL import ImageDrawimport csvimport shutil?def create_coco_maps(ann_handle): coco_name_maps = {} coco_id_maps = {} cat_ids = ann_handle.getCatIds() cat_infos = ann_handle.loadCats(cat_ids) for cat_info in cat_infos: cat_name = cat_info['name'] cat_id = cat_info['id']? if cat_name not in coco_name_maps.keys(): coco_name_maps[cat_name] = cat_id if cat_id not in coco_id_maps.keys(): coco_id_maps[cat_id] = cat_name? return coco_name_maps, coco_id_maps?def get_need_cls_ids(need_cls_names, coco_name_maps): need_cls_ids = [] for cls_name in coco_name_maps.keys(): if cls_name in need_cls_names: need_cls_ids.append(coco_name_maps[cls_name]) return need_cls_ids?def get_new_label_id(name, need_cls_names): for i,need_name in enumerate(need_cls_names): if name == need_name: return i return None?if __name__ == '__main__': # create coco ann handle need_cls_names = ['person','bicycle','car','motorcycle','bus','truck','traffic light'] dst_img_dir = '/dataset/coco_traffic_yolov5/images/val/' dst_label_dir = '/dataset/coco_traffic_yolov5/labels/val/' min_side = 0.04464 # while 224*224, min side is 10. 0.04464=10/224? dataDir='/dataset/COCO/' dataType='val2017' annFile = '{}/annotations/instances_{}.json'.format(dataDir,dataType) ann_handle=COCO(annFile)? # create coco maps for id and name coco_name_maps, coco_id_maps = create_coco_maps(ann_handle)? # get need_cls_ids need_cls_ids = get_need_cls_ids(need_cls_names, coco_name_maps)? # get all imgids img_ids = ann_handle.getImgIds() # get all imgids for i,img_id in enumerate(img_ids): print('process img: %d/%d'%(i, len(img_ids))) new_info = '' img_info = ann_handle.loadImgs(img_id)[0] img_name = img_info['file_name'] img_height = img_info['height'] img_width = img_info['width']? boj_infos = [] ann_ids = ann_handle.getAnnIds(imgIds=img_id,iscrowd=None) for ann_id in ann_ids: anns = ann_handle.loadAnns(ann_id)[0] obj_cls = anns['category_id'] obj_name = coco_id_maps[obj_cls] obj_box = anns['bbox'] ? if obj_name in need_cls_names: new_label = get_new_label_id(obj_name, need_cls_names) x1 = obj_box[0] y1 = obj_box[1] w = obj_box[2] h = obj_box[3]? #x_c_norm = (x1) / img_width #y_c_norm = (y1) / img_height x_c_norm = (x1 + w / 2.0) / img_width y_c_norm = (y1 + h / 2.0) / img_height? w_norm = w / img_width h_norm = h / img_height? if w_norm > min_side and h_norm > min_side: boj_infos.append('%d %.4f %.4f %.4f %.4f\n'%(new_label, x_c_norm, y_c_norm, w_norm, h_norm))? if len(boj_infos) > 0: print(' this img has need cls') shutil.copy(dataDir + '/' + dataType + '/' + img_name, dst_img_dir + '/' + img_name) with open(dst_label_dir + '/' + img_name.replace('.jpg', '.txt'), 'w') as f: f.writelines(boj_infos) else: print(' this img has no need cls')

4、APP開發(fā)

模型轉(zhuǎn)換

由于訓(xùn)練過程使用的是pytorch框架，而pytorch框架是無法直接在手機上運行的，因此需要將pytorch模型轉(zhuǎn)換為手機上支持的模型，這其實就是深度學(xué)習(xí)模型部署的問題?？梢赃x擇的開源項目非常多，例如mnn，ncnn，tnn等。這里我選擇使用ncnn，因為ncnn開源的早，使用的人多，網(wǎng)絡(luò)支持，硬件支持都還不錯，關(guān)鍵是很多問題都能搜索到別人的經(jīng)驗，可以少走很多彎路。但是遺憾的是ncnn并不支持直接將pytorch模型導(dǎo)入，需要先轉(zhuǎn)換成onnx格式，然后再將onnx格式導(dǎo)入到ncnn中。另外注意一點，將pytroch的模型到onnx之后有許多膠水op，這在ncnn中是不支持的，需要使用另外一個開源工具：onnx-simplifier對onnx模型進(jìn)行剪裁，然后再導(dǎo)入到ncnn中。因此整個過程還有些許繁瑣，為了簡單，我編寫了從"pytorch模型->onnx模型->onnx模型精簡->ncnn模型"的轉(zhuǎn)換腳本，方便大家一鍵轉(zhuǎn)換，減少中間過程出錯。我把主要流程的代碼貼出來。

# 1、pytroch模型導(dǎo)出到onnx模型torch.onnx.export(net,input,onnx_file,verbose=DETAIL_LOG)?# 2、調(diào)用onnx-simplifier工具對onnx模型進(jìn)行精簡cmd = 'python -m onnxsim ' + str(onnx_file) + ' ' + str(onnx_sim_file)ret = os.system(str(cmd))?# 3、調(diào)用ncnn的onnx2ncnn工具，將onnx模型準(zhǔn)換為ncnn模型cmd = onnx2ncnn_path + ' ' + str(new_onnx_file) + ' ' + str(ncnn_param_file) + ' ' + str(ncnn_bin_file)ret = os.system(str(cmd))?# 4、對ncnn模型加密（可選步驟）cmd = ncnn2mem_path + ' ' + str(ncnn_param_file) + ' ' + str(ncnn_bin_file) + ' ' + str(ncnn_id_file) + ' ' + str(ncnn_mem_file)ret = os.system(str(cmd))

APP結(jié)構(gòu)

當(dāng)完成了所有的算法模塊開發(fā)之后，APP開發(fā)實際上是水到渠成的事情。這里沿用運動技術(shù)APP中的框架，如下圖所示：

APP主要源碼：

參考計數(shù)APP開發(fā)中的源碼示例：

Activity類核心源碼

Camera類核心源碼

Alg類核心源碼

5、APP下載

語雀平臺下載：

https://www.yuque.com/lgddx/xmlb/ny150b

百度網(wǎng)盤下載：

鏈接：https://pan.baidu.com/s/13YAPaI_WdaMcjWWY8Syh5w

提取碼：hhjl

6、效果展示

手持手機在馬路口隨拍測試：

https://www.yuque.com/lgddx/xmlb/wyozh2

>堆堆星微信：15158106211

>官方微信討論群：先加堆堆星，再拉進(jìn)群

>官方QQ討論群：885194271

總結(jié)

以上是生活随笔為你收集整理的基于安卓手机的辅助驾驶APP开发的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

app
手机

上一篇： [开源]基于姿态估计的运动计数APP开发
下一篇：秀肌肉一加Ace 2将首发搭载OPPO