第二周——团队项目(小小大佬带飞队)
?
| 姓名 | 學號 |
| 楊浩政(組長) | 3116004705 |
| 謝創敏 | 3116004478 |
| 鐘偉 | 3116004711 |
| 李奕柱 | 3116004691 |
| 李曉陽 | 3116004641 |
| 肖潔鑾(小小) | 3216004492 |
文本圖像識別是機器視覺領域的重要研究課題之一。文本圖像識別涵蓋很多應用和任務,其中大部分起源于幾十年前的文檔數字化。利用原始圖像數據實現其分類、識別、檢索已經成為信息處理領域極其重要的研究內容。用戶能夠對圖像文檔進行更高層次的操作與理解,因此文本圖像識別技術得到了越來越廣泛的關注與應用。
需求規格說明
基礎項目需求
(1)對不同類型驗單圖像的識別
? 圖像預處理可以消除圖像中無關的信息,恢復有用的真實信息,增強有關信息的可檢測性和最大限度地簡化數據,從而改進特征抽取、圖像分割、匹配和識別的可靠性。因此對驗單圖像的預處理算法的選擇尤為關鍵。之后通過對驗單圖像的特征提取等操作,用神經網絡模型進行識別訓練,提高識別率。
(2)分類得到驗單中數據有效區域的ROI部分
對ROI區域進行處理和分析不但可以降低分析過程的復雜度,而且能夠減少不必要的計算浪費,由于每種驗單的數據區域已經固定,所以決定采用閾值分割算法中的全局閾值法以及canny算子等一些邊緣檢測算法提取ROI區域并進行圖像分割。
(3)對數據有效區域進行特征提取以及識別
對數據有效區域文本信息的檢測的步驟一般為定位圖像文本,將文本與背景分離最后進行識別并獲取文本信息,在文字檢測方面運用MSER算法和筆畫寬度變換算法對數據區域進行檢測,在文字識別方面使用卷積神經網絡AlexNet模型進行訓練并結合支持向量機的方法對樣本特征進行分類。
(4)流程圖
?
?
高級項目需求
(1)提供圖形界面給用戶
基礎需求只需要提供接口給用戶由那邊調用接口來獲取檢測到的文字數據,但當驗單類型增加則需要后臺通過手動更新模型來滿足驗單識別。另一種比較有難度的方案便是提供給用戶一個圖形界面,可以在圖形界面上添加新的驗單類型圖片,輸入標簽,并提供接口做到可以在原模型的基礎上迭代新模型,使得整個系統更加自動化與方便化。
關于系統
(1)真實性
本項目處理的圖像數據,來自于眼球檢驗設備的輸出驗單。
(2)可用性
本項目提供封裝好的接口供用戶使用,使其在輸入驗單圖片后能夠獲取驗單有效數據區域的文本格式文件并繼續接下來對數據的操作。免去了醫療人員手工錄入的繁瑣操作,極大地提高了醫生的效率。
(2)價值性
眼球作為人體生物特征的一個重要組成部分,包含著豐富的可用信息,在近年來得到了國內外研究者的高度重視和密切關注。同時眼球識別技術也得到了迅速的發展。眼球識別可以精確獲取眼部疾病患者雙眼信息,如眼球的位置區域、瞳孔中心、虹膜信息甚至視線方向等。而運用圖像處理與模式識別技術對眼球驗單以及數據區域進行識別,則可以將信息進一步進行處理,提取出各類相應的數據,使診斷和治療過程更加自動化,節省了患者與醫生的時間,提高效率。
項目規范
(1)項目采用碼云管理平臺:項目地址
(2)擬定驗單識別量:由于在初級階段,驗單數據集比較少,暫定20類驗單。
代碼規范
碼云issues 頁面截圖
項目計劃表
| 第6周 | 1.團隊組隊、團隊博客(?) |
| 2.團隊介紹、成員展示、角色分配、選題確定(?) | |
| 3.制定團隊計劃安排(?) | |
| 第7周 | 1.需求規格說明書 |
| 2.原型設計,隊員估計任務難度并學習必要的技術 | |
| 3.編碼規范完成、平臺環境搭建完成、初步架構搭建 | |
| 第8周 | 1.原型改進(給目標用戶展現原型,并進一步理解需求) |
| 2.架構設計,WBS, 團隊成員估計各自任務所需時間 | |
| 3.測試計劃 | |
| 第9周 | 1. 團隊項目Alpha任務分配計劃 |
| 2. 連續7天的Alpha敏捷沖刺,7 篇 每日Scrum Meeting博客+代碼提交 | |
| 第10周 | 1.用戶反饋+測試計劃改進 |
| 2. 團隊Alpha階段個人總結 | |
| 3. 團隊項目Alpha博客:發布說明、測試報告、展示博客、項目管理 | |
| 第11周 | 1. 團隊項目Alpha博客:事后分析 |
| 2. 每個團隊有一人必須離開,自己尋找下一個接納自己的團隊。團隊發博客宣布離隊和接納的成員。 | |
| 第12周 | 1. 團隊項目Beta任務分配計劃,介紹新成員 |
| 2. 連續7天的Beta敏捷沖刺,7 篇 每日Scrum Meeting博客+代碼提交 | |
| 第13周 | 1. 團隊項目Beta博客:發布說明、測試報告、展示博客 |
| 2. 團隊Beta階段個人總結 | |
| 第14周 | 1. 團隊項目Beta博客:事后分析, 宣布每人的貢獻分 |
| 第15周 | 1.團隊整個階段總結,分析用戶數據,整理文檔,保證以后的團隊能接手。 |
由于目前項目進展較為順利,所以項目計劃表暫無變更。
團隊分工
| 楊浩政 | 圖像識別與文字檢測算法方向整體把握,代碼整合與優化 |
| 鐘偉,謝創敏 | 嘗試并實現文字檢測的深度學習算法 |
| 李奕柱,李曉陽 | 驗單類型圖像識別代碼的實現與整合 |
| 肖潔鑾 | 協助后期實現用戶界面操作 |
感想
楊浩政:以前總覺得拿到項目直接上手就可以,直接思考代碼怎么寫,現在發現在寫代碼之前有好多事情需要思考,尤其現在是團隊合作,如何發揮團隊中每個人的才能與積極性很重要,同樣重要的是關于整個項目的實現思路一定要多思考,怎樣可以更快捷更方便,避免重復造輪子而寫出效果最好的代碼。
李曉陽:該項目之前就有接觸過了,不過因為之前就暑假只學了一點基礎知識,開學后也很久沒碰過,所以基本得從頭再學,現在還是有很多不明白的地方,需要努力學習。希望可以盡快上手,也希望項目進展順利。
鐘偉:第一次接觸這樣的團隊大項目,對于我個人來說都是很大的挑戰。經過大家的討論,目前有了基本的方向,我也在積極的儲備相應的知識。雖然有些知識挺難懂的,但是我相信花時間一定可以有所領悟,慢慢的做出點功能,在這個過程中,自己對python的掌握會不斷提高,經驗也會不斷豐富。
謝創敏:第一次接觸機器學習,發現機器學習沒有之前想象的復雜,但也不簡單。一邊學一邊實踐,越發對機器學習產生了興趣。雖然學習過程中遇到很多困難,但也鍛煉了自己解決困難的能力。期待這次項目可以帶給我更多的經驗和收獲。
李奕柱:團隊項目使用python+機器學習+opencv,我主要負責圖像處理方面模塊,雖然暑假對opencv有過一些了解,但目前還有許多問題不懂,也遇到了一些以目前個人水平難以解決的問題,接下來要好好深入學習,爭取在期限內把項目完成。
肖潔鑾: 在這次的項目中,我主要負責前端頁面的編寫,在開發中,我深刻體會到了溝通的重要性,并對某些理解不夠深入的知識點進行總結,期待在這此項目中,能夠突破一些技術難點,有更多的收獲。
?
轉載于:https://www.cnblogs.com/yhz-zero/p/9813887.html
總結
以上是生活随笔為你收集整理的第二周——团队项目(小小大佬带飞队)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 小米官网
- 下一篇: 计算机教育学校排名,教育知识:2020全