数据集标注工具_数据标注分享9个数据标注工具
2004 年,谷歌宣布開啟全球圖書館館藏圖書的數字化計劃,掃描了哈佛大學、牛津大學、斯坦福大學、康奈爾大學、紐約公共圖書館等世界一流設施內的書籍,光哈佛大學就有 1600 萬冊,將它們制作成電子版。
書頁內的文字主要通過 OCR 光學字符掃描分析,轉換成為文本。識別過程并非完美,字跡模糊、污跡等都可能產生錯誤,所以需要配合人工修正。
谷歌怎么做呢?他們直接把難于識別的文字,做成了驗證碼,當你在某些情況下需要登錄驗證谷歌帳號時,展示兩個單詞——一個單詞是谷歌已知信息,靠這個完成真正的驗證動作,另一個就是上述無法識別的圖書文本,谷歌讓你來肉眼識別,至少三個用戶給出同一個結果,就會被提交給谷歌服務器。
恭喜你被套路了!
同樣的,谷歌將這套發揚到了無人駕駛領域,做成了圖形驗證界面,讓用戶在驗證環節,從一堆谷歌街景的實拍照片矩陣中,選出「人」、「車」或是「路牌」。
?
盡管谷歌自身已有海量數據積累,但為了提升現行主流的「有監督學習」算法模型的準確度,數據永遠不嫌多,直接或者間接從用戶手中花樣收集數據標注,包裝出各種各樣的形態,防不勝防.但背后的一切還是流量的支持,沒有流量怎么辦?踏踏實實一點一點標注吧。02九個工具1.LabelImg
主頁地址:https://github.com/tzutalin/labelImg
下載以后根據作者提供的安裝指南即可安裝,如果安裝不上怎么辦,不用這么麻煩,下面這個地址提供了直接下載的地址,下載預編譯exe即可:
https://github.com/zhaobai62/labelImg
支持VOC2012格式與tfrecord自動生成!
2.LabelIme
主頁地址:https://github.com/wkentaro/labelme
支持對象檢測、圖像語義分割數據標注,實現語言為Python與QT。
支持導出VOC與COCO格式數據實例分割
強烈推薦,實例分割都可以用它標注!
3.RectLabel
https://rectlabel.com/
支持導出YOLO、KITTI、COCOJSON與CSV格式
讀寫Pascal VOC格式的XML文件
4.OpenCV/CVAT
官方主頁:https://github.com/opencv/cvat
高效的計算機視覺注釋工具,支持圖像分類,對象檢測框,圖像語義分割
5.VOTT
官方主頁:https://github.com/microsoft/VoTT
Microsoft發布了一個基于WEB的可視化數據注釋工具,用于本地部署。
支持圖像和視頻數據注釋
6.LableBox
官方主頁:https://github.com/Labelbox/Labelbox
WEB模式下的標記工具
提供自定義注釋API支持
純JS + HTML支持
7.VIA-VGG Image Annotator
http://www.robots.ox.ac.uk/~vgg/software/via/
VGG發布的圖像標準工具
基于WEB方式的標注工具
8.PixelAnnotationTool
https://github.com/abreheret/PixelAnnotationTool
9.point-cloud-annotation-tool
官方地址:https://github.com/springzfx/point-cloud-annotation-tool
3D點云數據注釋工件
支持3D BOX盒子生成
支持KITTI-bin格式數據
數據標注|國家信息安全標準化技術委員會-人工智能安全標準化白皮書(2019)
數據標注|明星秒變寵物臉
數據標注|定義我,請先了解我
總結
以上是生活随笔為你收集整理的数据集标注工具_数据标注分享9个数据标注工具的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 香港将探索发行数字港元 货币数字化
- 下一篇: 创业板第一股上市时间