纯干货!文字识别在高德地图数据生产中的演进
前言
豐富準(zhǔn)確的地圖數(shù)據(jù)大大提升了我們?cè)谑褂酶叩碌貓D出行的體驗(yàn)。相比于傳統(tǒng)的地圖數(shù)據(jù)采集和制作,高德地圖大量采用了圖像識(shí)別技術(shù)來(lái)進(jìn)行數(shù)據(jù)的自動(dòng)化生產(chǎn),而其中場(chǎng)景文字識(shí)別技術(shù)占據(jù)了重要位置。商家招牌上的藝術(shù)字、LOGO五花八門,文字背景復(fù)雜或被遮擋,拍攝的圖像質(zhì)量差,如此復(fù)雜的場(chǎng)景下,如何解決文字識(shí)別技術(shù)全、準(zhǔn)、快的問(wèn)題?本文分享文字識(shí)別技術(shù)在高德地圖數(shù)據(jù)生產(chǎn)中的演進(jìn)與實(shí)踐,介紹了文字識(shí)別自研算法的主要發(fā)展歷程和框架,以及未來(lái)的發(fā)展和挑戰(zhàn)。
一 背景
作為一個(gè)DAU過(guò)億的國(guó)民級(jí)軟件,高德地圖每天為用戶提供海量的查詢、定位和導(dǎo)航服務(wù)。地圖數(shù)據(jù)的豐富性和準(zhǔn)確性決定了用戶體驗(yàn)。傳統(tǒng)的地圖數(shù)據(jù)的采集和制作過(guò)程,是在數(shù)據(jù)采集設(shè)備實(shí)地采集的基礎(chǔ)上,再對(duì)采集資料進(jìn)行人工編輯和上線。這樣的模式下,數(shù)據(jù)更新慢、加工成本高。為解決這一問(wèn)題,高德地圖采用圖像識(shí)別技術(shù)從采集資料中直接識(shí)別地圖數(shù)據(jù)的各項(xiàng)要素,實(shí)現(xiàn)用機(jī)器代替人工進(jìn)行數(shù)據(jù)的自動(dòng)化生產(chǎn)。通過(guò)對(duì)現(xiàn)實(shí)世界高頻的數(shù)據(jù)采集,運(yùn)用圖像算法能力,在海量的采集圖片庫(kù)中自動(dòng)檢測(cè)識(shí)別出各項(xiàng)地圖要素的內(nèi)容和位置,構(gòu)建出實(shí)時(shí)更新的基礎(chǔ)地圖數(shù)據(jù)。而基礎(chǔ)地圖數(shù)據(jù)中最為重要的是POI(Point of Interest)和道路數(shù)據(jù),這兩種數(shù)據(jù)可以構(gòu)建出高德地圖的底圖,從而承載用戶的行為與商家的動(dòng)態(tài)數(shù)據(jù)。
圖像識(shí)別能力決定了數(shù)據(jù)自動(dòng)化生產(chǎn)的效率,其中場(chǎng)景文字識(shí)別技術(shù)占據(jù)了重要位置。不同采集設(shè)備的圖像信息都需要通過(guò)場(chǎng)景文字識(shí)別(Scene Text Recognition,STR)獲得文字信息。這要求我們致力于解決場(chǎng)景文字識(shí)別技術(shù)全、準(zhǔn)、快的問(wèn)題。在POI業(yè)務(wù)場(chǎng)景中,識(shí)別算法不僅需要盡可能多的識(shí)別街邊新開(kāi)商鋪的文字信息&#
總結(jié)
以上是生活随笔為你收集整理的纯干货!文字识别在高德地图数据生产中的演进的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 喜欢产品小师妹?你必须知道的一点产品知识
- 下一篇: Flink从入门到精通100篇(二十一)