【AI产品】五一出游赏花草,你一定需要这款“形色”
五一又來了,在這個普天同慶的勞動的日子,我們一起體驗形色“拍照識花草”的樂趣,感受人工智能與大自然的融合~
作者 | Luna
編輯 | Luna
前三期AI產(chǎn)品分析中,我們選擇抖音、美圖、作業(yè)幫等比較大眾且相對成熟的產(chǎn)品作為切入點,結(jié)合實際功能及技術(shù)分析了人工智能技術(shù)的落地,而本期適逢五一,于是我們決定浪漫一些,一起玩玩“形色”放松一下,作為拍照識花的神器,該產(chǎn)品可以說是日常裝逼、看花看草的智多星了。
生活中有很多人可能和我一樣是“花癡”,把各品類的花統(tǒng)稱為“花”,把各類型的植物全局命名為“草”,不思進取地活了很多年后,遇到“形色”才發(fā)現(xiàn)在人工智能面前,自己宛若一個“人工智障”,所以接下來我們一起來體驗一下這個讓人羞愧的小可愛吧~
1 關(guān)于形色
形色是由杭州大拿科技研發(fā)的一款拍照識花軟件,依托于人工智能下的深度學習技術(shù),可快速地對植物花草的特征進行分析,并以較高的準確率輸出花草所屬的類別。
雖然相較于抖音、美圖等產(chǎn)品,形色趨于小眾,然而該軟件自上線以來,仍然獲得了許多用戶的認可。
根據(jù)七麥數(shù)據(jù),形色近三個月下載量呈現(xiàn)出不斷上升的趨勢,尤其是進入四月份以來,日下載量增加更加明顯。
根據(jù)易觀千帆指數(shù),形色的月活也具有出色的表現(xiàn)。如圖,形色近6個月月活顯示,數(shù)據(jù)上雖有較小波動,但在2月份達到最低點也仍具有將近90萬的月活,且此后開始展現(xiàn)出良好的回升趨勢。
從整體的頁面上,形色的調(diào)性淡雅、配色清新、交互簡單流暢,且識別準確率較高。此外,除了拍照識別花草植物的功能,形色還提供了類似于花間、地圖、展覽及鑒定等功能,使得具有相同愛好的用戶圍繞著花草可以發(fā)生互動,使得平臺在花草之余平添了許多人氣。
基于此,形色在同類產(chǎn)品比如微軟識花、花幫主等產(chǎn)品中脫穎而出。
對于一款小眾產(chǎn)品而言,形色的下載量及月活充分說明,該應用很好地滿足了一部分用戶的需求,且根據(jù)我們前期做的調(diào)研結(jié)果顯示,形色充分發(fā)揮了人工智能的優(yōu)勢,即隨著用戶數(shù)據(jù)越來越多,其準確率越來越好,在用戶間具有良好的口碑。
我們大膽預測,在五一小長假,形色會住到更多人的手機里。
為了更好地凸顯AI技術(shù)在產(chǎn)品中的落地,我們僅以“拍照識別”功能項作為出發(fā)點,對其進行用戶-場景-需求、功能目的、功能邏輯、用戶評論及技術(shù)分析,并在此之外,對平臺中圍繞“拍照識花草”衍生出的“拍照識果蔬”進行簡介。
2 用戶-場景-需求分析
3 功能目的
從“拍照識別花草功能”出發(fā),形色滿足了許多用戶的許多需求。
不同于抖音、美圖或作業(yè)幫,它們都比較顯性地滿足了部分人群的需求,而形色則具有更廣的受眾,應用的場景也很豐富。比如對一些植物愛好者,形色可以滿足他們在遇到新植物類別時快速識別的需求,甚至是一些罕見的花草也可以更為準確地識別,倘若只是出于興趣,形色也提供了互動和分享的渠道。
而對于一些園林花藝從業(yè)者,形色更是在他們的工作中充當了效率提升器。由于這類人群經(jīng)常要在設計、搭配中對植物的類別進行識別與鑒定,而人的腦容量又十分有限,如果依靠傳統(tǒng)的文字搜索,則耗時耗力,形色使得這類人群可以快速地確定相關(guān)植物的類別及形態(tài)知識,從而可以極大地提高工作的效率。
最后,對于一些類似家長、教師、攝影愛好者、旅游愛好者、小朋友等,形色也都幫助他們快速認識花草、答疑解惑、學習植物知識、獲得好看或珍稀植物照片提供了更豐富、高效的渠道。
由此,我們可以看出,形色面向的用戶群廣,使用的場景豐富,而滿足的需求卻集中體現(xiàn)在快速識別花草、學習植物知識及鑒定植物等方面。
對于平臺而言,借助人工智能技術(shù),為用戶提供高準確率且快速地植物識別的服務體驗,通過植物將用戶聚集,并由此拓展功能外延,一方面平臺的算法越來越準確,吸引的用戶越來越多,另一方面圍繞著植物識別這一核心需求,通過更豐富的功能設計,比如花間、地圖等,產(chǎn)品可帶給用戶更多驚喜。
而形色的官方團隊也在新聞發(fā)言中坦言,他們是純粹的人工智能技術(shù)愛好者,希望通過產(chǎn)品作為載體,把人工智能的樂趣帶給更多用戶。這句話是不是空喊口號無從得知,但從目前的體驗過程中,形色暫時沒有特別顯性的廣告植入,而平臺算法的性能也比較穩(wěn)定和準確,形色未來可期。
4 功能邏輯
在功能邏輯上,我們也可看見,形色以拍照識花為中心,提出了“自拍,看看你像什么花”,該功能抓住了用戶愛美及好奇的心理,是一種比較具有趣味性的互動。
同時在生成的過程中,由于對圖片處理的過程可能算法存在一定的延時,尤其是一些比較少見的植物,則計算圖片特征及檢索數(shù)據(jù)庫的過程,可能會出現(xiàn)更長的等待時間。
則體驗中發(fā)現(xiàn),形色針對這一個可能做出了比較人性化的設計,比如給出的各類提示語包括“正在努力鑒定中XX%”,讓用戶心理有預期,減少焦慮。再比如“再等等,結(jié)果馬上就出來”、“網(wǎng)絡好像有點擁擠”,則在這些極具擬人化特征的提示語之上,用戶不會覺得背后是一個冷漠、機械的“機器人”或算法,而是覺得這是一種友好的互動,從而耐心及忍耐度會有所提升。
此外,在拍攝環(huán)節(jié)我們也可以看到,除了花草樹木外,還有“果蔬海鮮”也可以識別。
這也正是人工智能產(chǎn)品的優(yōu)勢所在,基于后臺的識別模型,可以進行不同數(shù)據(jù)庫下的算法設計及模型訓練,從而適配不同的物種,最終在功能的拓展上還算是比較靈活的。
所以未來可能隨著模型不斷強大,可以識別任意物種也說不定哦。
體驗中我們隨便采了一朵路邊的野花,拍照鑒定的過程中,一直顯示在緩沖,但是體驗相對比較好的是,系統(tǒng)一直有反饋,比如進度94%、99%,而且一直把延時的鍋扣給“網(wǎng)絡慢”、“網(wǎng)絡擁塞”。
其實這種提示語的設置也可以看作是人工智能產(chǎn)品設計的一個技巧,因為往往如果算法想要達到比較好的準確率,則模型的復雜度較高,那么模型在運行的時候其效率往往較低,則平臺通過這些標語一方面可以轉(zhuǎn)移用戶的注意力,另一方面,也可以一定程度降低用戶對算法不行的糟糕想法。
我在出現(xiàn)上述鑒定過程中的網(wǎng)絡問題時,悄悄地打開了愛奇藝,看了某綜藝,也打開了淘寶,看了幾眼衣服,發(fā)現(xiàn)都是秒開。
但是這也是產(chǎn)品狗們的用心,一切都是為了用戶。對于那些沒有進過人工智能大坑的純潔用戶,他們真的只會指著自家的路由器或是運營商罵娘~
本次體驗最終識別準確結(jié)果是鬼針草,我對這個結(jié)果表示信服,因為這個花的葉子像細長的針,而且通常也長在偏僻的好像只有鬼才會走的路上,如果你覺得不服,可以再請求高手鑒定。
提供高手鑒定的好處在于,一方面通過用戶使用高手鑒定的點擊率,可以用于對后臺識別算法準確率的反饋,重新調(diào)節(jié)模型的參數(shù),所以用戶會感覺到在不斷地使用產(chǎn)品的過程中,識別的準確率會越來越好。
其次,現(xiàn)有的AI產(chǎn)品設計中,如果僅僅依賴算法可能無法滿足用戶的所有需求,尤其是一些比較特殊的場景,還是沒有辦法滿足用戶任何情境下滿意的要求。因而目前最為常用的方法是算法+人工。
比如抖音后臺的鑒黃,只是應對大數(shù)據(jù)去除那些特別特征較為明顯的,而剩下的比較容易歧義的,還是需要一定的人工進行輔助判斷,減少誤判率。即便如此,從整體上看,也大大地減少了人力、物力的損耗。
所以,形色的高手鑒定中,一方面是發(fā)布到平臺上,一些同樣愛好植物或者剛好認識的用戶會幫助解答,同時平臺也吸引了一些相關(guān)的專家入駐,以提升鑒定的效率和專業(yè)度。
陷入花草世界無法自拔,我又繼續(xù)拍了很多進行識別,上圖是部分結(jié)果。
從中可見,整體的識別準確率很不錯,而且每一次識別之后,都附帶了特別詩情畫意的解說,體驗棒棒噠。
最后一幅圖,為了惡搞算法,我特意選取了杯子上的任意一個綠色部分,最后平臺返回的結(jié)果是“我竟然被難倒了”,所以,我也竟然覺得哪怕錯了也還是這么可愛。
想象一下,五一你出去游覽祖國的大好河山,各種花花草草,肯定有不少不認識的,然而你只要一拿起手機,天下植物都在你心中,拿起形色,你就是山水間最有文化的仔~
當然了,小可愛也有失靈的時候。
比如輸入一株火龍果圖片,它給出的第一答案選項是火龍果,后面還給出一個選項是曇花,雖然我不知道曇花長啥樣,但是確實從圖片中看起來和火龍果有點像,而且第一選項答案也是正確的,所以嚴格來講,其實這個也可以理解,畢竟如果讓我來識別,我會說這是“仙人掌”。
其次,我拍攝一把鑰匙的圖片,算法識別結(jié)果為辣椒。這也不能怪算法,因為人工智能一定程度上是基于過往的經(jīng)驗對眼前的新事物結(jié)合其特征做出判斷,也就是說算法覺得自己應當在植物品類里找一個最匹配的來表征輸入的圖片,看來看去只有辣椒最像,就只好選它了,可見大部分算法還是比較“單純”的。
5用戶評論
同樣地,我們對產(chǎn)品搜集了對應的用戶評論。
首先,基于七麥數(shù)據(jù)顯示,形色的用戶評分當前顯示評分為4.9分,所有版本評分也達到4.9分,基本所有的評論集中在5星、4星,而低分評論占比極低,從而可直觀地看到,形色多出色呀~
同樣地,我收集了30條用戶評論。但是本次評論的篩選中,沒有刻意地集中在差評,而是對用戶的評論進行了整體評估,并提取其對應關(guān)鍵詞,最后進行歸類分析。
首先用戶評論的關(guān)鍵詞主要包括“內(nèi)容質(zhì)量需加強”、“效率提升”、“增加知識”、“準確率不高”、“準確率高”。
其中36.7%的用戶覺得使用形色增加了植物相關(guān)的知識,對于學習及日常裝逼有益,20%用戶覺得形色對每種植物、花草判斷都十分準確,非常智能,16.7%的用戶認為形色的內(nèi)容質(zhì)量需要加強,比如關(guān)于識別結(jié)果的解說可以更為詳細一些、平臺上關(guān)于植物的科普文章要更加專業(yè)一些等,13.3%的用戶覺得通過形色極大地提升了學習花草植物知識的效率,他們中有的人是園林或花藝設計師,最后還有13.3%的用戶認為識別的準確率不夠優(yōu)秀,可能是恰好他們問到了“算法”沒學過的部分。
進一步地,我們把用戶的評論最終歸結(jié)為產(chǎn)品、算法及運營維度。
其中,如效率提升、增加知識屬于產(chǎn)品范疇,正是由于產(chǎn)品能夠看到用戶的需求,并從用戶的角度出發(fā),巧妙地利用人工智能技術(shù),得以為用戶解決需求。這是用戶對形色的贊同,也是對它未來發(fā)展的期許,希望它一直記得初衷,服務用戶,不斷進步。
而準確率問題則屬于算法范疇,而由于平臺的訓練數(shù)據(jù),后續(xù)的經(jīng)驗積累、調(diào)參優(yōu)化,都對最終平臺的識別準確率有影響。坊間傳言,形色起步的訓練數(shù)據(jù)集就很龐大,而且后續(xù)也很注重收集用戶的反饋,進行模型準確率的調(diào)整,所以相信算法的“盲區(qū)”會越來越少,從而整體的準確率會進一步優(yōu)化。
最后,內(nèi)容問題則屬于運營范疇。之前看了一篇文章說到,互聯(lián)網(wǎng)產(chǎn)品的發(fā)展,從技術(shù)主導到產(chǎn)品主導,已經(jīng)開始萌生出運營主導的趨勢,無論該論斷正確與否,我們都不可忽略的是,運營是一款產(chǎn)品能否觸達大眾、煥發(fā)生命力的關(guān)鍵。而遺憾地是,形色的運營好像比較單調(diào),甚至我們印象里不記得它搞過一些什么事,所以這一點也比較吃虧,這也可以作為以后一個繼續(xù)加強的點吧。
6 技術(shù)分析
形色的實現(xiàn),其技術(shù)原理比較簡單,主要就是圖像識別及檢索,即通過圖片特征的提取,而后進行搜索匹配,最終輸出結(jié)果。形色之所有獲得比較好的準確率,主要在于它十分專注地打磨,把上述的每一個技術(shù)環(huán)節(jié)都做到了最好。
首先,訓練數(shù)據(jù)集牛逼。正所謂有多少數(shù)據(jù),就有多少智能,在應用上線的前期,形色團隊就意識到數(shù)據(jù)對于模型準確率的重要性,因此他們在訓練數(shù)據(jù)集的打造上花費了很多時間。
比如在前期,通過向各大論壇植物愛好者征集花草圖片數(shù)據(jù),自身團隊出動,到當?shù)剡M行常見花卉采集之后請專家鑒定。對于深度學習而言,由于深度網(wǎng)絡的復雜性,需要訓練的參數(shù)規(guī)模龐大,要想算法落地成產(chǎn)品后能獲得實際可用的結(jié)果,其實訓練數(shù)據(jù)集的需求量遠遠超出一般人的想象。
而當數(shù)據(jù)量不斷增加后,數(shù)據(jù)的清洗和標注又是另外一個更為復雜問題,形色團隊在這方面上也可以稱的上斥巨資。通過數(shù)據(jù)集上的努力,形色最初的模型比較簡單,獲得的準確率接近50%,這讓團隊看到了希望。
人工智能是仿生的,和人一樣,如果見得少,則判斷出錯的概率就大。所以為了減少算法識別錯誤的概率,需要讓模型盡可能學習更多的數(shù)據(jù),形色采取了一個長遠更為有效的措施是:在產(chǎn)品上線之后,進一步搜集用戶上傳的圖片,用于算法的迭代訓練。
結(jié)果顯示,隨著用戶數(shù)量增加,平臺訓練數(shù)據(jù)集擴增,識別的準確率也越來越高。
其次,平臺的技術(shù)方案靈活。形色無疑是一款優(yōu)秀的人工智能類產(chǎn)品,它在為用戶解決的過程中,傳達出一種十分謙遜、負責的態(tài)度。
具體地,在實現(xiàn)的過程中,除了以深度卷積神經(jīng)網(wǎng)絡對圖片進行分類并檢索的識別算法外,為了應對算法失靈的情況,形色還配備了專業(yè)的人士進行人工鑒定及解答。這是一種為技術(shù)留有余地的做法,更為靈活。
最后,技術(shù)細節(jié)的處理。形色在提取照片之后,考慮到用戶拍攝的圖片可能存在模糊、關(guān)鍵特征不明顯的特點,所以算法會對圖片進行統(tǒng)一的預處理之后再識別。
預處理的過程包括了光線調(diào)整、顏色反轉(zhuǎn)、曝光度、裁剪出關(guān)鍵部位等,如此,可以提升照片的質(zhì)量。因為深度網(wǎng)絡中,算法訓練時學習照片的特征,如果照片本身的質(zhì)量不佳,則算法會學到一些錯誤的特征,從而可能引發(fā)后續(xù)的判斷錯誤。同時,一些肉眼無法辨識的特征,尤其是某些相近的種類,如果沒有經(jīng)過預處理,模型就有可能無法獲得相關(guān)細節(jié),從而發(fā)生誤判。
整個實現(xiàn)的細節(jié)看似簡單,但是形色更多地從產(chǎn)品及用戶的角度出發(fā),打造了優(yōu)秀體驗,這也告誡我們,人工智能產(chǎn)品的設計,核心的算法可以不用很復雜,但是每一個技術(shù)的環(huán)節(jié)都要更細致且深入。
技術(shù)關(guān)鍵詞:數(shù)據(jù)集 ?算法+人工輔助 ?細節(jié)處理
7 功能擴展
之前我們說過,形色現(xiàn)在除了可以拍照識花草等植物,還可以拍照識果蔬和海鮮。這種產(chǎn)品功能的拓展,具體的準確率沒有去體驗,但是看評論中好像反應還不錯。
之所以提及這一點,是因為它的出現(xiàn)充分體現(xiàn)了人工智能產(chǎn)品設計及未來迭代、擴展的靈活性。
對于人工智能產(chǎn)品而言,最重要的因素在于數(shù)據(jù)集和算法,有了這兩樣東西,就可以對一些新的輸出產(chǎn)出有意義的輸出。
而形色基于在植物花草上技術(shù)的積累,引入新的品類“瓜果蔬菜”作為訓練數(shù)據(jù),重新調(diào)整模型的參數(shù),使得整體識別的準確率得到良好的擴展。
我們可以從中借鑒的意義在于,有的時候我們只需要花足夠多的時間和精力在一項簡單的技術(shù)上做深入的積累,等到時機成熟的時候,也許可以花費極小的成本將其成功遷移到另一項功能上。所以人工智能類的產(chǎn)品,不要一開始就著眼于用多復雜的技術(shù)、做多復雜的功能,簡單、高效直至爐火純青才是王道!
總結(jié)
本期我們一起分析了好玩又有教育意義的小眾AI產(chǎn)品“形色”,什么都不嗶嗶了,今天五一用起來吧,一起在大自然母親的懷抱里感受到人工智能的無窮樂趣吧~
往期直播(點擊圖片跳轉(zhuǎn))
今日看圖猜技術(shù)
AI1000問
有三AI生態(tài)
更多精彩內(nèi)容請關(guān)注知乎專欄《有三AI學院》
轉(zhuǎn)載文章請后臺聯(lián)系
侵權(quán)必究
往期精選
【AI產(chǎn)品】產(chǎn)品小姐姐分析抖音背后的計算機視覺技術(shù)
【AI產(chǎn)品】深扒美圖秀秀中擄獲萬千少女芳心的“AI秘籍”
【AI產(chǎn)品】超長文詳解作業(yè)幫產(chǎn)品邏輯和技術(shù)原理
【AI初識境】從3次人工智能潮起潮落說起
【AI初識境】從頭理解神經(jīng)網(wǎng)絡-內(nèi)行與外行的分水嶺
【AI初識境】近20年深度學習在圖像領(lǐng)域的重要進展節(jié)點
【AI初識境】激活函數(shù):從人工設計到自動搜索
【AI初識境】什么是深度學習成功的開始?參數(shù)初始化
【AI初識境】深度學習模型中的Normalization,你懂了多少?
【AI初識境】為了圍剿SGD大家這些年想過的那十幾招
【AI初識境】被Hinton,DeepMind和斯坦福嫌棄的池化,到底是什么?
【AI初識境】如何增加深度學習模型的泛化能力
【AI初識境】深度學習模型評估,從圖像分類到生成模型
【AI初識境】深度學習中常用的損失函數(shù)有哪些?
【AI初識境】給深度學習新手做項目的10個建議
【完結(jié)】深度學習CV算法工程師從入門到初級面試有多遠,大概是25篇文章的距離
【完結(jié)】優(yōu)秀的深度學習從業(yè)者都有哪些優(yōu)秀的習慣
【完結(jié)】給新手的12大深度學習開源框架快速入門項目
【完結(jié)】總結(jié)12大CNN主流模型架構(gòu)設計思想
總結(jié)
以上是生活随笔為你收集整理的【AI产品】五一出游赏花草,你一定需要这款“形色”的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【AI不惑境】网络宽度对模型性能有什么影
- 下一篇: 有三AI小程序上线,把你的代码show给