大数据是风口,但是该怎么规划架构?一般人都没注意到
01
分析需求
1. 挖掘真實(shí)需求
俗話(huà)說(shuō),良好的開(kāi)始是成功的一半。很多大數(shù)據(jù)產(chǎn)品之所以失敗,歸根到底就是出發(fā)點(diǎn)不對(duì),沒(méi)有找準(zhǔn)真需求,無(wú)法推動(dòng)解決實(shí)際問(wèn)題。流于表面的數(shù)據(jù)產(chǎn)品,是對(duì)時(shí)間和人力資源的浪費(fèi)。
那么,如何對(duì)問(wèn)題進(jìn)行分析,挖掘真實(shí)需求呢?
從模糊的需求中挖掘本質(zhì),找出真需求,就是需求分析的內(nèi)容了。
需求分析的第一步是對(duì)客戶(hù)基本資料和現(xiàn)狀的解讀,從現(xiàn)狀出發(fā)了解客戶(hù)對(duì)現(xiàn)狀的不滿(mǎn)和遇到的困難。除了培養(yǎng)同理心之外,這里提供兩種簡(jiǎn)單有效的方法,第一個(gè)是花些時(shí)間收集客戶(hù)內(nèi)部需求干系人對(duì)現(xiàn)狀的吐槽,找出其中的共性和最不滿(mǎn)的點(diǎn);第二個(gè)是詢(xún)問(wèn)客戶(hù)對(duì)現(xiàn)有的各類(lèi)解決方案的點(diǎn)評(píng)和意見(jiàn),了解其關(guān)注點(diǎn)。
“診”完了客戶(hù)的現(xiàn)狀,下一步就是配”藥”了。人們常犯的第一個(gè)錯(cuò)誤就是功能堆砌,什么都有什么都能做。第二個(gè)錯(cuò)誤就是抄襲復(fù)刻,把別人的解決方案原封不動(dòng)照搬過(guò)來(lái),沒(méi)有特點(diǎn)。第三個(gè)錯(cuò)誤是為了讓產(chǎn)品顯得高端而強(qiáng)行捆綁一些不成熟的前沿技術(shù),沒(méi)有考慮實(shí)用性和性?xún)r(jià)比。
在大數(shù)據(jù)項(xiàng)目中,原子級(jí)能力的強(qiáng)弱大同小異,解決方案的好壞關(guān)鍵在于場(chǎng)景滲透能力、技術(shù)整合能力和可持續(xù)升級(jí)能力。所謂”對(duì)癥下藥”,就是要以點(diǎn)帶面,在客戶(hù)最關(guān)注的一點(diǎn)上做深做透,細(xì)節(jié)上考慮得更多,在完成度上更上一層樓。
2. 減法思維,以點(diǎn)帶面
前面提到了我們應(yīng)該在核心功能上做深做透,用到的是便是減法思維。
減法思維是指合理地減少一些不必要、與現(xiàn)狀不匹配的事情來(lái)提高效率的一種思維。從概念可以看出來(lái),減法思維的的關(guān)鍵點(diǎn)在于減少不必要、與現(xiàn)狀不匹配的事情來(lái)實(shí)現(xiàn)高效,也就是說(shuō),如果你要做減法,你需要先識(shí)別出哪些事情是不必要并與現(xiàn)狀不匹配的,并能在減掉這些事情之后能夠提高效率。
?
02
數(shù)據(jù)盤(pán)點(diǎn)
1. 準(zhǔn)備數(shù)據(jù)需求
傳統(tǒng)IT行業(yè)的需求點(diǎn)多是固定的業(yè)務(wù)邏輯,但大數(shù)據(jù)產(chǎn)品則更多的依賴(lài)數(shù)據(jù),它的價(jià)值上限取決于數(shù)據(jù)自身的價(jià)值上限,正如那句經(jīng)典的名言,”garbage in garbage out”。正因?yàn)槿绱?#xff0c;設(shè)計(jì)大數(shù)據(jù)產(chǎn)品需要盡早準(zhǔn)備數(shù)據(jù)需求。
數(shù)據(jù)需求文檔DRD(Data Raquirements Document)顧名思義同PRD一樣,是同研發(fā)團(tuán)隊(duì)溝通的一種憑據(jù)。主要包括了三部分:Source(來(lái)源)、Measures(指標(biāo))、Dimensions(維度)。
來(lái)源:就是指數(shù)據(jù)從何而來(lái)。來(lái)自哪個(gè)系統(tǒng)?使用何種數(shù)據(jù)接口?數(shù)據(jù)更新頻率如何?
指標(biāo):顧名思義,講指標(biāo)的定義和計(jì)算邏輯。
維度:是用戶(hù)用于查看指標(biāo)的數(shù)據(jù)元素。描述了數(shù)據(jù)需要以何種力度被組織起來(lái)。
從產(chǎn)物角度看,DRD需要產(chǎn)出的有數(shù)據(jù)流圖和數(shù)據(jù)字典,兩者相輔相成。沒(méi)有數(shù)據(jù)字典準(zhǔn)確地描述數(shù)據(jù)流圖中使用的數(shù)據(jù),數(shù)據(jù)流圖就不嚴(yán)格。反之,沒(méi)有數(shù)據(jù)流圖,數(shù)據(jù)字典也難于發(fā)揮作用。
?
數(shù)據(jù)流:是由一組固定成分的數(shù)據(jù)組成,表示數(shù)據(jù)的流向。值得注意的是,數(shù)據(jù)流圖中描述的是數(shù)據(jù)流,而不是控制流。除了流向數(shù)據(jù)存儲(chǔ)或從數(shù)據(jù)存儲(chǔ)流出的數(shù)據(jù)不必命名外,每個(gè)數(shù)據(jù)流必須要有一個(gè)合適的名字,以反映該數(shù)據(jù)流的含義。
數(shù)據(jù)存儲(chǔ):數(shù)據(jù)存儲(chǔ)表示暫時(shí)存儲(chǔ)的數(shù)據(jù)。每個(gè)數(shù)據(jù)存儲(chǔ)都有一個(gè)名字。
【拓展】數(shù)據(jù)字典
任何字典最重要的用途都是供人查詢(xún)對(duì)不了解的條目的解釋,在結(jié)構(gòu)化分析中,數(shù)據(jù)字典的作用是給數(shù)據(jù)流圖上每個(gè)成分加以定義和說(shuō)明。換句話(huà)說(shuō),數(shù)據(jù)流圖上所有的成分的定義和解釋的文字集合就是數(shù)據(jù)字典。
?
2. 收集數(shù)據(jù)
收集數(shù)據(jù)主要可以分為外部數(shù)據(jù)和內(nèi)部數(shù)據(jù)兩類(lèi)。
內(nèi)部數(shù)據(jù)是由組織內(nèi)部的業(yè)務(wù)流程和運(yùn)營(yíng)過(guò)程中生成的數(shù)據(jù)。這些業(yè)務(wù)流程可以生成特定于該組織運(yùn)營(yíng)的大量數(shù)據(jù),例如客戶(hù)購(gòu)買(mǎi)數(shù)據(jù)、商品物流數(shù)據(jù)、評(píng)價(jià)數(shù)據(jù)等。除了顯式反饋數(shù)據(jù)的收集外,互聯(lián)網(wǎng)行業(yè)的一大特色是擁有大量的隱式反饋數(shù)據(jù),例如通過(guò)埋點(diǎn)形式收集用戶(hù)的行為數(shù)據(jù)。
除了內(nèi)部數(shù)據(jù)之外,我們還會(huì)接觸到很多外部數(shù)據(jù),外部數(shù)據(jù)就是是在組織運(yùn)營(yíng)范圍之外生成的數(shù)據(jù)。外部數(shù)據(jù)一般是企業(yè)所處的外部環(huán)境相關(guān)的數(shù)據(jù),包括諸如全球經(jīng)濟(jì)指數(shù),人口普查信息和行業(yè)價(jià)格之類(lèi)的信息等等。所有這些數(shù)據(jù)均一直存在,與任何特定組織無(wú)關(guān)。
?
一般而言,價(jià)值創(chuàng)收目前主要都來(lái)自于對(duì)內(nèi)部數(shù)據(jù)的挖掘,但外部數(shù)據(jù)的價(jià)值也不容小覷。假如一家創(chuàng)業(yè)公司剛剛起步,自身并沒(méi)有還積累數(shù)據(jù),怎么辦?就算有數(shù)據(jù),但擁有的數(shù)據(jù)無(wú)論在“質(zhì)”和“量”上都很差,怎么辦?或者說(shuō),從內(nèi)部數(shù)據(jù)上發(fā)現(xiàn)了某指標(biāo)的變動(dòng),但對(duì)于其真實(shí)動(dòng)因無(wú)法準(zhǔn)確判定,怎么辦?這時(shí)候就需要外部數(shù)據(jù)的幫助了。
想要獲取外部數(shù)據(jù),除了前面提到的可以從公開(kāi)的數(shù)據(jù)網(wǎng)站上查詢(xún)外,另一大方法就是爬蟲(chóng)。這種方法更加靈活,但是需要注意法律風(fēng)險(xiǎn)。
03
數(shù)據(jù)源管理
1. 數(shù)據(jù)源分類(lèi)
完成數(shù)據(jù)盤(pán)點(diǎn)后,我們知道了現(xiàn)在有哪些數(shù)據(jù),接下來(lái)就是給它們劃分業(yè)務(wù)領(lǐng)域,也就是類(lèi)別。
對(duì)于小規(guī)模的業(yè)務(wù)來(lái)說(shuō),數(shù)據(jù)源歸類(lèi)的作用并不明顯,但是當(dāng)數(shù)據(jù)表多達(dá)幾百上千個(gè),而且功能有重疊冗余、有新有舊的時(shí)候,數(shù)據(jù)源歸類(lèi)就相當(dāng)重要了。
業(yè)務(wù)領(lǐng)域囊括的范圍可大可小,完全依托于前期基于業(yè)務(wù)的梳理結(jié)果。
值得一提的是,數(shù)據(jù)(中臺(tái))全景圖是一個(gè)執(zhí)行數(shù)據(jù)歸類(lèi)的很好的工具,便于數(shù)據(jù)查找。
?
2. 數(shù)據(jù)源分級(jí)
不同于數(shù)據(jù)分類(lèi),數(shù)據(jù)源分級(jí)更多的是從滿(mǎn)足監(jiān)管要求的角度出發(fā)。數(shù)據(jù)分級(jí)屬于數(shù)據(jù)安全領(lǐng)域,或許稱(chēng)呼它為敏感等級(jí)更為貼切。有的數(shù)據(jù)密集程度高,有的低,有的可公開(kāi),有的不可公開(kāi),不同敏感度等級(jí)的數(shù)據(jù)對(duì)外共享開(kāi)放的程度不同。
04
數(shù)據(jù)資產(chǎn)管理與數(shù)據(jù)資產(chǎn)管理平臺(tái)
1. 數(shù)據(jù)資產(chǎn)與數(shù)據(jù)資產(chǎn)管理
2. 數(shù)據(jù)資產(chǎn)管理平臺(tái)的作用和價(jià)值
?
數(shù)據(jù)資產(chǎn)管理平臺(tái)是對(duì)企業(yè)數(shù)據(jù)盤(pán)點(diǎn)、數(shù)據(jù)管控等能力的承載和表現(xiàn),它可以對(duì)全網(wǎng)數(shù)據(jù)資產(chǎn)進(jìn)行統(tǒng)計(jì)、對(duì)數(shù)據(jù)權(quán)限進(jìn)行細(xì)粒度的梳理、對(duì)數(shù)據(jù)使用狀況進(jìn)行分析,大大降低管理人員工作量,同時(shí)為數(shù)據(jù)安全制度的建設(shè)提供依據(jù)。
3. 數(shù)據(jù)資產(chǎn)管理平臺(tái)的主要功能
?
?
總結(jié)
以上是生活随笔為你收集整理的大数据是风口,但是该怎么规划架构?一般人都没注意到的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: BI报表平台纪实:半年被叫停,用户个位数
- 下一篇: 最可怕的企业“内卷化”,是走入以下10个