成为数据专家,你只差一个Quick Insights的距离
| 微軟亞洲研究院 2015年12月22日 | ? |
身處如今的大數(shù)據(jù)時(shí)代,你真的知道如何處理數(shù)據(jù)和分析數(shù)據(jù)嗎?或許那些被你忽視的數(shù)據(jù)背后就暗藏著重要的商業(yè)靈感。并非人人都是數(shù)據(jù)專(zhuān)家,有時(shí)候你需要一些專(zhuān)業(yè)的軟件來(lái)幫你處理數(shù)據(jù)。那么如何能快速、準(zhǔn)確地從數(shù)據(jù)中提取最有價(jià)值的部分從而進(jìn)行有效的分析呢?只會(huì)簡(jiǎn)單統(tǒng)計(jì)圖肯定是不夠的,你還需要Power BI平臺(tái)最新推出的“快速洞察”(Quick Insights)功能,利用可視化的數(shù)據(jù)呈現(xiàn)方法以及專(zhuān)家級(jí)的數(shù)據(jù)洞察能力,實(shí)現(xiàn)快速、專(zhuān)業(yè)的數(shù)據(jù)分析。
Power BI是微軟推出的在線服務(wù),通過(guò)powerbi.com能夠讓你用最直觀的方法對(duì)數(shù)據(jù)進(jìn)行處理,例如查找和呈現(xiàn)數(shù)據(jù)、在線共享數(shù)據(jù)、團(tuán)隊(duì)協(xié)同合作,等等。目前,Power BI平臺(tái)最新推出的“快速洞察”(Quick Insights)功能夠幫助你快速找到數(shù)據(jù)背后的秘密。想要使用這個(gè)新的工具,你只需選擇“Quick Insights”,并將它應(yīng)用在一個(gè)已經(jīng)上傳到Power BI的數(shù)據(jù)集上,系統(tǒng)將會(huì)在大約幾秒鐘內(nèi)從數(shù)據(jù)中搜索出你可能感興趣的信息,如數(shù)據(jù)之間的相關(guān)性、數(shù)據(jù)內(nèi)的異常點(diǎn)、時(shí)序數(shù)據(jù)的趨勢(shì)以及周期性變化規(guī)律等等,并進(jìn)行可視化呈現(xiàn)。當(dāng)用戶(hù)面對(duì)陌生的數(shù)據(jù)集不知從哪里入手進(jìn)行分析時(shí),這些自動(dòng)搜索出的信息可以為用戶(hù)提供有效的切入點(diǎn)。對(duì)于用戶(hù)熟悉的數(shù)據(jù)集,Quick Insights也有可能提供超出預(yù)期的分析結(jié)果。
更好的數(shù)據(jù)分析從Quick Insights開(kāi)始!
BI即商業(yè)智能(Business Intelligence, BI)。過(guò)去在商業(yè)智能領(lǐng)域,用戶(hù)和數(shù)據(jù)分析工具之間的交互往往是單向的。具體表現(xiàn)為,用戶(hù)用命令或者通過(guò)圖形化界面告訴系統(tǒng)需要進(jìn)行查詢(xún)或者生成圖表。這樣系統(tǒng)只是被動(dòng)地接受指令,對(duì)數(shù)據(jù)進(jìn)行處理然后返回結(jié)果。相比之下,Quick Insights提供了雙向的交互模型。當(dāng)用戶(hù)上傳數(shù)據(jù)之后,它的算法能夠主動(dòng)對(duì)這些數(shù)據(jù)進(jìn)行分析,將分析結(jié)果以insights的形式進(jìn)行組織和排序,并將排名在前的insights提供給用戶(hù)。不僅如此,Quick Insights會(huì)選擇適合的數(shù)據(jù)展示方式來(lái)呈現(xiàn)這些insights,并配合文字說(shuō)明以方便用戶(hù)理解。
目前,Quick Insights提供了七種類(lèi)型的insights。借助這些不同種類(lèi)的insights,用戶(hù)能夠快速地在數(shù)據(jù)中找到關(guān)鍵信息。以汽車(chē)銷(xiāo)售數(shù)據(jù)為例,倘若你上傳了一份跨越多年的汽車(chē)銷(xiāo)售記錄數(shù)據(jù),或者是一份應(yīng)用軟件的下載記錄數(shù)據(jù),那么如何在如此龐雜的數(shù)據(jù)中篩選出最有價(jià)值的信息呢?Quick Insights可以從以下方面提供幫助。
主因素分析:在特定維度下,分析找出對(duì)于結(jié)果影響最大的某個(gè)因素。例如汽車(chē)銷(xiāo)售量的大部分是由一線銷(xiāo)售貢獻(xiàn)的。
類(lèi)別優(yōu)勢(shì)或劣勢(shì)分析:鑒別出單一維度下,相對(duì)優(yōu)勢(shì)或劣勢(shì)突出的元素類(lèi)型。例如,在消費(fèi)者獲取購(gòu)車(chē)折扣的聯(lián)系人中,一線銷(xiāo)售和市場(chǎng)經(jīng)理這兩項(xiàng),相比于其他項(xiàng)有明顯的領(lǐng)先優(yōu)勢(shì)。
時(shí)間序列特殊點(diǎn):對(duì)于時(shí)間序列數(shù)據(jù),分析出具有異常數(shù)據(jù)的時(shí)間點(diǎn)。例如2012年1月到7月的某幾天,消費(fèi)者對(duì)于天氣相關(guān)的應(yīng)用軟件的下載量異常的高。
時(shí)間序列的趨勢(shì):分析數(shù)據(jù)隨時(shí)間變化趨勢(shì)。如南美地區(qū)的折扣在逐年增加等等。
時(shí)間序列的周期性:分析數(shù)據(jù)的周期性變化趨勢(shì)。如產(chǎn)品預(yù)算隨時(shí)間呈現(xiàn)明顯的周期性增長(zhǎng)。
穩(wěn)定的比例關(guān)系分析:找出一系列變量中有穩(wěn)定比例關(guān)系的自變量與因變量。例如在汽車(chē)銷(xiāo)售的成本核算上,一線銷(xiāo)售所占比例基本不變。
數(shù)據(jù)關(guān)聯(lián)分析:找出多個(gè)變量之間的相關(guān)性。例如折扣力度和銷(xiāo)售量之間的正比例關(guān)系。
未來(lái),Quick Insights還將推出時(shí)序數(shù)據(jù)的變化分析以及均勻分布分析等更多的專(zhuān)業(yè)分析模型供用戶(hù)使用。“Power BI的新功能——Quick Insights,讓你只通過(guò)點(diǎn)擊鼠標(biāo),就能對(duì)數(shù)據(jù)使用多種分析算法并找到潛在規(guī)律,” Power BI的項(xiàng)目主管Patrick Baumgartner解釋說(shuō)。
知其一,也知其二
Quick Insights的誕生來(lái)源于兩個(gè)團(tuán)隊(duì)的共同努力,分別是微軟亞洲研究院的軟件分析組(Software Analytics Group)和總部的Power BI產(chǎn)品團(tuán)隊(duì)。微軟亞洲研究院軟件分析組多年來(lái)在數(shù)據(jù)分析以及可視化等方面的研究和積累為Quick Insights的研發(fā)奠定了牢固的基礎(chǔ)。
“微軟亞洲研究院軟件分析組的研究工作可以分為應(yīng)用領(lǐng)域和基礎(chǔ)研究領(lǐng)域,”該組的首席研究員張冬梅博士介紹道。從應(yīng)用領(lǐng)域來(lái)說(shuō),軟件分析組以軟件為研究對(duì)象,主要采用數(shù)據(jù)驅(qū)動(dòng)的方式解決三個(gè)方面的問(wèn)題,一是軟件系統(tǒng)的質(zhì)量(Quality),如可靠性、性能、以及安全性等;二是用戶(hù)體驗(yàn)(Experience),如用戶(hù)界面、用戶(hù)使用方式、以及用戶(hù)黏度等等;最后是軟件開(kāi)發(fā)效率(Productivity)。為了解決這些應(yīng)用領(lǐng)域中的問(wèn)題,我們需要在一些基礎(chǔ)研究領(lǐng)域內(nèi)有相應(yīng)的技術(shù)支撐,包括大規(guī)模數(shù)據(jù)存儲(chǔ)與計(jì)算、各種數(shù)據(jù)分析算法、以及信息可視化。
張冬梅博士說(shuō):“日常工作中,我們?cè)诨A(chǔ)研究領(lǐng)域中的技術(shù)會(huì)為應(yīng)用領(lǐng)域的研究目標(biāo)提供支持;同時(shí),我們?cè)趹?yīng)用領(lǐng)域中遇到的挑戰(zhàn)也為我們?cè)诨A(chǔ)領(lǐng)域的研究提供問(wèn)題和靈感。事實(shí)上包括‘Quick Insights’在內(nèi),我們有很多研究課題與項(xiàng)目設(shè)想是基于這種‘應(yīng)用領(lǐng)域與基礎(chǔ)領(lǐng)域’相互作用的工作狀態(tài)。”
在張冬梅博士和她的團(tuán)隊(duì)內(nèi)部, Quick Insights有一個(gè)內(nèi)部代號(hào),即“IN4”項(xiàng)目。“IN4”的名稱(chēng)取自interactive(互動(dòng))、intuitive(直觀)、instant(瞬時(shí))和insights(洞察)這四個(gè)單詞。這四個(gè)單詞描述了Quick Insights的產(chǎn)品特性,更包含了微軟亞洲研究院軟件分析組對(duì)于這項(xiàng)技術(shù)的期待與追求。團(tuán)隊(duì)成員們希望“IN4”能讓未來(lái)的數(shù)據(jù)分析過(guò)程更具互動(dòng)性、更加直觀、更實(shí)時(shí)快速,最后也更具智能化的洞察性。
成功的基石伴隨著合作的共贏
2015年3月在微軟技術(shù)節(jié)(TechFest)上,“IN4”項(xiàng)目首次在公司內(nèi)發(fā)布。就在這場(chǎng)微軟技術(shù)節(jié)上,“IN4”項(xiàng)目和Power BI首次相遇,并一拍即合。隨后的幾個(gè)月中,兩個(gè)跨國(guó)團(tuán)隊(duì)密切合作,攻克了許多技術(shù)難關(guān),迅速開(kāi)發(fā)出Quick Insights的原型,隨后不斷完善。Power BI團(tuán)隊(duì)十分激動(dòng)地在郵件中寫(xiě)道:“非常感謝微軟亞洲研究院團(tuán)隊(duì)的支持。如果沒(méi)有你們的技術(shù),我們?cè)谥悄軘?shù)據(jù)分析方面的產(chǎn)品開(kāi)發(fā)將會(huì)難以開(kāi)展。正因?yàn)橛辛四銈兊膸椭?#xff0c;我們才能如此迅速和高效地把這項(xiàng)讓人驚喜的技術(shù)應(yīng)用到Power BI中。”
今年12月,Quick Insights正式上線。在短短不到9個(gè)月的時(shí)間里,我們見(jiàn)證了一項(xiàng)技術(shù)研究向產(chǎn)品的轉(zhuǎn)化,時(shí)間之快,在眾多技術(shù)轉(zhuǎn)化的合作案例中也不常見(jiàn)。談及為何能在這么短的時(shí)間內(nèi)從合作想法的萌芽到產(chǎn)品功能的發(fā)布,冬梅博士感慨這離不開(kāi)兩個(gè)團(tuán)隊(duì)的共同努力:“雖然兩個(gè)團(tuán)隊(duì)距離遙遠(yuǎn),甚至都沒(méi)有太多面對(duì)面交流的機(jī)會(huì),但兩個(gè)團(tuán)隊(duì)的合作非常默契。有了想法、技術(shù)再加之以踐行,合作共贏,才最終讓我們的靈感‘振翅高飛’!“相信在未來(lái),兩個(gè)團(tuán)隊(duì)將會(huì)繼續(xù)攜手并進(jìn),在Power BI的平臺(tái)上為用戶(hù)帶來(lái)更多更智能的數(shù)據(jù)分析服務(wù)。
總結(jié)
以上是生活随笔為你收集整理的成为数据专家,你只差一个Quick Insights的距离的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 微软自拍:让黑科技拯救不会拍照的你
- 下一篇: 百度外卖融资计划书