「Sqlserver」数据分析师有理由爱Sqlserver之三-最值得使有低投入高产出的Sqlserver功能...
數(shù)據(jù)分析師群體,有別于一般的傳統(tǒng)開(kāi)發(fā)群體和數(shù)據(jù)庫(kù)運(yùn)維群體,對(duì)Sqlserver的功能需求上也各不相同,本篇以筆者的親身經(jīng)歷,用一種有別于一般性教程的角度來(lái)講解Sqlserver值得我們學(xué)習(xí),投入產(chǎn)出比高的一些功能模塊。
當(dāng)然,知道地越多,能夠產(chǎn)生的價(jià)值也越大,在平衡投入產(chǎn)出比的前提下,越往深入學(xué)習(xí),在特定時(shí)候會(huì)產(chǎn)生成倍的回報(bào)。
相關(guān)閱讀
數(shù)據(jù)分析師有理由愛(ài)Sqlserver之一-好用的插件工具推薦
數(shù)據(jù)分析師有理由愛(ài)Sqlserver之二-像使用Excel一般地使用SqlServer
數(shù)據(jù)分析師的定義
雖然真正意義上的數(shù)據(jù)分析師是很高級(jí)的分析水平,也有超強(qiáng)的學(xué)習(xí)能力,大不必來(lái)閱讀筆者所寫(xiě)的這些不太有營(yíng)養(yǎng)的入門(mén)讀物。
但就像市面上大家都對(duì)一個(gè)小軟件叫系統(tǒng),一個(gè)簡(jiǎn)單進(jìn)銷(xiāo)存叫ERP一樣,大家對(duì)數(shù)據(jù)分析師的稱(chēng)號(hào)也是很大的寬容,類(lèi)似筆者這樣一個(gè)三流分析水平,經(jīng)常各種方向到處尋覓的各種知識(shí)領(lǐng)域的人,也能叫上個(gè)數(shù)據(jù)分析師的頭銜。
本篇的定義的數(shù)據(jù)分析師也同樣是寬泛的,可能只是一個(gè)普通數(shù)據(jù)文員,統(tǒng)計(jì)員的角色,但誰(shuí)都是從普通工作做起,普通數(shù)據(jù)統(tǒng)計(jì)慢慢爬升起來(lái)的,筆者也相信這些分享也可以幫助許多的沒(méi)有明確方向指引的、在數(shù)據(jù)領(lǐng)域摸爬滾打的人群帶來(lái)一些幫助的。
數(shù)據(jù)分析師的剛需
普通的數(shù)據(jù)分析師,在數(shù)據(jù)量不大的情形下,使用Excel是一個(gè)很不錯(cuò)的選擇,但數(shù)據(jù)量一大,Excel的性能也開(kāi)始出現(xiàn)瓶頸,就算是現(xiàn)在自助式BI技術(shù)的普及,對(duì)于定位為單機(jī)版的Excel、ACCESS、PowerBIDesktop等工具來(lái)說(shuō),仍然容易存在性能的瓶頸。
所以,筆者對(duì)數(shù)據(jù)分析師的剛需理解為:數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)查詢與處理方面的相關(guān)功能。對(duì)應(yīng)于Sqlserver的使用場(chǎng)景是,能夠幫我們把數(shù)據(jù)順利地把手頭上的數(shù)據(jù)放到數(shù)據(jù)庫(kù)中集中式存放,當(dāng)要使用時(shí),可以將其重新導(dǎo)出,并且可以適當(dāng)?shù)刈饕恍┘庸ぬ幚砣缍鄠€(gè)表關(guān)聯(lián)查詢,數(shù)據(jù)顆粒度的匯總聚合等。最終可以有很好的載體來(lái)承接這些數(shù)據(jù)如導(dǎo)出至Excel表格或?qū)氲絇owerBI模型或其他SPSS、python等更專(zhuān)業(yè)的分析軟件或工具中。
總結(jié)為Sqlserver上的功能掌握為:數(shù)據(jù)導(dǎo)入導(dǎo)出、會(huì)使用SQL查詢數(shù)據(jù),知道怎樣使用其他軟件工具訪問(wèn)Sqlserver數(shù)據(jù)。
數(shù)據(jù)分析師的進(jìn)階需求
有了前面的一些簡(jiǎn)單掌握后,基本可滿足自身的數(shù)據(jù)分析需求,但如果需要更加自動(dòng)化、更靈活安全地?cái)?shù)據(jù)分發(fā)、對(duì)數(shù)據(jù)運(yùn)算性能的更多地優(yōu)化,也是需要繼續(xù)學(xué)習(xí)Sqlserver的其他一些企業(yè)級(jí)的功能知識(shí)點(diǎn)的。
企業(yè)級(jí)IT主導(dǎo)和個(gè)人部門(mén)級(jí)業(yè)務(wù)主導(dǎo)很大的差異點(diǎn)在于企業(yè)級(jí)的解決方案可滿足到:數(shù)據(jù)權(quán)限控制,流程自動(dòng)化處理,流程穩(wěn)定性保障,性能并發(fā)性滿足等等,這些都是單機(jī)版文件型的解決方案所難于滿足到的。
所以進(jìn)階性的需求對(duì)應(yīng)于Sqlserver的知識(shí)點(diǎn)為:登錄名、用戶名的運(yùn)維,各數(shù)據(jù)表、視圖、存儲(chǔ)過(guò)程等數(shù)據(jù)庫(kù)對(duì)象的權(quán)限授予分發(fā),查詢性能的優(yōu)化如索引的添加維護(hù)、復(fù)雜SQL查詢的創(chuàng)建,特別是專(zhuān)為數(shù)據(jù)分析師準(zhǔn)備的數(shù)據(jù)分析窗口函數(shù)非常有必要完全掌握,還有一些自動(dòng)化調(diào)度作業(yè)系統(tǒng)的使用滿足流程的自動(dòng)化。
數(shù)據(jù)分析師較少需要關(guān)注到的方面
因數(shù)據(jù)分析的場(chǎng)景不像生產(chǎn)數(shù)據(jù)環(huán)節(jié)的業(yè)務(wù)系統(tǒng)那般高要求,例如不能隨便出錯(cuò),沒(méi)有機(jī)會(huì)讓你隨便死機(jī)后重啟系統(tǒng),應(yīng)對(duì)大量用戶的高并發(fā)查詢請(qǐng)求和數(shù)據(jù)增刪改查任務(wù),所以往往一些教材上談及的高級(jí)的功能,對(duì)數(shù)據(jù)分析的群體來(lái)說(shuō),都是非常少的應(yīng)用面和非常不實(shí)用的知識(shí)。
例如:數(shù)據(jù)庫(kù)鎖機(jī)制、觸發(fā)器、事務(wù)、游標(biāo)、高性能查詢優(yōu)化、日志的維護(hù)等等。這些知識(shí)點(diǎn)如果在學(xué)習(xí)過(guò)程中遇到,筆者認(rèn)為只需略略地帶過(guò),了解一下即可。
更合理的方案是數(shù)據(jù)分析使用的數(shù)據(jù)庫(kù),與業(yè)務(wù)系統(tǒng)的數(shù)據(jù)庫(kù)分離,一般專(zhuān)業(yè)一點(diǎn)的叫法是組建一個(gè)數(shù)據(jù)中心或數(shù)據(jù)倉(cāng)庫(kù),專(zhuān)門(mén)用于數(shù)據(jù)分析的查詢性需求(這個(gè)一般專(zhuān)業(yè)做法是使用BI系統(tǒng)中的數(shù)據(jù)ETL工具,將數(shù)據(jù)從生產(chǎn)性環(huán)境同步一份到分析服務(wù)器上)。
有了專(zhuān)門(mén)不受生產(chǎn)環(huán)境影響的數(shù)據(jù)倉(cāng)庫(kù),再怎么出錯(cuò),也最多重啟一下,數(shù)據(jù)不會(huì)因這短暫的停止而影響業(yè)務(wù)進(jìn)展,同時(shí)一般分析性的數(shù)據(jù)倉(cāng)庫(kù),并發(fā)性訪問(wèn)也不高,也無(wú)需苦苦地為了優(yōu)化一個(gè)查詢從100秒的等待時(shí)間優(yōu)化為1秒這種需要大量的知識(shí)儲(chǔ)備和專(zhuān)業(yè)知識(shí)才能完成的高難度任務(wù)。
結(jié)語(yǔ)
經(jīng)過(guò)以上的簡(jiǎn)單梳理,再結(jié)合上兩篇提及的Sqlserver的使用方式(盡可能地使用界面化操作完成降低難度和大量使用外部工具插件提升SQL書(shū)寫(xiě)的便捷性),自己再入門(mén)一些簡(jiǎn)單的教程和示例(微軟MSDN和微軟Learn等資源已經(jīng)非常豐富,易學(xué)),相信對(duì)于一名數(shù)據(jù)庫(kù)新手來(lái)說(shuō),要往數(shù)據(jù)分析師方向發(fā)展,往前邁出一步學(xué)習(xí)下Sqlserver也不會(huì)是太難的事情。
當(dāng)然筆者也會(huì)在日后有限的時(shí)間內(nèi),盡量分享一些簡(jiǎn)單易行、功能強(qiáng)大的個(gè)人的知識(shí)輸出和觀點(diǎn)分享,相信是除了系統(tǒng)學(xué)習(xí)外一個(gè)很好的補(bǔ)充,祝讀者朋友們?cè)趯W(xué)習(xí)上一路順利,有問(wèn)題多回來(lái)交流。如果覺(jué)得受用,也請(qǐng)多多幫忙傳播分享給有需要的人。
筆者未來(lái)聚焦在數(shù)據(jù)領(lǐng)域的分享,不限于Excel,會(huì)分享更多Sqlserver、dotNET、Azure、PowerBI等話題,升級(jí)數(shù)據(jù)分析的能力,歡迎繼續(xù)關(guān)注。
關(guān)于Excel催化劑
Excel催化劑先是一微信公眾號(hào)的名稱(chēng),后來(lái)順其名稱(chēng),正式推出了Excel插件,插件將持續(xù)性地更新,更新的周期視本人的時(shí)間而定爭(zhēng)取一周能夠上線一個(gè)大功能模塊。Excel催化劑插件承諾個(gè)人用戶永久性免費(fèi)使用!
Excel催化劑插件使用最新的布署技術(shù),實(shí)現(xiàn)一次安裝,日后所有更新自動(dòng)更新完成,無(wú)需重復(fù)關(guān)注更新動(dòng)態(tài),手動(dòng)下載安裝包重新安裝,只需一次安裝即可隨時(shí)保持最新版本!
Excel催化劑插件下載鏈接:https://pan.baidu.com/s/1Iz2_NZJ8v7C9eqhNjdnP3Q
聯(lián)系作者公眾號(hào)取名催化劑,因Excel本身的強(qiáng)大,并非所有人能夠立馬享受到,大部分人還是在被Excel軟件所虐的階段,就是頭腦里很清晰想達(dá)到的效果,而且高手們也已經(jīng)實(shí)現(xiàn)出來(lái),就是自己怎么弄都弄不出來(lái),或者更糟的是還不知道Excel能夠做什么而停留在不斷地重復(fù)、機(jī)械、手工地在做著數(shù)據(jù),耗費(fèi)著無(wú)數(shù)的青春年華歲月。所以催生了是否可以作為一種媒介,讓廣大的Excel用戶們可以瞬間點(diǎn)燃Excel的爆點(diǎn),無(wú)需苦苦地掙扎地沒(méi)日沒(méi)夜的技巧學(xué)習(xí)、高級(jí)復(fù)雜函數(shù)的燒腦,最終走向了從入門(mén)到放棄的道路。
最后Excel功能強(qiáng)大,其實(shí)還需樹(shù)立一個(gè)觀點(diǎn),不是所有事情都要交給Excel去完成,也不是所有事情Excel都是十分勝任的,外面的世界仍然是一個(gè)廣闊的世界,Excel只是其中一枚耀眼的明星,還有其他更多同樣精彩強(qiáng)大的技術(shù)、工具等。*Excel催化劑也將借力這些其他技術(shù),讓Excel能夠發(fā)揮更強(qiáng)大的爆發(fā)!
關(guān)于Excel催化劑作者
姓名:李偉堅(jiān),從事數(shù)據(jù)分析工作多年(BI方向),一名同樣在路上的學(xué)習(xí)者。
服務(wù)過(guò)行業(yè):零售特別是鞋服類(lèi)的零售行業(yè),電商(淘寶、天貓、京東、唯品會(huì))
技術(shù)路線從一名普通用戶,通過(guò)Excel軟件的學(xué)習(xí),從此走向數(shù)據(jù)世界,非科班IT專(zhuān)業(yè)人士。
歷經(jīng)重重難關(guān),終于在數(shù)據(jù)的道路上達(dá)到技術(shù)平原期,學(xué)習(xí)眾多的知識(shí)不再太吃力,同時(shí)也形成了自己的一套數(shù)據(jù)解決方案(數(shù)據(jù)采集、數(shù)據(jù)加工清洗、數(shù)據(jù)多維建模、數(shù)據(jù)報(bào)表展示等)。
擅長(zhǎng)技術(shù)領(lǐng)域:Excel等Office家族軟件、VBA&VSTO的二次開(kāi)發(fā)、Sqlserver數(shù)據(jù)庫(kù)技術(shù)、Sqlserver的商業(yè)智能BI技術(shù)、Powerbi技術(shù)、云服務(wù)器布署技術(shù)等等。
2018年開(kāi)始職業(yè)生涯作了重大調(diào)整,從原來(lái)的正職工作,轉(zhuǎn)為自由職業(yè)者,暫無(wú)固定收入,暫對(duì)前面道路不太明朗,苦重新回到正職工作,對(duì)Excel催化劑的運(yùn)營(yíng)和開(kāi)發(fā)必定受到很大的影響(正職工作時(shí)間內(nèi)不可能維護(hù)也不可能隨便把工作時(shí)間內(nèi)的成果公布于外,工作外的時(shí)間也十分有限,因已而立之年,家庭責(zé)任重大)。
和廣大擁護(hù)者一同期盼:Excel催化劑一直能運(yùn)行下去,我所惠及的群體們能夠給予支持(多留言鼓勵(lì)下、轉(zhuǎn)發(fā)下朋友圈推薦、小額打賞下和最重點(diǎn)的可以和所在公司及同行推薦推薦,讓我的技術(shù)可以在貴司發(fā)揮價(jià)值,實(shí)現(xiàn)雙贏(初步設(shè)想可以數(shù)據(jù)顧問(wèn)的方式或一些小型項(xiàng)目開(kāi)發(fā)的方式合作)。
總結(jié)
以上是生活随笔為你收集整理的「Sqlserver」数据分析师有理由爱Sqlserver之三-最值得使有低投入高产出的Sqlserver功能...的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: .NET Core 3.0 发布小尺寸
- 下一篇: .NET开发框架(八)-服务器集群之网络