R如何与Tableau集成分步指南 - 适用于数据科学和商业智能专业人员
Tableau是當今數據科學和商業智能專業人員使用的最流行的數據可視化工具之一。它使您能夠以交互式和多彩的方式創建具有洞察力和影響力的可視化效果。
在本文中,我們將看到一些超越拖放功能的高級圖表。我們將創建計算以深入研究數據以提取洞察力。我們還將看看R如何與Tableau集成和使用。
1.高級圖形
幾乎所有的Tableau用戶都知道各種基本圖形,例如介紹儀表板中顯示的那些圖形。這些圖表可以使用Tableau 的“ Show Me” 功能輕松完成。但由于這是一篇面向高級用戶的文章,因此我們將超越“展示自己”并探索需要額外計算的圖表。
首先,讓我們快速瀏覽一下我們將在接下來的幾節中做什么。以下是我們超市的銷售額和利潤的一些基本分析。簡單的圖表可以達到與儀表板中的目的相同的目的,但我認為您會同意這些圖表的宏偉令人興奮和激動。
1.1運動圖
因此,我們首先下載可在此處找到的Superstore數據集 。
現在讓趨勢線如下所示對你來說應該很容易:
但是本節我們首先要學習的是如何使下面的趨勢線運動:
所以讓我們開始吧!
導入您的數據集,并創建上述趨勢圖。我們的X軸是訂單日期(月份格式),銷售額和利潤是度量值。
您只需將“ 訂單日期” 拖動到“ 頁面”工作區即可,然后再次更改格式以與X軸匹配。
將標記類型從自動更改為圓形。
轉到顯示歷史記錄,并選擇Trails 查看趨勢變化。瞧!您的動態圖表已準備好啟動。
按箭頭按鈕查看動作,更改顯示歷史定制,速度等:
1.2凹凸圖
假設你想探索Superstore各個部分的銷售額(整整一年)。一種方法是:
雖然備選方案可能如下:
雖然折線圖能夠顯示每個細分市場之間的銷售差異,但凹凸圖(在上圖中)給出了更清晰和簡明的相同結果圖。
現在讓我們嘗試自己創建一個:
首先,我們需要根據我們想要對我們的維度進行排名的方式來考慮度量。這里的措施,我們采取的是銷售和尺寸是段。
您需要計算字段的幫助才能制作凹凸圖表。所以請快速創建一個如下所示的計算。我們將對每個細分市場的銷售總額進行排名 :
現在將訂單日期拖到列中并將格式更改為月。在標記窗格中將段拖動到顏色。最后將排名拖到行。
在你現在可以看到的圖表中,排名是根據月份數量分配的。但是,我們需要他們在細分市場的基礎上。因此,右鍵點擊排名在行, 并轉到編輯表計算。
由于我們希望使用段計算,請將配置更改為:
您將獲得的圖表看起來不像儀表板中的圖表,因為它缺少標簽。讓我們在雙軸的幫助下快速修復:
再次將等級拖放到行并重復步驟4和5以得到:
您會在商標窗格中看到排名和排名(2)?我們將使用這些來創建帶圓圈的標簽。
要將上述內容轉換為雙軸圖表,請右鍵單擊第二個圖表的等級軸并選擇雙軸。
在標記窗格中,選擇排名或排名(2),然后將標記類型更改為圓形而不是自動。
這里的排名按降序排列。要將其更改為升序,請右鍵單擊左側的Rank軸 - >編輯軸 - >反向比例。對右邊的Rank軸重復同樣的操作。
最后,將銷售額拖放到標簽 - >快速表計算 - >總計百分比上,以獲得我們期望的凹凸圖。
1.3甜甜圈圖
圓環圖是小學圖的另一種表現形式。坦率地說,它是一個中間有一個洞的餅圖,但它有助于更加強調各個細分市場,如下所示:
讓我們了解我們創建這個區別的不同之處。
我們將從一個簡單的餅圖開始,描繪每個細分市場的 利潤:
要為餅圖創建一個雙軸,拖記錄數從措施到了行,兩次。通過右鍵點擊它們并選擇最小值代替默認總和來更改每個綠色藥丸的度量:
選擇Marks Pane中的第二個餅圖,并將其中的每個度量/維度拖出。減小圖表的大小,并將顏色更改為白色(盡管此處未顯示):
要創建雙軸,右鍵單擊第二個餅圖的Y軸,然后選擇雙軸,以獲得圖表。
現在你必須明白,以上所有圖表雖然在最終外觀上都不相同,但都是從“ 顯示我”功能的核心圖表中獲得的。但是等一下,它還沒有結束。我有更多要展示給你。
1.4瀑布圖
瀑布圖從其類似的方向和流動中得出其名稱。在這里,我們繪制了Superstore多年來的運行銷售情況,您可以在2013年中和2014年初看到兩個小紅色區域,表明銷售額實際下降了,并且還有多少。
這意味著這樣的圖表被用來分析一個度量的累積效應,并且看它是如何作為一個整體增加和減少的。為了更好地理解這一點,讓我們想象它。
瀑布圖是折線圖的衍生物,因此我們將從該圖開始:
右鍵單擊綠色的Profit Pill,然后選擇Quick Table Calculation - > Running Total。
將標記類型從自動更改為甘特條:
創建一個名為'NegProfit'的計算字段:
將這個NegProfit拖到 Marks 框架中的Size上,得到:
計算的字段用于填寫甘特圖中的空間。利潤中的負值將向下延伸,而正值則會向上延伸。
圖表中每個小條的長度表示利潤從一個月到下一個月的變化量。
最后,將利潤拖到顏色:
您可以繼續前進,將顏色更改為兩步變化,并清楚地查看上升和下降:
您將獲得的圖表也可以非常容易地以條形圖的形式表示。請注意,我在這里顛倒了顏色,以使異常突出:
但我相信你會同意使用瀑布圖是一種更直觀的表示數據的方式,特別是看看多年來度量的變化,例如銷售和利潤。
1.5帕累托圖
下面我已經看到了一個流行的80-20數據分析原理。如果你還沒有聽說過它,讓我試著用我們的例子來解釋它。經常觀察到超市的大部分銷售來自少數幾種產品。
人們不能指望面包和雞蛋有與蛋糕相同的銷售數字,對吧?這正式被稱為80-20原則,這意味著80%的銷售額來自20%的產品。在我們的超市,這個原則可以在下面的圖表中看到,其中大部分銷售是由電話和椅子生成的:
相當流行的可視化, 帕累托圖通常用于風險管理,以確定對項目造成最大負面影響的最常見問題 ; 但正如我們將看到的,它也可以有其他應用程序。
讓我們看看它是如何完成的:
我們將從下面的圖表開始。這具有作為X軸的子類別和作為Y軸的銷售。圖表按降序排列:
接下來,將銷售額拖放到圖表上,直到您看到綠色突出顯示的條形和最右邊的虛線軸:
在此處下降銷售以創建雙軸。將第一個圖表的標記類型更改為條形圖,將第二個圖表更改為線條,最終得到:
右鍵單擊第二個綠色銷售藥丸,并為其添加運行總計算:
剩下的只是改變配色方案,并且您的帕累托圖表已準備就緒!
2.在Tableau中引入R編程
R的引入使得可以實現更豐富和動態的可視化,這是主要特征之一。R可與Tableau一起用于聚類,預測和預測等技術。
我想通過Clustering開始對R和Tableau的探索,所以我使用了超流行的Iris Dataset。
以下描述了Tableau和R之間的控制流程,以實現此集成:
R腳本作為表計算寫入Tableau ,并發送到R的R服務包。 在此模塊執行必要的計算并將結果返回給Tableau。
現在讓我們看看這個集成的步驟:
安裝Rserve軟件包
在R命令行中運行以下命令:
install.packages(“Rserve”); 庫(“Rserve”); Rserve()
配置Tableau以在R中運行
打開Tableau - >幫助 - >設置和性能 - >管理R /外部連接。使用以下默認信息填寫字段并選擇測試連接:
所以,現在 你已經準備好了適當的配料,讓我們開始做飯吧!
如上圖所示,您可以使用Tableau的表計算與R進行通信:
如果您向下滾動功能列表,您將遇到以下四種情況:
當計算區域中包含這些函數時,Tableau會自動理解該腳本適用于R.
我希望你最初興奮的制作集群仍然存在!我們繼續。
從這里下載Iris數據集。
在Tableau中導入數據集,并制作下圖:
在這里,您可以通過不同的度量獲得總和。要獲得離散值,請轉至分析,并取消選中聚合度量,以獲取:
最后,要形成群集,請在標記窗格中將類維度拖到顏色上:
我們上面的是一個散點圖,它顯示了分為3個不同群集的數據點群集。
現在讓我們嘗試與R一樣,并比較我們將得到的兩個可視化。我們將使用最常見的聚類算法K-Means:
從與上面第2點相同的散點圖開始。
創建一個新的計算字段并填寫以下內容:
為清楚起見,上述計算為:
_INT('result < - kmeans(data.frame(.arg1,.arg2,.arg3,.arg4),3); result $ cluster;',SUM([Petal length]),SUM([Petal width]),SUM([Sepal length]),SUM([Sepal width]))
雖然有一些重疊,但這兩個可視化確實看起來相當準確。
這是將R與Tableau集成的潛力的一個小要點。它的應用程序是無限的,我相信你一定已經開始考慮可以與之交互的不同方式。
?有問題請聯系我們
轉載于:https://www.cnblogs.com/tecdat/p/11064949.html
總結
以上是生活随笔為你收集整理的R如何与Tableau集成分步指南 - 适用于数据科学和商业智能专业人员的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 将DataTable中的数据导入到数据库
- 下一篇: java中如何获取系统时间