拉勾启源老师mysql讲义,【拉勾教育数据分析实战训练营】--Tableau学习笔记-重点回顾1...
【拉勾教育數據分析實戰訓練營】--Tableau學習筆記-重點回顧1
【拉勾教育數據分析實戰訓練營】--Tableau學習筆記-重點回顧1
以下是我搜羅的一些官方優秀case分享:
1、https://public.tableau.com/zh-cn/gallery/?tab=featured&type=featured
2、https://www.tableau.com/zh-cn/solutions/gallery?tab=featured&type=featured
3、 官方白皮書——哪種圖表或圖形是您的理想選擇?(部分圖表欣賞):
4、金融時報–圖表字典:
2.1數據導入
注意:CSV/TXT可以自動讀取同目錄源下多個文件
2.2 數據預處理
2.2.1 規整數據
數據解釋器:去除空行、標題等,智能識別數據表格;
2.2.2 數據格式設置
可以從數據預覽區、管理元數據、工作表維度處進行設置
文本轉日期
文本轉數字
以數據預覽區為例:
2.2.3 字段設置
列拆分:對有分隔符的列進行拆分,增加數據信息
轉置/數據透視表:選中同一維度的多個標題列,轉化為一列
別名:可方便不規范的數據統一別名
隱藏:隱藏不需要列
重命名:規范命名
2.3 數據聯接
根據相同列字段,列合并;
類似Excel的vlookup,MySQL中的join,Pandas中的merge
聯接是用于合并由通用字段關聯的表的一種方法。使用聯接合并數據后會產生一個通過添加數據列橫向擴展的表。
2.3.1 聯接方式(how)
左聯接
右聯接
內聯接
外聯接
2.3.2 聯接字段(on)
用已有的字段聯接
用計算字段聯接
2.4 數據并集
數據列一致,行合并;
類似MySQL中的 union,Pandas中的concat
合并是一種將值(行)附加到表的方法。如果表具有相同的列,則可以合并這些表。使用并集合并數據后會生成一個虛擬表,此表具有相同的列,但會通過添加數據行進行縱向擴展。
直接拖拽:適合CSV文件
新建并集:在數據源頁面上,雙擊**“新建并集”**以設置并集。
手動合并表新建并集:用此方法來手動合并不同的表。此方法允許您將單獨的表從“數據源”頁面的左側窗格拖放到“并集”對話框中。
通配符新建并集:文件批量合并
2.5 數據源管理
2.5.1 數據源的兩種讀取方式
實時和數據提取的選擇
什么情況下選擇“實時”
源數據的保密性要求較高,處于安全考慮不希望保存到本地時,可以采取實時連接的方式。
需要實時更新源數據信息,并且對實時性的要求較高時,可以選擇實時連接的方式。
什么情況下選擇數據提取
不便于實時連接數據源,如數據是通過本地服務器獲取,但又需要在別的電腦進行分析時,可以通過”數據提取“將所需分析的數據保存到本地。
分析的數據量較大,需要提高數據載入效率,降低源數據庫的訪問壓力時,可以通過數據提取將數據轉移到本地。
2.6 數據源合并(混合關系)
使用數據混合合并數據后會產生一個通過添加數據列橫向擴展的虛擬表。每個數據源中的數據將聚合到公共級別,然后再一起顯示在可視化項中。
2.6.1 如何創建混合關系?
頂部菜單欄”數據“ >> 編輯關系
若要在已連接到至少兩個數據源的工作簿中創建混合,請將一個數據源中的字段置于工作表中 — 該數據源將成為主數據源。切換到另一個數據源,并在同一工作表上使用一個字段 — 該數據源將成為輔助數據源。數據窗格中將出現一個橙色鏈接圖標,指明正在使用哪些字段來混合數據源。
藍色的是主源,黃色的輔源,紅色的紐帶代表已成功聯接的字段,灰色的紐帶代表未聯接成功的字段
3.1 分層
1.在“數據”窗格中,直接將字段拖放到另一個字段的頂部
2.出現提示時,請為該分層結構輸入名稱,并單擊“確定”。
上鉆或下鉆,請執行以下操作:
在可視化項中,單擊分層結構字段上的 + 或 - 圖標。
3.2 分組
創建組以在字段中合并相關成員:如地區分組、學科分組;
通過在視圖中選擇數據來創建組
在視圖中,選擇一個或多個數據點,然后在出現的工具提示上單擊組圖標,也可以在工作區頂部的工具欄上選擇組圖標。
利用“數據”窗格中的字段來創建組
在“數據”窗格中,右鍵單擊字段,然后選擇**“創建”>“組”。
在“創建組”對話框中,選擇要分組的多個成員,然后單擊“分組”。
3.3 創建集
異常值處理,篩選器使用
在可視化項的視圖中選擇一個或多個標記(或標題)。
右鍵單擊標記,并選擇“創建集”。
3.4 創建參數
參數是全局占位符值,例如數字、日期或字符串,可以替換計算、篩選器或參考行中的常量值。
可以創建一個動態參數,該參數設置為自動刷新其當前值(依據獨立于視圖的單值計算的結果)或值列表(基于數據源列)。
在計算中使用參數
可通過參數來動態修改計算中的值。可以使用參數而不是手動編輯計算(以及所有依賴計算)。然后在要更改值時,可打開參數控件并更改值;使用該參數的所有計算都會更新。
若要在計算中使用參數,請將參數從“數據”窗格拖放到計算編輯器中,放在公式中的一個新位置,或替換當前公式的一個部分:
if [利潤] >[盈利參數] then 'Profitable'
elseif [利潤] = [盈利參數] then 'Breakeven'
else 'Loss'
end
在篩選器中使用參數
可通過參數來動態修改“前 N 個”篩選器中的值。
“篩選器”對話框**“前”**選項卡上的下拉列表中有一個參數列表。選擇要在篩選器中使用的參數。
在參考線中使用參數
可通過參數來動態修改參考線。
“添加參考線、參考區間或框”對話框的“值”下拉列表中有一個參數列表。選擇要使用的參數。
延伸示例1-用參數控制度量切換
運用參數控制度量切換的基本思路如下:
【拉勾教育數據分析實戰訓練營】--Tableau學習筆記-重點回顧1相關教程
總結
以上是生活随笔為你收集整理的拉勾启源老师mysql讲义,【拉勾教育数据分析实战训练营】--Tableau学习笔记-重点回顾1...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: cad怎么自动标注面积(CAD中怎么标注
- 下一篇: matlab图像相加例子,MATLAB图