如何使用SQL对数据进行分析和可视化
什么是數據分析?
數據分析可以描述為清理、轉換和處理原始數據以提取可操作的相關信息以幫助企業做出明智決策的過程。數據分析過程提供了有用的見解和統計數據,可以以表格、圖表和圖形的形式呈現。
在本文中,您將了解如何通過運行 SQL 查詢從數據集合中獲取有用的信息。此外,您還將學習如何使用圖形和圖表來呈現該信息。我將使用超市公司不同商店的數據集、PostgreSQL 和 Arctype SQL 客戶端。
什么是 PostgreSQL 和 Arctype?
PostgreSQL,也稱為 Postgres,是一個免費的開源關系數據庫管理系統。Arctype 是一種快速且易于使用的數據庫管理工具,用于編寫 SQL 查詢、構建儀表板以及與您的團隊共享數據。
設置 PostgreSQL
要在本教程中使用 Postgres,請導航至Postgres 下載頁面并為您的操作系統下載它。它適用于 Linux、macOS 和 Windows。
在您的計算機上安裝 Postgres 后,運行以下命令以確認安裝。
psql --version您應該能夠看到系統中安裝的 Postgres 版本?,F在運行如下所示的命令以打開 Postgres 提示符。
sudo -u postgres psql postgres在命令行上打開 Postgres 后,運行以下命令為 Postgres 設置密碼。
\password postgres要退出 Postgres 提示符,請運行如下所示的命令。
\q現在讓我們在 PostgreSQL 中創建一個名為“超市”的數據庫,該數據庫將用于存儲超市商店 CSV 文件中的數據。我們運行下面的命令。
CREATE DATABASE supermarket;然后運行如下所示的命令,查看您創建的數據庫是否在 Postgres 的數據庫列表中。
\l從下面的屏幕截圖可以看出,超市數據庫是在 PostgreSQL 中創建的。
Arctype SQL 客戶端
要使用 Arctype,請導航至主頁并在您的計算機上下載該應用程序。該應用程序可在 Windows、MacOS 和 Linux 上使用。
安裝應用程序后,打開它,系統將提示您創建一個帳戶,如下所示。
將 Arctype SQL 客戶端與 Postgres 集成
創建帳戶后,系統將提示您選擇數據庫。在本例中,選擇 Postgres。
下一步是添加 Postgres 憑據以將 Arctype 連接到您的 Postgres 數據庫。
根據下面顯示的示例填寫字段。
- 名稱:超市數據集
- 主機:127.0.0.1
- 端口:5432
- 用戶:postgres
- 密碼:*postgres密碼*
- 數據庫:超市
注意:使用您在 Postgres 提示符下創建數據庫時創建的憑據。
輸入 Postgres 憑據后,單擊底部的“測試連接”按鈕以確保憑據正確。如果憑據正確,點擊“測試連接”按鈕右側的“保存”按鈕,完成Postgres和Arctype SQL客戶端集成,如下圖。
使用 Arctype 將 CSV 文件導入 Postgres
我們將導入超市的商店數據集 CSV 文件,您可以通過導航到此Kaggle 網頁下載該文件,如下所示。
要使用 Arctype 將 CSV 文件導入 Postgres,請導航至“表”視圖。單擊表搜索字段旁邊的三個點。然后選擇“將 CSV 導入表”,如下所示。
接下來,使用出現的文件選擇窗口選擇您下載的 CSV 文件。選擇您的文件并單擊“打開”按鈕,如下所示。
選擇并打開 CSV 文件后,Arctype 將顯示 CSV 文件數據的前十行以供預覽。如果一切正常,請單擊“接受”按鈕,如下所示。
單擊“接受”按鈕后,您將被重定向到配置窗口,如下所示。該窗口允許您確定要將數據存儲在何處并選擇模式。
如果一切正常,請單擊“導入 CSV”按鈕開始導入 CSV 文件。打開表數據導入成功;一切都應如下所示。
使用 Arctype 運行 SQL 查詢
SQL 查詢允許您顯示或修改數據庫中的數據。在本節中,我將向您展示一些查詢,您可以運行這些查詢來創建表格、圖表或圖形來可視化超市的數據。
假設您是超市的老板。您可能想知道有趣的統計數據,例如銷售額排名前 10 位的商店。要獲得此類見解,您可以運行一個 SQL 查詢來創建一個包含前 10 個表現商店的表。然后,您可以通過創建圖形或圖表來可視化數據。
要使用 Arctype 運行 SQL 查詢,請單擊 Arctype 窗口右上角的“創建查詢”按鈕。然后將出現一個屏幕,您可以在其中運行查詢,如下所示。
為您的查詢指定一個描述性名稱,例如“銷售額排名前 10 位的商店”。然后編寫以下 SQL 查詢,根據商店數據確定銷售額排名前 10 的商店。
SELECT store_area, store_sales AS Sales FROM stores GROUP BY store_id, store_sales ORDER BY store_sales DESC LIMIT 10;該查詢從商店的表中選擇列store_area和store_sales中的數據,其中store_sales已重命名為 Sales。然后數據按名為store_id和store_sales(銷售額)的列分組。之后,數據按store_sales 排序,其中銷售額從高到低排列。查詢將結果限制為前 10 個銷售商店區域。
總結
以上是生活随笔為你收集整理的如何使用SQL对数据进行分析和可视化的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 快速建站系统
- 下一篇: linux 虚拟ip 作用,linux-