Python数据可视化之折线图
Python數據可視化之折線圖
提示:前言
Python數據可視化之折線圖
提示:寫完文章后,目錄可以自動生成,如何生成可參考右邊的幫助文檔
文章目錄
- Python數據可視化之折線圖
- 前言
- 一、導入包
- 二、選擇數據集
- 三、折線圖
- 四、圖形的大小和圖表的標題
- 五、繪制數據的一個子集
- 六、改變樣式
前言
在本教程中,您將學習足夠的 Python 來創建具有專業外觀的折線圖。 然后,在下面的練習中,您將運用新技能處理真實世界的數據集
提示:以下是本篇文章正文內容,下面案例可供參考
一、導入包
import pandas as pd pd.plotting.register_matplotlib_converters() import matplotlib.pyplot as plt %matplotlib inline import seaborn as sns print("Setup Complete")二、選擇數據集
本教程的數據集跟蹤音樂流媒體服務 Spotify 上的全球每日流媒體。 我們專注于 2017 年和 2018 年的五首流行歌曲:
請注意,第一個出現的日期是 2017 年 1 月 6 日,對應于 Ed Sheeran 的“The Shape of You”的發行日期。 而且,使用該表,您可以看到“你的形狀”在發布當天在全球播放了 12,287,078 次。 請注意,其他歌曲在第一行中有缺失值,因為它們是后來才發布的!
我們可以使用您在上一教程中學到的 head 命令打印數據集的前五行
現在檢查前五行是否與上面的數據集圖像一致(從我們看到它在 Excel 中的樣子開始)??諚l目將顯示為 NaN,它是“Not a Number”的縮寫
我們還可以通過僅進行一個小更改(其中 .head() 變為 .tail())來查看數據的最后五行:
# Print the last five rows of the data spotify_data.tail()
值得慶幸的是,一切看起來都不錯,每首歌曲每天都有數百萬的全球流媒體播放,我們可以繼續繪制數據了!
三、折線圖
現在數據集已經加載到筆記本中,我們只需要一行代碼來制作折線圖
# Line chart showing daily global streams of each song sns.lineplot(data=spotify_data)正如您在上面看到的,這行代碼相對較短,主要有兩個組成部分:
sns.lineplot 告訴筆記本我們要創建折線圖。
您在本課程中學習的每個命令都將以 sns 開頭,這表明該命令來自 seaborn 包。 例如,我們使用 sns.lineplot 來制作折線圖。 很快,您就會了解到我們分別使用 sns.barplot 和 sns.heatmap 來制作條形圖和熱圖。
data=spotify_data 選擇將用于創建圖表的數據。
請注意,在創建折線圖時,您將始終使用相同的格式,并且隨著新數據集的變化,唯一改變的是數據集的名稱。 因此,例如,如果您正在使用名為 financial_data 的不同數據集,則代碼行將如下所示:
sns.lineplot(data=financial_data)四、圖形的大小和圖表的標題
有時我們想要修改其他細節,例如圖形的大小和圖表的標題。 這些選項中的每一個都可以使用一行代碼輕松設置。
# Set the width and height of the figure plt.figure(figsize=(14,6))# Add title plt.title("Daily Global Streams of Popular Songs in 2017-2018")# Line chart showing daily global streams of each song sns.lineplot(data=spotify_data)
第一行代碼將圖形的大小設置為 14 英寸(寬)乘 6 英寸(高)。 要設置任何圖形的大小,您只需復制它出現的同一行代碼。 然后,如果您想使用自定義尺寸,請將提供的值 14 和 6 更改為所需的寬度和高度。
第二行代碼設置圖形的標題。 請注意,標題必須始終用引號 (“…”) 括起來!
五、繪制數據的一個子集
到目前為止,您已經學習了如何為數據集中的每一列繪制一條線。 在本節中,您將學習如何繪制列的子集。
我們將從打印所有列的名稱開始。 這是用一行代碼完成的,只需換掉數據集的名稱(在本例中為 spotify_data)即可適用于任何數據集。
list(spotify_data.columns)在下一個代碼單元格中,我們繪制了與數據集中前兩列對應的線條。
# Set the width and height of the figure plt.figure(figsize=(14,6))# Add title plt.title("Daily Global Streams of Popular Songs in 2017-2018")# Line chart showing daily global streams of 'Shape of You' sns.lineplot(data=spotify_data['Shape of You'], label="Shape of You")# Line chart showing daily global streams of 'Despacito' sns.lineplot(data=spotify_data['Despacito'], label="Despacito")# Add label for horizontal axis plt.xlabel("Date")
前兩行代碼設置了圖形的標題和大小(看起來應該很眼熟!)。
接下來的兩行分別在折線圖中添加一條線。 例如,考慮第一個,它添加了“你的形狀”這一行:
# Line chart showing daily global streams of 'Shape of You' sns.lineplot(data=spotify_data['Shape of You'], label="Shape of You")這條線看起來與我們在繪制數據集中的每一行時使用的代碼非常相似,但它有幾個關鍵的區別:
我們不設置 data=spotify_data,而是設置 data=spotify_data[‘Shape of You’]。 通常,為了僅繪制單個列,我們使用這種格式,將列名放在單引號中并將其括在方括號中。 (為確保您正確指定列名,您可以使用上面學到的命令打印所有列名的列表。)
我們還添加 label=“Shape of You” 使線條出現在圖例中并設置其對應的標簽。
最后一行代碼修改水平軸(或 x 軸)的標簽,其中所需標簽放在引號 (“…”) 中。
六、改變樣式
只需一行代碼,我們就可以快速將圖形的樣式更改為不同的主題。
# Change the style of the figure to the "dark" theme sns.set_style("dark")# Line chart plt.figure(figsize=(12,6)) sns.lineplot(data=spotify_data)Seaborn 有五個不同的主題:
(1)“darkgrid”,
(2)“whitegrid”,
(3)“dark”,
(4)“white”,
(5)“ticks”,
你只需要使用類似的命令 到上面代碼單元格中的那個(填充了所選主題)以更改它。
參考鏈接
https://www.kaggle.com/code/alexisbcook/line-charts
總結
以上是生活随笔為你收集整理的Python数据可视化之折线图的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Acrel-3000电能管理系统在浙江某
- 下一篇: 计算机硬盘的分区和格式化,纯扫盲高手勿看