python 多组直方图 画图_python – 使用matplotlib的多个并排直方图?
我有一個軟件必須處理大量不同的數據,并且可能需要不同的時間來處理它.隨著軟件的修改,處理數據所需的時間也會發生變化,所以我想創建一個顯示時間差異和異常值的圖表,因為理想情況下,這個程序每個部分需要大約相同的時間數據(這聽起來很奇怪,不切實際,我知道,但在這里和我一起滾動).
起初,我想過使用箱形圖,但我認為它們是不合適的,因為完全有可能將一半數據集懸停在一個值附近,另一半圍繞另一個徘徊,我感覺不到箱形圖會很好地說明這一點.所以我決定嘗試使用直方圖,但我無法弄清楚如何讓matplotlib以我想要的方式繪制它.我想要一個單獨的數字,X軸標有軟件版本,Y軸顯示處理數據集所需的時間,有多個直方圖,就像我做的這個模型:
該圖表顯示在0.1版本中,大多數數據集在2-4秒內處理,由于某種原因需要12秒才能處理一組數據集. v0.1a擺脫了那些長的異常值,但一切都花了更長的時間. 0.1b比0.1a略快.最后,0.2顯示了很大的速度提升,但又引入了異常值.
我怎樣才能讓matplotlib創建這樣的情節?
解決方法:
這是一個(非常)基本的模型,說明如何實現這一目標:
import matplotlib.pyplot as plt
import numpy as np
number_of_bins = 20
number_of_data_points = 1000
ax = plt.subplot(111)
data_set = [np.random.normal(0, 1, number_of_data_points),
np.random.normal(6, 1, number_of_data_points),
np.random.normal(-3, 1, number_of_data_points)]
MID_VALUES = [0, 200, 400]
labels = ["v1", "v2", "v3"]
for MID_VAL, y in zip(MID_VALUES, data_set):
hist, bin_edges = np.histogram(y, bins=number_of_bins)
bottom = bin_edges[:-1]
heights = np.diff(bin_edges)
lefts = MID_VAL - .5 * hist
ax.barh(bottom, hist, height=heights, left=lefts)
ax.set_xticks(MID_VALUES)
ax.set_xticklabels(labels)
plt.show()
這個缺乏我承認的很多改進,例如:MID_VALUES是手動選擇的,這取決于數據集并且可以自動化.不過,您可以將其變為更有用的格式.
標簽:python,matplotlib
來源: https://codeday.me/bug/20190830/1768404.html
總結
以上是生活随笔為你收集整理的python 多组直方图 画图_python – 使用matplotlib的多个并排直方图?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python爬音乐网站_用 Python
- 下一篇: android移除动画,android