大鹏教你数据分析系列--运动员身材都是完美的吗
生活随笔
收集整理的這篇文章主要介紹了
大鹏教你数据分析系列--运动员身材都是完美的吗
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
本博客記錄學習數據分析的思考和心得
本博客會分享數據源碼,以及在學習數據分析過程中,學習到的內容和本人不熟悉的地方
本節主要研究運動員身材都是完美型嗎?
對于平時有健身的朋友們應該知道,衡量一個人身材是否完美有一個公式,即是BMI值
那么如何判斷自己的身材是否完美尼,來一起計算一下自己的BMI值把!向完美身材看齊!
BMI =?體重/身高的平方(體重單位是KG,身高單位是米)
?本次主要繪制的目標如下圖,每個項目的運動員的BMI值分布
那么繪制上圖,也需要經過以下幾步
- 加載數據
- 數據預處理與清洗?(如何處理缺失值,數據填充等數據處理常見的處理方式)
- 繪制小提琴圖形
?上述代碼,有幾個常用的知識點,在此mark一下
data2.dropna(inplace=True)?上述代碼是為了處理空值數據,使用的方法是直接刪除,也可以進行填充,后續會有介紹的
data2['BMI_range'] = pd.cut(data2['BMI'],[0, 18.5, 24, 28, 50], labels=['thin', 'normal', 'strong', 'very strong'])這里使用的是pandas庫中的cut方法,將BMI值按照區間劃分,并在相應區間給予標簽值,比如數據落入0-18.5區間,該運動員BMI則屬于‘thin’,屬于比較瘦
?在此以簡單的小例子,看一下實驗效果
pandas.cut(x,bins,right=True,labels=None,retbins=False,precision=3,include_lowest=False)pd.cut([1,10, 11,23,30], [0, 10, 20,32], labels=['<10', '<20', '<30'], right=True, include_lowest=True) Out[31]: [<10, <10, <20, <30, <30] Categories (3, object): [<10 < <20 < <30]pd.cut([0, 1,10, 11,23,30], [0, 10, 20,32], labels=['<10', '<20', '<30'], right=True) Out[33]: [NaN, <10, <10, <20, <30, <30] Categories (3, object): [<10 < <20 < <30]總結
以上是生活随笔為你收集整理的大鹏教你数据分析系列--运动员身材都是完美的吗的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Java基础之IO流(持续更新中)
- 下一篇: 大型主机的发展