python数据科学实战_Python数据科学实战第三讲作业HW4
先完成作業,再看老師解答,若有不同的地方或出錯之處再來修改。
作業要求:
使用auto_ins作如下分析
1、首先對loss重新編碼為1/0,有數值為1,命名為loss_flag
2、對loss_flag分布情況進行描述分析
3、分析是否出險和年齡、駕齡、性別、婚姻狀態等變量之間的關系(提示:使用分類盒須圖,堆疊柱形圖)
在spyder中完成第三講作業HW4:
# In[1]:
#導入模塊
from stack2dim import *
####################################################################
# # 1.首先對loss重新編碼為1/0,有數值為1,命名為loss_flag
auto_ins['loss_flag'] = auto_ins['Loss'].apply(lambda x: 0 if x==0 else 1)
print(auto_ins,'\n')
# In[2]:
####################################################################
# # 2.對loss_flag分布情況進行描述分析
import matplotlib.pyplot as plt
auto_ins['loss_flag'].value_counts().plot(kind = 'bar')
plt.title('loss_flag的分布')
plt.ylabel('頻數')
plt.xlabel('loss_flag')
plt.show()
# In[3]:
###################################################################
# # 3.分析是否出險和年齡、駕齡、性別、婚姻狀態等變量之間的關系
#???? (提示:使用分類盒須圖,堆疊柱形圖)
# # 3.1 是否出險與年齡的關系
#--------------------------------------錯誤繪圖方式---------------------------------------------
auto_ins.groupby('loss_flag').Age.mean().plot(kind = 'bar')
plt.title('Age vs loss_flag')
plt.ylabel('Age')
plt.xlabel('loss_flag')
plt.show()
'''
據圖可看出,出險與年齡無關
'''
# In[4]:
# # 3.2 是否出險與駕齡的關系
auto_ins.groupby('loss_flag').vAge.mean().plot(kind = 'bar')
plt.title('vAge vs loss_flag')
plt.ylabel('vAge')
plt.xlabel('loss_flag')
plt.show()
'''
據圖可看出,出險與駕齡有關
'''
#-------------------------------------------------------------------------------------------------
#%%
#------------------------------------------ 正確解答 --------------------------------------------
'''
老師講解后修改
'''
'''
年齡Age和駕齡exp為連續變量,loss_flag為分類變量,
分類變量與連續變量的描述統計關系圖用分類盒須圖
'''
fig = plt.figure()
ax1 = fig.add_subplot(1,2,1)
ax2 = fig.add_subplot(1,2,2)
#是否出險與年齡
import seaborn
seaborn.boxplot(x='loss_flag',y='Age',data=auto_ins,ax=ax1)
#是否出險與駕齡
seaborn.boxplot(x='loss_flag',y='exp',data=auto_ins,ax=ax2)
'''
據分類盒須圖可看出,年齡中位數幾乎相等,駕齡中位數相差明顯
所以,出險與年齡無關,和駕齡有關
'''
#------------------------------------------------------------------------------------------------
# In[5]:
# # 3.3 是否出險與性別的關系
stack2dim(auto_ins, 'loss_flag','Gender')
'''
據圖可看出,出險與性別有關
'''
# In[6]:
# # 3.4 是否出險與婚姻狀態的關系
stack2dim(auto_ins,'Marital','loss_flag')
'''
據圖可看出,出險與婚姻狀態有關
'''
# In[7]:
# # 3.5 是否出險與汽車出產國的關系
stack2dim(auto_ins, 'loss_flag', 'import')
'''
據圖可看出,出險與汽車出產國無關
'''
#%%
###################################################################
'''
根據上面的分析,可得出:出險與駕齡、性別、婚姻狀態有關
'''
總結
以上是生活随笔為你收集整理的python数据科学实战_Python数据科学实战第三讲作业HW4的全部內容,希望文章能夠幫你解決所遇到的問題。
 
                            
                        - 上一篇: 开源http协议库curl和wget的区
- 下一篇: MySQL运维系列 之 如何监控大事务
