python衍生特征
生活随笔
收集整理的這篇文章主要介紹了
python衍生特征
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
1.衍生方式一
df=pd.DataFrame({'id':[2,2,2,3,3,5],'cur':['cur1','cur2','cur3','cur1','cur1','cur2']}) df df_tmp=pd.crosstab(df['id'],df['cur']) df_tmp ''' 遇到問題沒人解答?小編創建了一個Python學習交流QQ群:778463939 尋找有志同道合的小伙伴,互幫互助,群里還有不錯的視頻學習教程和PDF電子書! ''' df_new=pd.DataFrame({'id':list(set(df.id))}) df_new['cur1_count']=0 df_new['cur_count_all']=0 df_new['cur_cate_num']=0 for id in list(set(df.id)):df_new.loc[df_new.id==id,'cur1_count']=df_tmp.loc[id,'cur1']df_new.loc[df_new.id==id,'cur_count_all']=df_tmp.loc[id,'cur1':'cur3'].sum()df_new.loc[df_new.id==id,'cur_cate_num']=len(np.where(df_tmp.loc[id,'cur1':'cur3']>0)[0]) df_new.head()總結
以上是生活随笔為你收集整理的python衍生特征的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python中json.dumps和js
- 下一篇: python-上传文件的几种方式