记录Pandas处理数据的两个小技巧
生活随笔
收集整理的這篇文章主要介紹了
记录Pandas处理数据的两个小技巧
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
◆?◆?◆ ?◆?◆
Pandas
Pandas無疑是Python中用于數據分析最好的第三方庫了。各種數據分析的日常應用場景下,我都會想Pandas能不能完成這個需求?會不會更簡單?!話不多說,今天分享兩個Pandas處理數據的小技巧。
按天統計不同類別商品銷量占比
工作中的小技巧(一),希望大家get起來~
| 日期 | 商品 | 銷售額 | 占比 |
| 2020-05-01 | 蘇菲 | 233 | |
| 2020-05-01 | 岡本 | 303 | |
| 2020-05-01 | 筋膜槍 | 296 | |
| 2020-05-01 | 口紅 | 318 | |
| 2020-05-02 | 蘇菲 | 106 | |
| 2020-05-02 | 岡本 | 392 | |
| 2020-05-02 | 筋膜槍 | 229 | |
| 2020-05-02 | 口紅 | 162 | |
| 2020-05-03 | 蘇菲 | 457 | |
| 2020-05-03 | 岡本 | 109 | |
| 2020-05-03 | 筋膜槍 | 281 | |
| 2020-05-03 | 口紅 | 497 | |
| …… | |||
| 2020-05-14 | 蘇菲 | 111 | |
| 2020-05-14 | 岡本 | 286 | |
| 2020-05-14 | 筋膜槍 | 245 | |
| 2020-05-14 | 口紅 | 215 | |
| 2020-05-15 | 蘇菲 | 260 | |
| 2020-05-15 | 岡本 | 226 | |
| 2020-05-15 | 筋膜槍 | 324 | |
| 2020-05-15 | 口紅 | 246 | |
工作中,這種問題還是比較多的。通過分析比較每天不同商品的銷售額占比,再結合利潤率情況,就可以知道公司下一步應該主推什么才能盈利,哪些商品的占比應該提高或者降低。或者也可以反映出哪些種類的商品更賺錢,對公司盈利層面更有幫助。
如果各位有關于SQL的寫法來解決此類問題,且比較簡單的解法,歡迎與我交流~還望不吝賜教!
Pandas實現group_concat功能
一般情況下,銷售表的生成方式都是產生記錄后,一條一條插入的。我們看到的表是一行一行的。但是,總有一些奇葩的需求,想把表橫過來看看。所謂的換個角度看世界,我依然很窮!
如何實現上述圖片的轉換過程呢?!看代碼吧~
>>> df.groupby('顧客').apply(lambda x:'-'.join(x['商品']))感覺怪怪的!我是想說,這看起來沒有字段名,也不太好吧。變個魔術即可~
>>> df.groupby('顧客').apply(lambda x:'-'.join(x['商品'])).reset_index().rename({0:'商品'},axis=1) >>> df_gb = df.groupby('顧客').apply(lambda x:'-'.join(x['商品'])).reset_index().rename({0:'商品'},axis=1) >>>?df_gb >>> df_gb['商品'].str.split('-',expand?=?True) >>>?df_gb[['商品1','商品2','商品3']]?=?df_gb['商品'].str.split('-',expand?=?True) >>> df_gb >>> df_gb.drop('商品',axis = 1,inplace = True) >>> df_gb完成~
總結
以上是生活随笔為你收集整理的记录Pandas处理数据的两个小技巧的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 周志华领衔撰写,历时4年,宝箱书问世!文
- 下一篇: 美国播客节目《指数视角》专访李飞飞:疫情