sql 行转列_想要表格行转列?简单几行Python代码搞定
生活随笔
收集整理的這篇文章主要介紹了
sql 行转列_想要表格行转列?简单几行Python代码搞定
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
前言數據的行轉列操作,在實際工作過程中應用非常廣泛。由于不同人員、不同部門對數據結構的認識是不大相同的,尤其是從基層人員手里拿到的數據,更是五花八門,橫七豎八。比如有這樣一張成績表:
乍一看,好像沒毛病啊!!
然鵝鵝鵝,當需求“就簡單計算一下每個人的總分吧!”來臨的時候。我腦海中不禁浮想起了:
安排# 123遇事不要慌,先導個包吧import pandas as pdimport numpy as np# 測試數據data = {'name':['嚴小樣兒','嚴小樣兒','嚴小樣兒','才華橫豎都溢','才華橫豎都溢','才華橫豎都溢','幽蘭幽香','幽蘭幽香','幽蘭幽香'], 'subject':['Python','C','SQL','Python','C','SQL','Python','C','SQL'], 'score':[95,60,95,96,95,80,99,94,88]}# 生成dfdf = pd.DataFrame(data)df使用 pivot 方法即可完成行轉列哦~語法如下:# df.pivot(index=None, columns=None, values=None)df.pivot(index='name',columns='subject',values='score')不要高興的太早,遇到重復值就麻煩了!少俠請看:
#?造含有重復值的假數據data1?=?{'name':['嚴小樣兒','嚴小樣兒','嚴小樣兒','嚴小樣兒','才華橫豎都溢','才華橫豎都溢','才華橫豎都溢','幽蘭幽香','幽蘭幽香','幽蘭幽香'], 'subject':['Python','Python','C','SQL','Python','C','SQL','Python','C','SQL'], 'score':[95,95,60,95,96,95,80,99,94,88]}df1?=?pd.DataFrame(data1)df1df1.pivot(index='name',columns='subject',values='score')#?一旦有重復值,就會報錯。ValueError: Index contains duplicate entries, cannot reshape別急別急,去個重不就可以了嗎?!
df1.drop_duplicates().pivot(index='name',columns='subject',values='score')方法二:數據透視表
# pivot_table(data, values=None, index=None, columns=None, aggfunc='mean')pd.pivot_table(df1,index='name',columns='subject',values='score',aggfunc={'score':'max'})聚合剛剛說了,要求每個人的總分,其實使用透視表就可以完成。不過,稍微動動腦筋哦。遇到重復值數據的話,只能使用下面的方法一,去重后的數據集,方法一,二都支持。計算每個人的總分,語法如下:# 重復數據集也可以df_pivot = pd.pivot_table(df1,index='name',columns='subject',values='score',aggfunc={'score':'max'})#?增加一個新列:Totaldf_pivot['Total'] = df_pivot.apply(lambda x:np.sum(x),axis = 1)df_pivot方法二,必須是去重后的數據集,否則會出現計算錯誤。# 使用去重數據集才可以pd.pivot_table(df,index='name',values='score',aggfunc='sum')# 使用join方法把總分列加進去。total = pd.pivot_table(df,index='name',values='score',aggfunc='sum')pd.pivot_table(df,index='name',columns='subject',values='score').join(total)--需求方:算是算出來了,可是,這個score看著怪怪的,能不能改成“總分”呢?--開發方:(卑微地)我改!安排~total1 = pd.pivot_table(df,index='name',values='score',aggfunc='sum').rename({'score':'總分'},axis=1)pd.pivot_table(df,index='name',columns='subject',values='score').join(total1)行轉列,就這樣講完了,大家趕快動手實踐一下吧。什么?你說要列轉行?!那等我們下次再來分解吧作者:嚴小樣兒?
來源:統計與數據分析實戰
總結
以上是生活随笔為你收集整理的sql 行转列_想要表格行转列?简单几行Python代码搞定的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 回调函数 相当于线程_Java中的回调机
- 下一篇: python上机报告出现的问题和解决方法