python 调用不存在的方法 统一处理_提取不重复数据在Excel、SQL与Python中的处理方法...
村長今天跟大家簡單分享一下如何在Excel、SQL和Python中用不同的方法提取不重復值(數據去重)。
一、Excel
1.1、函數法(數組公式)
函數公式:=IFERROR(INDEX(A:A,SMALL(IF(MATCH($A$2:$A$16,$A$2:$A$16,0)=ROW($1:$15),ROW($2:$16),9^9),ROW(A1))),"")
1.2、技巧法(刪除重復值)
操作步驟:
選中數據列,然后點擊【數據】選項卡,選擇“刪除重復值”
1.3、技巧法(高級篩選)
操作步驟:
選中數據區域,然后點擊【數據】選項卡,選擇“高級篩選”,勾選“選擇不重復的記錄”,選擇將篩選的數據復制到指定位置。
1.4、技巧法(數據透視)
操作步驟:
選中數據區域任意一個單元格或整個數據區域,然后點擊【插入】選項卡,選擇“數據透視表”,勾選“現有工作表”并選擇將透視的數據存放到指定位置,勾選“姓名”字段值。
二、數據庫(SQL)
2.1、去重復法(DISTINCT去重復)
SQL語句:
SELECT DISTINCT NAME FROM TEST
語句結構:
SELECT?DISTINCT 字段名稱 FROM 表名稱
2.2、取最新數據(rowid屬性)
SQL語句:
SELECT NAME,MAX(ROWID) FROM TEST GROUP BY NAME
語句結構:
SELECT 字段名稱,MAX(ROWID) FROM 表名稱 GROUP BY 字段名稱
2.3、分類匯總法(COUNT函數)
SQL語句:
SELECT NAME,COUNT(NAME) FROM TEST GROUP BY NAME
語句結構:
SELECT 字段名稱,COUNT(字段名稱) FROM 表名稱?GROUP BY 字段名稱
三、Python
3.1、集合的特性(SET方法)
Python代碼:
import pandas as pddf=pd.DataFrame(pd.read_excel('F:\\test.xlsx'))
df2=list(set(df['NAME']))
print(df2)
3.2、字典(keys方法)
Python代碼:
import pandas as pddf=pd.DataFrame(pd.read_excel('F:\\test.xlsx'))
df2=list({}.fromkeys(df['NAME']).keys())
print(df2)
3.3、循環查找的方式(for循環)
Python代碼:
import pandas as pddf=pd.DataFrame(pd.read_excel('F:\\test.xlsx'))
df2 = []for i in df['NAME']:if i not in df2:
df2.append(i)
print(df2)
好了,今天的分享就先到這里吧,學習有點累了,下面插播一則廣告提提神,感興趣的朋友可以了解一下!
總結
以上是生活随笔為你收集整理的python 调用不存在的方法 统一处理_提取不重复数据在Excel、SQL与Python中的处理方法...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: jenkins 手动执行_Jenkins
- 下一篇: oracle怎么以时间排序,oracle