python字符串出现次数最多的_python – Pandas:获取组中出现次数最多的字符串值...
使用
value_counts并返回第一個索引值:
df["responseCount"] = (df.groupby("item")["response"]
.transform(lambda x: x.value_counts().index[0]))
print (df)
item response responseCount
0 1 A A
1 1 A A
2 1 B A
3 2 C C
4 2 C C
from collections import Counter
df["responseCount"] = (df.groupby("item")["response"]
.transform(lambda x: Counter(x).most_common(1)[0][0]))
print (df)
item response responseCount
0 1 A A
1 1 A A
2 1 B A
3 2 C C
4 2 C C
編輯:
問題是只有一個或多個NaN組,解決方案是使用if-else過濾:
print (df)
item response
0 1 A
1 1 A
2 2 NaN
3 2 NaN
4 3 NaN
def f(x):
s = x.value_counts()
print (s)
A 2
Name: 1, dtype: int64
Series([], Name: 2, dtype: int64)
Series([], Name: 3, dtype: int64)
#return np.nan if s.empty else s.index[0]
return np.nan if len(s) == 0 else s.index[0]
df["responseCount"] = df.groupby("item")["response"].transform(f)
print (df)
item response responseCount
0 1 A A
1 1 A A
2 2 NaN NaN
3 2 NaN NaN
4 3 NaN NaN
與50位技術(shù)專家面對面20年技術(shù)見證,附贈技術(shù)全景圖總結(jié)
以上是生活随笔為你收集整理的python字符串出现次数最多的_python – Pandas:获取组中出现次数最多的字符串值...的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: laya 怎么生成签名_什么是数字签名
- 下一篇: 编写递归下降语法分析器_Python3知