python dataframe 分位数_Python pandas.DataFrame.quantile函数方法的使用
DataFrame.quantile(self,?q=0.5,?axis=0,?numeric_only=True,?interpolation='linear')[source]
返回在請求軸上的給定的quantile值。
參數:q : float 或 array-like, 默認 0.5 (50% quantile)
要計算的quantile值在0 <= q <= 1之間。
axis : {0, 1, ‘index’, ‘columns’}(默認為 0)
行為0或' index ',列為1或'columns'。
numeric_only : bool,默認值True
如果為False,也將計算datetime和timedelta數據的quantile。
interpolation: {‘linear’, ‘lower’, ‘higher’, ‘midpoint’, ‘nearest’}
這個可選參數指定了當所需quantile位于兩個數據點i和j之間時要使用的插值方法:
1) linear: i + (j - i) *fraction,其中分數是指數中被i和j包圍的小數部分。
2) lower:?i
3)?higher: j
4) nearest: i或j,以最接近的為準。
5)?midpoint:?(i?+?j) / 2
返回值:Series或 DataFrame
如果q是數組,則將返回DataFrame,其中
index是q,列是self的列,值是quantiles。
如果q為float,則在
index是self的列,值是quantiles。
例子>>> df = pd.DataFrame(np.array([[1, 1], [2, 10], [3, 100], [4, 100]]),
... columns=['a', 'b'])
>>> df.quantile(.1)
a 1.3
b 3.7
Name: 0.1, dtype: float64
>>> df.quantile([.1, .5])
a b
0.1 1.3 3.7
0.5 2.5 55.0
指定numeric_only = False還將計算日期時間和時間增量數據的分位數>>> df = pd.DataFrame({'A': [1, 2],
... 'B': [pd.Timestamp('2010'),
... pd.Timestamp('2011')],
... 'C': [pd.Timedelta('1 days'),
... pd.Timedelta('2 days')]})
>>> df.quantile(0.5, numeric_only=False)
A 1.5
B 2010-07-02 12:00:00
C 1 days 12:00:00
Name: 0.5, dtype: object
總結
以上是生活随笔為你收集整理的python dataframe 分位数_Python pandas.DataFrame.quantile函数方法的使用的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 原神迷你仙灵有什么用?
- 下一篇: sonar jacoco 覆盖率为0_J