python 列表 随机采样_Python 随机抽样
# -*- coding: utf-8 -*-
import numpy
import pandas
data = pandas.read_csv(
'D:\\PDA\\4.9\\data.csv'
)
#設置隨機種子
numpy.random.seed(seed=2)
#按照個數抽樣
data.sample(n=10)
#按照百分比抽樣
data.sample(frac=0.02)
#是否可放回抽樣,
#replace=True,可放回,
#replace=False,不可放回
data.sample(n=10, replace=True)
#典型抽樣,分層抽樣
gbr = data.groupby("class")
gbr.groups
typicalNDict = {
1: 2,
2: 4,
3: 6
}#定義一個字典,從一班級中抽取2個人,二班級中抽取4個人,三班級中抽取6個人
def typicalSampling(group, typicalNDict):
name = group.name
n = typicalNDict[name]
return group.sample(n=n)
result = data.groupby(
'class', group_keys=False
).apply(typicalSampling, typicalNDict)#向量化運算的函數apply
typicalFracDict = {
1: 0.2,
2: 0.4,
3: 0.6
}#定義字典,按照百分比抽樣
def typicalSampling(group, typicalFracDict):
name = group.name
frac = typicalFracDict[name]
return group.sample(frac=frac)
result = data.groupby(
'class', group_keys=False
).apply(typicalSampling, typicalFracDict)
idclassscore
3940145
45163
5354195
2526164
37381107
7071175
8586277
8182263
54552121
6869256
1314269
8687293
5758282
8485285
94952103
96972108
35362101
8990286
4546295
8081281
20212138
6566383
8384352
3435366
67387
7778377
8283354
55563126
1718358
6768393
1011389
2627364
61623103
8889389
6970396
01377
9091391
9192359
4849398
78348
5253362
總結
以上是生活随笔為你收集整理的python 列表 随机采样_Python 随机抽样的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 输入参数的数目不足_机器学习算法—KME
- 下一篇: linux 文件大小_linux系统中查