pd.cut
pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False)
x:要分箱的输入数组,必须是一维的
bins:int或标量序列
若bins是一个int,它定义在x范围内的等宽单元的数量。然而,在这种情况下,x的范围在每一侧延伸0.1%以包括x的最小值或最大值
若bins是一个序列,它定义了允许非均匀bin宽度的bin边缘。在这种情况下不进行x的范围的扩展
right:bool,可选:决定区间的开闭,如果right == True(默认),则区间[1,2,3,4]指示(1,2],(2,3],(3,4]
labels:array或boolean,默认值为无:用作生成的区间的标签。必须与生成的区间的长度相同。如果为False,则只返回bin的整数指示符
retbins:bool,可选:是否返回bin。如果bin作为标量给出,则可能有用
precision:int:存储和显示容器标签的精度,默认保留三位小数
include_lowest:bool:第一个间隔是否应该包含左边
import numpy as np import pandas as pd # 使用pandas的cut函数划分年龄组 ages = [20,22,25,27,21,23,37,31,61,45,32] bins = [18,25,35,60,100] cats = pd.cut(ages,bins) print(cats) # 分类时,当数据不在区间中将变为nan # 统计落在各个区间的值数量 print(pd.value_counts(cats)) # 使用codes为年龄数据进行标号 print(cats.codes) # 设置自己想要的面元名称 group_names = ['Youth','YoungAdult','MiddleAged','Senior'] print(pd.cut(ages, bins, labels=group_names)) # 设置区间数学符号为左闭右开 print(pd.cut(ages, bins, right=False)) # 向cut传入面元的数量,则会根据数据的最小值和最大值计算等长面元 print(pd.cut(ages, 4, precision=2)) # precision=2表示设置的精度
pd.qcut
与cut类似,它可以根据样本分位数对数据进行面元划分
pandas.qcut(x, q, labels=None, retbins=False, precision=3)
x:ndarray或Series
q:整数或分位数阵列分位数。十分位数为10,四分位数为4或者,分位数阵列,例如[0,.25,.5,.75,1.]四分位数
labels:array或boolean,默认值为无:用作生成的区间的标签。必须与生成的区间的长度相同。如果为False,则只返回bin的整数指示符。
retbins:bool,可选:是否返回bin。如果bin作为标量给出,则可能有用。
precision:int:存储和显示容器标签的精度
import numpy as np import pandas as pd # qcut可以根据样本分位数对数据进行面元划分 # data = np.random.randn(20) # 正态分布 data = [1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20] cats = pd.qcut(data, 4) # 按四分位数进行切割 print(cats) print(pd.value_counts(cats)) print("-------------------------------------------------") # 通过指定分位数(0到1之间的数值,包含端点)进行面元划分 cats_2 = pd.qcut(data, [0, 0.5, 0.8, 0.9, 1]) print(cats_2) print(pd.value_counts(cats_2))
以上这篇关于pandas的离散化,面元划分详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。
pandas,离散化,面元划分
免责声明:本站文章均来自网站采集或用户投稿,网站不提供任何软件下载或自行开发的软件! 如有用户或公司发现本站内容信息存在侵权行为,请邮件告知! 858582#qq.com
稳了!魔兽国服回归的3条重磅消息!官宣时间再确认!
昨天有一位朋友在大神群里分享,自己亚服账号被封号之后居然弹出了国服的封号信息对话框。
这里面让他访问的是一个国服的战网网址,com.cn和后面的zh都非常明白地表明这就是国服战网。
而他在复制这个网址并且进行登录之后,确实是网易的网址,也就是我们熟悉的停服之后国服发布的暴雪游戏产品运营到期开放退款的说明。这是一件比较奇怪的事情,因为以前都没有出现这样的情况,现在突然提示跳转到国服战网的网址,是不是说明了简体中文客户端已经开始进行更新了呢?
更新日志
- 雨林唱片《赏》新曲+精选集SACD版[ISO][2.3G]
- 罗大佑与OK男女合唱团.1995-再会吧!素兰【音乐工厂】【WAV+CUE】
- 草蜢.1993-宝贝对不起(国)【宝丽金】【WAV+CUE】
- 杨培安.2009-抒·情(EP)【擎天娱乐】【WAV+CUE】
- 周慧敏《EndlessDream》[WAV+CUE]
- 彭芳《纯色角3》2007[WAV+CUE]
- 江志丰2008-今生为你[豪记][WAV+CUE]
- 罗大佑1994《恋曲2000》音乐工厂[WAV+CUE][1G]
- 群星《一首歌一个故事》赵英俊某些作品重唱企划[FLAC分轨][1G]
- 群星《网易云英文歌曲播放量TOP100》[MP3][1G]
- 方大同.2024-梦想家TheDreamer【赋音乐】【FLAC分轨】
- 李慧珍.2007-爱死了【华谊兄弟】【WAV+CUE】
- 王大文.2019-国际太空站【环球】【FLAC分轨】
- 群星《2022超好听的十倍音质网络歌曲(163)》U盘音乐[WAV分轨][1.1G]
- 童丽《啼笑姻缘》头版限量编号24K金碟[低速原抓WAV+CUE][1.1G]