这篇文章主要介绍了pandas 空数据处理方法详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
方法一:直接删除
1.查看行或列是否有空格(以下的df为DataFrame类型,axis=0,代表列,axis=1代表行,以下的返回值都是行或列索引加上布尔值)
isnull方法
查看行:df.isnull().any(axis=1)
查看列:df.isnull().any(axis=0)
notnull方法:
查看行:df.notnull().all(axis=1)
查看列:df.notnull().all(axis=0)
例子:
df.isnull().any(axis=1) # 检测行内是否有空值 0 False 1 True 2 False 3 True 4 False 5 True 6 False 7 True 8 False 9 False dtype: bool
注意点:以上方法都可以用~取反的办法获取相反的结果
2.在1的前提下使用df.loc[],可取出1中筛选出数据的具体数据如:
df.loc[df.isnull().any(axis=1)]
取出这几行的索引可用属性index如:df.loc[df.isnull().any(axis=1)].index
得到这些索引后可以使用drop方法进行删除如:
注意:drop方法中的axis值与其他方法相反,axis=0表示行,=1表示列。
df.drop(labels=drop_index, axis=0)
总结下来为4步:
一.使用isnull或notnull筛选:df.isnull().any(axis=0)
二.使用loc取出具体数据:df.loc[df.isnull().any(axis=1)]
三:取出这些数据的索引:df.loc[df.isnull().any(axis=1)].index
四.使用drop删除:df.drop(labels=drop_index, axis=0)
方法二:填充空值
步骤和方法一前几步相同
isnull()
notnull()
dropna(): 过滤丢失数据(df.dropna() 可以选择过滤的是行还是列(默认为行):axis中0表示行,1表示的列)
fillna(): 填充丢失数据(可以选择自主添加数据,或者用表中原有的数据进行补充)
1.使用dropna(不常用):df.dropna(axis=0)
2.使用fillna(常用):
一.df.fillna(value=666)给所有的控制赋值为666
二.df.fillna(method='ffill', axis=0) # axis=0表示在垂直方向填充(axis值:0为垂直,1为水平),使用上方的值对空值进行填充,组合起来就是,使用垂直方向上方的值对当前位置的值进行填充
三.df.fillna(method='bfill', axis=1) # axis=1表示在水平方向填充(axis值为0垂直1为水平),bfill表示使用后面的值对空值进行填充,组合起来就是,使用水平方向右边的值对当前位置的值进行填充
总结:ffill(前)和bfill(后)决定前或后,axis决定垂直或水平
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。
pandas,空数据,处理
免责声明:本站文章均来自网站采集或用户投稿,网站不提供任何软件下载或自行开发的软件! 如有用户或公司发现本站内容信息存在侵权行为,请邮件告知! 858582#qq.com
稳了!魔兽国服回归的3条重磅消息!官宣时间再确认!
昨天有一位朋友在大神群里分享,自己亚服账号被封号之后居然弹出了国服的封号信息对话框。
这里面让他访问的是一个国服的战网网址,com.cn和后面的zh都非常明白地表明这就是国服战网。
而他在复制这个网址并且进行登录之后,确实是网易的网址,也就是我们熟悉的停服之后国服发布的暴雪游戏产品运营到期开放退款的说明。这是一件比较奇怪的事情,因为以前都没有出现这样的情况,现在突然提示跳转到国服战网的网址,是不是说明了简体中文客户端已经开始进行更新了呢?
更新日志
- 雨林唱片《赏》新曲+精选集SACD版[ISO][2.3G]
- 罗大佑与OK男女合唱团.1995-再会吧!素兰【音乐工厂】【WAV+CUE】
- 草蜢.1993-宝贝对不起(国)【宝丽金】【WAV+CUE】
- 杨培安.2009-抒·情(EP)【擎天娱乐】【WAV+CUE】
- 周慧敏《EndlessDream》[WAV+CUE]
- 彭芳《纯色角3》2007[WAV+CUE]
- 江志丰2008-今生为你[豪记][WAV+CUE]
- 罗大佑1994《恋曲2000》音乐工厂[WAV+CUE][1G]
- 群星《一首歌一个故事》赵英俊某些作品重唱企划[FLAC分轨][1G]
- 群星《网易云英文歌曲播放量TOP100》[MP3][1G]
- 方大同.2024-梦想家TheDreamer【赋音乐】【FLAC分轨】
- 李慧珍.2007-爱死了【华谊兄弟】【WAV+CUE】
- 王大文.2019-国际太空站【环球】【FLAC分轨】
- 群星《2022超好听的十倍音质网络歌曲(163)》U盘音乐[WAV分轨][1.1G]
- 童丽《啼笑姻缘》头版限量编号24K金碟[低速原抓WAV+CUE][1.1G]