博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
利用Python进行数据分析(10) pandas基础: 处理缺失数据
阅读量:4958 次
发布时间:2019-06-12

本文共 407 字,大约阅读时间需要 1 分钟。

 
数据不完整在数据分析的过程中很常见。
pandas使用浮点值NaN表示浮点和非浮点数组里的缺失数据。
pandas使用isnull()和notnull()函数来判断缺失情况。
对于缺失数据一般处理方法为滤掉或者填充
滤除缺失数据
 
对于一个Series,dropna()函数返回一个包含非空数据和索引值的Series,例如:
对于DataFrame,dropna()函数同样会丢掉所有含有空元素的数据,例如:
 
但是可以指定how='all',这表示只有行里的数据全部为空时才丢弃,例如:
 
如果想以同样的方式按列丢弃,可以传入axis=1,例如:
 
 
填充缺失数据
如果不想丢掉缺失的数据而是想用默认值填充这些空洞,可以使用fillna()函数:
 
如果不想只以某个标量填充,可以传入一个字典,对不同的列填充不同的值:

转载于:https://www.cnblogs.com/sirkevin/p/5767532.html

你可能感兴趣的文章
9、总线
查看>>
Git 笔记 - section 1
查看>>
HDU6409 没有兄弟的舞会
查看>>
2018 Multi-University Training Contest 10 - TeaTree
查看>>
2018 Multi-University Training Contest 10 - Count
查看>>
HDU6203 ping ping ping
查看>>
《人人都是产品经理》书籍目录
查看>>
如何在git bash中运行mysql
查看>>
OO第三阶段总结
查看>>
构建之法阅读笔记02
查看>>
DataTable和 DataRow的 区别与联系
查看>>
检索COM 类工厂中CLSID 为 {00024500-0000-0000-C000-000000000046}的组件时失败
查看>>
mysql数据库中数据类型
查看>>
Fireworks基本使用
查看>>
两台电脑间的消息传输
查看>>
Linux 标准 I/O 库
查看>>
.net Tuple特性
查看>>
Java基础常见英语词汇
查看>>
iOS并发编程笔记【转】
查看>>
08号团队-团队任务5:项目总结会
查看>>