处理DataFrame的inf值的技巧有什么

lewis 6年前 (2019-06-25) 阅读数 10 #技术

这篇文章给大家分享的是处理DataFrame的inf值的技巧有什么。小编觉得挺实用的，因此分享给大家做个参考，文中的介绍得很详细，而要易于理解和学习，有需要的朋友可以参考，接下来就跟随小编一起了解看看吧。

如何处理DataFrame的inf值

在用DataFrame计算变化率时，例如(今天-昨天) / 昨天恰好为(2-0) / 0时，这些结果数据会变为inf。

为了方便后续处理，可以利用numpy，将这些inf值进行替换。

1. 将某1列（series格式）中的 inf 替换为数值。

import numpy as np

df['Col'][np.isinf(df['Col'])] = -1

2. 将某1列（series格式）中的 inf 替换为NA值。

import numpy as np

df['Col'][np.isinf(df['Col'])] = np.nan

3. 将整个DataFrame中的 inf 替换为数值（空值同理）。#感谢评论区的补充

import numpy as np

df.replace(np.inf, -1) #替换正inf为-1

#替换正负inf为NA，加inplace参数
df.replace([np.inf, -np.inf], np.nan, inplace=True)

DataFrame有关inf的处理技巧

numpy中inf的相关文档

什么是inf？

IEEE 754浮点表示（正）无穷大。

为什么会产生？

>>> np.NINF
-inf
>>> np.inf
inf
>>> np.log(0)
-inf
>>> np.array([1,2])/0 #碰到的最多的情况
array([ inf, inf])

产生inf有什么好处？

目前没看到有什么好处，只是单纯用inf表示无穷大，方便理解和表示。

产生inf有什么坏处？

对用户而言，对inf需要特殊处理，加大了工作量。

为什么需要特殊处理？因为许多机器学习算法库并不支持对inf的处理。

怎么处理？

常见的处理方法：

不处理替换

怎么获取到inf的所在位置并进行填补？

isinf：显示哪些元素为正或负无穷大 isposinf：显示哪些元素为正无穷大 isneginf：显示哪些元素为负无穷大 isnan：显示哪些元素不是数字 isfinite：显示哪些元素是有限的（不是非数字，正无穷大和负无穷大中的一个）

'''
>>> np.isinf(np.inf) #其他函数同理使用，isinf使用最多。
True
>>> np.isinf(np.array([1,np.inf]))
array([False, True], dtype=bool)
>>>np.isinf(pd.DataFrame(np.array([1,np.inf])))
   0
0 False
1  True
>>>s1 = pd.Series([1,2,3,np.inf])
>>>s1
0  1.0
1  2.0
2  3.0
3  NaN
dtype: float64
#对inf填补 999
>>>s1[np.isinf(s1)] = 999
>>>s1
0  1.0
1  2.0
2  3.0
3 999.0
dtype: float64
#对inf填补np.nan (较为常用)
>>>s1[np.isinf(s1)] = np.nan
>>>s1
0  1.0
1  2.0
2  3.0
3  NaN
dtype: float64

现在大家对于处理DataFrame的inf值的技巧有什么的内容应该都有一定的认识了吧，希望这篇能对大家有所帮助。最后，想要了解更多，欢迎关注博信，博信将为大家推送更多相关的文章。