当前位置:首页 >> 脚本专栏

深入浅析python的第三方库pandas

pandas模块

pandas是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供数据清洗功能。

作为pandas系列的最终章,本文引出一个数据“复制”问题。

示例如下:

深入浅析python的第三方库pandas

从上图中可以看到:我们对data_pd做了删除一行的操作,但是这并没有改变变量data_pd在内存中的值,而是将删减一行后的数据放置在一块新开辟的内存区域。
可以这么理解,这种机制是在复制的一份原数据上进行操作,从而保护原数据不受改变,保证了原数据的安全性。

如果需要直接改变原数据的值,可以在上述方法上设定参数值:

深入浅析python的第三方库pandas

上面讨论的这种现象,在python领域里广泛存在,本文作为一个引子,笔者将在另一篇博文中讨论整个python领域“赋值与深浅复制”的问题。

总结

以上所述是小编给大家介绍的python的第三方库pandas,希望对大家有所帮助!