为什么pandas数据框单元格的ID每次执行都会改变？

您没有获得“单元格”的ID，而是获得id了.loc访问器返回的对象的ID，该访问器是基础数据的盒装版本。

所以，

>>> import pandas as pd
>>> df = pd.DataFrame(columns=list('abc'), data=np.arange(18).reshape(6, 3))
>>> df1 = df.iloc[:3, :]
>>> df.dtypes
a    int64
b    int64
c    int64
dtype: object
>>> df1.dtypes
a    int64
b    int64
c    int64
dtype: object

但是由于Python中的 所有内容 都是对象，因此您的loc方法必须返回一个对象：

>>> x = df.loc[0, 'a']
>>> x
0
>>> type(x)
<class 'numpy.int64'>
>>> isinstance(x, object)
True

但是，实际的基础缓冲区是C个固定大小的64位有符号整数的原始数组。它们不是Python对象，它们被“装箱”以从其他将原始类型与对象混合在一起的语言中借用一个术语。

现在，所有对象都具有相同现象的现象id：

>>> id(df.loc[0, 'a']), id(df.loc[0, 'a'])
(4539673432, 4539673432)
>>> id(df.loc[0, 'a']), id(df.loc[0, 'a']), id(df1.loc[0,'a'])
(4539673432, 4539673432, 4539673432)

发生是因为在Python中，对象可以自由地重用最近回收的对象的内存地址。确实，当您创建的元组时id，对象的返回loc仅存在足够长的时间，以通过第一次调用进行传递和处理id，第二次使用时loc，已经释放的对象仅会重复使用相同的内存。您可以在任何Python对象中看到相同的行为，例如list：

>>> id([]), id([])
(4545276872, 4545276872)

从根本上讲，id只能保证在对象的 生存期内 唯一的。在此处阅读有关此现象的更多信息。但是请注意，在以下情况下，它将始终是不同的：

>>> x = df.loc[0, 'a']
>>> x2 = df.loc[0, 'a']
>>> id(x), id(x2)
(4539673432, 4539673408)

由于您维护引用，因此不会回收对象，并且需要新的内存。

注意，对于许多不可变的对象，解释器可以自由优化并返回 相同的精确对象 。在cpython中，“小整数”就是这种情况，所谓的小整数缓存：

>>> x = 2
>>> y = 2
>>> id(x), id(y)
(4304820368, 4304820368)

但这是不应该依赖的实现细节。

如果您想证明自己的数据帧正在共享相同的基础缓冲区，只需对其进行突变，便会在视图之间看到相同的变化：

>>> df
    a   b   c
0   0   1   2
1   3   4   5
2   6   7   8
3   9  10  11
4  12  13  14
5  15  16  17
>>> df1
   a  b  c
0  0  1  2
1  3  4  5
2  6  7  8
>>> df.loc[0, 'a'] = 99
>>> df
    a   b   c
0  99   1   2
1   3   4   5
2   6   7   8
3   9  10  11
4  12  13  14
5  15  16  17
>>> df1
    a  b  c
0  99  1  2
1   3  4  5
2   6  7  8

其他 2022/1/1 18:43:07 有300人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

PHP中的全局变量是否被视为不良做法？如果是这样，为什么？

PHP中的全局变量是否被视为不良做法？如果是这样，为什么？

php 2022-01-01 1097
为什么需要将匿名函数传递给onClick事件？

为什么需要将匿名函数传递给onClick事件？

其他 2022-01-01 1091
为什么Class.newInstance（）是“evil”？

为什么Class.newInstance（）是“evil”？

其他 2022-01-01 1029
在为该对象分配其他内容时，为什么不通过引用传递该对象？

在为该对象分配其他内容时，为什么不通过引用传递该对象？

其他 2022-01-01 1318
为什么我们将firefoxdriver实例分配给webdriver

为什么我们将firefoxdriver实例分配给webdriver

其他 2022-01-01 1019
为什么新的Java 8日期时间API不具有纳秒精度？

为什么新的Java 8日期时间API不具有纳秒精度？

java 2022-01-01 1044
为什么浮点数打印方式如此不同？

为什么浮点数打印方式如此不同？

其他 2022-01-01 1033
为什么说深度优先搜索会遭受无限循环的困扰？

为什么说深度优先搜索会遭受无限循环的困扰？

其他 2022-01-01 933
为什么找不到SSL握手的信任库？

为什么找不到SSL握手的信任库？

其他 2022-01-01 1037
为什么没有输入，民意调查仍会返回？

为什么没有输入，民意调查仍会返回？

其他 2022-01-01 941
为什么在React中认为cancelledPromise模式比isMounted（）“反模式”更好？

为什么在React中认为cancelledPromise模式比isMounted（）“反模式”更好？

其他 2022-01-01 935
在onPause，onStop和onDestroy方法中调用超类方法的正确顺序是什么？为什么？

在onPause，onStop和onDestroy方法中调用超类方法的正确顺序是什么？为什么？

其他 2022-01-01 1046
为什么Hibernate切换为通过CLOB使用LONG？

为什么Hibernate切换为通过CLOB使用LONG？

其他 2022-01-01 982
为什么“无”映像出现在Docker中以及我们如何避免它

为什么“无”映像出现在Docker中以及我们如何避免它

其他 2022-01-01 910
为什么在pom.xml的第1行中出现Unknown错误？

为什么在pom.xml的第1行中出现Unknown错误？

其他 2022-01-01 1232
为什么数据传输对象（DTO）是反模式？

为什么数据传输对象（DTO）是反模式？

其他 2022-01-01 908
为什么某些技术上可序列化的输入属性不能序列化？

为什么某些技术上可序列化的输入属性不能序列化？

其他 2022-01-01 984
什么是仓库和标签？为什么在使用docker build时它们会出现？

什么是仓库和标签？为什么在使用docker build时它们会出现？

其他 2022-01-01 1017
为什么无法在Java中扩展注释？

为什么无法在Java中扩展注释？

java 2022-01-01 1101
Java Map为什么不扩展Collection？

Java Map为什么不扩展Collection？

java 2022-01-01 987

为什么pandas数据框单元格的ID每次执行都会改变？

撰写回答

推荐问题

PHP中的全局变量是否被视为不良做法？如果是这样，为什么？

为什么需要将匿名函数传递给onClick事件？

为什么Class.newInstance（）是“evil”？

在为该对象分配其他内容时，为什么不通过引用传递该对象？

为什么我们将firefoxdriver实例分配给webdriver

为什么新的Java 8日期时间API不具有纳秒精度？

为什么浮点数打印方式如此不同？

为什么说深度优先搜索会遭受无限循环的困扰？

为什么找不到SSL握手的信任库？

为什么没有输入，民意调查仍会返回？

为什么在React中认为cancelledPromise模式比isMounted（）“反模式”更好？

在onPause，onStop和onDestroy方法中调用超类方法的正确顺序是什么？为什么？

为什么Hibernate切换为通过CLOB使用LONG？

为什么“无”映像出现在Docker中以及我们如何避免它

为什么在pom.xml的第1行中出现Unknown错误？

为什么数据传输对象（DTO）是反模式？

为什么某些技术上可序列化的输入属性不能序列化？

什么是仓库和标签？为什么在使用docker build时它们会出现？

为什么无法在Java中扩展注释？

Java Map为什么不扩展Collection？

分类汇总

您的鼓励是对我最大的支持