list（）比列表理解使用更多的内存

我认为您正在看到过度分配模式，这是来自源的示例：

/* This over-allocates proportional to the list size, making room
 * for additional growth.  The over-allocation is mild, but is
 * enough to give linear-time amortized behavior over a long
 * sequence of appends() in the presence of a poorly-performing
 * system realloc().
 * The growth pattern is:  0, 4, 8, 16, 25, 35, 46, 58, 72, 88, ...
 */

new_allocated = (newsize >> 3) + (newsize < 9 ? 3 : 6);

打印长度为0-88的列表理解的大小，您可以看到模式匹配：

# create comprehensions for sizes 0-88
comprehensions = [sys.getsizeof([1 for _ in range(l)]) for l in range(90)]

# only take those that resulted in growth compared to prevIoUs length
steps = zip(comprehensions, comprehensions[1:])
growths = [x for x in list(enumerate(steps)) if x[1][0] != x[1][1]]

# print the results:
for growth in growths:
    print(growth)

结果（格式为(list length, (old total size, new total size))）：

(0, (64, 96)) 
(4, (96, 128))
(8, (128, 192))
(16, (192, 264))
(25, (264, 344))
(35, (344, 432))
(46, (432, 528))
(58, (528, 640))
(72, (640, 768))
(88, (768, 912))

出于性能原因而进行了过度分配，从而允许列表增长而不会每次增长都分配更多的内存（更好的摊销性能）。

使用列表理解的差异的一个可能原因是列表理解不能确定性地计算所生成列表的大小，但是list()可以。这意味着，在使用过度分配填充列表的过程中，理解力将不断增长，直到最终填充它。

一旦完成，有可能不会使用未分配的分配节点来增加过度分配缓冲区（实际上，在大多数情况下，这样做不会克服过度分配的目的）。

list()但是，无论列表大小如何，都可以添加一些缓冲区，因为它事先知道最终的列表大小。

同样从源头获得的另一个支持证据是，我们看到列表理解正在调用LIST_APPEND，它表示的使用list.resize，而这又表明在不知道要填充多少预分配缓冲区的情况下消耗了预分配缓冲区。这与您看到的行为一致。

总而言之，list()将根据列表大小预分配更多节点

>>> sys.getsizeof(list([1,2,3]))
60
>>> sys.getsizeof(list([1,2,3,4]))
64

列表理解不知道列表的大小，因此随着列表的增长，它会使用追加操作，从而耗尽了预分配缓冲区：

# one item before filling pre-allocation buffer completely
>>> sys.getsizeof([i for i in [1,2,3]]) 
52
# fills pre-allocation buffer completely
# note that size did not change, we still have buffered unused nodes
>>> sys.getsizeof([i for i in [1,2,3,4]]) 
52
# grows pre-allocation buffer
>>> sys.getsizeof([i for i in [1,2,3,4,5]])
68

其他 2022/1/1 18:38:32 有493人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

list（）比列表理解使用更多的内存

撰写回答

推荐问题

强制JsonConvert.SerializeXmlNode将节点值序列化为Integer或Boolean

ESLint-组件应被编写为纯函数（react preferred / stateless function）

为什么需要将匿名函数传递给onClick事件？

在JavaScript中删除数组元素-Delete与Splice

JavaScriptWays to circumvent the same-origin policy

带有React的ESLint会给出“ no-unused-vars”错误

在Mac中缺少对/ usr / local / lib / node_modules的写访问权限

Tomcat，HTTP Keep-Alive和Java的HttpsUrlConnection

HttpClient的进度栏

pandas.io.json.json_normalize与非常嵌套的json

如何在Linux用户空间应用程序中测试地址是否可读

是否可以从eclispe中的mysql表生成带有休眠注释的java类文件

如何正确使用CipherOutputStream加密和解密使用log4j（RollingFileAppender）创建的日志

Linux的Opengl未定义对基本功能的引用

如何在Azure网站上的React App中替换％PUBLIC_URL％

iTunesConnect TestFlight的iOS应用版本和内部版本号

Linux中进程和线程之间的区别

如何在JSP页面的选项标签上使用onClick（）或onSelect（）？

用Eclipse Kepler运行Tomcat

在Linux中的特定行中向文件中添加文本

分类汇总

您的鼓励是对我最大的支持