Python以相同的方式传递所有内容,但是“按值”或“按引用”称呼它并不会清除所有内容,因为Python的语义不同于这些术语通常适用的语言。如果要描述它,我会说所有传递都是按值进行的,并且该值是对象引用。(这就是为什么我不想说!)
foo = range(100000)
new_foo = []
for item in foo:
if item % 3 != 0: # Things divisble by 3 don't get through
new_foo.append(item)
或者,使用列表推导语法
new_foo = [item for item in foo if item % 3 != 0]
Python不会复制列表中的对象,而是复制两者foo
并new_foo
引用相同的对象。(Python从不隐式复制任何对象。)
您建议您对此操作有性能方面的担忧。使用del
旧列表中的重复 语句将不会导致代码不那么惯用且难以处理,但是由于每次都必须重新整理整个列表,因此会引入二次性能。
除非您有代码工作,否则您无法弄清楚性能如何。这还将告诉您必须优化的速度还是空间。您在代码中提到了对两者的担忧,但是通常,优化需要以牺牲另一个为代价。
您可以使用stdlib工具及时获得性能。有各种各样的第三方内存分析器可能有些有用,但使用起来却不太好。
进行更改时花费时间或重新配置内存,以查看更改是否带来了改进,如果有改进,那么这是什么。
为了使代码对内存更敏感,通常需要在存储数据的方式上进行范式转换,而不是进行微优化,而不是不构建第二个列表来进行过滤。(时间上也是如此,实际上:更改为更好的算法几乎总会带来最佳的加速。但是,很难对速度优化进行概括。)
一些优化Python内存消耗的常见范例转换包括
1. 使用发电机。生成器是懒惰的可迭代对象:它们不会立即将整个列表加载到内存中,而是会弄清楚下一步将运行什么。要使用生成器,上面的代码片段看起来像
foo = xrange(100000) # Like generators, xrange is lazy
def filter_divisible_by_three(iterable):
for item in foo:
if item % 3 != 0:
yield item
new_foo = filter_divisible_by_three(foo)
或者,使用生成器表达式语法,
new_foo = (item for item in foo if item % 3 != 0)
2. 使用`numpy`为均质的序列,特别是那些是数值-mathy。这也可以加快执行大量矢量操作的代码的速度。
3. 将数据存储到磁盘,例如数据库中。