您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

Python:创建一个函数来通过引用而不是值来修改列表

Python:创建一个函数来通过引用而不是值来修改列表

Python以相同的方式传递所有内容,但是“按值”或“按引用”称呼它并不会清除所有内容,因为Python的语义不同于这些术语通常适用的语言。如果要描述它,我会说所有传递都是按值进行的,并且该值是对象引用。(这就是为什么我不想说!)

如果要从列表中过滤掉某些内容,请建立一个新列表

foo = range(100000)
new_foo = []
for item in foo:
    if item % 3 != 0: # Things divisble by 3 don't get through
        new_foo.append(item)

或者,使用列表推导语法

 new_foo = [item for item in foo if item % 3 != 0]

Python不会复制列表中的对象,而是复制两者foonew_foo引用相同的对象。(Python从不隐式复制任何对象。)

您建议您对此操作有性能方面的担忧。使用del旧列表中的重复 语句将不会导致代码不那么惯用且难以处理,但是由于每次都必须重新整理整个列表,因此会引入二次性能

解决性能问题:

除非您有代码工作,否则您无法弄清楚性能如何。这还将告诉您必须优化的速度还是空间。您在代码中提到了对两者的担忧,但是通常,优化需要以牺牲另一个为代价。

您可以使用stdlib工具及时获得性能。有各种各样的第三方内存分析器可能有些有用,但使用起来却不太好。

进行更改时花费时间或重新配置内存,以查看更改是否带来了改进,如果有改进,那么这是什么。

为了使代码对内存更敏感,通常需要在存储数据的方式上进行范式转换,而不是进行微优化,而不是不构建第二个列表来进行过滤。(时间上也是如此,实际上:更改为更好的算法几乎总会带来最佳的加速。但是,很难对速度优化进行概括。)

一些优化Python内存消耗的常见范例转换包括

1. 使用发电机。生成器是懒惰的可迭代对象:它们不会立即将整个列表加载到内存中,而是会弄清楚下一步将运行什么。要使用生成器,上面的代码片段看起来像

            foo = xrange(100000) # Like generators, xrange is lazy
    def filter_divisible_by_three(iterable):
        for item in foo:
            if item % 3 != 0:
                yield item

    new_foo = filter_divisible_by_three(foo)

或者,使用生成器表达式语法,

            new_foo = (item for item in foo if item % 3 != 0)


2. 使用`numpy`为均质的序列,特别是那些是数值-mathy。这也可以加快执行大量矢量操作的代码的速度。

3. 将数据存储到磁盘,例如数据库中。
python 2022/1/1 18:39:08 有247人围观

撰写回答


你尚未登录,登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进,让解决方法与时俱进

请先登录

推荐问题


联系我
置顶