从numpy数组列表创建numpy数组的Python方法

假设您知道最终的数组arr永远不会大于5000x10。然后，您可以预分配最大大小的数组，在遍历循环时将其填充数据，然后arr.resize在退出循环后将其缩减为发现的大小。

下面的测试表明，无论数组的最终大小如何，这样做都会比构造中间python列表快一点。

同样，arr.resize取消分配未使用的内存，因此最终的（虽然可能不是中间的）内存占用空间小于所使用的内存占用空间python_lists_to_array。

这表明numpy_all_the_way速度更快：

% python -mtimeit -s"import test" "test.numpy_all_the_way(100)"
100 loops, best of 3: 1.78 msec per loop
% python -mtimeit -s"import test" "test.numpy_all_the_way(1000)"
100 loops, best of 3: 18.1 msec per loop
% python -mtimeit -s"import test" "test.numpy_all_the_way(5000)"
10 loops, best of 3: 90.4 msec per loop

% python -mtimeit -s"import test" "test.python_lists_to_array(100)"
1000 loops, best of 3: 1.97 msec per loop
% python -mtimeit -s"import test" "test.python_lists_to_array(1000)"
10 loops, best of 3: 20.3 msec per loop
% python -mtimeit -s"import test" "test.python_lists_to_array(5000)"
10 loops, best of 3: 101 msec per loop

这显示numpy_all_the_way使用更少的内存：

% test.py
Initial memory usage: 19788
After python_lists_to_array: 20976
After numpy_all_the_way: 20348

test.py：

import numpy as np
import os


def memory_usage():
    pid = os.getpid()
    return next(line for line in open('/proc/%s/status' % pid).read().splitlines()
                if line.startswith('VmSize')).split()[-2]

N, M = 5000, 10


def python_lists_to_array(k):
    list_of_arrays = list(map(lambda x: x * np.ones(M), range(k)))
    arr = np.array(list_of_arrays)
    return arr


def numpy_all_the_way(k):
    arr = np.empty((N, M))
    for x in range(k):
        arr[x] = x * np.ones(M)
    arr.resize((k, M))
    return arr

if __name__ == '__main__':
    print('Initial memory usage: %s' % memory_usage())
    arr = python_lists_to_array(5000)
    print('After python_lists_to_array: %s' % memory_usage())
    arr = numpy_all_the_way(5000)
    print('After numpy_all_the_way: %s' % memory_usage())

python 2022/1/1 18:28:08 有185人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

从numpy数组列表创建numpy数组的Python方法

撰写回答

推荐问题

MySQL从n最后一行选择

从Nest客户端elasticsearch2.3序列化查询

如何从node.js调用外部脚本/程序

如何从nbviewer可视化的ipython Notebook中的单元格中隐藏代码？

如何从NodeJS中的文件设置process.env？

在Swift中从NSString创建NSData

使用babel从node_modules导入模块但失败

如何将数据从NSWindowController传递到其NSViewController？

从ND到一维阵列

从NSTimeInterval迅速转换为时，分，秒，毫秒

完成所有异步任务后，从NodeJS脚本退出

如何从Node.Js中的字符串创建流？

从Node.js中的回调函数返回值

如何从NetBeans部署到Tomcat？

从Netbeans启动Tomcat失败

从Node.js执行Powershell脚本

如何从NodeJs调用Java程序

如何查看从node.js发送到服务器的请求？

如何使用webpack从node_modules加载静态CSS文件的示例？

在.NET中从NetworkStream读取的正确方法是什么

分类汇总

您的鼓励是对我最大的支持