您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

加载速度更快:python中的pickle或hdf5

加载速度更快:python中的pickle或hdf5

我只考虑两种存储格式:HDF5(PyTables)和Feather

这是我对DF进行读写比较的结果(形状:4000000 x6,内存大小183.1 MB,未压缩CSV的大小-492 MB)。

以下存储格式比较:( ,CSV,,CSV.gzip [各种压缩]):Pickle``HDF5

                  read_s  write_s  size_ratio_to_CSV
storage
CSV               17.900    69.00              1.000
CSV.gzip          18.900   186.00              0.047
Pickle             0.173     1.77              0.374
HDF_fixed          0.196     2.03              0.435
HDF_tab            0.230     2.60              0.437
HDF_tab_zlib_c5    0.845     5.44              0.035
HDF_tab_zlib_c9    0.860     5.95              0.035
HDF_tab_bzip2_c5   2.500    36.50              0.011
HDF_tab_bzip2_c9   2.500    36.50              0.011

但这对您来说可能有所不同,因为我的所有数据都是datetimedtype,因此最好将它与 您的 真实数据或至少与相似数据进行比较…

python 2022/1/1 18:36:51 有232人围观

撰写回答


你尚未登录,登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进,让解决方法与时俱进

请先登录

推荐问题


联系我
置顶