import numpy as np
import tables
# Generate some data
x = np.random.random((100,100,100))
# Store "x" in a chunked array...
f = tables.open_file('test.hdf', 'w')
atom = tables.Atom.from_dtype(x.dtype)
ds = f.createCArray(f.root, 'somename', atom, x.shape)
ds[:] = x
f.close()
如果要指定要使用的压缩,请查看tables.Filters
。例如
import numpy as np
import tables
# Generate some data
x = np.random.random((100,100,100))
# Store "x" in a chunked array with level 5 BLOSC compression...
f = tables.open_file('test.hdf', 'w')
atom = tables.Atom.from_dtype(x.dtype)
filters = tables.Filters(complib='blosc', complevel=5)
ds = f.createCArray(f.root, 'somename', atom, x.shape, filters=filters)
ds[:] = x
f.close()
可能有很多更简单的方法……pytables
很长一段时间以来,我除了表型数据外没有用过其他任何东西。
在pytables 3.0中,f.createCArray
已重命名为f.create_carray
。它也可以直接接受数组,而无需指定atom
,
f.create_carray('/', 'somename', obj=x, filters=filters)