在python中仅加载图像的一部分

将文件另存为未压缩的24位BMP。这些以非常规则的方式存储像素数据。从Wikipedia中检出此图的“图像数据”部分。请注意，图中的大多数复杂性仅来自标题：

BMP文件格式

例如，假设您正在存储此图像（此处显示为放大）：

2x2方形图片

如果将其存储为24位未压缩的BMP，则像素数据部分的外观将是这样。请注意，由于某种原因，数据是以自下而上的方式存储的，并且以BGR格式而不是RGB格式存储，因此文件中的第一行是图像的最底行，第二行是倒数第二行，等等：

00 00 FF    FF FF FF    00 00
FF 00 00    00 FF 00    00 00

该数据的解释如下：

           |  First column  |  Second Column  |  Padding
-----------+----------------+-----------------+-----------
Second Row |  00 00 FF      |  FF FF FF       |  00 00
-----------+----------------+-----------------+-----------
First Row  |  FF 00 00      |  00 FF 00       |  00 00
-----------+----------------+-----------------+-----------

要么：

           |  First column  |  Second Column  |  Padding
-----------+----------------+-----------------+-----------
Second Row |  red           |  white          |  00 00
-----------+----------------+-----------------+-----------
First Row  |  blue          |  green          |  00 00
-----------+----------------+-----------------+-----------

在那里填充可以将行大小填充为4字节的倍数。

因此，您要做的就是为这种特定的文件格式实现阅读器，然后计算必须开始和停止读取每一行的字节偏移量：

def calc_bytes_per_row(width, bytes_per_pixel):
    res = width * bytes_per_pixel
    if res % 4 != 0:
        res += 4 - res % 4
    return res

def calc_row_offsets(pixel_array_offset, bmp_width, bmp_height, x, y, row_width):
    if x + row_width > bmp_width:
        raise ValueError("This is only for calculating offsets within a row")

    bytes_per_row = calc_bytes_per_row(bmp_width, 3)
    whole_row_offset = pixel_array_offset + bytes_per_row * (bmp_height - y - 1)
    start_row_offset = whole_row_offset + x * 3
    end_row_offset = start_row_offset + row_width * 3
    return (start_row_offset, end_row_offset)

然后，您只需要处理适当的字节偏移即可。例如，假设您要读取10000x10000位图中从位置500x500开始的400x400块：

def process_row_bytes(row_bytes):
    ... some efficient way to process the bytes ...

bmpf = open(..., "rb")
pixel_array_offset = ... extract from bmp header ...
bmp_width = 10000
bmp_height = 10000
start_x = 500
start_y = 500
end_x = 500 + 400
end_y = 500 + 400

for cur_y in xrange(start_y, end_y):
    start, end = calc_row_offsets(pixel_array_offset, 
                                  bmp_width, bmp_height, 
                                  start_x, cur_y, 
                                  end_x - start_x)
    bmpf.seek(start)
    cur_row_bytes = bmpf.read(end - start)
    process_row_bytes(cur_row_bytes)

请注意，处理字节非常重要。您可能可以使用PIL做一些聪明的事情，然后将像素数据转储到其中，但是我不确定。如果您以低效的方式进行操作，则可能不值得。如果速度是一个非常大的问题，您可以考虑使用pyrex编写它，或在C中实现以上内容，然后从Python调用它。

python 2022/1/1 18:46:58 有418人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

在python中仅加载图像的一部分

撰写回答

推荐问题

如何在PHP变量中去除空格？

我可以在php中的SESSION数组上使用array_push吗？

如何使用bcrypt在PHP中对密码进行哈希处理？

如何在PHP中使用XMLReader？

PDOException“找不到驱动程序”在PHP

为什么在pom.xml的第1行中出现Unknown错误？

__construct（）与SameAsClassName（）在PHP中的构造函数

使用Retrofit2在POST请求中发送JSON

用单引号在PHP中打印换行符

可以嵌套在P元素内的HTML5元素列表？

为什么在PHP中通过标头（'Location ..'）重定向后必须调用'exit'？

如何在PHP中发出异步GET请求？

如何在php中为其他所有函数调用自动调用函数

当软键盘出现在phonegap中时，输入字段隐藏

在PHP中连接n个数组的值

在PHP中“ =>”是什么意思？

在PHP中写入新行到文件（换行）

文件上传可以在PHP中超时吗？

如何在Python中使用Selenium滚动到页面的末尾？

在PHP中对关联数组进行排序

分类汇总

您的鼓励是对我最大的支持