为什么我不能用numba（cuda python）得到正确的一维数组总和？

您没有得到期望的总和的原因是因为您尚未编写代码来产生该总和。

基本的CUDA编程模型（无论您使用CUDA C，Fortran还是Python作为语言）都是编写由每个线程执行的内核代码。您已经为每个线程编写了代码，以读取和求和输入数组的一部分。您尚未编写任何代码来使这些线程共享和将其各个部分总和求和为最终总和。

有一个非常好的描述算法可以做到这一点- 称为并行约简。您可以在CUDA工具包的每个版本的示例中附带的PDF中找到该算法的简介，或在此处下载有关该算法的演示文稿。您还可以阅读其采用CUDA的新功能（经整理指令和原子交易）的算法更现代的版本在这里。

研究完归约算法后，您需要将标准CUDA C内核代码改编为Numba Python内核方言。至少，像这样：

tpb = (1,3)

@cuda.jit
def calcu_sum(D,T):

    ty = cuda.threadIdx.y
    bh = cuda.blockDim.y
    index_i = ty
    sbuf = cuda.shared.array(tpb, float32)

    L = len(D)
    su = 0
    while index_i < L:
        su += D[index_i]
        index_i +=bh

    print('su:',su)

    sbuf[0,ty] = su
    cuda.syncthreads()

    if ty == 0:
        T[0,0] = 0
        for i in range(0, bh):
            T[0,0] += sbuf[0,i]
        print('T:',T[0,0])

尽管距离最佳并行共享内存的减少还有很长的路要走，但是阅读完我提供的链接资料后，您会发现，这可能会做您想要的事情。

python 2022/1/1 18:42:11 有541人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

PHP中的全局变量是否被视为不良做法？如果是这样，为什么？

PHP中的全局变量是否被视为不良做法？如果是这样，为什么？

php 2022-01-01 1096
为什么需要将匿名函数传递给onClick事件？

为什么需要将匿名函数传递给onClick事件？

其他 2022-01-01 1088
为什么Class.newInstance（）是“evil”？

为什么Class.newInstance（）是“evil”？

其他 2022-01-01 1028
在为该对象分配其他内容时，为什么不通过引用传递该对象？

在为该对象分配其他内容时，为什么不通过引用传递该对象？

其他 2022-01-01 1317
为什么我们将firefoxdriver实例分配给webdriver

为什么我们将firefoxdriver实例分配给webdriver

其他 2022-01-01 1017
为什么新的Java 8日期时间API不具有纳秒精度？

为什么新的Java 8日期时间API不具有纳秒精度？

java 2022-01-01 1043
为什么浮点数打印方式如此不同？

为什么浮点数打印方式如此不同？

其他 2022-01-01 1032
为什么说深度优先搜索会遭受无限循环的困扰？

为什么说深度优先搜索会遭受无限循环的困扰？

其他 2022-01-01 931
为什么找不到SSL握手的信任库？

为什么找不到SSL握手的信任库？

其他 2022-01-01 1035
为什么没有输入，民意调查仍会返回？

为什么没有输入，民意调查仍会返回？

其他 2022-01-01 940
为什么在React中认为cancelledPromise模式比isMounted（）“反模式”更好？

为什么在React中认为cancelledPromise模式比isMounted（）“反模式”更好？

其他 2022-01-01 934
在onPause，onStop和onDestroy方法中调用超类方法的正确顺序是什么？为什么？

在onPause，onStop和onDestroy方法中调用超类方法的正确顺序是什么？为什么？

其他 2022-01-01 1045
为什么Hibernate切换为通过CLOB使用LONG？

为什么Hibernate切换为通过CLOB使用LONG？

其他 2022-01-01 981
为什么“无”映像出现在Docker中以及我们如何避免它

为什么“无”映像出现在Docker中以及我们如何避免它

其他 2022-01-01 909
为什么在pom.xml的第1行中出现Unknown错误？

为什么在pom.xml的第1行中出现Unknown错误？

其他 2022-01-01 1231
为什么数据传输对象（DTO）是反模式？

为什么数据传输对象（DTO）是反模式？

其他 2022-01-01 907
为什么某些技术上可序列化的输入属性不能序列化？

为什么某些技术上可序列化的输入属性不能序列化？

其他 2022-01-01 981
什么是仓库和标签？为什么在使用docker build时它们会出现？

什么是仓库和标签？为什么在使用docker build时它们会出现？

其他 2022-01-01 1016
为什么无法在Java中扩展注释？

为什么无法在Java中扩展注释？

java 2022-01-01 1099
Java Map为什么不扩展Collection？

Java Map为什么不扩展Collection？

java 2022-01-01 986

为什么我不能用numba（cuda python）得到正确的一维数组总和？

撰写回答

推荐问题

PHP中的全局变量是否被视为不良做法？如果是这样，为什么？

为什么需要将匿名函数传递给onClick事件？

为什么Class.newInstance（）是“evil”？

在为该对象分配其他内容时，为什么不通过引用传递该对象？

为什么我们将firefoxdriver实例分配给webdriver

为什么新的Java 8日期时间API不具有纳秒精度？

为什么浮点数打印方式如此不同？

为什么说深度优先搜索会遭受无限循环的困扰？

为什么找不到SSL握手的信任库？

为什么没有输入，民意调查仍会返回？

为什么在React中认为cancelledPromise模式比isMounted（）“反模式”更好？

在onPause，onStop和onDestroy方法中调用超类方法的正确顺序是什么？为什么？

为什么Hibernate切换为通过CLOB使用LONG？

为什么“无”映像出现在Docker中以及我们如何避免它

为什么在pom.xml的第1行中出现Unknown错误？

为什么数据传输对象（DTO）是反模式？

为什么某些技术上可序列化的输入属性不能序列化？

什么是仓库和标签？为什么在使用docker build时它们会出现？

为什么无法在Java中扩展注释？

Java Map为什么不扩展Collection？

分类汇总

您的鼓励是对我最大的支持