为什么pandas在这里应用lambda比循环慢？

apply在后台使用循环，因此，如果需要更好的性能，最好的和最快的方法是最好的选择。

没有循环，只有链2条件向量化解决方案：

m1 = all_actions['Lower'] <= all_actions['Mid']
m2 = all_actions['Mid'] <= all_actions['Upper']
qualified_actions = m1 & m2

感谢on Clements提供的另一种解决方案：

all_actions.Mid.between(all_actions.Lower, all_actions.Upper)

：

np.random.seed(2017)
N = 45000
all_actions=pd.DataFrame(np.random.randint(50, size=(N,3)),columns=['Lower','Mid','Upper'])

#print (all_actions)

In [85]: %%timeit
    ...: qualified_actions = []
    ...: for row in all_actions.index:
    ...:     if all_actions.ix[row,'Lower'] <= all_actions.ix[row, 'Mid'] <= all_actions.ix[row,'Upper']:
    ...:         qualified_actions.append(True)
    ...:     else:
    ...:         qualified_actions.append(False)
    ...: 
    ...: 
__main__:259: DeprecationWarning: 
.ix is deprecated. Please use
.loc for label based indexing or
.iloc for positional indexing

See the documentation here:
http://pandas.pydata.org/pandas-docs/stable/indexing.html#ix-indexer-is-deprecated
1 loop, best of 3: 579 ms per loop

In [86]: %%timeit
    ...: (all_actions.apply(lambda row: row['Lower'] <= row['Mid'] <= row['Upper'], axis=1))
    ...: 
1 loop, best of 3: 1.17 s per loop

In [87]: %%timeit
    ...: ((all_actions['Lower'] <= all_actions['Mid']) & (all_actions['Mid'] <= all_actions['Upper']))
    ...: 
1000 loops, best of 3: 509 µs per loop


In [90]: %%timeit
    ...: (all_actions.Mid.between(all_actions.Lower, all_actions.Upper))
    ...: 
1000 loops, best of 3: 520 µs per loop

其他 2022/1/1 18:27:45 有667人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

PHP中的全局变量是否被视为不良做法？如果是这样，为什么？

PHP中的全局变量是否被视为不良做法？如果是这样，为什么？

php 2022-01-01 1095
为什么需要将匿名函数传递给onClick事件？

为什么需要将匿名函数传递给onClick事件？

其他 2022-01-01 1088
为什么Class.newInstance（）是“evil”？

为什么Class.newInstance（）是“evil”？

其他 2022-01-01 1027
在为该对象分配其他内容时，为什么不通过引用传递该对象？

在为该对象分配其他内容时，为什么不通过引用传递该对象？

其他 2022-01-01 1315
为什么我们将firefoxdriver实例分配给webdriver

为什么我们将firefoxdriver实例分配给webdriver

其他 2022-01-01 1017
为什么新的Java 8日期时间API不具有纳秒精度？

为什么新的Java 8日期时间API不具有纳秒精度？

java 2022-01-01 1042
为什么浮点数打印方式如此不同？

为什么浮点数打印方式如此不同？

其他 2022-01-01 1032
为什么说深度优先搜索会遭受无限循环的困扰？

为什么说深度优先搜索会遭受无限循环的困扰？

其他 2022-01-01 929
为什么找不到SSL握手的信任库？

为什么找不到SSL握手的信任库？

其他 2022-01-01 1035
为什么没有输入，民意调查仍会返回？

为什么没有输入，民意调查仍会返回？

其他 2022-01-01 939
为什么在React中认为cancelledPromise模式比isMounted（）“反模式”更好？

为什么在React中认为cancelledPromise模式比isMounted（）“反模式”更好？

其他 2022-01-01 933
在onPause，onStop和onDestroy方法中调用超类方法的正确顺序是什么？为什么？

在onPause，onStop和onDestroy方法中调用超类方法的正确顺序是什么？为什么？

其他 2022-01-01 1045
为什么Hibernate切换为通过CLOB使用LONG？

为什么Hibernate切换为通过CLOB使用LONG？

其他 2022-01-01 981
为什么“无”映像出现在Docker中以及我们如何避免它

为什么“无”映像出现在Docker中以及我们如何避免它

其他 2022-01-01 909
为什么在pom.xml的第1行中出现Unknown错误？

为什么在pom.xml的第1行中出现Unknown错误？

其他 2022-01-01 1231
为什么数据传输对象（DTO）是反模式？

为什么数据传输对象（DTO）是反模式？

其他 2022-01-01 906
为什么某些技术上可序列化的输入属性不能序列化？

为什么某些技术上可序列化的输入属性不能序列化？

其他 2022-01-01 981
什么是仓库和标签？为什么在使用docker build时它们会出现？

什么是仓库和标签？为什么在使用docker build时它们会出现？

其他 2022-01-01 1016
为什么无法在Java中扩展注释？

为什么无法在Java中扩展注释？

java 2022-01-01 1099
Java Map为什么不扩展Collection？

Java Map为什么不扩展Collection？

java 2022-01-01 986

为什么pandas在这里应用lambda比循环慢？

撰写回答

推荐问题

PHP中的全局变量是否被视为不良做法？如果是这样，为什么？

为什么需要将匿名函数传递给onClick事件？

为什么Class.newInstance（）是“evil”？

在为该对象分配其他内容时，为什么不通过引用传递该对象？

为什么我们将firefoxdriver实例分配给webdriver

为什么新的Java 8日期时间API不具有纳秒精度？

为什么浮点数打印方式如此不同？

为什么说深度优先搜索会遭受无限循环的困扰？

为什么找不到SSL握手的信任库？

为什么没有输入，民意调查仍会返回？

为什么在React中认为cancelledPromise模式比isMounted（）“反模式”更好？

在onPause，onStop和onDestroy方法中调用超类方法的正确顺序是什么？为什么？

为什么Hibernate切换为通过CLOB使用LONG？

为什么“无”映像出现在Docker中以及我们如何避免它

为什么在pom.xml的第1行中出现Unknown错误？

为什么数据传输对象（DTO）是反模式？

为什么某些技术上可序列化的输入属性不能序列化？

什么是仓库和标签？为什么在使用docker build时它们会出现？

为什么无法在Java中扩展注释？

Java Map为什么不扩展Collection？

分类汇总

您的鼓励是对我最大的支持