您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

设置Python DataFrame

设置Python DataFrame

我将假设TimeProduct是中的列DataFramedf是的实例DataFrame,而其他变量是标量值:

现在,您必须引用DataFrame实例:

k1 = df.loc[(df.Product == p_id) & (df.Time >= start_time) & (df.Time < end_time), ['Time', 'Product']]

由于&运算符与比较运算符之间的优先级,因此括号也是必需的。该&运算符实际上是一个重载的按位运算符,其优先级与算术运算符相同,而算术运算符的优先级又高于比较运算符。

pandas0.13中,DataFrame.query()将提供一种新的实验方法。这与子集对select参数取模非常相似:

query()您一起这样做:

df[['Time', 'Product']].query('Product == p_id and Month < mn and Year == yr')

这是一个简单的例子:

In [9]: df = DataFrame({'gender': np.random.choice(['m', 'f'], size=10), 'price': poisson(100, size=10)})

In [10]: df
Out[10]:
  gender  price
0      m     89
1      f    123
2      f    100
3      m    104
4      m     98
5      m    103
6      f    100
7      f    109
8      f     95
9      m     87

In [11]: df.query('gender == "m" and price < 100')
Out[11]:
  gender  price
0      m     89
4      m     98
9      m     87

您感兴趣的最终查询甚至可以利用链式比较,如下所示:

k1 = df[['Time', 'Product']].query('Product == p_id and start_time <= Time < end_time')
python 2022/1/1 18:46:16 有309人围观

撰写回答


你尚未登录,登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进,让解决方法与时俱进

请先登录

推荐问题


联系我
置顶