您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

在python中使用.loc选择

在python中使用.loc选择

pd.DataFrame.loc可以使用一两个索引器。在其余文章中,我将第一个索引器表示为i,将第二个索引器表示为j

如果仅提供一个索引器,则该索引器将应用于数据帧的索引,并且假定缺少的索引器代表所有列。因此,以下两个 示例是等效的。

其中:用来表示所有列。

如果同时存在两个索引器,则i引用索引值和j引用列值。

现在我们可以专注于什么类型的值i,并j可以承担。让我们以以下数据框df为例:

    df = pd.DataFrame([[1, 2], [3, 4]], index=['A', 'B'], columns=['X', 'Y'])

loc 已经写成这样i并且j可以是

应该是各个索引对象中的值

df.loc['A', 'Y']

其元素也是相应索引对象的成员(请注意,我传递给的数组的顺序loc受尊重

        df.loc[['B', 'A'], 'X']

          B    3
         A    1
         Name: X, dtype: int64
* 传递数组时,请注意返回对象的维数。`i`是上面的数组,`loc`返回一个对象,其中返回带有这些值的索引。在这种情况下,因为j是标量,所以`loc`返回了一个`pd.Series`对象。如果我们为i和传递了一个数组,我们可以操纵它以返回一个数据帧j,并且该数组可能只是一个单值数组。

``` df.loc[[‘B’, ‘A’], [‘X’]]

       X
    B  3
    A  1

  3. **boolean arrays** 为True或False且长度与相应索引的长度匹配的布尔数组。在这种情况下,loc只需获取布尔数组所在的行(或列) `True`.

    df.loc[[True, False], ['X']]

   X
A  1

```

除了可以传递给哪些索引器之外loc,它还使您能够进行分配。现在,我们可以分解您提供的代码行。

iris_data.loc[iris_data['class'] == 'versicolor', 'class'] = 'Iris-versicolor'
iris_data.loc[iris_data['class'] == 'versicolor', 'class'] = 'Iris-versicolor'

我们分配'Iris-versicolor'在列中的所有元素'class',其中'class''versicolor'

python 2022/1/1 18:25:20 有477人围观

撰写回答


你尚未登录,登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进,让解决方法与时俱进

请先登录

推荐问题


联系我
置顶