您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

python pandas删除重复的列

python pandas删除重复的列

有一种解决方案。如果某些列名重复并且您希望删除它们,则适用此规则:

df = df.loc[:,~df.columns.duplicated()]

假设数据框的列是 ['alpha','beta','alpha']

df.columns.duplicated()返回一个布尔数组:aTrueFalse每列。如果是,False则该列名称在该点之前是唯一的;如果是,True则该列名称在前面已重复。例如,使用给定的示例,返回值为[False,False,True]

Pandas允许使用布尔值建立索引,从而仅选择True值。由于我们要保留不重复的列,因此需要翻转上面的布尔数组(即[True, True, False] = ~[False,False,True]

最后,df.loc[:,[True,True,False]]使用上述索引功能仅选择非重复列。

:以上仅检查列名称而不 检查列值。

python 2022/1/1 18:37:58 有238人围观

撰写回答


你尚未登录,登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进,让解决方法与时俱进

请先登录

推荐问题


联系我
置顶