Scikit学习OneHotEncoder拟合和变换错误：ValueError：X的形状与拟合期间不同

pd.get_dummies()不需要使用LabelEncoder + OneHotEncoder，它们可以存储原始值，然后在新数据上使用它们。

像下面那样更改代码将为您提供所需的结果。

import pandas as pd
from sklearn.preprocessing import OneHotEncoder, LabelEncoder
input_df = pd.DataFrame(dict(fruit=['Apple', 'Orange', 'Pine'], 
                             color=['Red', 'Orange','Green'],
                             is_sweet = [0,0,1],
                             country=['USA','India','Asia']))

filtered_df = input_df.apply(pd.to_numeric, errors='ignore')

# This is what you need
le_dict = {}
for col in filtered_df.columns:
    le_dict[col] = LabelEncoder().fit(filtered_df[col])
    filtered_df[col] = le_dict[col].transform(filtered_df[col])

enc = OneHotEncoder()
enc.fit(filtered_df)
refreshed_df = enc.transform(filtered_df).toarray()

new_df = pd.DataFrame(dict(fruit=['Apple'], 
                             color=['Red'],
                             is_sweet = [0],
                             country=['USA']))
for col in new_df.columns:
    new_df[col] = le_dict[col].transform(new_df[col])

new_refreshed_df = enc.transform(new_df).toarray()

print(filtered_df)
      color  country  fruit  is_sweet
0      2        2      0         0
1      1        1      1         0
2      0        0      2         1

print(refreshed_df)
[[ 0.  0.  1.  0.  0.  1.  1.  0.  0.  1.  0.]
 [ 0.  1.  0.  0.  1.  0.  0.  1.  0.  1.  0.]
 [ 1.  0.  0.  1.  0.  0.  0.  0.  1.  0.  1.]]

print(new_df)
      color  country  fruit  is_sweet
0      2        2      0         0

print(new_refreshed_df)
[[ 0.  0.  1.  0.  0.  1.  1.  0.  0.  1.  0.]]

其他 2022/1/1 18:44:36 有345人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

如何在JavaScript中将浮点数转换为整数？

如何在JavaScript中将浮点数转换为整数？

javascript 2022-01-01 1282
如何枚举JavaScript对象的属性？

如何枚举JavaScript对象的属性？

javascript 2022-01-01 1240
java.lang.ClassCastException

java.lang.ClassCastException

java 2022-01-01 1102
在JavaScript中删除数组元素-Delete与Splice

在JavaScript中删除数组元素-Delete与Splice

SQL 2022-01-01 1258
JavaScriptWays to circumvent the same-origin policy

JavaScriptWays to circumvent the same-origin policy

javascript 2022-01-01 1117
带有Hibernate 5和Spring 4的程序化SchemaExport / SchemaUpdate

带有Hibernate 5和Spring 4的程序化SchemaExport / SchemaUpdate

Java 2022-01-01 1105
如何获取JavaScript对象的类？

如何获取JavaScript对象的类？

javascript 2022-01-01 973
如何在AngularJS中使用$ scope。$ watch和$ scope。$ apply？

如何在AngularJS中使用$ scope。$ watch和$ scope。$ apply？

其他 2022-01-01 968
JavaScript中两个日期之间的月份差异

JavaScript中两个日期之间的月份差异

javascript 2022-01-01 902
查看JavaScript中的所有超时/时间间隔？

查看JavaScript中的所有超时/时间间隔？

javascript 2022-01-01 807
如何从javascript中的Razor Model对象获取JSON对象

如何从javascript中的Razor Model对象获取JSON对象

javascript 2022-01-01 949
[ScriptMethod（ResponseFormat = ResponseFormat.Json）]

[ScriptMethod（ResponseFormat = ResponseFormat.Json）]

其他 2022-01-01 999
javascript属性名称中允许使用破折号吗？

javascript属性名称中允许使用破折号吗？

javascript 2022-01-01 762
如何检查是否使用Javascript加载了外部（跨域）CSS文件

如何检查是否使用Javascript加载了外部（跨域）CSS文件

javascript 2022-01-01 902
iTunesConnect TestFlight的iOS应用版本和内部版本号

iTunesConnect TestFlight的iOS应用版本和内部版本号

其他 2022-01-01 1030
怎么把PascalCase转换成pascal_case？

怎么把PascalCase转换成pascal_case？

其他 2022-01-01 854
如何使用JavaScript创建文档对象

如何使用JavaScript创建文档对象

javascript 2022-01-01 919
从javascript对象访问父对象的父对象

从javascript对象访问父对象的父对象

javascript 2022-01-01 919
Java正则表达式以匹配ASCII字符

Java正则表达式以匹配ASCII字符

java 2022-01-01 714
使用javascript和服务器端禁用/启用requiredFieldValidators

使用javascript和服务器端禁用/启用requiredFieldValidators

javascript 2022-01-01 922

Scikit学习OneHotEncoder拟合和变换错误：ValueError：X的形状与拟合期间不同

撰写回答

推荐问题

如何在JavaScript中将浮点数转换为整数？

如何枚举JavaScript对象的属性？

java.lang.ClassCastException

在JavaScript中删除数组元素-Delete与Splice

JavaScriptWays to circumvent the same-origin policy

带有Hibernate 5和Spring 4的程序化SchemaExport / SchemaUpdate

如何获取JavaScript对象的类？

如何在AngularJS中使用$ scope。$ watch和$ scope。$ apply？

JavaScript中两个日期之间的月份差异

查看JavaScript中的所有超时/时间间隔？

如何从javascript中的Razor Model对象获取JSON对象

[ScriptMethod（ResponseFormat = ResponseFormat.Json）]

javascript属性名称中允许使用破折号吗？

如何检查是否使用Javascript加载了外部（跨域）CSS文件

iTunesConnect TestFlight的iOS应用版本和内部版本号

怎么把PascalCase转换成pascal_case？

如何使用JavaScript创建文档对象

从javascript对象访问父对象的父对象

Java正则表达式以匹配ASCII字符

使用javascript和服务器端禁用/启用requiredFieldValidators

分类汇总

您的鼓励是对我最大的支持