sklearn DecisionTreeClassifier可以真正使用分类数据吗？

好吧，我很惊讶，但事实证明，sklearn的决策树确实无法处理分类数据。从2015年6月开始，这个问题（＃4899）出现了Github问题，但是它仍然是开放的（我建议您快速浏览一下该线程，因为有些评论非常有趣）。

正如您在此处所做的那样，将分类变量编码为整数的问题在于，它对它们强加了一个顺序，根据情况的不同，该顺序可能有意义，也可能没有意义。例如，你可以编码['low', 'medium', 'high']的[0, 1, 2]，因为'low' < 'medium' < 'high'（我们称这些分类变量序数），但你仍然隐含作出额外的（也可能是不希望的）假设之间的距离'low'和'medium'与之间的距离相同'medium'，并'high'（在没有影响决策树，但很重要，例如在k- nn和聚类中）。但是这种方法在诸如['red','green','blue']或的情况下完全失败了['male','female']，因为我们不能要求它们之间有任何有意义的相对顺序。

因此，对于非常规分类变量，正确编码它们以供sklearn决策树使用的方法是使用OneHotEncoder模块。用户指南的“编码分类功能”部分也可能会有所帮助。

其他 2022/1/1 18:27:39 有529人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

在服务器上运行selenium浏览器（Flask / Python / Heroku）

在服务器上运行selenium浏览器（Flask / Python / Heroku）

Python 2022-01-01 1260
Langford序列实现Haskell或C

Langford序列实现Haskell或C

其他 2022-01-01 993
Swift-使用downloadTaskWithURL下载视频

Swift-使用downloadTaskWithURL下载视频

Swift 2022-01-01 818
AWS Lambda错误：“找不到模块'/ var / task / index'”

AWS Lambda错误：“找不到模块'/ var / task / index'”

其他 2022-01-01 648
如何使用Windows Schedule Task运行PHP脚本？

如何使用Windows Schedule Task运行PHP脚本？

php 2022-01-01 687
flask-login：无法理解其工作原理

flask-login：无法理解其工作原理

Python 2022-01-01 679
如何在Lambda上使用TimerTask？

如何在Lambda上使用TimerTask？

其他 2022-01-01 631
如何在现有的dockerfile中运行Flask应用程序？我如何让flask运行其他应用程序？

如何在现有的dockerfile中运行Flask应用程序？我如何让flask运行其他应用程序？

Python 2022-01-01 823
等待与task.Result相同的已完成任务？

等待与task.Result相同的已完成任务？

其他 2022-01-01 669
获取相对于已执行flask应用程序的路径

获取相对于已执行flask应用程序的路径

Python 2022-01-01 881
SpriteKit模板中GameScene.swift和GameScene.sks文件之间的关系是什么

SpriteKit模板中GameScene.swift和GameScene.sks文件之间的关系是什么

Swift 2022-01-01 754
Parallel.ForEach与Task.Factory.StartNew

Parallel.ForEach与Task.Factory.StartNew

其他 2022-01-01 624
使用Swift将NSTask实时输出到NSTextView

使用Swift将NSTask实时输出到NSTextView

Swift 2022-01-01 717
带有TaskExecutor示例的Spring线程？

带有TaskExecutor示例的Spring线程？

Java 2022-01-01 695
在使用Flask的python中，如何写出要下载的对象？

在使用Flask的python中，如何写出要下载的对象？

Python 2022-01-01 700
创建一个静态的Haskell Linux可执行文件

创建一个静态的Haskell Linux可执行文件

其他 2022-01-01 610
使用python / flask中的twitter引导CSS更改链接的活动类

使用python / flask中的twitter引导CSS更改链接的活动类

Python 2022-01-01 637
在Docker上自动重新加载Flask服务器

在Docker上自动重新加载Flask服务器

Python 2022-01-01 617
将Swift 2.3转换为Swift 3.0-错误，无法使用类型为参数的列表调用'dataTask'

将Swift 2.3转换为Swift 3.0-错误，无法使用类型为参数的列表调用'dataTask'

Swift 2022-01-01 620
无法在AsyncTask内未为ProgressDialog调用Looper.prepare（）的线程内创建处理程序

无法在AsyncTask内未为ProgressDialog调用Looper.prepare（）的线程内创建处理程序

其他 2022-01-01 650

sklearn DecisionTreeClassifier可以真正使用分类数据吗？

撰写回答

推荐问题

在服务器上运行selenium浏览器（Flask / Python / Heroku）

Langford序列实现Haskell或C

Swift-使用downloadTaskWithURL下载视频

AWS Lambda错误：“找不到模块'/ var / task / index'”

如何使用Windows Schedule Task运行PHP脚本？

flask-login：无法理解其工作原理

如何在Lambda上使用TimerTask？

如何在现有的dockerfile中运行Flask应用程序？我如何让flask运行其他应用程序？

等待与task.Result相同的已完成任务？

获取相对于已执行flask应用程序的路径

SpriteKit模板中GameScene.swift和GameScene.sks文件之间的关系是什么

Parallel.ForEach与Task.Factory.StartNew

使用Swift将NSTask实时输出到NSTextView

带有TaskExecutor示例的Spring线程？

在使用Flask的python中，如何写出要下载的对象？

创建一个静态的Haskell Linux可执行文件

使用python / flask中的twitter引导CSS更改链接的活动类

在Docker上自动重新加载Flask服务器

将Swift 2.3转换为Swift 3.0-错误，无法使用类型为参数的列表调用'dataTask'

无法在AsyncTask内未为ProgressDialog调用Looper.prepare（）的线程内创建处理程序

分类汇总

您的鼓励是对我最大的支持