Scikits机器学习中的价值缺失
scikit-learn 不支持缺少值。 以前在 邮件列表上已经对此进行了讨论,但是没有尝试实际编写 代码来处理它们。
无论您做什么, 都不要 使用NaN编码缺失值,因为许多算法都拒绝处理包含NaN的样本。
上面的答案已经过时;最新版本的scikit-learn具有一个类Imputer,该类可以进行简单的针对每个功能的缺失值估算。您可以向其提供包含NaN的数组,以将其替换为相应特征的均值,中位数或众数。
Imputer
你尚未登录,登录后可以
和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进,让解决方法与时俱进
联系我
602392714
清零编程群