您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

帮助了解交叉验证和决策树

帮助了解交叉验证和决策树

我不知道的问题是最后您将拥有k个决策树,这些决策树可能都稍有不同,因为它们可能无法以相同的方式拆分,等等。您选择哪棵树?

不是帮助选择分类器的特定 实例 (或决策树,或任何自动学习应用程序),而是使 模型 合格,即提供诸如平均错误率,相对于此的偏差之类的度量。平均值等,对确定应用程序可以期望的精度水平很有用。交叉验证可以帮助断言的一件事是训练数据是否足够大。

,您应该改为对100%可用的训练数据进行另一次训练,因为这通常会产生更好的树。(交叉验证方法的缺点是,我们需要将[通常很少]的训练数据划分为“折叠”,正如您在问题中暗示的那样,这可能导致特定数据实例的树过拟合或欠拟合) 。

在决策树的情况下,我不确定您对节点中收集的统计信息的引用与用于修剪决策树的引用有关。也许是交叉验证相关技术的一种特殊用法

其他 2022/1/1 18:16:47 有698人围观

撰写回答


你尚未登录,登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进,让解决方法与时俱进

请先登录

推荐问题


联系我
置顶