python – sklearn pipeline – 在管道中应用多项式特征转换后应用样本权重

5b51 2022/1/14 8:23:09 python 字数 2603 阅读 582 来源 www.jb51.cc/python

我想应用样本权重,同时使用来自sklearn的管道,该管道应该进行特征转换,例如多项式,然后应用回归量,例如ExtraTrees. 我在以下两个示例中使用以下包： from sklearn.ensemble import ExtraTreesRegressor import numpy as np from sklearn.pipeline import Pipeline from sklearn

概述

我在以下两个示例中使用以下包：

from sklearn.ensemble import ExtraTreesRegressor
import numpy as np
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import PolynomialFeatures

只要我单独转换功能并在之后生成和训练模型,一切都很顺利：

#Feature generation
X = np.random.rand(200,4)
Y = np.random.rand(200)

#Feature transformation
poly = PolynomialFeatures(degree=2)
poly.fit_transform(X)

#Model generation and fit
clf = ExtraTreesRegressor(n_estimators=5,max_depth = 3)
weights = [1]*100 + [2]*100
clf.fit(X,Y,weights)

但是在管道中执行它不起作用：

#Pipeline generation
pipe = Pipeline([('poly2',PolynomialFeatures(degree=2)),('ExtraTrees',ExtraTreesRegressor(n_estimators=5,max_depth = 3))])

#Feature generation
X = np.random.rand(200,4)
Y = np.random.rand(200)

#Fitting model
clf = pipe
weights = [1]*100 + [2]*100
clf.fit(X,weights)

我收到以下错误：TypeError：fit()最多需要3个参数(给定4个)
在这个简单的例子中,修改代码没有问题,但是当我想在我的实际代码中对我的真实数据运行几个不同的测试时,能够使用管道和样本权重

For this,it enables setting parameters of the varIoUs steps using their names and the parameter name separated by a ‘__’,as in the example below.

所以说的是,尝试将最后一行更改为：

clf.fit(X,**{'ExtraTrees__sample_weight': weights})

This is a good example如何使用管道中的参数.

总结

以上是编程之家为你收集整理的python – sklearn pipeline – 在管道中应用多项式特征转换后应用样本权重全部内容，希望文章能够帮你解决python – sklearn pipeline – 在管道中应用多项式特征转换后应用样本权重所遇到的程序开发问题。

如果您也喜欢它,动动您的小指点个赞吧

除非注明，文章均由 laddyq.com 整理发布，欢迎转载。

转载请注明：
链接：http://laddyq.com
来源：laddyq.com
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

python – sklearn pipeline – 在管道中应用多项式特征转换后应用样本权重

概述

总结

分类汇总

您的鼓励是对我最大的支持