官方文档中的pyspark线性回归示例-错误的结果？

对于初学者，您缺少拦截。尽管自变量的平均值接近零：

parsedData.map(lambda lp: lp.features).mean()
## DenseVector([-0.031, -0.0066, 0.1182, -0.0199, 0.0178, -0.0249,
##     -0.0294, 0.0669]

因变量的平均值离它很远：

parsedData.map(lambda lp: lp.label).mean()
## 2.452345085074627

在这种情况下，强制回归线穿过原点是没有意义的。因此，让我们看看如何LinearRegressionWithSGD使用默认参数和添加的拦截执行：

model = LinearRegressionWithSGD.train(parsedData, intercept=True)
valuesAndPreds = (parsedData.map(lambda p: (p.label, model.predict(p.features))))
valuesAndPreds.map(lambda vp: (vp[0] - vp[1]) ** 2).mean()
## 0.44005904185432504

让我们将其与分析解决方案进行比较

import numpy as np
from sklearn import linear_model

features = np.array(parsedData.map(lambda lp: lp.features.toArray()).collect())
labels = np.array(parsedData.map(lambda lp: lp.label).collect())

lm = linear_model.LinearRegression()
lm.fit(features, labels)
np.mean((lm.predict(features) - labels) ** 2)
## 0.43919976805833411

尽您所能，使用获得的结果LinearRegressionWithSGD几乎是最佳的。

您可以添加网格搜索，但是在这种特殊情况下，可能没有任何收获。

其他 2022/1/1 18:27:50 有541人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

“软件导致连接中止：套接字写入错误”的官方原因

“软件导致连接中止：套接字写入错误”的官方原因

其他 2022-01-01 539
如何使用官方的PHP Docker映像方法安装php-redis扩展？

如何使用官方的PHP Docker映像方法安装php-redis扩展？

php 2022-01-01 606
使用'docker stop'和官方Java映像的Java进程未收到SIGTERM

使用'docker stop'和官方Java映像的Java进程未收到SIGTERM

java 2022-01-01 702
如何使用官方PHP Docker映像方法安装php-redis扩展？

如何使用官方PHP Docker映像方法安装php-redis扩展？

php 2022-01-01 467
使用官方的Alpine Docker映像将yaml扩展添加到php

使用官方的Alpine Docker映像将yaml扩展添加到php

php 2022-01-01 726
Java-“软件导致连接中断：套接字写入错误”的官方原因

Java-“软件导致连接中断：套接字写入错误”的官方原因

java 2022-01-01 479
如何自定义官方PostgreSQL Docker映像的配置文件？

如何自定义官方PostgreSQL Docker映像的配置文件？

SQLServer 2022-01-01 439
@RequestMapping使用或不使用斜杠值。需要官方文档或指向Spring源码吗？

@RequestMapping使用或不使用斜杠值。需要官方文档或指向Spring源码吗？

Java 2022-01-01 471
使用Apache POI 4.0运行官方示例LineChars和ScatterChart时出现问题

使用Apache POI 4.0运行官方示例LineChars和ScatterChart时出现问题

其他 2022-01-01 475
官方文档中的pyspark线性回归示例-错误的结果？

官方文档中的pyspark线性回归示例-错误的结果？

其他 2022-01-01 541
SparseBooleanArray的明确目的是什么？[我为此推荐了官方android网站]

SparseBooleanArray的明确目的是什么？[我为此推荐了官方android网站]

其他 2022-01-01 526
python：sys.argv [0]在官方文档中的含义

python：sys.argv [0]在官方文档中的含义

python 2022-01-01 476
官方缩写：将scipy导入为sp / sc

官方缩写：将scipy导入为sp / sc

其他 2022-01-01 527
为什么IronPython比官方Python解释器快

为什么IronPython比官方Python解释器快

python 2022-01-01 464
有没有官方/非官方的方式在python中编写Unity脚本？

有没有官方/非官方的方式在python中编写Unity脚本？

python 2022-01-01 448
存储python程序设置的官方方式是什么？

存储python程序设置的官方方式是什么？

python 2022-01-01 426
在系统范围内安装pip和virtualenv的官方“首选”方式是什么？

在系统范围内安装pip和virtualenv的官方“首选”方式是什么？

其他 2022-01-01 504
我们厂商写了一篇关于HarmonyOS的解决方案，想发布到官方的生态市场中去，应该怎么做

我们厂商写了一篇关于HarmonyOS的解决方案，想发布到官方的生态市场中去，应该怎么做

harmonyos 2022-02-08 700
鱼唇红请问扫描普通链接二维码跳转小程序，配置这个后要怎么生成二维码，然后用微信官方调小程序接口，这两种方案有啥区别吗？

鱼唇红请问扫描普通链接二维码跳转小程序，配置这个后要怎么生成二维码，然后用微信官方调小程序接口，这两种方案有啥区别吗？

小程序 2022-02-15 844
带有Selenium的Python“元素未附加到页面文档中”

带有Selenium的Python“元素未附加到页面文档中”

python 2022-01-01 1036
如何从C＃中的MS Office文档中提取文本

如何从C＃中的MS Office文档中提取文本

c# 2022-01-01 889
从主文档中的JavaScript获取IFrame的文档

从主文档中的JavaScript获取IFrame的文档

javascript 2022-01-01 667
ElasticSearch在文档和动态嵌套文档中搜索

ElasticSearch在文档和动态嵌套文档中搜索

其他 2022-01-01 702
Elasticsearch-片段在文档中的位置

Elasticsearch-片段在文档中的位置

其他 2022-01-01 709
JSP文档中的Google Map

JSP文档中的Google Map

Go 2022-01-01 638
节点文档中的此“…$ {…}…”代码是什么意思？

节点文档中的此“…$ {…}…”代码是什么意思？

其他 2022-01-01 651
如何在不占用磁盘空间的情况下在tar存档中的文件中使用grep模式

如何在不占用磁盘空间的情况下在tar存档中的文件中使用grep模式

其他 2022-01-01 595
从ElasticSearch文档中检索分析的令牌

从ElasticSearch文档中检索分析的令牌

其他 2022-01-01 632
从搜索文档中查找最小片段的算法？

从搜索文档中查找最小片段的算法？

其他 2022-01-01 683
无论字段的位置如何，都在嵌套文档中搜索字段

无论字段的位置如何，都在嵌套文档中搜索字段

其他 2022-01-01 612
Meteor文档中的messages-count示例如何工作？

Meteor文档中的messages-count示例如何工作？

其他 2022-01-01 515
Logstash，来自多个文档中xml文件的split事件，保留来自根标签的信息

Logstash，来自多个文档中xml文件的split事件，保留来自根标签的信息

其他 2022-01-01 591
这在文档中是什么意思：方括号后跟逗号（[，）

这在文档中是什么意思：方括号后跟逗号（[，）

其他 2022-01-01 573
elasticsearch-将嵌套字段与文档中的另一个字段进行比较

elasticsearch-将嵌套字段与文档中的另一个字段进行比较

其他 2022-01-01 726
Tar目录，但不要在归档中存储完整的绝对路径

Tar目录，但不要在归档中存储完整的绝对路径

其他 2022-01-01 666
JavaScript ECMAScript文档中的SpreadElement是什么？它与MDN的Spread语法相同吗？

JavaScript ECMAScript文档中的SpreadElement是什么？它与MDN的Spread语法相同吗？

javascript 2022-01-01 610
如何在Spring Boot中从Swagger文档中隐藏端点

如何在Spring Boot中从Swagger文档中隐藏端点

Java 2022-01-01 618
Dart / flutter文档中的“ T”，“ f”，“ E”，“ e”，“→”代表什么？

Dart / flutter文档中的“ T”，“ f”，“ E”，“ e”，“→”代表什么？

其他 2022-01-01 635
jQuery-如何使用元素的HTML获取所有样式/ css（在内部/外部文档中定义）

jQuery-如何使用元素的HTML获取所有样式/ css（在内部/外部文档中定义）

CSS 2022-01-01 623

官方文档中的pyspark线性回归示例-错误的结果？

撰写回答

推荐问题

分类汇总

您的鼓励是对我最大的支持