配置Spark以与Jupyter Notebook和Anaconda一起使用

Conda可以帮助正确管理很多依赖项…

安装火花。假设spark安装在/ opt / spark中，请将其包含在?/ .bashrc中：

export SPARK_HOME=/opt/spark
export PATH=$SPARK_HOME/bin:$PATH

创建一个conda环境，其中包含除spark之外的所有必需依赖项：

conda create -n findspark-jupyter-openjdk8-py3 -c conda-forge python=3.5 jupyter=1.0 notebook=5.0 openjdk=8.0.144 findspark=1.1.0

激活环境

$ source activate findspark-jupyter-openjdk8-py3

启动Jupyter Notebook服务器：

$ jupyter notebook

在浏览器中，创建一个新的python3笔记本

试着用下面的脚本（从借来的计算PI这个）

import findspark
findspark.init()
import pyspark
import random
sc = pyspark.SparkContext(appName="Pi")
num_samples = 100000000
def inside(p):     
  x, y = random.random(), random.random()
  return x*x + y*y < 1
count = sc.parallelize(range(0, num_samples)).filter(inside).count()
pi = 4 * count / num_samples
print(pi)
sc.stop()

其他 2022/1/1 18:50:49 有382人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

在不重新启动JVM的情况下重新加载JAVA中的Kerberos配置

在不重新启动JVM的情况下重新加载JAVA中的Kerberos配置

java 2022-01-01 847
php.ini不存在已加载的配置文件（无）

php.ini不存在已加载的配置文件（无）

php 2022-01-01 785
Magento-仅加载可配置产品

Magento-仅加载可配置产品

其他 2022-01-01 849
Hibernate：无法加载在Hibernate配置中声明的类条目

Hibernate：无法加载在Hibernate配置中声明的类条目

其他 2022-01-01 760
在Azure上配置Redis会话状态

在Azure上配置Redis会话状态

其他 2022-01-01 843
如何配置Tomcat使用1个以上的CPU？

如何配置Tomcat使用1个以上的CPU？

其他 2022-01-01 693
如果我在项目中包含多个struts配置文件，流程顺序是什么？

如果我在项目中包含多个struts配置文件，流程顺序是什么？

其他 2022-01-01 1063
如何配置Tomcat从Webapps外部的外部文件夹提供图像？

如何配置Tomcat从Webapps外部的外部文件夹提供图像？

其他 2022-01-01 885
如何配置Jenkins StarTeam插件？

如何配置Jenkins StarTeam插件？

其他 2022-01-01 774
配置Tomcat以使用属性文件加载数据库连接信息

配置Tomcat以使用属性文件加载数据库连接信息

其他 2022-01-01 726
Selenium WebDriver默认使用什么配置文件？

Selenium WebDriver默认使用什么配置文件？

其他 2022-01-01 752
如何配置Spring MVC 3在JSON响应中不返回“空”对象？

如何配置Spring MVC 3在JSON响应中不返回“空”对象？

Java 2022-01-01 698
Jenkins自动重新加载配置可能吗？

Jenkins自动重新加载配置可能吗？

其他 2022-01-01 722
如何配置Tomcat以使用Java 7

如何配置Tomcat以使用Java 7

java 2022-01-01 613
Jenkins：如何在Nginx反向代理后面配置Jenkins，以便JNLP从站进行连接

Jenkins：如何在Nginx反向代理后面配置Jenkins，以便JNLP从站进行连接

其他 2022-01-01 879
MySQL配置不正确原因：不安全地使用相对路径

MySQL配置不正确原因：不安全地使用相对路径

MySQL 2022-01-01 757
Spring Boot JPA-配置自动重新连接

Spring Boot JPA-配置自动重新连接

Java 2022-01-01 675
Golang生产Web应用程序配置

Golang生产Web应用程序配置

Go 2022-01-01 728
配置openjpa以启动Spring

配置openjpa以启动Spring

Java 2022-01-01 794
如何使用Spring Boot配置嵌入式ActiveMQ Broker URL

如何使用Spring Boot配置嵌入式ActiveMQ Broker URL

Java 2022-01-01 677

配置Spark以与Jupyter Notebook和Anaconda一起使用

撰写回答

推荐问题

在不重新启动JVM的情况下重新加载JAVA中的Kerberos配置

php.ini不存在已加载的配置文件（无）

Magento-仅加载可配置产品

Hibernate：无法加载在Hibernate配置中声明的类条目

在Azure上配置Redis会话状态

如何配置Tomcat使用1个以上的CPU？

如果我在项目中包含多个struts配置文件，流程顺序是什么？

如何配置Tomcat从Webapps外部的外部文件夹提供图像？

如何配置Jenkins StarTeam插件？

配置Tomcat以使用属性文件加载数据库连接信息

Selenium WebDriver默认使用什么配置文件？

如何配置Spring MVC 3在JSON响应中不返回“空”对象？

Jenkins自动重新加载配置可能吗？

如何配置Tomcat以使用Java 7

Jenkins：如何在Nginx反向代理后面配置Jenkins，以便JNLP从站进行连接

MySQL配置不正确原因：不安全地使用相对路径

Spring Boot JPA-配置自动重新连接

Golang生产Web应用程序配置

配置openjpa以启动Spring

如何使用Spring Boot配置嵌入式ActiveMQ Broker URL

分类汇总

您的鼓励是对我最大的支持