python spark windows pycharm pyspark环境配置
发表于:2025-01-26 作者:千家信息网编辑
千家信息网最后更新 2025年01月26日,1、下载如下放在D盘添加 SPARK_HOME = D:\spark-2.3.0-bin-hadoop2.7。并将 %SPARK_HOME%/bin 添加至环境变量PATH。然后进入命令行,输入pys
千家信息网最后更新 2025年01月26日python spark windows pycharm pyspark环境配置
1、下载如下
放在D盘
添加 SPARK_HOME = D:\spark-2.3.0-bin-hadoop2.7。
- 并将 %SPARK_HOME%/bin 添加至环境变量PATH。
- 然后进入命令行,输入pyspark命令。若成功执行。则成功设置环境变量
找到pycharm sitepackage目录
右键点击即可进入目录,将上面D:\spark-2.3.0-bin-hadoop2.7里面有个/python/pyspark目录拷贝到上面的 sitepackage目录
安装 py4j
试验如下代码:
from __future__ import print_functionimport sysfrom operator import addimport os# Path for spark source folderos.environ['SPARK_HOME'] = "D:\spark-2.3.0-bin-hadoop2.7"# Append pyspark to Python Pathsys.path.append("D:\spark-2.3.0-bin-hadoop2.7\python")sys.path.append("D:\spark-2.3.0-bin-hadoop2.7\python\lib\py4j-0.9-src.zip")from pyspark import SparkContextfrom pyspark import SparkConfif __name__ == '__main__': inputFile = "D:\Harry.txt" outputFile = "D:\Harry1.txt" sc = SparkContext() text_file = sc.textFile(inputFile) counts = text_file.flatMap(lambda line: line.split(' ')).map(lambda word: (word, 1)).reduceByKey(lambda a, b: a + b) counts.saveAsTextFile(outputFile)
计算成功即可
目录
成功
环境
变量
命令
代码
拷贝
面的
并将
试验
输入
配置
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
数据库闭包python代码实现
热带雨林网络技术服务公司
设有两个数据库事务
超微服务器826
MySQL数据库固定的结构
三级网络技术题集
发展网络技术的途径
台州银行软件开发工程师
数据库删除一张表怎么操作
大学软件开发项目
华数工程网络技术岗位
河北省网络安全公约
学生网络安全教学
pop邮件公司服务器没电能发吗
毕业论文会传到万芳数据库吗
阜阳电力软件开发哪家好
广东电信佛山软件开发
2020网络安全问答题库
彩红鼎盛互联网科技
湖南本地软件开发成本价
昆明品牌软件开发市场价
嘉兴壮游网络技术有限公司
央行云服务器怎么下载
如何查看数据库的ddl
网络安全法线上考试组织情况
rman 恢复数据库
苹果无法连接到查找服务器
东方国际网络技术
u8系统管理服务器名填写
网络安全总体要求b类有哪些