搭建scala 开发spark程序环境及实例演示
发表于:2024-12-12 作者:千家信息网编辑
千家信息网最后更新 2024年12月12日,上一篇博文已经介绍了搭建scala的开发环境,现在进入正题。如何开发我们的第一个spark程序。下载spark安装包,下载地址http://spark.apache.org/downloads.htm
千家信息网最后更新 2024年12月12日搭建scala 开发spark程序环境及实例演示
上一篇博文已经介绍了搭建scala的开发环境,现在进入正题。如何开发我们的第一个spark程序。
下载spark安装包,下载地址http://spark.apache.org/downloads.html(因为开发环境需要引用spark的jar包)
我下载的是spark-2.1.0-bin-hadoop2.6.tgz,因为我的scalaIDE版本是scala-SDK-4.5.0-vfinal-2.11-win32.win32.x86_64.zip
最好,IDE版本和spark版本要匹配,否则,开发程序的时候,可能会包引用的jar包错误等等。
new 一个 scala project,然后new 一个 scala object
代码如下:
package com.testimport org.apache.spark.SparkContextimport org.apache.spark.SparkConf /** * 统计字符出现次数 */ object WordCount { def main(args: Array[String]) { if (args.length < 1) { System.err.println("Usage:") System.exit(1) } val conf = new SparkConf();//创建SparkConf对象 conf.setAppName("Wow,My First Spark Programe");//设置应用程序的名称,在程序运行的监 conf.setMaster("local")//此时,程序在本地运行,不需要安装Spark集群 val sc = new SparkContext(conf);//创建SparkContext对象,通过传入SparkConf实例// val lines = sc.textFile(args(0)); val lines = sc.textFile(args(0)); val words = lines.flatMap{line => line.split(" ")};//对每一行的字符串进行单词拆 val pairs = words.map{word => (word,1)}; val wordCounts = pairs.reduceByKey(_+_);//对相同的Key,进行Value的累计(包括Local和Reducer级别同时Reduce) // val wordCounts = pairs.reduce((x,y)=>(x.)); wordCounts.foreach(wordNumberPair => println(wordNumberPair._1 + " : " +wordNumberPair)); // line.flatMap(_.split(" ")).map((_, 1)).reduceByKey(_+_).collect().foreach(println) sc.stop() } }
3.配置JDK1.8 和引入spark jar包
spark的jar包是 spark安装包解压之后jars目录里面的jar包,可以把这个目录下面的所有jar包都引入工程
4.run Configurations,配置运行入参,
因为 这个代码是读入一个文本,在hadoop文件系统,可以spark-submit的时候传入这个参数,在windows 本地开发环境可以在eclipse里面配置这个参数,见下面的图
val lines = sc.textFile(args(0));
4.入参文本及运行结果
入参文本:
run scala Application运行结果
ok,开发环境搭建完毕。
开发
程序
运行
环境
文本
版本
配置
代码
参数
字符
对象
时候
目录
结果
面的
实例
相同
一行
单词
同时
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
怎样保护数据库安全性
我的世界服务器管理员监狱
查询数据库中没有查询结果
安徽通信软件开发设施服务标准
3m服务器登陆
科技互联网青年图片
四川服务器ups不间断电源
重庆纺织外贸软件开发
win11怎么连接远程服务器
龙芯3a5000软件开发工具
数据库和java哪个更好
现在网络技术的发展
手抄报简笔画网络安全
刘家峡天气预报软件开发
中转服务器租
c 配置数据库链接文件
地下城与勇士游戏服务器多少钱
服务器 股
宝德服务器系统管理平台
mysql转储数据库
苏声网络技术有限公司
哪里给数据库中的密码加密
有关于网络安全的图
软件开发部的工作计划
a100服务器价格
方圆数据库
肖战指使蒙古上单杀入b站服务器
汽车电子软件开发资料
京微网络技术
iis服务器打不开