导航：首页 > 互联网科技 >

如何进行Spark中Spark Streaming的分析

发表于：2024-11-26 作者：千家信息网编辑

千家信息网最后更新 2024年11月26日，今天就跟大家聊聊有关如何进行Spark中Spark Streaming的分析，可能很多人都不太了解，为了让大家更加了解，小编给大家总结了以下内容，希望大家根据这篇文章可以有所收获。概览Spark St

千家信息网最后更新 2024年11月26日如何进行Spark中Spark Streaming的分析

今天就跟大家聊聊有关如何进行Spark中Spark Streaming的分析，可能很多人都不太了解，为了让大家更加了解，小编给大家总结了以下内容，希望大家根据这篇文章可以有所收获。

概览

Spark Streaming是Spark API的一个可横向扩容，高吞吐量，容错的实时数据流处理引擎，Spark能够从Kafka、Flume、Kinesis或者TCP等等输入获取数据，然后能够使用复杂的计算表达式如map,reduce,join和window对数据进行计算。计算完后的数据能够被推送到文件系统，数据库，和实时的仪表盘。另外，你也可以使用Spark ML和图计算处理实时数据流。

Spark Streaming接受到了实时数据后，把它们分批进行切割，然后再交给Spark进行数据的批量处理。

Spark Streaming对离散化的数据流提供了高级别的抽象DStream，所有进入的数据流都会被处理为DStreams，在内部，DStream是一个顺序排列的RDD。

快速起步

第一个实例是如何从TCP输入中计算单词出现的次数

首先，我们创建一个JavaStreamingContext对象，它是所有Streaming函数的主入口，再创建一个带有2个线程的StreamingContext对象，每1秒进行一次批处理。

import org.apache.spark.*; import org.apache.spark.api.java.function.*; import org.apache.spark.streaming.*; import org.apache.spark.streaming.api.java.*; import scala.Tuple2;  SparkConf conf = new SparkConf().setMaster("local[2]").setAppName("NetworkWordCount"); JavaStreamingContext jssc = new JavaStreamingContext(conf, Durations.seconds(1));

创建一个侦听本地9999的TCP数据源

JavaReceiverInputDStream lines = jssc.socketTextStream("localhost", 9999);

我们把接受到的数据按照空格进行切割

JavaDStream words = lines.flatMap(x -> Arrays.asList(x.split(" ")).iterator());

对单词进行统计

JavaPairDStream pairs = words.mapToPair(s -> new Tuple2<>(s, 1)); JavaPairDStream wordCounts = pairs.reduceByKey((i1, i2) -> i1 + i2);  wordCounts.print();

把字符串拍扁->映射->进行去重统计，***调用print函数把数据打印到控制台中

jssc.start();              // Start the computation jssc.awaitTermination();   // Wait for the computation to terminate

最后，启动整个计算过程

为了完成这次实验，还需要使用nc作为Server进行配合

nc -lk 9999

Spark提供了示例，可以使用 ./bin/run-example streaming.JavaNetworkWordCount localhost 9999 来体验WordCount

看完上述内容，你们对如何进行Spark中Spark Streaming的分析有进一步的了解吗？如果还想了解更多知识或者相关内容，请关注行业资讯频道，感谢大家的支持。

很赞哦！

数据数据流处理内容实时分析函数单词对象统计输入复杂高级仪表仪表盘入口吞吐量字符字符串实例数据库的安全要保护哪些东西数据库安全各自的含义是什么生产安全数据库录入数据库的安全性及管理数据库安全策略包含哪些海淀数据库安全审计系统建立农村房屋安全信息数据库易用的数据库客户端支持安全管理连接数据库失败ssl安全错误数据库的锁怎样保障安全数据库对仓储的作用黑龙江专业软件开发价格数据库能合并字段吗炉石传说佣兵数据库电信连网通服务器数据库开发专业学校数据库工程师分支我的世界1.18幻界服务器如果有幸成为软件开发工程师数据库的计算方式服务器硬件配置要求数据库使用pg 普陀区海航数据库服务内容 lol台湾服务器云空间吴江区提供网络技术费用远程办公网络安全意识主题《电子支付与网络安全》服务器中的异常进程是怎么存在的校园网络安全的的紧迫性上海好的软件开发资费浦东新区互联网软件开发问答知识徐州仓储生鲜软件开发树莓派如何查看数据库密云区先进软件开发创意自动化设备pc软件开发华三服务器怎么恢复出厂设置干软件开发需要考证书吗金山区软件开发哪家好丰南区正规软件开发抖音为什么老显示服务器繁忙

千家信息网

千家信息网

如何进行Spark中Spark Streaming的分析

win7中文字出现乱码怎么解决

xz文件该如何解压

相关文章