千家信息网

Spark Stream怎么使用

发表于:2025-02-01 作者:千家信息网编辑
千家信息网最后更新 2025年02月01日,这篇文章主要讲解了"Spark Stream怎么使用",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"Spark Stream怎么使用"吧!pom.xml
千家信息网最后更新 2025年02月01日Spark Stream怎么使用

这篇文章主要讲解了"Spark Stream怎么使用",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"Spark Stream怎么使用"吧!

pom.xml

  1. org.apache.spark

  2. spark-streaming_2.11

  3. 2.1.0

  1. import java.io.OutputStream;

  2. import java.net.ServerSocket;

  3. import java.net.Socket;

  4. import java.util.Arrays;

  5. import java.util.UUID;


  6. import org.apache.spark.SparkConf;

  7. import org.apache.spark.streaming.Durations;

  8. import org.apache.spark.streaming.api.java.JavaDStream;

  9. import org.apache.spark.streaming.api.java.JavaPairDStream;

  10. import org.apache.spark.streaming.api.java.JavaStreamingContext;


  11. import scala.Tuple2;


  12. public class SparkStreamTest {


  13. public static void main(String[] args) throws Exception {

  14. startSockerServer(9999);


  15. SparkConf conf = new SparkConf().setMaster("local[2]").setAppName("NetworkWordCount");

  16. JavaStreamingContext jssc = new JavaStreamingContext(conf, Durations.seconds(1));

  17. JavaDStream lines = jssc.socketTextStream("localhost", 9999);


  18. JavaDStream words = lines.flatMap(x -> Arrays.asList(x.split(" ")).iterator());

  19. JavaPairDStream pairs = words.mapToPair(s -> new Tuple2<>(s, 1));

  20. JavaPairDStream counts = pairs.reduceByKey((x, y) -> x + y);

  21. counts.print();


  22. jssc.start();

  23. jssc.awaitTermination();

  24. jssc.close();

  25. }


  26. private static void startSockerServer(int port) throws Exception {

  27. new Thread(){

  28. public void run() {

  29. try {

  30. ServerSocket server = new ServerSocket(port);

  31. Socket socket = server.accept();

  32. OutputStream os = socket.getOutputStream();

  33. for (int i = 0; i < 1000; i++) {

  34. String txt = UUID.randomUUID().toString().replaceAll("-", " ");

  35. txt = "Hello test\n";

  36. os.write(txt.getBytes());

  37. Thread.sleep(10);

  38. }

  39. socket.close();

  40. server.close();

  41. } catch (Exception e) {

  42. e.printStackTrace();

  43. }

  44. }

  45. }.start();

  46. }

  47. }

会不断地打印出类似的结果:
-------------------------------------------
Time: 1490947248000 ms
-------------------------------------------
(Hello,99)
(test,99)

感谢各位的阅读,以上就是"Spark Stream怎么使用"的内容了,经过本文的学习后,相信大家对Spark Stream怎么使用这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是,小编将为大家推送更多相关知识点的文章,欢迎关注!

0