MapReduce执行流程是怎样的
发表于:2025-02-06 作者:千家信息网编辑
千家信息网最后更新 2025年02月06日,本篇内容介绍了"MapReduce执行流程是怎样的"的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!Ma
千家信息网最后更新 2025年02月06日MapReduce执行流程是怎样的
本篇内容介绍了"MapReduce执行流程是怎样的"的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!
MapReduce执行流程图
概述
MapReduce是一种分布式计算模型,由Google提出,主要用于搜索领域,解决海量数据的计算问题。
MapReduce是分布式运行的,由两个阶段组成:Map和Reduce,Map阶段是一个独立的程序,有很多个节点同时运行,每个节点处理一部分数据。
Reduce阶段是一个独立的程序,有很多个节点同时运行,每个节点处理一部分数据。
使用
MapReduce框架都有默认实现,用户只需要覆盖map()和reduce()两个函数,即可实现分布式计算,非常简单。
这两个函数的形参和返回值都是,使用的时候一定要注意构造。
执行流程(此处举例说明)
一个文本(在HDFS上面保存,两个block)中每一个单词的出现的次数: hello you hello marry hello me really ----->block-1 hello kate ready xiao wang hello tomcat ----->block-2
1.获取每一个block块中的文本,遍历所有,回去其中的一行str
因为要统计的是每一个单词i的次数,所以还需要直到文本中有哪些单词,可以根据字符串的特点,使用split()进行切割。
String[] words=str.split("");
根据要求,需将每一个单词i转换为的形式,k为单词本身,v为单词出现的次数。
2.因为mr的计算是分布式的 ,每一个map(称之为一个mapper task)计算其中的一个block块数据。
map阶段: 输入k1,偏移量,v1,当前行文本内容 map()函数操作 输出 k2,具体单词,v2,单词对应的统计项,比如次数 输出
shuffle阶段 研究后发现,如果按照这种方式向reduce输出数据的时候,会有 大量的冗余数据。 比如map阶段之后有5个hello,则输出 , , , , 5次,实际上会对网络造成一定的压力,能不能对 这5个 进行一个进入reduce之前的本地组合?比如成为 或者 . 这个过程成为shuffle,洗牌重组阶段,达到上述的结果,称之为规约。 >>>shuffle阶段,也就是对map的输出进行重新洗牌: 分区、分组、排序 ...===>
reduce阶段 接收map的输出结果对这个结果进行汇总统计,针对values,进行简单的累加,计算得出key 对应的次数 reduce针对一个key调用一次reduce()函数 =====>reduce 阶段 输入 K2,就是map的输出的K2,V2s是map经过shuffle之后的结果集 reduce()函数操作 转化为
经过上述操作之后,系统会将计算结果输出给用户,一般会先存储(落地)到hdfs,然后反馈给用户。
"MapReduce执行流程是怎样的"的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注网站,小编将为大家输出更多高质量的实用文章!
阶段
输出
单词
数据
函数
次数
结果
流程
两个
分布式
节点
内容
文本
用户
统计
运行
同时
实际
时候
更多
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
第1讲网络安全概论pptx下载
hgmd数据库介绍
完美世界服务器指令
软件开发助理需要什么手续
云数据库redis部署
系统软件开发人员工作在哪一层
程序中数据如何存储在数据库
软件开发公司算甲方吗
鹏城杯网络安全竞赛
互联网大脑科技
怎么在云服务器上搭建后台
mdb数据库建库步骤
顺义区运营网络技术市场报价
激光打印数据库
炸猴爷服务器的是谁
石家庄java软件开发工资
opc额服务器
2020网络安全宣
linux是软件开发
数据库连接地址参数
计算机网络技术胡乃翔
软件测试学哪些软件开发
浙江高考资料数据库
软件开发的分析和评估
stata列出数据库
投注app软件开发
网络技术与应用基础考试
美国对中国们网络安全威胁
杭州泳江网络技术有限公司
promo数据库