千家信息网

Flink on Yarn的部署和设置

发表于:2025-02-12 作者:千家信息网编辑
千家信息网最后更新 2025年02月12日,这篇文章主要讲解了"Flink on Yarn的部署和设置",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"Flink on Yarn的部署和设置"吧!执
千家信息网最后更新 2025年02月12日Flink on Yarn的部署和设置

这篇文章主要讲解了"Flink on Yarn的部署和设置",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"Flink on Yarn的部署和设置"吧!

执行ansible脚本部署CDH和Flink(ansible电脑)

  1. 进入ansible电脑的~/playbooks目录,经过上一篇的准备工作,该目录下应该是下图这些内容:

  2. 检查ansible远程操作CDH服务器是否正常,执行命令ansible deskmini -a "free -m",正常情况下显示CDH服务器的内存信息,如下图:

  3. 执行命令开始部署:ansible-playbook cm6-cdh6-flink1.7-single-install.yml

  4. 整个部署过程涉及在线安装、传文件等耗时的操作,因此请耐心等待(半小时左右),如果部署期间出错退出(例如网络问题),只需重复执行上述命令即可,ansible保证了操作的幂等性;

  5. 部署成功如下图所示:

重启CDH服务器

由于修改了selinux和swap的设置,需要重启操作系统才能生效,因此请重启CDH服务器;

执行ansible脚本启动CDH服务(ansible电脑)

  1. 等待CDH服务器重启成功;

  2. 登录ansible电脑,进入~/playbooks目录;

  3. 执行初始化数据库和启动CDH的脚本:ansible-playbook cdh-single-start.yml

  4. 启动完成输出如下信息:

  5. ssh登录CDH服务器,执行此命令观察CDH服务的启动情况:tail -f /var/log/cloudera-scm-server/cloudera-scm-server.log,看到下图红框中的内容时,表示启动完成,可以用浏览器登录了:

设置(浏览器操作)

现在CDH服务已经启动了,可以通过浏览器来操作:

  1. 浏览器访问:http://192.168.50.134:7180 ,如下图,账号密码都是admin

  2. 一路next,在选择版本页面选择60天体验版:

  3. 选择主机页面可见CDH服务器(deskmini):

  4. 在选择CDH版本的页面,请选择下图红框中的5.16.2-1

  5. 进入安装Parcel的页面,由于提前上传了离线parcle包,因此下载进度瞬间变成百分之百,此时请等待分配、解压、激活的完成:

  6. 接下来有一些推荐操作,这里选择如下图红框,即可跳过:

  7. 接下来是选择服务的页面,我选择了自定义服务,然后选择了HDFS、YARN、Zookeeper这三项,可以满足运行Flink的需要:

  8. 在选择主机的页面,都选择CDH服务器:

  9. 接下来是数据库设置的页面,您填写的内容必须与下图保持一致,即主机名为localhost,Activity Monitor的数据库、用户、密码都是amon,Reports Manager的数据库、用户、密码都是rman,这些内容在ansible脚本中已经固定了,此处的填写必须保持一致:

  10. 在设置参数的页面,请按照您的硬盘实际情况设置,我这里/home目录下空间充足,因此存储位置都改为/home目录下:

  11. 等待服务启动:

  12. 各服务启动完成:

YARN设置

默认的YARN参数是非常保守的,需要做一些设置才能顺利执行Flink任务:

  1. 点下图红框位置,进入YARN管理页:

  2. 如下图所示,检查参数yarn.nodemanager.resource.cpu-vcores的值,该值必须大于1,否则提交Flink任务后YARN不分配资源执行任务,(如果您的CDH服务器是虚拟机,当CPU只有单核时,则此参数就会被设置为1,解决办法是先提升虚拟机CPU核数,再来修改此参数):

  3. yarn.scheduler.minimum-allocation-mb:单个容器可申请的最小内存,我这里设置为1G

  4. yarn.scheduler.maximum-allocation-mb:单个容器可申请的最大内存,我这里设置为8G

  5. yarn.nodemanager.resource.memory-mb:节点最大可用内存,我这里设置为8G

  6. 上述三个参数的值,是基于我的CDH服务器有32G内存的背景,请您按照自己硬件资源自行调整;

  7. 设置完毕后重启YARN服务,操作如下图所示:

  8. 至此,部署和设置都已完成,Flink on Yarn的环境已经可用了。

感谢各位的阅读,以上就是"Flink on Yarn的部署和设置"的内容了,经过本文的学习后,相信大家对Flink on Yarn的部署和设置这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是,小编将为大家推送更多相关知识点的文章,欢迎关注!

服务 选择 服务器 页面 内容 参数 下图 内存 目录 命令 情况 数据 数据库 浏览器 电脑 脚本 浏览 接下来 主机 任务 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 和平精英服务器没响应怎么办 超星数据库可不可以查找标准文献 网络安全和移动通信 滴滴打车软件开发需求 网络安全预防人防联防 查看网页数据库 计算机分流数据库 金蝶数据库错误代码1067 英语六级数据库多久更新 无法激活因为激活服务器 网络安全威胁针对 a内部网络 江苏智能视频分析服务器 服务器电脑端怎么切换到手机端 山东安卓智能化软件开发 qq数据库 读取 申请网络安全审计服务资质认证 襄阳农村房屋登记数据库 网络安全信息百度百科 香港统计年鉴数据库 搭建网络代理服务器 数据库查询影响 数据库读写设置 移动端如何进行网络安全防护 万方数据库应届生免费查一次 重庆银行软件开发招聘信息 奉贤区推广软件开发厂家范围 嵌入式软件开发中的难点 政治七上知识点网络安全 中通快递软件开发怎么样 永嘉网络安全宣传周
0