大数据Flink进阶(十一):Flink History Server配置使用
基于Standalone或者Yarn模式提交Flink任务后,当任务执行失败、取消或者完成后,可以在WebUI中查看对应任务的统计信息,这些统计信息在生产环境中
基于Standalone或者Yarn模式提交Flink任务后,当任务执行失败、取消或者完成后,可以在WebUI中查看对应任务的统计信息,这些统计信息在生产环境中对我们来说非常重要,可以知道一个任务异常挂掉前发生了什么,便于定位问题。
当基于Standalone session模式提交相应任务时,集群重启后我们没有办法查看集群之前运行任务的情况,如果是基于pre-job方式提交任务,任务执行完成之后,那么相对应的统计信息也不会保存,基于Yarn运行的Flink任务也是一样道理。这样对于我们查看先前Flink作业统计信息或参数带来了不便。Flink中提供了History Server 来解决这个问题,可以在任务执行完成后保留相应的任务统计信息,便于分析和定位问题。
(资料图片仅供参考)
History Server 允许查询由JobManager归档的已完成作业的状态和统计日志信息。已完成的作业归档由JobManager上传持久化到某个路径下,这个路径可以是本地文件系统、HDFS、H3等,History Server 可以周期扫描该路径将归档的Flink任务日志恢复出来,从而可以查看相应Flink任务日志情况。
在Standalone中配置History Server 服务需要选择一台节点当做History Server ,这台节点可以是JobManager/TaskManager节点,也可以是Standalone集群外的一台节点,这里选择node4节点作为Flink History Server 节点。Standalone配置HistoryServer 服务步骤如下:
1.1、在JM 和 TM 节点上配置 flink-conf.yaml
在Flink Standalone JobManager和TaskManager节点上配置flink-conf.yaml文件,指定Flink完成任务持久化的路径,这里选择HDFS目录作为任务日志持久化保存目录。在node1、node2、node3节点上配置$FLINK_HOME/conf/flink-conf.yaml文件,加入以下配置。
#Flink job运行完成后日志存储目录jobmanager.archive.fs.dir: hdfs://mycluster/flink/completed-jobs/Flink会根据以上配置连接HDFS 目录存储任务数据,所以需要在node1、node2、node3节点上/etc/profile中配置HADOOP_CLASSPATH环境变量。
#vim /etc/profile,加入以下配置export HADOOP_CLASSPATH=`hadoop classpath`#source /etc/profile 使环境变量生效source /etc/profile1.2、在History Server 节点上配置 flink-conf.yaml
在node4节点上配置$FLINK_HOME/conf/flink-conf.yaml文件,加入如下配置,配置HistoryServer。
#Flink History Server 节点historyserver.web.address: node4#Flink History Server 端口historyserver.web.port: 8082#Flink History Server 恢复任务的目录historyserver.archive.fs.dir: hdfs://mycluster/flink/completed-jobs/#Flink History Server 监控任务日志目录刷新时间间隔(毫秒)historyserver.archive.fs.refresh-interval: 10000Flink会根据以上配置连接HDFS目录恢复任务数据,这里要求"historyserver.archive.fs.dir"参数配置需要与Flink各个节点上配置的"jobmanager.archive.fs.dir"参数路径保持一致。此外,需要在node4节点上/etc/profile中配置HADOOP_CLASSPATH环境变量。
# vim /etc/profile,加入以下配置export HADOOP_CLASSPATH=`hadoop classpath`#source /etc/profile 使环境变量生效[root@node4 ~]# source /etc/profile1.3、启动 Flink 历史日志服务器
在node4节点上启动Flink History Server
#启动Flink 历史日志服务器[root@node4 ~]# cd /software/flink-1.16.0/bin/[root@node4 bin]# ./historyserver.sh startHistory Server 启动后,可以通过https://node4:8082 来访问历史日志服务页面。
我们可以通过向Standalone集群中提交任务来验证History Server是否能正常展示运行Flink任务的统计信息,步骤如下:
2.1、启动 Standalone 集群
[root@node1 ~]# cd /software/flink-1.16.0/bin/[root@node1 bin]# ./start-cluster.sh2.2、提交任务
向Flink集群中提交任务,任务还是选择读取Socket端口数据实时统计WordCount。首先在node5节点上启动socket服务:
[root@node5 ~]# nc -lk 9999在node4 客户端提交Flink任务(可以在任意节点提交Flink任务),命令如下:
[root@node4 ~]# cd /software/flink-1.16.0/bin/[root@node4 bin]# ./flink run -m node1:8081 -c com.mashibing.flinkjava.code.chapter3.SocketWordCount /root/FlinkJavaCode-1.0-SNAPSHOT-jar-with-dependencies.jar提交任务后在HDFS中暂时不会生成hdfs://mycluster/flink/completed-jobs"目录,当Flink集群停止、任务取消、任务失败后才可以在该目录下看到job信息。
2.3、取消任务并查看历史日志
在node5节点向Socket 9999端口输入一些数据:
hello,ahello,bhello,chello,d然后在Flink WebUI中取消当前任务:
取消任务后可以在"hdfs://mycluster/flink/completed-jobs"目录中看到取消任务的信息:
当任务取消后,也可以停止Flink集群,Flink集群重启后先前的任务统计信息不会展示,可以登录Flink历史日志服务器查看先前任务统计信息:
注意:在取消任务或者停止Flink集群后,需要等待一小段时间才能在Flink历史日志服务器中查看到对应的取消任务。
Flink基于Yarn运行时,当Flink任务形成的集群停止后,无法看到对应任务的统计信息,也可以通过配置History Server来实现基于Yarn的Flink集群停止后查看任务的统计信息。
这里选择node5节点为History Server,基于Yarn运行Flink任务配置HistoryServer服务步骤如下:
1.1、在node5 节点上配置 flink-conf.yaml
在node5节点上配置$FLINK_HOME/conf/flink-conf.yaml文件,最后配置以下配置项。
#Flink job运行完成后日志存储目录jobmanager.archive.fs.dir: hdfs://mycluster/flink-yarn/completed-jobs/#Flink History 服务器地址historyserver.web.address: node5#HistroyServer WebUI 访问端口historyserver.web.port: 8082#HistoryServer历史日志服务恢复任务信息目录historyserver.archive.fs.dir: hdfs://mycluster/flink-yarn/completed-jobs/#Flink History Server 监控任务日志目录刷新时间间隔(毫秒)historyserver.archive.fs.refresh-interval: 10000Flink会根据以上配置连接HDFS 目录存储任务数据,所以需要在node5节点上/etc/profile中配置HADOOP_CLASSPATH环境变量。
#vim /etc/profile,加入以下配置export HADOOP_CLASSPATH=`hadoop classpath`#source /etc/profile 使环境变量生效source /etc/profile1.2、启动 Flink 历史日志服务器并访问
在node5节点上启动Flink History Server
#启动Flink 历史日志服务器[root@node5 ~]# cd /software/flink-1.16.0/bin/[root@node5 bin]# ./historyserver.sh start访问历史日志服务地址:https://node5:8082
在node5节点基于Yarn提交Flink任务来验证History Server是否能正常展示执行完成的Flink任务统计信息。步骤如下:
2.1、向Yarn 集群中提交 Flink任务
向Yarn集群中提交Flink任务,任务还是选择读取Socket端口数据实时统计WordCount。在node5节点启动socket服务器:
[root@node5 ~]# nc -lk 9999在node5节点向Flink集群中提交Flink任务,命令如下:
[root@node5 ~]# cd /software/flink-1.16.0/bin/# 提交Flink任务[root@node5 bin]#./flink run-application -t yarn-application -c com.lanson.flinkjava.code.chapter3.SocketWordCount /root/FlinkJavaCode-1.0-SNAPSHOT-jar-with-dependencies.jar提交任务后在HDFS中暂时不会生成hdfs://mycluster/flink/completed-jobs"目录,当Flink集群停止、任务取消、任务失败后才可以在该目录下看到job信息。
2.2、取消任务并查看历史日志
在node5节点向Socket 9999端口输入一些数据:
hello,ahello,bhello,chello,d然后登录Yarn(https://node1:8081) WebUI,找到提交的任务取消对应Flink任务:
取消任务后可以在"hdfs://mycluster/flink-yarn/completed-jobs"目录中看到取消任务的信息:
登录Flink历史日志服务器查看取消任务统计信息:
注意:在取消任务或者停止Flink集群后,需要等待一小段时间才能在Flink历史日志服务器中查看到对应的取消任务。
标签:
基于Standalone或者Yarn模式提交Flink任务后,当任务执行失败、取消或者完成后,可以在WebUI中查看对应任务的统计信息,这些统计信息在生产环境中
一、探视带走孩子犯法吗探视带走孩子犯法。如果双方在协议中约定了探视时可以接走孩子,则探视接走孩子不犯法。《民法典》第一千
随着政策的陆续出台,披露及评价标准的不断完善,环境、社会及公司治理(ESG)生态体系正在进一步完善。中欧国际工商学院发布的《2023ESG白皮书
优刻得接待中金公司等多家机构调研
4月7日,记者从厦门市交通运输局举行的新闻发布会上获悉,2023年第一季度,厦门市交通运行情况总体平稳有序,运输服务品质不断提升,对内和对
《百鸟归巢》南音专场首演赢得满堂彩庄丽芬(左)献演琴箫奏唱《庭院七弦响》泉州网4月10日讯(记者陈智勇通讯员何绍峰文 图)8日晚,《百鸟归
近日,国内小家电领跑者--浙江苏泊尔股份有限公司(以下简称“苏泊尔”,002032 SZ)披露了一份“增利不增收”的年度成绩单。
送长辈生日礼物,最重要的还是看心意,只要你有这份心意就行了,相信她就会很喜欢的。如果你是长辈,就送实惠点的礼物吧,像包
今天晚上:盆地大部多云,其中西南部和南部有分散阵雨;甘孜州南部多云间阴有分散阵雨(雪),川西高原其余地方多云间晴,攀西地区晴间多云。1
陈梦打得较为轻松,3-0横扫老对手田志希晋级,单局甚至只让对手拿2分,摆脱了新加坡大满贯赛爆冷出局的阴影。剩下5场比赛结果都较为正常,华裔
毅行者在特产展销台询价、选购。红网时刻益阳4月9日讯(通讯员易凡)“这个山枣红薯皮不错,多少钱一袋?”4月8日下午,在第八届桃花江30公...
证券时报e公司讯,浦东建设(600284)4月9日晚间公告,2023年第一季度,公司新签工程施工项目数量总计为70个,新签项目金额为97 14亿元,新签项
4月9日,微软更新的官方支持文档,明确提及了Win11Moment3更新。 在“为多个Windows版本生成WiFiCx驱动程序”支持文档中,微软明确提到了Momen
CFi CN讯:证券代码:002746证券简称:仙坛股份公告编号:2023-015山东仙坛股份有限公司202
今天,雷报和ChatGPT4进行了对话,对话的主要内容是围绕腾讯、B站、优酷、爱奇艺等平台在动画领域的布局展开,主要问题如下:1,怎样看待腾讯
历史上的四大悲情英雄,有没有一个戳中你的泪点?,商鞅变法,使得秦国迅速崛起,国力和军事实力大幅度提高,从以前被魏国压着打一跃成为战国七
四月春意更浓,河南省洛阳市牡丹花开得正艳。在洛龙区石油社区养老服务中心,65岁的刘晓霞走出理发店,笑得比花都灿烂:“自从养老服务中心...
送给老婆的生日礼物,最好是能够让她感动的,能够感动老婆的,送一些老婆感动的吧,最重要的是你的心意,送老婆一定会非常开心的
1、 你电脑上安装360手机助手然后手机插上数据线点开电脑上的360手机助手就可以了插上数据线。2、手机打开USB
江苏南通熊孩子头卡椅子,家长连娃带椅子搬到消防站求助
1、行政复议有以下四个特点: (1)提出行政复议的人,必须是认为行政机关行使职权的行为侵犯其合法权益的法人和其他组织
现代快报网是由凤凰出版传媒集团旗下的现代快报倾力打造的江苏新闻门户网站,目前在南京、苏州、无锡、常州、扬州、泰州等十三地市,影响力辐射
1、我是能源动力专业毕业的,本身是学热能的,不知道你所谓的哪个好是什么意思,按我的理解就是以后的就业问题吧?我们专业毕
为您介绍!化妆品代工概念龙头股全名单揭晓!(2023 4 8),化妆品代工概念龙头股有:青松股份(300132):化妆品代工龙头。青松股份2022年第三
藏粮于技!解锁龙岩连城丰收密码
【热血传奇】《热血传奇》这个游戏,相信不少人都曾经玩过,是一款三维的MMORPG游戏,因其丰富的人物角色和流畅的操作,成为了曾经最受欢迎的
想必现在有很多小伙伴对于CSOL挂机脚本问题方面的知识都比较想要了解,那么今天小好小编就为大家收集了一些关于CSOL挂机
美国2月份消费者信贷增长放缓,因信用卡余额的增长创近两年来最低。美联储周五公布的数据显示,信贷总额2月份增加153亿美元
中国男篮将会在本赛季的CBA联赛结束之后迅速集结,备战在今年夏天开始的男篮世界杯,这一次的世界杯,关乎中国队能否重返奥运会,中国篮协也是
智通财经APP讯永吉股份603058603058SH公告公司控股股东贵州永吉控股有限责任公司永吉控股或转让方拟通过协议转让方式向公司实际控制人邓代兴受