问题一:
flink日志一直报错如下:
1 | 2019-07-29 16:41:42,634 ERROR org.apache.flink.runtime.rest.handler.job.JobDetailsHandler - Exception occurred in REST handler: Job 4b1ab21b418e7b4128838ee4efbde4dc not found |
原因:
有查看该任务的web页面未关闭,关闭之后就不报错了。
问题二:
flink启动之后,checkpoint报错。看起来是kafka问题
1 | org.apache.kafka.common.errors.TimeoutException |
原因:
因为该任务sink是kafkaproducer,但是未创建topic,所以超时异常。
问题三
之前flink checkpoint存在本地目录,存在两个问题。
一个是,每个运行任务的taskManager都有保存其checkpoint
第二个是,运行一段时间以后,总是会无法生存新的chk-n文件,然后下次一checkpoint就一直找不到文件,失败。
1 | java.lang.Exception: Exception while creating StreamOperatorStateContext. |
解决办法:
将状态后端修改为 hdfs,然后将checkpoint保存到hdfs路径下