描述:Spark Streaming Long Running Job,以 client 模式跑在 YARN 集群上,HDFS 启用 HA,整个集群启用 Kerberos 认证。在执行任务时,ApplicationMaster 可以正常重新 renew 新的 HDFS DELEGATION TOKEN,executor 端也可以正常拿到 AM 新生成的 Token (由 AM 写到 HDFS 的一个文件上)。但是 Driver 端无法正常拿到新的 Token。总是报 GSS Error 和 token not found in cache。
环境:CDH 5.13.1,hadoop-2.6.0-cdh5.13.1,spark 2.2.0 社区版
Google 了一圈,加了 --conf spark.hadoop.fs.hdfs.impl.disable.cache=true,说是在 HDFS HA 模式下,必须关掉 cache 功能,但是加上了并没有什么用。
有遇到过类似 TOKEN 问题过期的大佬吗?指点一下
1
zuston 2019-08-10 22:33:18 +08:00
你遇到的应该是一个 HDFS bug. 参考 issue: https://issues.apache.org/jira/browse/HDFS-9276、因为此 bug, 导致过期 renew 的时候没有更新 ha 的 token
|