解决 Apache Spark 中的依赖关系问题
Apache Spark 应用程序在构建和部署过程中通常会遇到与依赖关系相关的问题。这些问题包括 java.lang.ClassNotFoundException、object x is not a member of package y 编译错误以及 java.lang.NoSuchMethodError.
动态类路径和依赖管理
Spark 的类路径是动态构建的以适应用户代码,可能会导致这些问题。此外,所使用的特定集群管理器(master)引入了进一步的考虑因素。
组件和类放置
Spark应用程序包含以下组件:
每个组件的类放置如下所示:
< ;img src="https://i.sstatic.net/eGByZ.png" alt="如何有效管理依赖关系以避免 Apache Spark 应用程序出现错误?">
分发代码
了解类放置要求可以在组件之间正确分发代码:
不同集群管理器中的依赖管理
独立:
YARN / Mesos:
使用 YARN 的建议方法
为了最大限度地减少依赖性问题,请考虑以下方法:
以上是如何有效管理依赖关系以避免 Apache Spark 应用程序出现错误?的详细内容。更多信息请关注PHP中文网其他相关文章!