Spark性能优化:对RDD持久化或CheckPoint操作
生活随笔
收集整理的这篇文章主要介绍了
Spark性能优化:对RDD持久化或CheckPoint操作
小编觉得挺不错的,现在分享给大家,帮大家做个参考.
对多次使用的RDD进行持久化或Checkpoint
-
如果程序中,对某一个RDD,基于它进行了多次transformation或者action操作。那么就非常有必要对其进行持久化操作,以避免对一个RDD反复进行计算。
-
此外,如果要保证在RDD的持久化数据可能丢失的情况下,还要保证高性能,那么可以对RDD进行Checkpoint操作。
总结
以上是生活随笔为你收集整理的Spark性能优化:对RDD持久化或CheckPoint操作的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇: AI搜索外星人 发现宇宙深处72神秘光
- 下一篇: LeetCode--160--相交链表