Spark性能优化:对RDD持久化或CheckPoint操作
生活随笔
收集整理的這篇文章主要介紹了
Spark性能优化:对RDD持久化或CheckPoint操作
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
對多次使用的RDD進行持久化或Checkpoint
-
如果程序中,對某一個RDD,基于它進行了多次transformation或者action操作。那么就非常有必要對其進行持久化操作,以避免對一個RDD反復進行計算。
-
此外,如果要保證在RDD的持久化數據可能丟失的情況下,還要保證高性能,那么可以對RDD進行Checkpoint操作。
總結
以上是生活随笔為你收集整理的Spark性能优化:对RDD持久化或CheckPoint操作的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: AI搜索外星人 发现宇宙深处72神秘光
- 下一篇: LeetCode--160--相交链表