pyspark 캐싱, partitioning, broadcast, accumulater 설명
[PySpark_#5] 파이썬을 활용한 스파크 프로그래밍, (5장/8장)
5장 - 스파크 코어 API를 사용한 고급 프로그래밍5장에서 다루는 내용은
spark broadcast, accumulater 소개
RDD partitioning, repartitioning
RDD 저장옵션
caching, RDD checkpoint를 다룬다고 한다.
스파크 공유변수코드 스니펫으로 따지면12345678sc = SparkConte......
Posted by 박홍 on
2024-03-21