Cloud Storage 정렬

Cloud Storage에서 텍스트 파일의 콘텐츠를 정렬하는 PySpark 작업 예시입니다.

코드 샘플

Python

이 샘플을 사용해 보기 전에 Dataproc 빠른 시작: 클라이언트 라이브러리 사용의 Python 설정 안내를 따르세요. 자세한 내용은 Dataproc Python API 참조 문서를 확인하세요.

import pyspark

sc = pyspark.SparkContext()
rdd = sc.textFile("gs://path-to-your-GCS-file")
print(sorted(rdd.collect()))