並べ替え

PySpark 並べ替えジョブの例。

コードサンプル

Python

このサンプルを試す前に、Dataproc クイックスタート: クライアント ライブラリの使用の Python の手順に従って設定を行ってください。詳細については、Dataproc Python API のリファレンス ドキュメントをご覧ください。

import pyspark

sc = pyspark.SparkContext()
rdd = sc.parallelize(["Hello,", "world!", "dog", "elephant", "panther"])
words = sorted(rdd.collect())
print(words)