对 Cloud Storage 进行排序

使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。

用于对 Cloud Storage 中的文本文件内容进行排序的 PySpark 作业示例

代码示例

Python

在尝试此示例之前,请按照 Dataproc 快速入门:使用客户端库中的 Python 设置说明进行操作。 如需了解详情,请参阅 Dataproc Python API 参考文档

import pyspark

sc = pyspark.SparkContext()
rdd = sc.textFile("gs://path-to-your-GCS-file")
print(sorted(rdd.collect()))

后续步骤

如需搜索和过滤其他 Google Cloud 产品的代码示例,请参阅 Google Cloud 示例浏览器