Ordinamento di Cloud Storage

Un esempio di job PySpark per ordinare i contenuti di un file di testo in Cloud Storage.

Esempio di codice

Python

Prima di provare questo esempio, segui le istruzioni di configurazione di Python riportate nella guida rapida all'utilizzo delle librerie client di Dataproc. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Dataproc Python.

Per autenticarti a Dataproc, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.

import pyspark

sc = pyspark.SparkContext()
rdd = sc.textFile("gs://path-to-your-GCS-file")
print(sorted(rdd.collect()))

Passaggi successivi

Per cercare e filtrare i sample di codice per altri Google Cloud prodotti, consulta il Google Cloud browser di sample.