Ordinamento di Cloud Storage

Un esempio di job PySpark per ordinare i contenuti di un file di testo in Cloud Storage.

Esempio di codice

Python

Prima di provare questo esempio, segui le istruzioni di configurazione di Python nella guida rapida di Dataproc per l'utilizzo delle librerie client. Per saperne di più, consulta la documentazione di riferimento dell'API Dataproc per Python.

Per effettuare l'autenticazione in Dataproc, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.

import pyspark

sc = pyspark.SparkContext()
rdd = sc.textFile("gs://path-to-your-GCS-file")
print(sorted(rdd.collect()))

Passaggi successivi

Per cercare e filtrare gli esempi di codice per altri prodotti Google Cloud , consulta il browser degli esempi diGoogle Cloud .