Ordenar Cloud Storage

Un trabajo de PySpark de ejemplo para ordenar el contenido de un archivo de texto en Cloud Storage.

Muestra de código

Python

Antes de probar este ejemplo, sigue las instrucciones de configuración para Python que se encuentran en la guía de inicio rápido de Dataproc sobre el uso de bibliotecas cliente. Para obtener más información, consulta la API de Python de Dataproc documentación de referencia.

Para autenticarte en Dataproc, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.

import pyspark

sc = pyspark.SparkContext()
rdd = sc.textFile("gs://path-to-your-GCS-file")
print(sorted(rdd.collect()))

¿Qué sigue?

Para buscar y filtrar muestras de código para otros productos de Google Cloud, consulta el navegador de muestra de Google Cloud.