Analiza y desarrolla estrategias de forma más inteligente

Google Cloud Platform ofrece tecnología y herramientas clave que los científicos de datos pueden usar para extraer información con valor comercial tangible de conjuntos de datos masivos. Desde clústeres Spark administrados y análisis rápidos con SQL hasta lo último en aprendizaje automático, Google Cloud Platform ayuda a los científicos de datos a dedicar más tiempo a encontrar valor en los datos y menos tiempo a preocuparse por la infraestructura. No importa si la tarea en cuestión es optimización táctica, análisis predictivo, obtener información matizada, motores de recomendaciones o la construcción de motores de decisión automatizados, con Google Cloud Platform los científicos de datos pueden trabajar de manera más inteligente.

Convierte depósitos de bits en información clara

Con Google Cloud Platform, es fácil analizar los datos sin importar cómo estén almacenados. Si tienes datos estructurados, Google BigQuery es un depósito de datos completamente administrado y de bajo costo que, además, es compatible en su totalidad con SQL y está integrado a Python, R y muchos otros lenguajes. Para obtener un almacenamiento más general, Google Cloud Storage te ofrece almacenamiento simple, pero poderoso, al que puedes acceder desde cualquier parte de GCP. En ambos casos, podrás acceder a tus datos mediante Apache Spark en Google Cloud Dataproc, transmitirlos y analizarlos en Google Cloud Dataflow o usarlos como base para generar modelos con Google Cloud Machine Learning. Además, puedes administrar todo con Google Cloud Datalab, nuestro ambiente dedicado al aprendizaje automático y la ciencia de datos con formato de cuaderno electrónico.

Ciencia de datos, sin necesidad de desarrollo y operación

Google Cloud Platform permite que los equipos de científicos de datos trabajen sin ocuparse de administrar la infraestructura. Las herramientas de GCP como Google BigQuery, un almacén de datos ultrarrápido, no necesitan servidores: siempre tendrás los recursos que necesites y únicamente pagas lo que usas. Mediante un variado conjunto de API cliente, BigQuery se integra a Pandas, a dplyr y a otras de las bibliotecas más populares para el análisis de datos. Cloud Dataflow proporciona una manera de ejecutar canalizaciones de datos por lotes y por transmisión sin servidores, lo cual es perfecto para la limpieza de datos o la aplicación de modelos en datos de transmisión. La compatibilidad de Cloud Dataflow con Python garantiza que los científicos de datos que usan Python puedan aprovechar el modelo de programación de Apache Beam a la vez que usan su herramienta de preferencia.

Una plataforma de análisis de código abierto

Con Google Cloud Platform, los científicos de datos pueden beneficiarse de las innovaciones más recientes en software de código abierto. Google Cloud Dataproc permite que los usuarios creen clústeres administrados de Apache Spark en cuestión de segundos, con cuadernos de Apache Zeppelin o de Jupyter. Los equipos que están diseñando la última generación de herramientas de procesamiento de datos en Apache Beam pueden usar Cloud Dataflow, Apache Spark o Apache Flink. GCP está comprometido con el código abierto para diseminar y ampliar las comunidades de ciencia de datos y aprendizaje automático. Con ese fin, Google pasó Cloud Datalab, su entorno de cuadernos basado en Jupyter, y TensorFlow, su biblioteca de aprendizaje profundo, al modelo de código abierto.

Una plataforma de aprendizaje automático en la nube

Con Google Cloud Machine Learning Platform, es fácil para los equipos de científicos de datos investigar formas novedosas de aprendizaje automático. Gracias a las API de Google Machine Learning, los equipos pueden usar modelos generados por Google para analizar y comprender los datos mediante API simples para reconocimiento de voz y de imágenes de vanguardia, procesamiento de lenguajes naturales y traducción automática. Con CloudML, los científicos de datos pueden entrenar y poner en funcionamiento sus propios modelos de aprendizaje profundo con TensorFlow y Cloud Datalab. CloudML se integra directamente a otros productos de GCP, como Google Cloud Storage o Google BigQuery, para que puedas extraer información valiosa de nuestros datos.

Guías y recursos para ciencia de datos

Tenemos recursos y guías detalladas que te ayudarán a conocer más acerca de cómo usar Cloud Platform para la ciencia de datos.

Valor del ciclo de vida del cliente

Usa BigQuery, Python y R para calcular el valor del ciclo de vida del cliente con datos de Google Analytics.

Lee la guía de desarrollo

Generación de recomendaciones

Usa SparkML, Cloud SQL y Google App Engine para generar un motor de recomendaciones.

Leer el artículo

Pronóstico de la demanda

Usa BigQuery y TensorFlow para pronosticar la demanda de taxis en Nueva York.

Leer el artículo

Análisis de opiniones

Usa BigQuery y Cloud Natural Language para realizar predicciones de opiniones y visualizar el resultado con Google Data Studio.

Leer el artículo

Canalización de analítica en tiempo real

Usa BigQuery y Cloud Dataflow para construir una arquitectura de analítica en tiempo real.

Leer el artículo

Análisis de series temporales

Usa BigQuery para analizar datos de series temporales sobre el mercado de divisas.

Leer el instructivo

Clasificación de series temporales

Usa BigQuery y TensorFlow para generar un clasificador para datos de una serie temporal.

Leer el instructivo

Predicciones y remarketing

Usa BigQuery y R para crear una lista de remarketing a partir de datos de Google Analytics.

Leer el instructivo