Herramientas para científicos de datos

Infraestructura sin servidores y herramientas y servicios fáciles de usar para macrodatos y aprendizaje automático.

Imagen de datos de GCP para científicos

Almacena, procesa y prepara datos fácilmente para implementar y entrenar modelos de aprendizaje automático en todo tipo de datos, sin importar su tamaño. Gracias a nuestros servicios completamente administrados y al software de código abierto, los ingenieros y científicos de datos pueden dedicarse a convertir la información en inteligencia práctica en lugar de ocuparse de controlar clústeres.

Aprendizaje

Explora capacitaciones y recursos para aumentar tus conocimientos sobre ciencia de datos y aprendizaje automático.

Formación en IA a cargo de Google

Obtén información y ejercicios de los expertos en AA de Google para desarrollar tus habilidades y avanzar en tus proyectos.

Aprendizaje sobre Kaggle

Regístrate en cursos gratuitos sobre aprendizaje automático y ciencia de datos enfocados en la adquisición de habilidades prácticas por sobre la teoría abstracta.

Qwiklabs

Practica cómo usar las tecnologías y el software de nube.

Capacitaciones de Google Cloud

Busca cursos específicos para profesionales de datos encargados de diseñar, compilar, analizar y optimizar soluciones de macrodatos.

Coursera

Descubre el aprendizaje automático con Google Cloud a través de experimentación real con AA de extremo a extremo.

Prototipado

Explora herramientas y muestras para diseñar prototipos rápidamente en Google Cloud.
Colaboratory

Colaboratory

Colaboratory es un proyecto de investigación de Google creado para ayudar a difundir la investigación y educación en el campo del aprendizaje automático. Es un entorno de notebook de Jupyter gratuito que no requiere configuración y se ejecuta completamente en la nube. Los notebooks de Colaboratory se pueden compartir del mismo modo que los Documentos o las Hojas de cálculo de Google.

Ir a la guía de inicio rápido 
Cloud Datalab

Cloud Datalab

Explora, analiza, transforma y visualiza datos, y crea modelos de aprendizaje automático en Google Cloud Platform. Cloud Datalab se ejecuta en Compute Engine y se conecta fácilmente a varios servicios de nube.

Más información 
Ver documentación 
Conjuntos de datos públicos

Conjuntos de datos públicos

Accede a un repositorio de datos abiertos seleccionados por ingenieros de Google y con el respaldo de expertos en la materia de todo el mundo. Usa los datos para crear y probar tus algoritmos antes de implementarlos, o bien combinarlos con otros conjuntos de datos a fin de obtener estadísticas nuevas. Los datos se alojan en BigQuery y Cloud Storage, por lo que es muy fácil compilarlos y usarlos.

Ver documentación 
Kaggle

Kaggle

Los kernels de Kaggle ofrecen un entorno de codificación gratuito basado en navegador para Python y R. Accede sin problemas a miles de conjuntos de datos públicos, ejemplos de código provistos por una comunidad de científicos de datos y funciones de colaboración.

Explorar el repositorio 
Explorar conjuntos de datos públicos 
Jupyter

Jupyter

Usa los notebooks de Jupyter con las pilas de macrodatos completamente administradas de Google Cloud para acceder a una experiencia de ciencia de datos familiar sin necesidad de realizar tediosas configuraciones de infraestructura.

Leer el blog 
Revisar el instructivo 
Aprendizaje profundo de Cloud

Cloud Deep Learning VM Image (Beta)

Deep Learning VM Image son imágenes de Compute Engine preconfiguradas para marcos de trabajo de aprendizaje automático populares, como TensorFlow, scikit-learn y PyTorch.

Ver documentación 

Creación

Obtén herramientas para optimizar el proceso, desde la transferencia de datos hasta el entrenamiento de modelos.

Transferencia

Cloud Pub/Sub

Cloud Pub/Sub

Cloud Pub/Sub es una base sencilla, confiable y escalable para el análisis de transmisiones por volumen y sistemas de procesamiento basados en eventos. Como parte de la solución de análisis de transmisiones de Google Cloud, el servicio transfiere transmisiones de eventos y las envía a Cloud Dataflow para procesarlas y a BigQuery a fin de analizarlas como una solución de almacenamiento de datos.

Ver documentación 
Ir a GitHub 

Procesamiento

Cloud Dataflow

Cloud Dataflow

Transforma y enriquece los datos transferidos en los modos de transmisión y por lotes con la misma fiabilidad y expresividad.

Ver documentación 
Ir a las guías de inicio rápido 
Cloud Dataprep

Cloud Dataprep

Cloud Dataprep es un servicio inteligente de datos que permite explorar, limpiar y preparar visualmente los datos estructurados y sin estructurar para su análisis. Funciona sin servidores y a cualquier escala, y no requiere la implementación ni administración de infraestructuras.

Ver documentación 
Ir a las guías de inicio rápido

Almacenamiento

BigQuery

BigQuery

BigQuery es un servicio de almacenamiento completamente administrado que admite 100,000 inserciones de filas de transmisión por segundo y permite el análisis ad hoc de datos en tiempo real con SQL estándar.

Ver instructivos 
Ir a las guías de inicio rápido 
Cloud Storage

Cloud Storage

Usa Cloud Storage para almacenar tu entrenador de modelos, los datos de entrenamiento, los modelos guardados y las entradas y los resultados de las predicciones.

Ver documentación 
Ir a las guías de inicio rápido 

Exploración

BigQuery

BigQuery

Obtén información valiosa a partir de tus datos más rápido y sin tener que copiarlos ni transferirlos. BigQuery ofrece una vista completa de todos tus datos, ya que consulta sin problemas los datos del almacenamiento en columnas administrado de BigQuery, Cloud Storage, Cloud Bigtable, Hojas de cálculo de Google y Google Drive.

Explorar instructivos 
Ir a las guías de inicio rápido 
Cloud Datalab

Cloud Datalab

Cloud Datalab es una herramienta interactiva compilada en Jupyter (anteriormente llamado iPython) creada para explorar, analizar, transformar y visualizar datos, y para compilar modelos de aprendizaje automático en Google Cloud Platform. Se ejecuta en Google Compute Engine y se conecta fácilmente a varios servicios en la nube, de modo que puedes enfocarte en tus tareas de ciencia de datos.

Ir a las guías de inicio rápido 
Iniciar el instructivo 
Cloud ML Engine

Cloud ML Engine

Agrega un nivel adicional de inteligencia a tus canalizaciones mediante la ejecución de transmisiones de eventos a través de los modelos de aprendizaje automático personalizados de TensorFlow, XGBoost o scikit-learn.

Ver la descripción general del entrenamiento 
Tensorflow

TensorFlow

TensorFlow™ es una biblioteca de software de código abierto para procesamiento numérico de alto rendimiento. Su arquitectura flexible permite implementar fácilmente el procesamiento en distintas plataformas (CPU, GPU y TPU) y empleando desde computadoras de escritorio y clústeres de servidores hasta dispositivos móviles y perimetrales.

Ver documentación 
Realizar el curso intensivo sobre AA 
Aceleradores de hardware

Aceleradores de hardware

Los aceleradores de hardware de Google Cloud ofrecen la flexibilidad necesaria para elegir la opción más adecuada con el fin de obtener el mejor rendimiento por dólar en las cargas de trabajo de AA. Elige de una cartera de aceleradores para ejecutar las cargas de entrenamiento y predicciones.

Cloud TPU 
Cloud GPU 
Cloud CPU 
Facets

Facets

Facets proporciona dos sólidos modos de visualización para ayudar a entender y analizar conjuntos de datos de aprendizaje automático. Usa Facets Overview para obtener una idea sobre el estado de cada función de tus conjuntos de datos o Facets Dive a fin de explorar observaciones específicas.

Explorar Facets 

Implementación

Implementa modelos de aprendizaje automático en cualquier lugar.
Kubeflow

Kubeflow

El proyecto Kubeflow está destinado a implementar cargas de trabajo de AA en Kubernetes de manera simple, portátil y escalable. Su objetivo no es volver a crear otros servicios, sino ofrecer un método directo de implementación de sistemas de código abierto de primer nivel para AA en infraestructuras distintas. Puedes ejecutar Kubeflow en cualquier lugar en el que ejecutes Kubernetes.

Leer la entrada de blog 
Kubeflow en GitHub 
Cloud ML Engine

Cloud ML Engine

Cloud ML Engine ofrece servicios de predicciones en línea y por lotes para varios marcos de trabajo de AA. Permite a los científicos de datos ocuparse fácilmente de la puesta en producción de modelos entrenados en cualquier lugar sin necesidad de usar contenedores de Docker ni mecanismos de unión y reparación. Las predicciones en línea son compatibles con marcos de trabajo como scikit-learn, XGBoost, Keras y TensorFlow para entregar modelos de clasificación, regresión, agrupación en clústeres y reducción de la dimensionalidad.

Acceder a una descripción general de las predicciones 

Socios

Busca Socios de aprendizaje automático de Google Cloud y accede a su vasta experiencia en IA a fin de incorporar el aprendizaje automático en relación con una amplia variedad de necesidades y casos prácticos. Según la industria a la que pertenezcas y tus necesidades, puedes elegir las rutas de desarrollo que prefieras. Nuestros socios pueden ayudar en todas las etapas del desarrollo y la entrega de modelos mediante la preparación de los datos para el aprendizaje automático o la provisión de las herramientas y plataformas adecuadas para tu trabajo, lo que incluye soluciones de IA listas para usar y desarrollo de modelos personalizados.
Más información 

Preparación o procesamiento previo de los datos

Busca socios especializados en la preparación de datos para entrenamiento.

Figureeight Alteryx Imerit

Plataformas de ciencia de datos

Descubre plataformas y herramientas para aprendizaje automático y ciencia de datos.

H2O Anaconda R Studio
Google Cloud

Comenzar

Aprende y crea

¿Eres nuevo en GCP? Empieza a utilizar cualquier producto sin costo con un crédito de $300.

¿Necesitas ayuda con un proyecto más grande?

Nuestros expertos te ayudarán a crear la solución adecuada o a encontrar el socio más conveniente según tus necesidades.