Acompáñanos en la Cumbre sobre IA y nube de datos de Google en 2023 para conocer las innovaciones más recientes en IA, estadísticas, IE, bases de datos y mucho más..

Conjuntos de datos

Mejora tus iniciativas de IA y estadísticas con soluciones de datos compiladas previamente y conjuntos de datos valiosos con la tecnología de BigQuery, Cloud Storage, Earth Engine y otros servicios de Google Cloud.

Expande tu ecosistema de datos

Aumenta el valor de tus recursos de datos cuando aumenten tus iniciativas de estadísticas o IA con datos externos. Descubre y accede a conjuntos de datos únicos y valiosos, y soluciones compiladas previamente hechas de proveedores de Google, públicos o comerciales. Con las canalizaciones de datos completamente administradas, puedes enfocarte en lo más importante: obtener estadísticas y valor empresarial.

Obtén más información sobre nuestros conjuntos de datos públicos

Categoría Conjuntos de datos destacados Ejemplos casos de uso y estadísticas
Conjuntos de datos de Google

Con este conjunto de datos, se pueden ver las 25 búsquedas y las 25 consultas más populares de Google Trends de los últimos 30 días. Cada término incluye 5 años de datos históricos de las 210 áreas de mercado designadas (DMA) de EE.UU. y más de 50 países en todo el mundo.

  • ¿Cuáles son los artículos minoristas más populares que las personas buscaron en todo el área?

Ejemplo de Google Analytics

El conjunto de datos proporciona 12 meses (agosto de 2016 a agosto de 2017) de datos ofuscados de Google Analytics 360 que provienen de Google Merchandise Store para mostrar lo que vería un sitio web de comercio electrónico, como la fuente de tráfico, el contenido y los datos transaccionales.

  • ¿Cuál es la cantidad total de transacciones que se generan por navegador del dispositivo?

Investigación de patentes de Google

Los datos de investigación de patentes de Google contienen el resultado de la mayor parte del trabajo de análisis de datos utilizado en patentes de Google (patents.google.com), incluidas las traducciones automáticas de títulos y resúmenes de Google Traductor, en incorporaciones de vectores, términos principales extraídos, documentos similares y referencias futuras.

  • ¿Cuáles son las 20 patentes más recientes?

Conjuntos de datos comerciales
Crux Informatics

Crux Deliver es un servicio administrado para ingeniería y operaciones de datos. Crux conecta a todos los proveedores de datos tradicionales y alternativos en nombre de sus clientes y administra todos los aspectos de integración, ingeniería de datos y operaciones. Todos los conjuntos de datos se validan para que solo entreguemos datos limpios y procesables.

  • ¿Qué conjuntos de datos Crux puede ayudarme a incorporar a mi ecosistema de datos?

Exchange Data International

Exchange Data International (EDI) ayuda a la comunidad financiera y de inversión mundial a tomar decisiones fundamentadas. La extensa base de datos del contenido de EDI incluye acciones corporativas a largo plazo, capital fijo, dividendos, datos de referencia estáticos, precios de cierre y acciones en circulación en todo el mundo.

  • Comprender los eventos históricos que afectan las acciones y las ETF

Factset

FactSet es un proveedor global de información financiera integrada, aplicaciones analíticas y servicios líderes en el sector que ofrecen contenido, estadísticas y tecnología flexible superiores.

  • Realiza un seguimiento de varias versiones de acuerdos de fusión para mejorar tu proceso de inversión.

HouseCanary

Acceso instantáneo a información confiable sobre propiedades, préstamos y valoración para 100 millones de hogares. Los algoritmos de AA procesan cientos de fuentes de datos para proporcionar índices de precio en vivienda de 381 áreas metropolitanas, 18,300 códigos postales y 4 millones de bloques que abarcan más del 95% del mercado residencial de EE.UU. 

  • Toma decisiones de inversión a partir de la volatilidad histórica de 40 años o la previsión de 3 años.

LinkUp

LinkUp, el líder mundial en estadísticas y datos precisos, en tiempo real y predictivos sobre el mercado de trabajo, ofrece soluciones de datos de propiedad que les permiten a los clientes obtener estadísticas valiosas sobre el mercado laboral global y ayudan a los inversionistas a generar alfa a nivel macro, del sector, de la ubicación geográfica y de la empresa individual.

  • Crear indicadores y modelos para evaluar y predecir el crecimiento del trabajo a nivel de sector.

London Energy Brokers Association

La solución de la LEBA permite a los clientes acceder a una vista consolidada y única de los mercados de energía proveniente de los principales agentes de energía. Los productores de energía, petróleo y gas, mayoristas, usuarios, servicios públicos y comercios financieros se benefician de la información de mercado independiente basada en la actividad comercializada en lugar de en las evaluaciones de precios.

  • Información sobre los precios de energía en los países de Europa

Neustar

Neustar, Inc., una empresa de TransUnion, es una empresa líder en la resolución de identidades que proporciona datos y tecnología que permiten conexiones de confianza entre empresas y personas en los momentos más importantes. Neustar ofrece soluciones líderes en la industria en relación con las áreas de marketing, riesgo y comunicaciones.

  • Mejora los datos de los clientes y crea bases de datos de consumidores enfocadas en la privacidad.

RS Metrics

RS Metrics, la empresa líder en datos de ESG en tiempo real, objetivos y verificables a nivel de recursos, les brinda a los clientes la capacidad de acceder a estadísticas precisas sobre los niveles de inventario de fábrica de los fabricantes de VE.

  • Crea comparativas independientes, comprobables y objetivas de la producción de automóviles de tipo VE.

Ursa Space Systems

Ursa Space Systems, un proveedor global de infraestructura de inteligencia satelital, brinda a los clientes la posibilidad de supervisar las tendencias económicas globales con datos derivados de imágenes satelitales que se actualizan semanalmente.

  • ¿Cuál es la dirección probable de las comparativas del precio del petróleo y los spreads regionales?

Conjuntos de datos públicos
Detalles de eventos de tormentas intensas

La base de datos de eventos de tormentas es una base de datos integrada de eventos climáticos graves en los Estados Unidos desde 1950 hasta este año, con información sobre la ubicación, la azimuth, la distancia, el impacto, la gravedad y los costos de los daños a las propiedades y cultivos.

Límites en la oficina del censo de EE.UU.

Estos son archivos de límite de resolución completa, derivados de TIGER/Line Shapefiles, los productos geográficos principales y totalmente compatibles de la Oficina del Censo de EE.UU. Estos datos incluyen información sobre los 50 estados, el distrito de Columbia, Puerto Rico y las áreas insulares de las islas.

  • Caso de uso: Desarrolla un índice de urbanización para minoristas

American Community Survey

La American Community Survey (ACS) es una encuesta continua que proporciona información vital de forma anual sobre nuestra nación y sus habitantes mediante la comunicación con más de 3.5 millones de hogares de todo el país. Los datos resultantes proporcionan información demográfica con muchos detalles en todo el país estadounidense en distintos niveles geográficos.

  • Caso de uso: Tendencias de crecimiento demográfico como entradas para el análisis de selección de instalaciones o sitios

Todos los conjuntos de datos públicos

Busca más de 200 conjuntos de datos enumerados en Google Cloud Marketplace y accede a ellos.

  • ¿Qué conjuntos de datos pueden ayudar a proporcionar un contexto más profundo para nuestros flujos de trabajo de estadísticas o de IA?

Conjuntos de datos de Earth Engine
Earth Engine

El archivo de datos públicos de Earth Engine incluye más de cuarenta años de imágenes históricas y conjuntos de datos científicos, que se actualizan a diario y están disponibles para el análisis en línea.

  • ¿Cómo ha cambiado la temperatura de la superficie durante los últimos 30 años?

  • ¿Cómo era esta área antes del año 2000?

Conjuntos de datos de Kaggle
Conjuntos de datos de Kaggle

En Kaggle, encontrarás todo el código y los datos que necesitas para trabajar en la ciencia de datos. Usa más de 80,000 conjuntos de datos públicos y 400,000 notebooks públicos para conquistar cualquier análisis en muy poco tiempo.

  • ¿Puedes abordar algunos de los problemas más comunes y provocativos en la ciencia de datos?

Conjuntos de datos sintéticos
Cymbal Investments

Los datos sintéticos representan transacciones de bots de negociación automatizados operados por el grupo ficticio Cymbal Investments, cada uno de los cuales usa un solo algoritmo para guiar sus decisiones comerciales. Los registros derivan de los informes de captura comercial  del protocolo FIX (versión 4.4) cargados en BigQuery. 

  • ¿Cuánto fabricaban los comerciantes de cada comercio?

Conjuntos de datos de investigación

El programa de Búsqueda de Datasets de Google indexó casi 25 millones de conjuntos de datos de toda la Web, lo que te permite buscar conjuntos de datos desde un solo lugar y encontrar vínculos a las ubicaciones. Filtra por compras recientes, formato, tema y mucho más.

  • ¿Qué conjuntos de datos existen para < palabra clave que te interesa >?

  • ¿Qué conjuntos de datos de sustentabilidad del año pasado son gratuitos para uso comercial?

Con este conjunto de datos, se pueden ver las 25 búsquedas y las 25 consultas más populares de Google Trends de los últimos 30 días. Cada término incluye 5 años de datos históricos de las 210 áreas de mercado designadas (DMA) de EE.UU. y más de 50 países en todo el mundo.

  • ¿Cuáles son los artículos minoristas más populares que las personas buscaron en todo el área?

Ejemplo de Google Analytics

El conjunto de datos proporciona 12 meses (agosto de 2016 a agosto de 2017) de datos ofuscados de Google Analytics 360 que provienen de Google Merchandise Store para mostrar lo que vería un sitio web de comercio electrónico, como la fuente de tráfico, el contenido y los datos transaccionales.

  • ¿Cuál es la cantidad total de transacciones que se generan por navegador del dispositivo?

Investigación de patentes de Google

Los datos de investigación de patentes de Google contienen el resultado de la mayor parte del trabajo de análisis de datos utilizado en patentes de Google (patents.google.com), incluidas las traducciones automáticas de títulos y resúmenes de Google Traductor, en incorporaciones de vectores, términos principales extraídos, documentos similares y referencias futuras.

  • ¿Cuáles son las 20 patentes más recientes?

Crux Informatics

Crux Deliver es un servicio administrado para ingeniería y operaciones de datos. Crux conecta a todos los proveedores de datos tradicionales y alternativos en nombre de sus clientes y administra todos los aspectos de integración, ingeniería de datos y operaciones. Todos los conjuntos de datos se validan para que solo entreguemos datos limpios y procesables.

  • ¿Qué conjuntos de datos Crux puede ayudarme a incorporar a mi ecosistema de datos?

Exchange Data International

Exchange Data International (EDI) ayuda a la comunidad financiera y de inversión mundial a tomar decisiones fundamentadas. La extensa base de datos del contenido de EDI incluye acciones corporativas a largo plazo, capital fijo, dividendos, datos de referencia estáticos, precios de cierre y acciones en circulación en todo el mundo.

  • Comprender los eventos históricos que afectan las acciones y las ETF

Factset

FactSet es un proveedor global de información financiera integrada, aplicaciones analíticas y servicios líderes en el sector que ofrecen contenido, estadísticas y tecnología flexible superiores.

  • Realiza un seguimiento de varias versiones de acuerdos de fusión para mejorar tu proceso de inversión.

HouseCanary

Acceso instantáneo a información confiable sobre propiedades, préstamos y valoración para 100 millones de hogares. Los algoritmos de AA procesan cientos de fuentes de datos para proporcionar índices de precio en vivienda de 381 áreas metropolitanas, 18,300 códigos postales y 4 millones de bloques que abarcan más del 95% del mercado residencial de EE.UU.

  • Toma decisiones de inversión a partir de la volatilidad histórica de 40 años o la previsión de 3 años.

LinkUp

LinkUp, el líder mundial en estadísticas y datos precisos, en tiempo real y predictivos sobre el mercado de trabajo, ofrece soluciones de datos de propiedad que les permiten a los clientes obtener estadísticas valiosas sobre el mercado laboral global y ayudan a los inversionistas a generar alfa a nivel macro, del sector, de la ubicación geográfica y de la empresa individual.

  • Crear indicadores y modelos para evaluar y predecir el crecimiento del trabajo a nivel de sector.

London Energy Brokers Association

La solución de la LEBA permite a los clientes acceder a una vista consolidada y única de los mercados de energía proveniente de los principales agentes de energía. Los productores de energía, petróleo y gas, mayoristas, usuarios, servicios públicos y comercios financieros se benefician de la información de mercado independiente basada en la actividad comercializada en lugar de en las evaluaciones de precios.

  • Información sobre los precios de energía en los países de Europa

Neustar

Neustar, Inc., una empresa de TransUnion, es una empresa líder en la resolución de identidades que proporciona datos y tecnología que permiten conexiones de confianza entre empresas y personas en los momentos más importantes. Neustar ofrece soluciones líderes en la industria en relación con las áreas de marketing, riesgo y comunicaciones.

  • Mejora los datos de los clientes y crea bases de datos de consumidores enfocadas en la privacidad.

RS Metrics

RS Metrics, la empresa líder en datos de ESG en tiempo real, objetivos y verificables a nivel de recursos, les brinda a los clientes la capacidad de acceder a estadísticas precisas sobre los niveles de inventario de fábrica de los fabricantes de VE.

  • Crea comparativas independientes, comprobables y objetivas de la producción de automóviles de tipo VE.

Ursa Space Systems

Ursa Space Systems, un proveedor global de infraestructura de inteligencia satelital, brinda a los clientes la posibilidad de supervisar las tendencias económicas globales con datos derivados de imágenes satelitales que se actualizan semanalmente.

  • ¿Cuál es la dirección probable de las comparativas del precio del petróleo y los spreads regionales?

Detalles de evento de tormenta intensa

La base de datos de eventos de tormentas es una base de datos integrada de eventos climáticos graves en los Estados Unidos desde 1950 hasta este año, con información sobre la ubicación, la azimuth, la distancia, el impacto, la gravedad y los costos de los daños a las propiedades y cultivos.

Límites en la oficina del censo de EE.UU.

Estos son archivos de límite de resolución completa, derivados de TIGER/Line Shapefiles, los productos geográficos principales y totalmente compatibles de la Oficina del Censo de EE.UU. Estos datos incluyen información sobre los 50 estados, el distrito de Columbia, Puerto Rico y las áreas insulares de las islas.

  • Caso de uso: Desarrolla un índice de urbanización para minoristas

American Community Survey

La American Community Survey (ACS) es una encuesta continua que proporciona información vital de forma anual sobre nuestra nación y sus habitantes mediante la comunicación con más de 3.5 millones de hogares de todo el país. Los datos resultantes proporcionan información demográfica con muchos detalles en todo el país estadounidense en distintos niveles geográficos.

  • Caso de uso: Tendencias de crecimiento demográfico como entradas para el análisis de selección de instalaciones o sitios

Todos los conjuntos de datos públicos

Busca más de 200 conjuntos de datos enumerados en Google Cloud Marketplace y accede a ellos.

  • ¿Qué conjuntos de datos pueden ayudar a proporcionar un contexto más profundo para nuestros flujos de trabajo de estadísticas o de IA?

Earth Engine

El archivo de datos públicos de Earth Engine incluye más de cuarenta años de imágenes históricas y conjuntos de datos científicos, que se actualizan a diario y están disponibles para el análisis en línea.

  • ¿Cómo ha cambiado la temperatura de la superficie durante los últimos 30 años?

  • ¿Cómo era esta área antes del año 2000?

Conjuntos de datos de Kaggle

En Kaggle, encontrarás todo el código y los datos que necesitas para trabajar en la ciencia de datos. Usa más de 80,000 conjuntos de datos públicos y 400,000 notebooks públicos para conquistar cualquier análisis en muy poco tiempo.

  • ¿Puedes abordar algunos de los problemas más comunes y provocativos en la ciencia de datos?

Cymbal Investments

Los datos sintéticos representan transacciones de bots de negociación automatizados operados por el grupo ficticio Cymbal Investments, cada uno de los cuales usa un solo algoritmo para guiar sus decisiones comerciales. Los registros derivan de los informes de captura comercial  del protocolo FIX (versión 4.4) cargados en BigQuery. 

  • ¿Cuánto fabricaban los comerciantes de cada comercio?

Búsqueda de Datasets

El programa de Búsqueda de Datasets de Google indexó casi 25 millones de conjuntos de datos de toda la Web, lo que te permite buscar conjuntos de datos desde un solo lugar y encontrar vínculos a las ubicaciones. Filtra por compras recientes, formato, tema y mucho más.

  • ¿Qué conjuntos de datos existen para < palabra clave que te interesa >?

  • ¿Qué conjuntos de datos de sustentabilidad del año pasado son gratuitos para uso comercial?

¿Te sientes inspirado? Trabajemos juntos para abordar tus desafíos.

Obtén información sobre cómo los conjuntos de datos de Google Cloud transforman la manera en que opera tu empresa con datos y soluciones precompiladas.
Comunicarse con Ventas
Si hay un conjunto de datos públicos que te gustaría integrar, comunícate con public-data-help@google.com.

Con la zona de pruebas de BigQuery, puedes probar la experiencia completa de BigQuery sin tener una cuenta de facturación ni una tarjeta de crédito.

Historias de clientes y socios de datos

Obtén más información sobre ambos lados del ecosistema del conjunto de datos: los proveedores y los consumidores de datos.