Visualiza datos de BigQuery con Data Studio

BigQuery es un almacén de datos estadísticos a escala de petabytes que puedes usar para ejecutar consultas de SQL en grandes cantidades de datos casi en tiempo real.

Las herramientas de visualización de datos pueden ayudarte a comprender los datos de BigQuery y a analizarlos de forma interactiva. Puedes usar herramientas de visualización para que sea más simple identificar tendencias, responder a ellas y hacer predicciones con tus datos. En este instructivo, usarás Google Data Studio para visualizar datos en la tabla de muestra de natalidad de BigQuery.

Objetivos

En este instructivo, harás lo siguiente:

  • Te conectarás a la fuente de datos de BigQuery.
  • Crearás informes y gráficos para visualizar datos de BigQuery

Costos

El conector de BigQuery de Google Data Studio te permite acceder a los datos de tus tablas de BigQuery dentro de Google Data Studio. BigQuery es un producto pago, por lo que se generarán costos de uso cuando accedas a él a través de Data Studio. El precio de consulta de BigQuery proporciona el primer TB por mes de forma gratuita. Para obtener más información, consulta la página de precios de BigQuery.

Antes de comenzar

Antes de comenzar con este instructivo, usa Google Cloud Console para crear o seleccionar un proyecto y habilitar la facturación.

  1. Accede a tu Cuenta de Google.

    Si todavía no tienes una cuenta, regístrate para obtener una nueva.

  2. En la página de selección de proyectos de Cloud Console, selecciona o crea un proyecto de Cloud.

    Ir a la página Selector de proyectos

  3. Comprueba que la facturación esté habilitada en tu proyecto.

    Descubre cómo puedes habilitar la facturación

  4. BigQuery se habilita de forma automática en proyectos nuevos. Para activar BigQuery en un proyecto preexistente, Habilita la API BigQuery.

    Habilita la API

Crea informes y gráficos con Google Data Studio y el conector de BigQuery

En esta sección del instructivo, se usa Google Data Studio para visualizar datos en BigQuery con el conector de BigQuery. Crea una fuente de datos, un informe y gráficos que visualizan datos en la tabla de muestra de natalidad.

Crea una fuente de datos

El primer paso en la creación de un informe en Google Data Studio es crear una fuente de datos para el informe. Un informe puede contener una o más fuentes de datos. Cuando creas una fuente de datos de BigQuery, Google Data Studio usa el conector de BigQuery.

Debes tener los permisos adecuados para agregar una fuente de datos de BigQuery a un informe de Google Data Studio. Además, los permisos usados en los conjuntos de datos de BigQuery se aplicarán a los informes, gráficos y paneles que crees en Google Data Studio. Cuando se comparte un informe de Google Data Studio, solo los usuarios que tienen los permisos adecuados pueden ver los componentes del informe.

Para crear una fuente de datos, haz lo siguiente:

  1. Abre Google Data Studio.

  2. En la página Informes, en la sección Empezar con una plantilla, haz clic en la plantilla Informe vacío. Esto crea un informe nuevo sin título.

    Plantilla en blanco

  3. Si se te solicita, completa las Preferencias de marketing (Marketing Preferences) y la configuración de Cuenta y privacidad (Account and Privacy) y haz clic en Guardar (Save). Es posible que debas volver a hacer clic en la plantilla En blanco (Blank) después de guardar la configuración.

  4. En la ventana Agregar datos al informe, en el cuadro de búsqueda, ingresa BigQuery.

    Agrega fuente de datos

  5. En la sección Conectores de Google (Google Connectors), coloca el cursor sobre BigQuery y, luego, haz clic en Seleccionar (Select).

  6. En Autorización, haz clic en Autorizar. Esto permite que Google Data Studio acceda a tu proyecto de Google Cloud.

  7. En el cuadro de diálogo Solicitud de permiso (Request for permission), haz clic en Permitir (Allow) para que Google Data Studio pueda ver datos en BigQuery. Es posible que no recibas este mensaje si usaste Google Data Studio con anterioridad.

  8. En Mis proyectos (My Projects), haz clic en Conjuntos de datos públicos (Public Datasets).

  9. En Proyecto de facturación (Billing Project), haz clic en el nombre del proyecto de Cloud que creaste anteriormente.

  10. Para Conjunto de datos públicos (Public Dataset), haz clic en muestras (samples).

  11. En Tabla (Table), haz clic en natality.

    tabla de natalidad

  12. En la esquina superior derecha de la ventana, haz clic en Conectar (Connect). Una vez que Google Data Studio se conecta a la fuente de datos de BigQuery, se muestran los campos de la tabla. Puedes usar esta página para ajustar las propiedades del campo o crear nuevos campos calculados.

  13. En la tabla natality, los campos year y source_year se almacenan como números enteros. Para usar estas columnas como strings en Google Data Studio, debes cambiar el tipo de las columnas a texto. A la derecha de los campos year y source_year, en la columna Tipo (Type), haz clic en Número (Number) y elige Texto (Text) en la lista desplegable.

    Diálogo de campo

  14. Haz clic en Agregar al informe (Add to report).

    Agregar al informe

  15. Cuando se te solicite, haz clic en Agregar al informe (Add to report).

  16. En el cuadro de diálogo Solicitud de permiso (Request for permission), haz clic en Permitir (Allow) para que Data Studio pueda ver y administrar archivos en Google Drive. Es posible que no recibas este mensaje si usaste Google Data Studio con anterioridad.

Crea un gráfico de barras con un campo calculado

Una vez que hayas agregado la fuente de datos natalidad al informe, el siguiente paso es crear una visualización. Crea un gráfico de barras para comenzar. El gráfico de barras muestra el número total de nacimientos para cada año. Para mostrar los nacimientos por año, crea un campo calculado.

Para crear un gráfico de barras que muestre el total de nacimientos por año, haz lo siguiente:

  1. De forma opcional, en la parte superior de la página, haz clic en Informe sin título (Untitled Report) para cambiar el nombre del informe. Por ejemplo, escribe BigQuery tutorial.

  2. Después de que se cargue el editor del informe, haz clic en Insertar > Gráfico de barras (Insert > Bar chart).

  3. Coloca el gráfico en tu informe con el controlador.

  4. En la pestaña Datos (Data), observa el valor de Fuente de datos: natality (Data Source: natality) y los valores predeterminados para Dimensión (Dimension) y Métrica (Metric).

  5. Debido a que se registra la cantidad de nacimientos por año, se debe establecer la dimensión en source_year. Si source_year no es la dimensión predeterminada, haz clic y arrastra recurso_año (source_year) desde Campos disponibles (Available Fields) a la dimensión predeterminada para reemplazarla.

  6. En la sección Métrica (Metric), haz clic en Agregar métrica (Add metric).

  7. En el selector de métricas, haz clic en Crear campo (Create field).

  8. Para mostrar un recuento de la cantidad de niños nacidos cada año (por género), debes crear un campo calculado. Para este instructivo, cuenta las entradas en el campo is_male. El valor en is_male es true si el niño es de sexo masculino y false si es de sexo femenino. En la ventana de métrica nueva, en Nombre (Name), escribe birth_count.

  9. En Fórmula (Formula), escribe el siguiente valor: COUNT(is_male).

  10. Haz clic en Aplicar (Apply).

  11. Haz clic en la página de informes para cerrar el selector de métricas.

  12. Después de agregar la métrica, desplázate sobre la métrica predeterminada y haz clic en el ícono de borrar en el lado derecho. Se debe configurar la Dimensión (Dimension) en source_year y la Métrica (Metric) en birth_count.

  13. Observa que, por configuración predeterminada, el gráfico tiene un orden descendente. Los años con más nacimientos se muestran primero.

    Cuadro de nacimientos totales

  14. Para mejorar el gráfico, cambia las etiquetas de la barra. En la ventana de propiedades del gráfico de barras, haz clic en la pestaña Style (Estilo).

  15. En la sección Gráfico de barras (Bar chart), haz clic en Mostrar etiquetas de datos (Show data labels).

    Muestra etiquetas

    La cantidad total de nacimientos se muestra en la parte superior de cada barra en la tabla.

  16. Ordena los datos por source_year, en lugar de birth_count. En la ventana de propiedades del gráfico de barras, en la pestaña Datos (Data), en la sección Ordenar (Sort), realiza lo siguiente:

    • Haz clic en Campo nuevo (New field).
    • En el selector de orden, desplázate hasta Campos de gráfico (Chart fields) y selecciona source_year.
    • Haz clic fuera del cuadro de diálogo para cerrar el selector de orden.
    • Haz clic en Descendente (Descending) y selecciona Ascendente (Ascending). La pantalla cambia para mostrar el número de nacimientos por año en orden ascendente.

    Nacimientos en orden ascendente

Filtra el gráfico

En este momento, el gráfico de barras muestra el número total de niños y niñas nacidos cada año. Agrega un filtro para mostrar solo las niñas nacidas cada año.

  1. En la ventana de propiedades del gráfico de barras, haz clic en la pestaña Datos (Data).

  2. En la sección Filtro (Filter), haz clic en Agregar un filtro (Add a filter).

  3. En la ventana Crear filtro (Create filter), sigue estos pasos:

    • En Nombre (Name), escribe Female birth count.
    • Haz clic en Incluir (Include) y cámbialo a Excluir (Exclude).
    • Haz clic en Seleccionar un campo (Select a field) y elige is_male.
    • Haz clic en Seleccionar una condición (Select a condition) y elige Verdadero (True).
    • Haz clic en Guardar (Save).

    Crear ventana de filtro

Observa que la tabla se actualiza para mostrar solo las niñas nacidas cada año. Observa también que la leyenda no cambia. El nombre de la leyenda aún refleja el nombre de la métrica - birth_count.

Gráfico filtrado

Crea un gráfico con una consulta personalizada

La creación de un gráfico con la opción de consulta personalizada te permite aprovechar las funcionalidades completas de consulta de BigQuery, como las combinaciones, uniones y funciones analíticas.

De forma alternativa, puedes aprovechar las funcionalidades completas de consulta de BigQuery mediante la creación de una vista. Una vista es una tabla virtual definida por una consulta de SQL. Para consultar datos en una vista, agrega el conjunto de datos que contiene la vista como fuente de datos. Para obtener más información sobre las vistas, consulta Usa vistas.

Cuando especificas una consulta de SQL como tu fuente de datos de BigQuery, los resultados de la consulta están en formato de tabla, que se convierte en la definición de campo (esquema) de tu fuente de datos. Cuando usas una consulta personalizada como una fuente de datos, Google Data Studio usa tu SQL como una instrucción de selección interna para cada consulta generada a BigQuery. Para obtener más información sobre consultas personalizadas en Google Data Studio, consulta la ayuda en línea.

Agrega un gráfico de barras con una consulta personalizada

Para agregar un gráfico de barras a tu informe que usa una fuente de datos de consulta personalizada, haz lo siguiente:

  1. Desde las opciones de menú, selecciona Página > Página nueva (Page > New Page).

  2. Haz clic en Insertar > Gráfico de barras (Insert > Bar chart).

  3. Coloca el gráfico en el informe con el controlador.

  4. En la ventana Propiedades del gráfico de barras (Bar chart properties), en la pestaña Datos (Data), observa que la Fuente de datos (Data source) está configurada en natality. Haz clic en natality para abrir la ventana Seleccionar fuente de datos (Select Data Source).

  5. Haz clic en Crear fuente de datos nueva (Create new data source).

  6. En la sección Google Connectors, desplaza el mouse sobre BigQuery y haz clic en Seleccionar (Select).

  7. Para Mis proyectos (My Projects), haz clic en Custom query (Consulta personalizada).

  8. En Proyecto, selecciona tu proyecto de Google Cloud.

  9. Ingresa la siguiente consulta de SQL estándar en la ventana Ingresar consulta personalizada (Enter custom query):

    SELECT
     source_year,
     sum(case when is_male then 1 else 0 end) as male_births,
     sum(case when is_male then 0 else 1 end) as female_births
    FROM
     `bigquery-public-data.samples.natality`
    GROUP BY
     source_year
    ORDER BY
     source_year
    DESC
    

    Esta consulta usa una declaración CASE para evaluar el campo booleano is_male a fin de determinar la cantidad de nacimientos de niñas y niños en un año determinado.

  10. En Query Options (Opciones de consulta), verifica que no esté seleccionada la opción Use Legacy SQL (Usar SQL heredado). Esto te permite usar la sintaxis de SQL estándar de BigQuery.

    Consulta personalizada

  11. En la parte superior de la ventana, haz clic en Fuente de datos sin título (Untitled data source) y cambia el nombre de la fuente de datos a Male female case query.

  12. En la esquina superior derecha de la ventana, haz clic en Conectar (Connect). Después de que Google Data Studio se conecta a la fuente de datos de BigQuery, los resultados de la consulta se usan para determinar el esquema de la tabla.

  13. Cuando se muestra el esquema, observa el tipo y la agregación para cada campo. De forma predeterminada, source_year está formateado como Número (Number), y Agregación (Aggregation) se establece en Ninguno (None). A la derecha del campo source_year, en la columna Tipo (Type), haz clic en Número (Number) y selecciona Texto (Text). Verifica que Agregación (Aggregation) esté configurada en Ninguno (None).

    Gráfico filtrado

  14. Haz clic en Agregar al informe (Add to report).

  15. Cuando se te solicite, haz clic en Agregar al informe (Add to report).

  16. Haz clic en la flecha hacia atrás para cerrar la ventana Seleccionar fuente de datos (Select Data Source).

  17. Es posible que Google Data Studio no pueda determinar de forma correcta la métrica adecuada para el gráfico. Debido a que debes registrar la cantidad de nacimientos de niños y niñas por año, los valores de métrica deben ser female_births y male_births. En la ventana de propiedades del gráfico de barras, en la pestaña Datos (Data), en la sección Métrica (Metric), haz clic en Recuento de registros (Record count).

  18. En el selector de métricas, selecciona Nacimientos de niñas (female_births).

  19. En la sección Métrica (Metric), haz clic en Agregar métrica (Add metric).

  20. En el selector de métricas, selecciona Nacimientos de niños (male_births). Ahora tu cuadro muestra la cantidad de niños y niñas nacidos cada año con barras separadas.

    Gráfico filtrado

  21. El gráfico debe estar ordenado por female_births en orden descendente. Cambia esto a source_year como lo hiciste en el gráfico anterior. En la sección Ordenar (Sort), haz clic en female_births.

  22. En el selector de orden, elige source_year. Ahora la tabla muestra los nacimientos de niñas y niños cada año en orden descendente.

  23. Para mayor legibilidad, cambia los estilos de gráfico. En Propiedades del gráfico de barras (Bar chart properties), haz clic en la pestaña Estilo (Style).

  24. Ten en cuenta que cada barra tiene un color predeterminado según el orden en que se agregaron las métricas al gráfico. Haz clic en el segundo cuadrado de la paleta de colores y cámbialo de rojo a azul.

    Gráfico filtrado

  25. Haz clic en el primer cuadrado de la paleta de colores y cámbialo de azul a rojo.

    El gráfico debería tener el siguiente aspecto:

    Gráfico de barras de color

Observa tu historial de consultas

Puedes ver las consultas enviadas a través del conector de BigQuery en el historial de consultas en la interfaz web de BigQuery. Con el historial de consultas, puedes calcular sus costos y guardarlas para usarlas en otras situaciones.

Para examinar tu historial de consultas, haz lo siguiente:

Console

  1. Abre la página de BigQuery en Cloud Console.

    Ir a la página BigQuery

  2. Haz clic en Historial de consultas (Query history) en la barra de navegación izquierda.

  3. En la lista de consultas, se muestran las consultas más recientes primero. Haz clic en una consulta para ver sus detalles, como el ID de trabajo y los bytes procesados.

IU clásica

  1. Ve a la IU web de BigQuery.

    Ir a la IU web de BigQuery

  2. Haz clic en Historial de consultas (Query History).

  3. En la lista de consultas, se muestran las consultas más recientes primero. Haz clic en Abrir consulta (Open Query) para ver los detalles de la consulta, como el ID de trabajo y los bytes procesados.

    Gráfico de barras de color

Realiza una limpieza

Para evitar que se apliquen cargos a tu cuenta de Google Cloud Platform por los recursos que usaste en este instructivo, haz lo siguiente:

  1. En Cloud Console, ve a la página Administrar recursos.

    Ir a la página Administrar recursos

  2. En la lista de proyectos, selecciona el proyecto que deseas borrar y haz clic en Borrar .
  3. En el cuadro de diálogo, escribe el ID del proyecto y haz clic en Cerrar para borrar el proyecto.

Borrar tu proyecto evita que Google Data Studio consulte los datos, porque la fuente de datos está asociada a tu proyecto. Si no deseas borrar tu proyecto de Cloud Platform, puedes borrar el informe de Google Data Studio y la fuente de datos.

Para borrar los recursos de Google Data Studio, sigue estos pasos:

  1. Abre Google Data Studio.

  2. En la página Informes (Reports), a la derecha del informe del instructivo de BigQuery (BigQuery tutorial), haz clic en el botón “más” (more) botón más y selecciona Quitar (Remove).

  3. Haz clic en Fuentes de datos (Data Sources).

  4. A la derecha de la fuente de datos de natalidad (natality), haz clic en el botón “más” (more) y elige Remover (Remove).

  5. A la derecha de la fuente de datos de consulta de casos femeninos y masculinos (Male female case query), haz clic en el botón “más” (more) y elige Remover(Remove).

Próximos pasos

  • Obtén más información sobre cómo escribir consultas para BigQuery: en la sección sobre cómo consultar datos de la documentación de BigQuery, se explica cómo ejecutar consultas, crear funciones definidas por el usuario (UDF) y mucho más.

  • Explora la sintaxis de BigQuery: el dialecto preferido para realizar consultas de SQL en BigQuery es SQL estándar, que se describe en la Referencia de SQL. La sintaxis similar a SQL heredado de BigQuery se describe en la referencia de consulta (SQL heredado).