Visualiza datos de BigQuery con Data Studio

BigQuery es un almacén de datos de estadísticas a escala de petabytes que puedes usar para ejecutar consultas de SQL en grandes cantidades de datos casi en tiempo real.

Las herramientas de visualización de datos pueden ayudarte a comprender los datos de BigQuery y a analizarlos de forma interactiva. Puedes usar herramientas de visualización para que sea más simple identificar tendencias, responder a ellas y hacer predicciones con tus datos. En este instructivo, usarás Google Data Studio para visualizar datos en la tabla de muestra de natalidad de BigQuery.

Objetivos

En este instructivo, harás lo siguiente:

  • Conectarse a la fuente de datos de BigQuery
  • Crear informes y gráficos para visualizar datos de BigQuery

Costos

El conector de BigQuery de Google Data Studio te permite acceder a los datos de tus tablas de BigQuery dentro de Google Data Studio. BigQuery es un producto pago, por lo que se generarán costos de uso cuando accedas a él a través de Data Studio. El precio de consulta de BigQuery proporciona el primer TB por mes de forma gratuita. Para obtener más información, consulta la página de precios de BigQuery.

Antes de comenzar

Antes de comenzar con este instructivo, usa Google Cloud Console para crear o seleccionar un proyecto y habilitar la facturación.

  1. Accede a tu Cuenta de Google.

    Si todavía no tienes una cuenta, regístrate para obtener una nueva.

  2. Selecciona o crea un proyecto de GCP.

    Ir a la página Administrar recursos

  3. Comprueba que la facturación esté habilitada en tu proyecto.

    Descubre cómo puedes habilitar la facturación

  4. BigQuery se habilita de forma automática en proyectos nuevos. Para activar BigQuery en un proyecto preexistente, dirígete a Habilita las BigQuery API necesarias.

    Habilita las API

Crea informes y gráficos con Google Data Studio y el conector de BigQuery

En esta sección del instructivo, se usa Google Data Studio para visualizar datos en BigQuery con el conector de BigQuery. Crea una fuente de datos, un informe y gráficos que visualizan datos en la tabla de muestra de natalidad.

Crea una fuente de datos

El primer paso en la creación de un informe en Google Data Studio es crear una fuente de datos para el informe. Un informe puede contener una o más fuentes de datos. Cuando creas una fuente de datos de BigQuery, Google Data Studio usa el conector de BigQuery.

Debes tener los permisos adecuados para agregar una fuente de datos de BigQuery a un informe de Google Data Studio. Además, los permisos usados en los conjuntos de datos de BigQuery se aplicarán a los informes, gráficos y paneles que crees en Google Data Studio. Cuando se comparte un informe de Google Data Studio, solo los usuarios que tienen los permisos adecuados pueden ver los componentes del informe.

Para crear una fuente de datos, haz lo siguiente:

  1. Abre Google Data Studio.

  2. En la página Reports (Informes), en la sección Start a new report (Comenzar un informe nuevo), haz clic en la plantilla Blank (En blanco). Esto crea un informe nuevo sin título.

    Plantilla en blanco

  3. Si se te solicita, completa las Preferencias de marketing (Marketing Preferences) y la configuración de Cuenta y privacidad (Account and Privacy) y haz clic en Guardar (Save). Es posible que debas volver a hacer clic en la plantilla En blanco (Blank) después de guardar la configuración.

  4. En la ventana Agregar una fuente de datos (Add a data source), haz clic en Crear una fuente de datos nueva (Create new data source).

    Agrega fuente de datos

  5. En la sección Conectores de Google (Google Connectors), desplázate sobre BigQuery (BigQuery) y, luego, haz clic en Seleccionar (Select).

  6. En Autorización, haz clic en Autorizar. Esto permite que Google Data Studio acceda a tu proyecto de GCP.

  7. En el cuadro de diálogo Solicitud de permiso, haz clic en Permitir para que Google Data Studio pueda ver datos en BigQuery. Es posible que no recibas este mensaje si usaste Google Data Studio con anterioridad.

  8. En My Projects (Mis proyectos), haz clic en Public Datasets (Conjuntos de datos públicos).

  9. Para Billing Project (Proyecto de facturación), haz clic en el nombre del proyecto de GCP que creaste antes.

  10. Para Conjunto de datos públicos (Public Dataset), haz clic en muestras (samples).

  11. En Tabla (Table), haz clic en natality.

    tabla de natalidad

  12. En la esquina superior derecha de la ventana, haz clic en Conectar (Connect). Una vez que Google Data Studio se conecta a la fuente de datos de BigQuery, se muestran los campos de la tabla. Puedes usar esta página para ajustar las propiedades del campo o crear nuevos campos calculados.

  13. En la tabla natality, los campos year y source_year se almacenan como números enteros. Para usar estas columnas como strings en Google Data Studio, debes cambiar el tipo de las columnas a texto. A la derecha de los campos year y source_year, en la columna Tipo (Type), haz clic en Número (Number) y elige Texto (Text) en la lista. desplegable.

    Diálogo de campo

  14. Haz clic en Agregar al informe (Add to report).

    Agregar al informe

  15. Cuando se te solicite, haz clic en Agregar al informe (Add to report).

  16. En el cuadro de diálogo Solicitud de permiso, haz clic en Permitir para que Data Studio pueda ver y administrar archivos en Google Drive. Es posible que no recibas este mensaje si usaste Google Data Studio con anterioridad.

Crea un gráfico de barras con un campo calculado

Una vez que hayas agregado la fuente de datos natalidad al informe, el siguiente paso es crear una visualización. Crea un gráfico de barras para comenzar. El gráfico de barras muestra el número total de nacimientos para cada año. Para mostrar los nacimientos por año, crea un campo calculado.

Para crear un gráfico de barras que muestre el total de nacimientos por año, haz lo siguiente:

  1. De forma opcional, en la parte superior de la página, haz clic en Informe sin título para cambiar el informe. Por ejemplo, escribe BigQuery tutorial.

  2. Después de que se cargue el editor del informe, haz clic en Insertar > Gráfico de barras.

  3. Coloca el gráfico en tu informe con el controlador.

  4. En la pestaña Datos, observa el valor de Data Source (natality) (Fuente de datos: natality) y los valores predeterminados para Dimension (Dimensión) y Metric (Métrica).

  5. Debido a que se registra la cantidad de nacimientos por año, se debe establecer la dimensión en source_year. Si source_year no es la dimensión predeterminada, haz clic y arrastra source_year desde Campos disponibles a la dimensión predeterminada para reemplazarla.

  6. En la sección Métrica, haz clic en Agregar métrica.

  7. En el selector de métricas, haz clic en Crear campo.

  8. Para mostrar un recuento de la cantidad de niños nacidos cada año (por género), debes crear un campo calculado. Para este instructivo, cuenta las entradas en el campo is_male. El valor en is_male es true si el niño es de sexo masculino y false si es de sexo femenino. En la ventana de métrica nueva, en Nombre, escribe birth_count.

  9. En Fórmula, escribe el valor siguiente: COUNT(is_male).

  10. Haz clic en Aplicar.

  11. Haz clic en la página de informes para cerrar el selector de métricas.

  12. Después de agregar la métrica, desplázate sobre la métrica predeterminada y haz clic en el ícono de borrar en el lado derecho. Se debe configurar la Dimensión en source_year y la Métrica en birth_count.

  13. Observa que, por configuración predeterminada, el gráfico tiene un orden descendente. Los años con más nacimientos se muestran primero.

    Cuadro de nacimientos totales

  14. Para mejorar el gráfico, cambia las etiquetas de la barra. En la ventana de propiedades del gráfico de barras, haz clic en Style (Estilo).

  15. En la sección Gráfico de barras (Bar chart), haz clic en Mostrar etiquetas de datos (Show data labels).

    Muestra etiquetas

    La cantidad total de nacimientos se muestra en la parte superior de cada barra en la tabla.

  16. Ordena los datos por source_year, en lugar de birth_count. En la ventana de propiedades del gráfico de barras, en la pestaña Datos (Data), en la sección Ordenar (Sort), realiza lo siguiente:

    • Haz clic en Campo nuevo (New field).
    • En el selector de orden, desplázate hasta Campos de gráfico (Chart fields) y selecciona source_year.
    • Haz clic fuera del cuadro de diálogo para cerrar el selector de orden.
    • Haz clic en Descendente y selecciona Ascendente. La pantalla cambia para mostrar la cantidad de nacimientos por año en orden ascendente.

    Nacimientos en orden ascendente

Filtra el gráfico

En este momento, el gráfico de barras muestra el número total de niños y niñas nacidos cada año. Agrega un filtro para mostrar solo las niñas nacidas cada año.

  1. En la ventana de propiedades del gráfico de barras, haz clic en la pestaña Datos (Datos).

  2. En la sección Filter (Filtro), haz clic en Add a filter (Agregar un filtro).

  3. En la ventana Create filter (Crear filtro), sigue estos pasos:

    • En Nombre (Name), escribe Female birth count.
    • Haz clic en Incluir (Include) y cámbialo a Excluir (Exclude).
    • Haz clic en Seleccionar un campo (Select a field) y elige is_male.
    • Haz clic en Seleccionar una condición (Select a condition) y elige Verdadero (True).
    • Haz clic en Guardar (Save).

    Crear ventana de filtro

Observa que la tabla se actualiza para mostrar solo las niñas nacidas cada año. Observa también que la leyenda no cambia. El nombre de la leyenda aún refleja el nombre de la métrica - birth_count.

Gráfico filtrado

Crea un gráfico con una consulta personalizada

La creación de un gráfico con la opción de consulta personalizada te permite aprovechar las funcionalidades completas de consulta de BigQuery, como las combinaciones, uniones y funciones analíticas.

De forma alternativa, puedes aprovechar las funcionalidades completas de consulta de BigQuery mediante la creación de una vista. Una vista es una tabla virtual definida por una consulta de SQL. Para consultar datos en una vista, agrega el conjunto de datos que contiene la vista como fuente de datos. Para obtener más información sobre las vistas, consulta Usa vistas.

Cuando especificas una consulta de SQL como tu fuente de datos de BigQuery, los resultados de la consulta están en formato de tabla, que se convierte en la definición de campo (esquema) de tu fuente de datos. Cuando usas una consulta personalizada como una fuente de datos, Google Data Studio usa tu SQL como una instrucción de selección interna para cada consulta generada a BigQuery. Para obtener más información sobre consultas personalizadas en Google Data Studio, consulta la ayuda en línea.

Agrega un gráfico de barras con una consulta personalizada

Para agregar un gráfico de barras a tu informe que usa una fuente de datos de consulta personalizada, haz lo siguiente:

  1. Desde las opciones de menú Página > Página nueva (Page > New Page).

  2. Haz clic en Insertar > Gráfico de barras.

  3. Coloca el gráfico en el informe con el controlador.

  4. En la ventana Propiedades del gráfico de barras (Bar chart properties), en la pestaña Datos (Data), observa que la Fuente de datos (Data source) está configurada en natality. Haz clic en natality para abrir la ventana Seleccionar fuente de datos (Select Data Source).

  5. Haz clic en Crear fuente de datos nueva (Create new data source).

  6. En la sección Google Connectors, desplaza el mouse sobre BigQuery y haz clic en Select.

  7. Para My Projects, haz clic en Custom query (Consulta personalizada).

  8. Para Project (Proyecto), selecciona tu proyecto de GCP.

  9. Ingresa la consulta siguiente de SQL estándar en la ventana Ingresar consulta personalizada (Enter custom query):

    SELECT
     source_year,
     sum(case when is_male then 1 else 0 end) as male_births,
     sum(case when is_male then 0 else 1 end) as female_births
    FROM
     `bigquery-public-data.samples.natality`
    GROUP BY
     source_year
    ORDER BY
     source_year
    DESC
    

    Esta consulta usa una declaración CASE para evaluar el campo booleano is_male a fin de determinar la cantidad de nacimientos de niñas y niños en un año determinado.

  10. En Opciones de consulta (Query Options), verifica que no esté seleccionada la opción Usar SQL heredado (Use Legacy SQL). Esto te permite usar la sintaxis de SQL estándar de BigQuery.

    Consulta personalizada

  11. En la parte superior de la ventana, haz clic en Fuente de datos sin título (Untitled data source) y cambia el nombre de la fuente de datos a Male female case query.

  12. En la esquina superior derecha de la ventana, haz clic en Conectar (Connect). Después de que Google Data Studio se conecta a la fuente de datos de BigQuery, los resultados de la consulta se usan para determinar el esquema de la tabla.

  13. Cuando se muestra el esquema, observa el tipo y la agregación para cada campo. De forma predeterminada, source_year está formateado como Número (Number), y Agregación (Aggregation) se establece en Ninguno (None). A la derecha del campo source_year, en la columna Tipo (Type), haz clic en Número y selecciona Texto (Text). Verifica que Agregación (Aggregation) está configurada en Ninguno (None).

    Gráfico filtrado

  14. Haz clic en Agregar al informe (Add to report).

  15. Cuando se te solicite, haz clic en Add to report.

  16. Haz clic en la flecha hacia atrás para cerrar la ventana Seleccionar fuente de datos.

  17. Es posible que Google Data Studio no pueda determinar de forma correcta la métrica adecuada para el gráfico. Debido a que debes registrar la cantidad de nacimientos de niños y niñas por año, los valores de métrica deben ser female_births y male_births. En la ventana de propiedades del gráfico de barras, en la pestaña Datos (Data), en la sección Métrica (Metric), haz clic en Recuento de registros (Record count).

  18. En el selector de métricas, selecciona female_births.

  19. En la sección Métrica, haz clic en Agregar métrica.

  20. En el selector de métricas, selecciona male_births. Ahora tu cuadro muestra la cantidad de niños y niñas nacidos cada año con barras separadas.

    Gráfico filtrado

  21. El gráfico debe estar ordenado por female_births en orden descendente. Cambia esto a source_year como lo hiciste en el gráfico anterior. En la sección Ordenar (Sort), haz clic en female_births.

  22. En el selector de orden, elige source_year. Ahora la tabla muestra los nacimientos de niñas y niños cada año en orden descendente.

  23. Para mayor legibilidad, cambia los estilos de gráfico. En Bar chart properties, haz clic en la pestaña Style.

  24. Ten en cuenta que cada barra tiene un color predeterminado según el orden en que se agregaron las métricas al gráfico. Haz clic en el segundo cuadrado de la paleta de colores y cámbialo de rojo a azul.

    Gráfico filtrado

  25. Haz clic en el primer cuadrado de la paleta de colores y cámbialo de azul a rojo.

    El gráfico debería tener el aspecto siguiente:

    Gráfico de barras de color

Observa tu historial de consultas

Puedes ver las consultas enviadas a través del conector de BigQuery en el historial de consultas en la interfaz web de BigQuery. Con el historial de consultas, puedes calcular sus costos y guardarlas para usarlas en otras situaciones.

Para examinar tu historial de consultas, haz lo siguiente:

Console

  1. Abre la IU web de BigQuery en Cloud Console.
    Ir a la IU web de BigQuery

  2. Haz clic en Historial de consultas (Query history) en la barra de navegación izquierda.

  3. En la lista de consultas, se muestran las consultas más recientes primero. Haz clic en una consulta para ver sus detalles, como el ID de trabajo y los bytes procesad s.

IU clásica

  1. Ve a la IU web de BigQuery.

    Ir a la IU web de BigQuery

  2. Haz clic en Query History (Historial de consultas).

  3. En la lista de consultas, se muestran las consultas más recientes primero. Haz clic en Abrir consulta (Open Query) para ver los detalles de la consulta, como el ID de trabajo y los bytes procesados.

    Gráfico de barras de color

Cómo realizar una limpieza

Sigue estos pasos para evitar que se apliquen cargos a tu cuenta de Google Cloud Platform por los recursos que usaste en este instructivo:

  1. En la GCP Console, dirígete a la página Proyectos.

    Ir a la página Proyectos

  2. En la lista de proyectos, selecciona el proyecto que deseas borrar y haz clic en Borrar.
  3. En el cuadro de diálogo, escribe el ID del proyecto y, luego, haz clic en Cerrar para borrar el proyecto.

Borrar tu proyecto evita que Google Data Studio consulte los datos, porque la fuente de datos está asociada a tu proyecto. Si no deseas borrar tu proyecto de Cloud Platform, puedes borrar el informe de Google Data Studio y la fuente de datos.

Para borrar los recursos de Google Data Studio, sigue estos pasos:

  1. Abre Google Data Studio.

  2. En la página Informes, a la derecha del informe del instructivo de BigQuery, haz clic en el botón “más” botón más y selecciona Quitar.

  3. Haz clic en Fuentes de datos.

  4. A la derecha de la fuente de datos de natalidad, haz clic en el botón “más” y elige Remove.

  5. A la derecha de la fuente de datos de Consulta de casos femeninos y masculinos, haz clic en el botón “más” y elige Quitar.

Pasos siguientes

  • Obtén más información sobre cómo escribir consultas para BigQuery: en la sección sobre cómo consultar datos de la documentación de BigQuery, se explica cómo ejecutar consultas, crear funciones definidas por el usuario (UDF) y mucho más.

  • Explora la sintaxis de BigQuery: el dialecto preferido para realizar consultas de SQL en BigQuery es SQL estándar, que se describe en la Referencia de SQL. La sintaxis similar a SQL heredado de BigQuery se describe en la Referencia de consulta (SQL heredado).

¿Te ha resultado útil esta página? Enviar comentarios:

Enviar comentarios sobre...