Crea un modelo de agrupamiento en clústeres de k-means

BigQuery ML admite el aprendizaje no supervisado. Puedes aplicar el algoritmo k-means para agrupar tus datos en clústeres. A diferencia del aprendizaje automático supervisado, que es sobre estadísticas predictivas, el aprendizaje no supervisado tiene que ver con estadísticas descriptivas. Se trata de comprender los datos para poder tomar decisiones basadas en datos.

En este instructivo, usarás un modelo de k-means en BigQuery ML para compilar clústeres de datos en el conjunto de datos públicos Alquileres de bicicletas de Londres. Los datos de Alquileres de bicicletas de Londres contienen la cantidad de alquileres del Esquema de alquileres de bicicletas Santander de Londres desde 2011 hasta el presente. Los datos incluyen marcas de tiempo de inicio y parada, nombres de estaciones y duración del viaje.

Las consultas de este instructivo utilizan Funciones geográficas disponibles en BigQuery GIS. Para obtener más información sobre BigQuery GIS, consulta Introducción a BigQuery GIS.

Objetivos

En este instructivo, harás lo siguiente:

  • Crear un modelo de agrupamiento en clústeres de k-means
  • Usar Google Data Studio para visualizar tu modelo
  • Tomar decisiones basadas en datos en función de tu modelo

Costos

En este instructivo, se usan componentes facturables de Cloud Platform, incluidos los siguientes:

  • BigQuery
  • BigQuery ML

Para obtener más información sobre los costos de BigQuery, consulta la página de precios de BigQuery.

Para obtener más información sobre los costos de BigQuery ML, consulta la página de precios de BigQuery ML.

Antes de comenzar

  1. Accede a tu Cuenta de Google.

    Si todavía no tienes una cuenta, regístrate para obtener una nueva.

  2. Selecciona o crea un proyecto de GCP.

    Ir a la página Administrar recursos

  3. Asegúrate de tener habilitada la facturación para tu proyecto.

    Aprende a habilitar la facturación

  4. BigQuery se habilita de forma automática en proyectos nuevos. Para activar BigQuery en un proyecto preexistente, ve a Habilita las BigQuery API necesarias.

    Habilita las API

Introducción

Tus datos pueden contener clústeres de datos o agrupaciones naturales. Es posible que desees identificar estas agrupaciones de forma descriptiva para tomar decisiones basadas en datos. Por ejemplo, es posible que un minorista quiera identificar agrupaciones naturales de clientes que tengan hábitos o lugares de compra similares. Este proceso se conoce como segmentación de clientes.

Los datos que usas para realizar la segmentación de clientes pueden incluir la tienda que visitaron, los artículos que compraron, cuánto pagaron, etcétera. Deberías crear un modelo para tratar de entender cómo son estos grupos de clientes a fin de que puedas diseñar artículos que atraigan a los miembros del grupo.

También puedes encontrar grupos de productos entre los artículos comprados. En este caso, agruparías los artículos en clústeres, en función de quién los compró, cuándo se compraron, dónde se compraron, etcétera. Deberías crear un modelo para determinar las características de un grupo de productos para que puedas tomar decisiones fundamentadas, como la forma de mejorar la venta cruzada.

En este instructivo, usas BigQuery ML para crear un modelo de k-means que agrupa en clústeres los datos de Alquileres de bicicletas en Londres en función de los atributos de las estaciones de bicicletas.

La creación de tu modelo de k-means consta de los siguientes pasos:

  • Paso uno: Crea un conjunto de datos para almacenar tu modelo.
    El primer paso es crear un conjunto de datos que almacene tu modelo. Debido a que el conjunto de datos de Alquileres de bicicletas en Londres se almacena en la ubicación multirregión EU, tu conjunto de datos también debe residir en EU.
  • Paso dos: Examina tus datos de entrenamiento.
    El siguiente paso es examinar los datos que usas para entrenar tu modelo de agrupamiento en clústeres mediante la ejecución de una consulta en la tabla london_bicycles. Debido a que k-means es una técnica de aprendizaje no supervisado, el entrenamiento del modelo no requiere etiquetas ni que dividas los datos en datos de entrenamiento y de evaluación.
  • Paso tres: Crea un modelo de k-means.
    El tercer paso es crear tu modelo de k-means. Cuando creas el modelo, el campo de agrupamiento en clústeres es station_name y agrupas en clústeres los datos en función de los atributos de la estación, como la cantidad de soportes para bicicletas y la distancia de la estación al centro de la ciudad.
  • Paso cuatro: Usa la función ML.PREDICT para predecir el clúster de una estación.
    Luego, usa la función ML.PREDICT para predecir el clúster de un conjunto de estaciones específico. Predice clústeres para todos los nombres de estaciones que contengan la string Kennington.
  • Paso cinco: Visualiza tu modelo.
    El quinto paso es examinar las características de cada clúster mediante el uso de una herramienta de visualización. En este instructivo, visualizas los clústeres con Google Data Studio.
  • Paso seis: Usa tu modelo para tomar decisiones basadas en datos.
    El último paso es usar el modelo para tomar decisiones basadas en datos. Por ejemplo, en función de los resultados del modelo, puedes determinar qué estaciones se beneficiarían de una capacidad adicional.

Paso uno: Crea tu conjunto de datos

El primer paso es crear un conjunto de datos de BigQuery a fin de almacenar tu modelo. Para crear tu conjunto de datos, haz lo siguiente:

  1. Ve a la IU web de BigQuery en GCP Console.

    Ir a la IU web de BigQuery

  2. En el panel de navegación, en la sección Resources (Recursos), haz clic en el nombre de tu proyecto.

  3. En el panel de detalles a la derecha, haz clic en Create dataset (Crear conjunto de datos).

    Crear conjunto de datos

  4. En la página Create dataset, sigue estos pasos:

    • En ID de conjunto de datos (Dataset ID), ingresa bqml_tutorial.
    • En Ubicación de datos (Data location), selecciona Unión Europea (UE) (European Union (EU)). El conjunto de datos públicos de Alquileres de bicicletas de Londres se almacena en la ubicación multirregión EU. Tu conjunto de datos debe estar en la misma ubicación.

      Crear página de conjunto de datos

  5. Usa los valores predeterminados para el resto de la configuración y haz clic en Crear conjunto de datos (Create dataset).

Paso dos: Examina tus datos de entrenamiento

A continuación, examina los datos usados para entrenar tu modelo de k-means. En este instructivo, agruparás en clústeres las estaciones de bicicletas en función de los siguientes atributos:

  • Duración de los alquileres
  • Cantidad de viajes por día
  • Cantidad de soportes para bicicletas
  • Distancia desde el centro de la ciudad

La siguiente consulta recopila tus datos de entrenamiento. Esta consulta se incluye en tu declaración CREATE MODEL más adelante en este instructivo.

WITH
  hs AS (
  SELECT
    h.start_station_name AS station_name,
    h.duration,
    s.bikes_count,
    ST_DISTANCE(ST_GEOGPOINT(s.longitude,
        s.latitude),
      ST_GEOGPOINT(-0.1,
        51.5))/1000 AS distance_from_city_center
  FROM
    `bigquery-public-data.london_bicycles.cycle_hire` AS h
  JOIN
    `bigquery-public-data.london_bicycles.cycle_stations` AS s
  ON
    h.start_station_id = s.id
  WHERE
    h.start_date BETWEEN CAST('2015-01-01 00:00:00' AS TIMESTAMP)
    AND CAST('2016-01-01 00:00:00' AS TIMESTAMP) ),
  stationstats AS (
  SELECT
    station_name,
    AVG(duration) AS duration,
    COUNT(duration) AS num_trips,
    MAX(bikes_count) AS bikes_count,
    MAX(distance_from_city_center) AS distance_from_city_center
  FROM
    hs
  GROUP BY
    station_name )
SELECT
  *
FROM
  stationstats
ORDER BY
  distance_from_city_center ASC

Detalles de la consulta

Esta consulta extrae datos sobre los alquileres de bicicletas, incluidos start_station_name y duration, y los une a la información de estación, incluidos bike_count y distance-from-city-center. Luego, calcula los atributos de la estación en stationstats, incluida la duración promedio de los viajes y la cantidad de viajes, y pasa por los atributos de estación bike_count y distance_from_city_center.

Esta consulta usa la cláusula WITH para definir subconsultas. La consulta también usa las funciones de BigQuery GIS ST_DISTANCE y ST_GEOGPOINT. Para obtener más información sobre estas funciones, consulta Funciones geográficas. Si deseas obtener más información sobre BigQuery GIS, consulta Introducción a BigQuery GIS.

Ejecuta la consulta

Para ejecutar la consulta que compila los datos de entrenamiento de tu modelo:

  1. En la IU web de BigQuery, haz clic en el botón Redactar consulta nueva.

  2. Ingresa la siguiente consulta de SQL estándar en el área de texto del Editor de consultas.

    WITH
      hs AS (
      SELECT
        h.start_station_name AS station_name,
        h.duration,
        s.bikes_count,
        ST_DISTANCE(ST_GEOGPOINT(s.longitude,
            s.latitude),
          ST_GEOGPOINT(-0.1,
            51.5))/1000 AS distance_from_city_center
      FROM
        `bigquery-public-data.london_bicycles.cycle_hire` AS h
      JOIN
        `bigquery-public-data.london_bicycles.cycle_stations` AS s
      ON
        h.start_station_id = s.id
      WHERE
        h.start_date BETWEEN CAST('2015-01-01 00:00:00' AS TIMESTAMP)
        AND CAST('2016-01-01 00:00:00' AS TIMESTAMP) ),
      stationstats AS (
      SELECT
        station_name,
        AVG(duration) AS duration,
        COUNT(duration) AS num_trips,
        MAX(bikes_count) AS bikes_count,
        MAX(distance_from_city_center) AS distance_from_city_center
      FROM
        hs
      GROUP BY
        station_name )
    SELECT
      *
    FROM
      stationstats
    ORDER BY
      distance_from_city_center ASC
    
  3. Haz clic en Ejecutar.

  4. Cuando la consulta finalice, haz clic en la pestaña Resultados debajo del área de texto de la consulta. La pestaña de resultados muestra las columnas que consultaste que se usan para entrenar tu modelo: station_name, duration, num_trips, bikes_count, distance_from_city_center. Los resultados deberían verse de la siguiente manera.

    Resultados de la consulta

Paso tres: Crea un modelo de k-means

Ahora que examinaste tus datos de entrenamiento, el siguiente paso es crear un modelo de k-means con los datos.

Puedes crear y entrenar un modelo de k-means mediante la declaración CREATE MODEL con la opción model_type=kmeans. La siguiente consulta agrega una declaración CREATE MODEL a la consulta anterior y quita los campos id en los datos.

CREATE OR REPLACE MODEL
  bqml_tutorial.london_station_clusters
OPTIONS
  (model_type='kmeans',
    num_clusters=4,
    standardize_features = TRUE) AS
WITH
  hs AS (
  SELECT
    h.start_station_name AS station_name,
    h.duration,
    s.bikes_count,
    ST_DISTANCE(ST_GEOGPOINT(s.longitude,
        s.latitude),
      ST_GEOGPOINT(-0.1,
        51.5))/1000 AS distance_from_city_center
  FROM
    `bigquery-public-data.london_bicycles.cycle_hire` AS h
  JOIN
    `bigquery-public-data.london_bicycles.cycle_stations` AS s
  ON
    h.start_station_id = s.id
  WHERE
    h.start_date BETWEEN CAST('2015-01-01 00:00:00' AS TIMESTAMP)
    AND CAST('2016-01-01 00:00:00' AS TIMESTAMP) ),
  stationstats AS (
  SELECT
    station_name,
    AVG(duration) AS duration,
    COUNT(duration) AS num_trips,
    MAX(bikes_count) AS bikes_count,
    MAX(distance_from_city_center) AS distance_from_city_center
  FROM
    hs
  GROUP BY
    station_name )
SELECT
  * EXCEPT(station_name,
    isweekday)
FROM
  stationstats

Detalles de la consulta

La declaración CREATE MODEL especifica el número de clústeres deseado: cuatro. En la declaración SELECT, la cláusula EXCEPT excluye la columna station_name porque station_name no es una característica. La consulta crea una fila única por station_name y solo se mencionan las características en la declaración SELECT.

Estandarizar características es una buena idea si tus características tienen rangos dinámicos diferentes. Aquí, bikes_count está en el rango de 10 a 50, mientras que num_trips está en los miles, por lo que la opción standardize_features se configura en true. La configuración predeterminada es standardize_features en true, por lo que su configuración es opcional.

Si omites la opción num_clusters, BigQuery ML elegirá un valor predeterminado razonable en función del número total de filas en los datos de entrenamiento. También puedes realizar el ajuste de hiperparámetros para encontrar un número apropiado. A fin de determinar un número óptimo de clústeres, ejecuta la consulta CREATE MODEL para diferentes valores de num_clusters, encuentra la medida de error y elige el punto en el que está en su valor mínimo. Puedes obtener la medida de error si seleccionas tu modelo y haces clic en la pestaña Entrenamiento. La pestaña de entrenamiento muestra el índice de Davies-Bouldin.

Pestaña de entrenamiento

Ejecuta la consulta CREATE MODEL

Para ejecutar la consulta que crea tu modelo de k-means, haz lo siguiente:

  1. En la IU web de BigQuery, haz clic en el botón Redactar consulta nueva.

  2. Ingresa la siguiente consulta de SQL estándar en el área de texto del Editor de consultas.

    CREATE OR REPLACE MODEL
      bqml_tutorial.london_station_clusters
    OPTIONS
      (model_type='kmeans',
        num_clusters=4,
        standardize_features = TRUE) AS
    WITH
      hs AS (
      SELECT
        h.start_station_name AS station_name,
        h.duration,
        s.bikes_count,
        ST_DISTANCE(ST_GEOGPOINT(s.longitude,
            s.latitude),
          ST_GEOGPOINT(-0.1,
            51.5))/1000 AS distance_from_city_center
      FROM
        `bigquery-public-data.london_bicycles.cycle_hire` AS h
      JOIN
        `bigquery-public-data.london_bicycles.cycle_stations` AS s
      ON
        h.start_station_id = s.id
      WHERE
        h.start_date BETWEEN CAST('2015-01-01 00:00:00' AS TIMESTAMP)
        AND CAST('2016-01-01 00:00:00' AS TIMESTAMP) ),
      stationstats AS (
      SELECT
        station_name,
        AVG(duration) AS duration,
        COUNT(duration) AS num_trips,
        MAX(bikes_count) AS bikes_count,
        MAX(distance_from_city_center) AS distance_from_city_center
      FROM
        hs
      GROUP BY
        station_name )
    SELECT
      * EXCEPT(station_name)
    FROM
      stationstats
    
  3. Haz clic en Ejecutar.

  4. En la sección Recursos de la IU web de BigQuery, expande [PROJECT_ID] >bqml_tutorial y, luego, haz clic en london_station_clusters.

  5. Haz clic en la pestaña Esquema (Schema). El esquema del modelo enumera los cuatro atributos de estación que BigQuery ML usó para realizar el agrupamiento en clústeres. El esquema debe verse de la manera siguiente.

    Información de esquema de clúster

Paso cuatro: Usa la función ML.PREDICT para predecir el clúster de una estación

Para identificar a qué clúster pertenece una estación en particular, usa la función ML.PREDICT. La siguiente consulta predice el clúster de cada estación que tiene la string "Kennington" en su nombre.

WITH
  hs AS (
  SELECT
    h.start_station_name AS station_name,
    h.duration,
    s.bikes_count,
    ST_DISTANCE(ST_GEOGPOINT(s.longitude,
        s.latitude),
      ST_GEOGPOINT(-0.1,
        51.5))/1000 AS distance_from_city_center
  FROM
    `bigquery-public-data.london_bicycles.cycle_hire` AS h
  JOIN
    `bigquery-public-data.london_bicycles.cycle_stations` AS s
  ON
    h.start_station_id = s.id
  WHERE
    h.start_date BETWEEN CAST('2015-01-01 00:00:00' AS TIMESTAMP)
    AND CAST('2016-01-01 00:00:00' AS TIMESTAMP) ),
  stationstats AS (
  SELECT
    station_name,
    AVG(duration) AS duration,
    COUNT(duration) AS num_trips,
    MAX(bikes_count) AS bikes_count,
    MAX(distance_from_city_center) AS distance_from_city_center
  FROM
    hs
  GROUP BY
    station_name )
SELECT
  * EXCEPT(nearest_centroids_distance)
FROM
  ML.PREDICT( MODEL bqml_tutorial.london_station_clusters,
    (
    SELECT
      *
    FROM
      stationstats
    WHERE
      REGEXP_CONTAINS(station_name, 'Kennington')))

Detalles de la consulta

Esta consulta usa la función REGEXP_CONTAINS para buscar todas las entradas en la columna station_name que contengan la string "Kennington". La función ML.PREDICT usa esos valores a fin de predecir qué clústeres contendrán esas estaciones.

Ejecuta la consulta ML.PREDICT

Para ejecutar la consulta ML.PREDICT:

  1. En la IU web de BigQuery, haz clic en el botón Redactar consulta nueva.

  2. Ingresa la siguiente consulta de SQL estándar en el área de texto del Editor de consultas.

    WITH
      hs AS (
      SELECT
        h.start_station_name AS station_name,
        h.duration,
        s.bikes_count,
        ST_DISTANCE(ST_GEOGPOINT(s.longitude,
            s.latitude),
          ST_GEOGPOINT(-0.1,
            51.5))/1000 AS distance_from_city_center
      FROM
        `bigquery-public-data.london_bicycles.cycle_hire` AS h
      JOIN
        `bigquery-public-data.london_bicycles.cycle_stations` AS s
      ON
        h.start_station_id = s.id
      WHERE
        h.start_date BETWEEN CAST('2015-01-01 00:00:00' AS TIMESTAMP)
        AND CAST('2016-01-01 00:00:00' AS TIMESTAMP) ),
      stationstats AS (
      SELECT
        station_name,
        AVG(duration) AS duration,
        COUNT(duration) AS num_trips,
        MAX(bikes_count) AS bikes_count,
        MAX(distance_from_city_center) AS distance_from_city_center
      FROM
        hs
      GROUP BY
        station_name )
    SELECT
      * EXCEPT(nearest_centroids_distance)
    FROM
      ML.PREDICT( MODEL bqml_tutorial.london_station_clusters,
        (
        SELECT
          *
        FROM
          stationstats
        WHERE
          REGEXP_CONTAINS(station_name, 'Kennington')))
    
  3. Haz clic en Ejecutar.

  4. Cuando la consulta finalice, haz clic en la pestaña Resultados (Results) debajo del área de texto de la consulta. Los resultados deberían verse de la siguiente manera.

    Resultados de ML.PREDICT

Paso cinco: Visualiza tu modelo

Cada clúster tiene un valor para cada una de las columnas utilizadas como entradas. Para recuperar estos valores, usa la función ML.CENTROIDS como en la siguiente consulta de SQL estándar.

SELECT
  *
FROM
  ML.CENTROIDS(MODEL bqml_tutorial.london_station_clusters)
ORDER BY
  centroid_id

Haz lo siguiente para ejecutar la consulta ML.CENTROIDS:

  1. En la IU web de BigQuery, haz clic en el botón Redactar consulta nueva.

  2. Ingresa la siguiente consulta de SQL estándar en el área de texto del Editor de consultas.

    SELECT
      *
    FROM
      ML.CENTROIDS(MODEL bqml_tutorial.london_station_clusters)
    ORDER BY
      centroid_id
    
  3. Cuando la consulta finalice, haz clic en la pestaña Resultados (Results) debajo del área de texto de la consulta. Los resultados deberían verse de la siguiente manera.

    Resultados de ML.CENTROIDS

  4. A fin de comparar con más facilidad los valores correspondientes para cada clúster, gira los resultados de la consulta anterior mediante el operador UNNEST. Ingresa la siguiente consulta de SQL estándar en el área de texto del Editor de consultas.

    WITH
      T AS (
      SELECT
        centroid_id,
        ARRAY_AGG(STRUCT(feature AS name,
            ROUND(numerical_value,1) AS value)
        ORDER BY
          centroid_id) AS cluster
      FROM
        ML.CENTROIDS(MODEL bqml_tutorial.london_station_clusters)
      GROUP BY
        centroid_id )
    SELECT
      CONCAT('Cluster#', CAST(centroid_id AS STRING)) AS centroid,
      (
      SELECT
        value
      FROM
        UNNEST(cluster)
      WHERE
        name = 'duration') AS duration,
      (
      SELECT
        value
      FROM
        UNNEST(cluster)
      WHERE
        name = 'num_trips') AS num_trips,
      (
      SELECT
        value
      FROM
        UNNEST(cluster)
      WHERE
        name = 'bikes_count') AS bikes_count,
      (
      SELECT
        value
      FROM
        UNNEST(cluster)
      WHERE
        name = 'distance_from_city_center') AS distance_from_city_center
    FROM
      T
    ORDER BY
      duration DESC
    
  5. Haz clic en Ejecutar.

  6. Cuando la consulta finalice, haz clic en la pestaña Resultados (Results) debajo del área de texto de la consulta. Los resultados deberían verse de la siguiente manera.

    Resultados dinámicos

Visualiza los resultados en Google Data Studio

Haz lo siguiente para visualizar los resultados en Google Data Studio:

  1. Arriba de los resultados de la consulta, haz clic en Explorar en Data Studio.

  2. Haz clic en Comenzar para aceptar las Condiciones del Servicio. Es posible que no veas este diálogo si utilizaste anteriormente Google Data Studio.

  3. En el selector de gráficos, haz clic en Tabla con barras (Table with bars).

    Ícono de gráfico de barras en el selector de gráficos

  4. En la pestaña Datos (Data), verifica que Dimensión (Dimension) esté configurada en la columna centroid.

    Sección de dimensiones en Google Data Studio

  5. En la sección Métrica, desplaza el cursor sobre la métrica predeterminada, probablemente Record Count y, luego, haz clic en el ícono X para borrarla.

  6. Arrastra los siguientes elementos desde la sección Campos disponibles hasta el cuadro Agregar métrica: bikes_count, distance_from_city_center, duration y num_trips. El gráfico debería tener el siguiente aspecto.

    Tabla completa

Para obtener ayuda con la configuración de los componentes del gráfico en Google Data Studio, consulta Agregar y configurar componentes en el Centro de ayuda de Google Data Studio.

Paso seis: Usa tu modelo para tomar decisiones basadas en datos

La visualización de los resultados puede ayudarte a interpretar los diferentes clústeres. En este ejemplo, Cluster#4 muestra una cantidad relativamente pequeña de viajes, una distancia moderada desde el centro de la ciudad y viajes largos. Esto indica que las estaciones en Cluster#4 son estaciones suburbanas menos transitadas.

Cluster#1 muestra una mayor distancia desde el centro de la ciudad y viajes largos, pero menos viajes. Esto indica que son otras estaciones suburbanas menos transitadas.

Cluster#2 muestra una mayor cantidad de viajes y una menor distancia al centro de la ciudad. Esto indica que estas estaciones son estaciones urbanas relativamente transitadas.

Cluster#3 muestra una distancia corta al centro de la ciudad y una gran cantidad de viajes. Esto indica que estas estaciones son estaciones urbanas muy transitadas.

En función de estos resultados, puedes usar los datos para comunicar tus decisiones. Por ejemplo:

  • Supongamos que necesitas experimentar con un tipo nuevo de anclaje. ¿Qué clúster de estaciones deberías elegir para realizar este experimento? Las estaciones en Cluster#4 parecen ser una opción lógica, porque son las estaciones que tienen una gran cantidad de bicicletas capaces de admitir una prueba A/B.

  • Supongamos que deseas abastecer algunas estaciones con bicicletas de carrera. ¿Qué estaciones debes elegir? Cluster#1 es el grupo de estaciones que se encuentran a mayor distancia desde el centro de la ciudad y que tienen los viajes más largos. Estas son las posibles candidatas para las bicicletas de carrera.

  • Recibiste fondos adicionales y puedes agregar capacidad a tus estaciones. ¿Qué estaciones deben ser el objetivo para bicicletas adicionales? Cluster#2 tiene la menor cantidad de bicicletas y la segunda cantidad más alta de viajes. Eso hace que estas estaciones sean un objetivo probable para la capacidad adicional.

Limpia

Sigue estos pasos para evitar que se apliquen cargos a tu cuenta de Google Cloud Platform por los recursos que usaste en este instructivo:

  • Puedes borrar el proyecto que creaste.
  • De lo contrario, puedes mantener el proyecto y borrar el conjunto de datos.

Borra tu conjunto de datos

Borrar tu proyecto quita todos sus conjuntos de datos y tablas. Si prefieres volver a usar el proyecto, puedes borrar el conjunto de datos que creaste en este instructivo:

  1. Si es necesario, abre la IU web de BigQuery.

    Ir a la IU web de BigQuery

  2. En el panel de navegación, haz clic en el conjunto de datos bqml_tutorial que creaste.

  3. Haz clic en Borrar conjunto de datos en el lado derecho de la ventana. Esta acción borra el conjunto de datos y el modelo.

  4. En el cuadro de diálogo Borrar conjunto de datos, escribe el nombre de tu conjunto de datos (bqml_tutorial) para confirmar la eliminación y, luego, haz clic en Borrar.

Borra tu proyecto

Para borrar el proyecto, haz lo siguiente:

  1. En la GCP Console, dirígete a la página Proyectos.

    Ir a la página Proyectos

  2. En la lista de proyectos, selecciona el proyecto que deseas borrar y haz clic en Borrar.
  3. En el cuadro de diálogo, escribe el ID del proyecto y, luego, haz clic en Cerrar para borrar el proyecto.

Qué sigue

¿Te sirvió esta página? Envíanos tu opinión:

Enviar comentarios sobre…

Documentación de BigQuery ML