Soluciona problemas de suscripciones a BigQuery

En esta página, se proporcionan algunas sugerencias comunes para solucionar problemas de suscripciones a BigQuery.

Verifica el estado de una suscripción a BigQuery

Para verificar el estado de una suscripción, sigue estos pasos:

  1. En la consola de Google Cloud, ve a la página de suscripción a Pub/Sub.

    Ir a Suscripciones

  2. Marca el ícono del Estado de tu suscripción a BigQuery.

    Si el ícono es una marca de verificación verde, la suscripción está en buen estado.

    Si el ícono tiene un signo de exclamación rojo, la suscripción tiene un estado de error.

  3. Haz clic en la suscripción a BigQuery.

    Se abrirá la página de detalles de la suscripción.

  4. Revisa el Estado de la suscripción para ver el mensaje de error.

  5. Según el mensaje de error, ve a la sección relevante de esta página para solucionar el problema.

Una vez que se resuelve el problema, la suscripción vuelve a un estado correcto.

No se puede crear ni actualizar la suscripción

Estos son algunos de los problemas habituales que puedes encontrar si tienes dificultades para crear o actualizar una suscripción a BigQuery.

Error de tabla no encontrada

Si la tabla que especificas en el flujo de trabajo para crear o actualizar suscripciones no existe, el flujo de trabajo mostrará un error de tabla no encontrada. En la consola de Google Cloud, el mensaje es similar al siguiente:

The BigQuery table or dataset specified cannot be found.

Para resolver el problema, crea la tabla y asegúrate de que puedes verificar su state antes de usarla con una suscripción a BigQuery.

Error de falta de coincidencia de esquema

Si los esquemas de la tabla y el tema no son compatibles, el flujo de trabajo para crear o actualizar suscripciones muestra un error de no coincidencia del esquema. En la consola de Google Cloud, el mensaje es similar al siguiente:

Incompatible schema type for field project_ids: expected INT64, got STRING

El mensaje de error especificado es para un esquema que no coincide en un campo llamado project_ids. Según el tipo de discrepancia de esquema que tengas, es posible que veas una variación diferente del mensaje de error.

Para resolver el problema, verifica si las asignaciones de esquemas son compatibles.

Error de la cuenta de servicio

Si no configuraste la cuenta de servicio de Pub/Sub con los permisos correctos, el flujo de trabajo para crear o actualizar suscripciones muestra un error. En la consola de Google Cloud, el mensaje es similar al siguiente:

Service account service-1234234234@gcp-sa-pubsub.iam.gserviceaccount.com
is missing permissions required to write to the BigQuery table:
bigquery.tables.get, bigquery.tables.updateData.

Para resolver el problema, verifica si la cuenta de servicio tiene los permisos correctos.

El estado de la suscripción muestra un signo de exclamación rojo

Si editas la tabla después de crear una suscripción, esto puede afectar la forma en que Pub/Sub escribe los mensajes en la tabla. Si un cambio genera un problema, el campo de estado de la suscripción se establece en un estado de error.

En la página de detalles de la suscripción, verifica el estado del campo Subscription state. El campo Subscription state proporciona un error más específico, que puede ser uno de los siguientes:

  • table not found: La tabla se borró. Crea una tabla y verifica su estado. Consulta Obtén información de las tablas.

  • Permiso de tabla denegado: La cuenta de servicio de Pub/Sub ya no tiene permiso para escribir en la tabla. Verifica si la cuenta de servicio tiene los permisos correctos.

  • Discrepancia en el esquema de la tabla: El esquema de la tabla ya no es compatible con la configuración de suscripción de BigQuery. Comprueba si las asignaciones de esquemas son compatibles.

Mientras una suscripción a Pub/Sub se encuentra en estado de error, los mensajes no se escriben en la tabla de BigQuery y permanecen en las tareas pendientes de la suscripción. Ten en cuenta que los mensajes no se entregan a un tema de mensajes no entregados adjunto, si está configurado. Los mensajes no confirmados se conservan durante el período establecido en message_retention_duration(7d, de forma predeterminada).

Se está acumulando una lista

Si ves acumulaciones de mensajes acumulados en la suscripción o que van al tema de mensajes no entregados de una suscripción, revisa las siguientes causas posibles.

Mensaje de error INVALID_ARGUMENT

Este error ocurre cuando el mensaje proporcionado está en un formato que Pub/Sub considera válido, pero el esquema de la tabla de destino de BigQuery no lo hace. Esto significa que uno o más campos en el mensaje tienen valores que el esquema de tabla de BigQuery no permite. Revisa la compatibilidad de esquemas para verificar que los tipos y formatos de datos sean correctos. Estos son algunos de los errores más comunes:

  • Una string vacía ("") no es un JSON válido. Cuando envíes datos a una columna de tabla JSON de BigQuery anulable, proporciona un objeto JSON vacío ({}), una null o una string JSON vacía ("\"\"") para representar los valores faltantes. El envío de una cadena vacía genera un error.

  • Si el valor de un campo de mensaje excede la longitud máxima del campo de BigQuery, el mensaje falla debido a las limitaciones de tamaño.

Para solucionar los errores INVALID_ARGUMENT, agrega un tema de mensajes no entregados a la suscripción de interés. El tema de mensajes no entregados captura mensajes que no se pudieron escribir en BigQuery, junto con un atributo llamado CloudPubSubDeadLetterSourceDeliveryErrorMessage que explica el motivo de la falla.

Estas fallas de entrega también se pueden ver en el Explorador de métricas. Selecciona la métrica pubsub.googleapis.com/subscription/push_request_count y filtra por response_code=invalid_argument.

Mensaje de error RESOURCE_EXHAUSTED

Si los mensajes se escriben con lentitud en BigQuery, es posible que debas aumentar la cuota de envío de Pub/Sub de tu proyecto o la cuota de capacidad de procesamiento de escritura de almacenamiento de BigQuery. Para verificar si estás experimentando limitaciones de cuota, examina la métrica de solicitudes de envío (subscription/push_request_count) en busca de errores resource_exhausted.

Otra forma de diagnosticar problemas de cuota es verificar la cuota del proyecto. Navega a IAM y administración > Cuotas dentro del proyecto que contiene tu recurso de Pub/Sub o instancia de BigQuery. Busca la cuota relevante, pubsub.googleapis.com/regionalpushsubscriber o bigquerystorage.googleapis.com/write/append_bytes. Si alguna de las cuotas requiere un aumento, puedes solicitar una cuota más alta.

Tabla particionada por hora que muestra __UNPARTITIONED__ en la columna de ID de partición

Cuando una tabla de destino de BigQuery se particiona por hora, las filas primero llegan a una partición especial etiquetada como __UNPARTITIONED__ dentro de la vista INFORMATION_SCHEMA.PARTITIONS. Este es el comportamiento esperado en las tablas que usan la partición por tiempo de transferencia.

BigQuery utiliza un búfer de transmisión para optimizar el proceso de escritura. Es posible que los datos residan en la partición __UNPARTITIONED__ hasta que se acumule suficiente volumen o que haya transcurrido al menos una hora. Después de que se cumplen estas condiciones, BigQuery vuelve a particionar los datos en su partición por hora adecuada.

Puedes supervisar los datos dentro de la partición __UNPARTITIONED__ con la vista INFORMATION_SCHEMA.PARTITIONS.

¿Qué sigue?

  • Si aún tienes problemas con tu suscripción a BigQuery, consulta Obtén asistencia.