Solução de problemas do Cloud SQL

Nesta página, apresentamos algumas dicas para solucionar problemas do Cloud SQL que não sejam relacionados a um mecanismo de banco de dados específico.

Os tópicos desta página incluem:

Backup e recuperação

Clique nos links da tabela para ver detalhes:

Para este problema... O problema pode ser... Tente o seguinte...
Não é possível ver o status atual da operação. A interface do usuário mostra apenas sucesso ou falha. Use estes comandos do banco de dados para saber mais.
Não é possível encontrar o criador da operação. A interface do usuário não mostra quem iniciou uma operação. Use o registro de auditoria para descobrir.
Sem espaço em disco durante o backup automatizado. A instância atingiu os limites de espaço do disco rígido. Verifique o tamanho e a cota do sistema de arquivos.
Não é possível fazer backup após a instância ser excluída. A instância foi excluída. Recrie de uma exportação ou entre em contato com o suporte ao cliente se estiver dentro do período de carência.
O backup automatizado parece travado. O tempo de backup está correlacionado ao tamanho do banco de dados. Entre em contato com o suporte ao cliente se você realmente precisar cancelar a operação.
Falha na restauração. O arquivo dump pode conter usuários de banco de dados que ainda não existem. Crie os usuários do banco de dados antes de restaurar.
A operação não é válida para esta instância. O tamanho da instância de destino é menor que a origem. Aumente o tamanho da instância de destino.
Aumente o número de dias que backups automáticos precisam ser mantidos. Apenas sete backups automáticos são mantidos. Gerencie seus próprios backups manuais.
Erro desconhecido de falha do backup É possível que o backup tenha expirado. Marque estas sinalizações.
Uma notificação sobre a falha no backup não foi enviada. Não há uma notificação padrão. Configure alertas personalizados.

Não é possível ver o status atual da operação

Não é possível ver o status de uma operação no Console do Google Cloud.

O problema pode ser

O Console do Google Cloud informa apenas o sucesso ou falha no momento da conclusão e não foi projetado para retornar avisos.

O que você deve tentar

Conecte-se ao banco de dados e execute SHOW WARNINGS.


Não é possível encontrar o criador da operação

Você quer descobrir quem emitiu uma operação de backup sob demanda.

O problema pode ser

A página de operações da instância no Console do Google Cloud não mostra quem iniciou uma operação.

O que você deve tentar

Procure nos registros e filtre por texto para encontrar o usuário. Talvez seja necessário usar registros de auditoria para informações particulares. Os arquivos de registro relevantes incluem:

  • cloudaudit.googleapis.com/activity também pode estar disponível, caso os Cloud Audit Logs estejam ativados.


Não é possível fazer backup após a instância ser excluída

Não é possível fazer um backup depois de excluir a instância.

O problema pode ser

A instância foi excluída.

O que você deve tentar

  • O período de carência para uma limpeza de instância do Cloud SQL é de quatro dias. Durante esse período, o suporte ao cliente pode recriar a instância. Depois que as instâncias são removidas, não é possível recuperar dados.
  • Se você tiver feito uma exportação, crie uma nova instância e faça uma importação para recriar o banco de dados. As exportações são gravadas no Cloud Storage e as importações são lidas de lá.

O backup automático está paralisado

O backup automático fica paralisado por muitas horas e não pode ser cancelado.

O problema pode ser

Os backups podem levar muito tempo, dependendo do tamanho do banco de dados.

O que você deve tentar

Se você realmente precisa cancelar a operação, peça ao suporte ao cliente para aplicar force restart à instância.


Falha na restauração do backup

Uma operação de restauração pode falhar quando um ou mais usuários referenciados no arquivo dump SQL não existem.

O problema pode ser

Antes de restaurar um despejo SQL, todos os usuários do banco de dados com objetos ou que receberam permissões para os objetos do banco de dados despejado precisam existir. Caso contrário, a restauração não recriará os objetos com a propriedade e/ou as permissões originais.

O que você deve tentar

Crie os usuários do banco de dados antes de restaurar do dump SQL.


A operação não é válida para esta instância

Você vê a mensagem de erro HTTP Error 400: This operation isn't valid for this instance de uma chamada de API para instances.restoreBackup.

O problema pode ser

Não é possível restaurar de um backup de uma instância com um tamanho de armazenamento (XX GB) menor que o tamanho de backup (YY GB).

O que você deve tentar

Edite a instância de destino para aumentar o tamanho de armazenamento dela.


Aumentar o número de dias que backups automáticos precisam ser mantidos

Você quer aumentar o número de dias em que pode manter backups automáticos, de sete para 30 dias ou mais.

O problema pode ser

Apenas sete backups são mantidos. Os backups são removidos regularmente devido ao custo e ao tamanho da retenção de backups. Infelizmente, isso significa que os backups visíveis atualmente são os únicos backups automatizados que podem ser usados para restaurar.

O que você deve tentar

Para manter os backups indefinidamente, crie um backup sob demanda. Ele não é excluído da mesma forma que backups automáticos. Os backups sob demanda permanecem indefinidamente. Ou seja, eles permanecem até que sejam excluídos ou a instância a que pertencem seja excluída. Como esse tipo de backup não é excluído automaticamente, ele pode afetar o faturamento.


Erro desconhecido de falha do backup

O backup falhou e você vê Unknown error.

O problema pode ser

A criação do backup atingindo o tempo limite de 10 minutos. Há um tempo limite de 10 minutos definido no backup automatizado, e o processo deve ser concluído nesse período.

O que você deve tentar

Há duas sinalizações que influenciam a criação de backup: checkpoint_timeout e checkpoint_completion_target. No início do backup, um checkpoint slow é executado e usa checkpoint_completion_target multiplicado por checkpoint_timeout.

Por exemplo, 900 sec * 0.9 sec = 810 sec = 13.5 min Por esse motivo, ocorre um tempo limite. Diminuir o valor de checkpoint_completion_target corrige o problema nesse caso.

Uma notificação sobre a falha no backup não foi enviada

Houve falha em um backup automático, e você não recebeu uma notificação sobre isso.

O problema pode ser

Quando um backup automático falha, uma mensagem Operation error é exibida na página Details da instância do Cloud SQL. As notificações por e-mail não são enviadas no caso de falha no backup.

O que você deve tentar

É possível criar um alerta do Monitoring ou usar notificações do Error Reporting para configurar suas próprias notificações personalizadas.

Clonagem

Clique nos links da tabela para ver detalhes:

Para este problema... O problema pode ser... Tente o seguinte...
Ocorreu uma falha na clonagem com um erro constraints/sql.restrictAuthorizedNetworks. Bloqueado pela configuração de redes autorizadas. Tente uma destas opções.

Ocorreu uma falha na clonagem com um erro constraints/sql.restrictAuthorizedNetworks

Ocorreu uma falha na clonagem com um erro constraints/sql.restrictAuthorizedNetworks.

O problema pode ser

A operação de clonagem é bloqueada pela configuração Authorized Networks. Authorized Networks são configurados para endereços IP públicos na seção "Conectividade" do Console do Google Cloud, e a clonagem não é permitida devido a considerações de segurança.

O que você deve tentar

Remova todas as entradas Authorized Networks da instância do Cloud SQL, se possível. Caso contrário, crie uma réplica sem nenhuma entrada Authorized Networks.

Conectividade

Clique nos links da tabela para ver detalhes:

Para este problema... O problema pode ser... Tente o seguinte...
Erros Unauthorized to connect. Há muitas causas possíveis. Veja aqui o que você deve testar.
Falha na associação de rede. Service Networking API não está ativado no projeto. Ative o Service Networking API no projeto.
Remaining connection slots are reserved. O número máximo de conexões foi atingido. Aumente a sinalização max_connections.
Set Service Networking service account as servicenetworking.serviceAgent role on consumer project As permissões de rede na conta de serviço estão incorretas ou ausentes. Desative e reative a API Service Networking.
error x509: certificate is not valid for any names, but wanted to match project-name:db-name. Problema conhecido: no momento, o Cloud SQL Proxy Dialer (em inglês) não é compatível com o Go 1.15. Até que o problema seja resolvido, confira esta discussão no GitHub (em inglês), que inclui uma solução alternativa.

Conexão cancelada

Você verá a mensagem de erro Got an error reading communication packets ou Aborted connection xxx to db: DB_NAME.

O problema pode ser

  • Instabilidade de rede.
  • Nenhuma resposta aos comandos de sinal de atividade TCP (o cliente ou o servidor não é responsivo, possivelmente sobrecarregado).
  • A vida útil da conexão do mecanismo de banco de dados foi excedida e o servidor encerrou a conexão.

O que você deve tentar

Os aplicativos devem tolerar falhas de rede e seguir as práticas recomendadas, como a repetição e o pooling de conexões. A maioria dos pools de conexão identifica esses erros sempre que possível. Caso contrário, o aplicativo precisará tentar novamente ou falhar normalmente.

Para novas tentativas de conexão, recomendamos os métodos a seguir:

  1. Espera exponencial. Aumente o intervalo de tempo entre cada nova tentativa, exponencialmente.
  2. Adicione também a espera aleatória.
Combinar esses métodos ajuda a reduzir a limitação.


Sem autorização para se conectar

Você vê a mensagem de erro Unauthorized to connect.

O problema pode ser

Pode haver muitas causas, já que a autorização ocorre em muitos níveis.

  • No nível do banco de dados, o usuário do banco de dados precisa existir e a senha precisa corresponder.
  • No nível do projeto, é possível que o usuário não tenha as permissões corretas do IAM.
  • No nível do Cloud SQL, a causa pode depender de como você se conecta à instância. Se você estiver se conectando diretamente a uma instância pelo IP público, o IP de origem da conexão precisará estar na rede autorizada da instância.

    A conectividade IP particular é permitida por padrão, exceto quando você está se conectando a partir de um endereço não RFC 1918. Os endereços de clientes que não são RFC 1918 precisam ser configurados como redes autorizadas.

    Por padrão, o Cloud SQL não grava as rotas de sub-rede não RFC 1918 da sua VPC. É necessário atualizar o peering de rede para o Cloud SQL para exportar rotas que não sejam RFC 1918. Exemplo:

    gcloud compute networks peerings update cloudsql-mysql-googleapis-com --network=NETWORK --export-subnet-routes-with-public-ip --project=PROJECT
    

    Se você estiver se conectando pelo Cloud SQL Proxy, verifique se as permissões do IAM estão configuradas corretamente.

  • No nível da rede, se a instância do Cloud SQL estiver usando IP público, o IP de origem da conexão precisa estar em uma rede autorizada.

O que você deve tentar

  • Confirme o nome de usuário e a senha.
  • Verifique os papéis e as permissões do IAM do usuário.
  • Se estiver usando IP público, verifique se a origem está nas redes autorizadas.

Falha na associação de rede

Você verá a mensagem de erro Error: Network association failed due to the following error: conceda o papel servicenetworking.serviceAgent à conta de serviço do Service Networking no projeto do consumidor.

O problema pode ser

A Service Networking API não está ativada no projeto.

O que você deve tentar

Ative a Service Networking API no seu projeto. Se você vir esse erro ao tentar atribuir um endereço IP particular a uma instância do Cloud SQL e estiver usando uma VPC compartilhada, também será necessário ativar a Service Networking API para o projeto host.


Os slots de conexão restantes estão reservados

Você vê a mensagem de erro FATAL: remaining connection slots are reserved for non-replication superuser connections.

O problema pode ser

O número máximo de conexões foi atingido.

O que você deve tentar

Edite o valor da sinalização max_connections. Aumentar max_connections acima de um determinado valor pode resultar na perda do suporte ao SLA.


Defina a conta de serviço do Service Networking com o papel servicenetworking.serviceAgent no projeto do consumidor

Você vê a mensagem de erro set Service Networking service account as servicenetworking.serviceAgent role on consumer project..

O problema pode ser

As permissões do usuário ou da conta de serviço estão incorretas. Isso pode acontecer durante scripts de configuração automatizados, como um script de configuração do Terraform.

O que você deve tentar

Para corrigir as permissões do serviço, desative o Service Networking API, aguarde cinco minutos e reative-o.


Erro x509: o certificado não é válido para nenhum nome

Você vê a mensagem de erro error x509: certificate is not valid for any names, but wanted to match project-name:db-name.

O problema pode ser…

Problema conhecido: no momento, o Cloud SQL Proxy Dialer (em inglês) não é compatível com o Go 1.15.

O que você precisa tentar

Até que o problema seja resolvido, confira esta discussão no GitHub (em inglês), que inclui uma solução alternativa.


Criar instâncias

Clique nos links da tabela para ver detalhes:

Para este problema... O problema pode ser... Tente o seguinte...
Internal error. Não há conta de serviço da rede de serviço. Desative e reative o Service Networking API.
Falha na criação da instância do Terraform. Erro de configuração do Terraform. Inspecione e repare o arquivo de configuração do Terraform.
HTTP Error 409 no script do Terraform. Outra operação já está em andamento. Corrija o script do Terraform para aguardar a conclusão de cada operação.
Unknown error Tentativa de criar uma instância com o mesmo nome de uma excluída recentemente. Ou tentativa de criar várias instâncias simultaneamente com o uso de um novo intervalo de IPs privados. Use um nome diferente para a instância ou aguarde uma semana desde que a instância foi excluída. Recrie instâncias com falha consecutivamente usando nomes diferentes.

Erro interno

Você vê a mensagem de erro {"ResourceType":"sqladmin.v1beta4.instance", "ResourceErrorCode":"INTERNAL_ERROR","ResourceErrorMessage":null}.

O problema pode ser

O projeto de serviço provavelmente não tem a conta de serviço da rede de serviço necessária para esse recurso.

O que você deve tentar

Para corrigir as permissões do serviço, desative o Service Networking API , aguarde cinco minutos e reative-o.


Falha na criação da instância do Terraform

Falha na criação da instância do Terraform.

O problema pode ser

Isso geralmente é um problema no próprio script do Terraform.

O que você deve tentar

Inspecione e repare o arquivo de configuração do Terraform.


Erro 409 no script do Terraform

Você verá a mensagem de erro HTTP Error 409 nos scripts do Terraform.

O problema pode ser

Operation failed because another operation was already in progress

O que você deve tentar

Revise o script para interromper a execução até que cada operação da instância seja concluída. Antes de continuar para a próxima etapa, faça uma pesquisa com o script e aguarde até que um 200 seja retornado para o ID da operação anterior.


Erro desconhecido

Ao tentar criar uma instância, você vê uma mensagem de erro como Cloud SQL creation failed, error UNKNOWN.

O problema pode ser

É provável que você esteja tentando reutilizar o nome de uma instância excluída recentemente. Os nomes das instâncias não podem ser reutilizados por uma semana após a exclusão. Ou você está tentando criar várias instâncias simultaneamente usando um novo intervalo de IPs privados quando apenas a primeira instância é criada e as outras falham com Unknown error.

O que você deve tentar

Use um nome diferente para a instância ou aguarde uma semana para criar uma nova com esse nome. Crie várias instâncias consecutivamente em vez de simultaneamente.

Alta disponibilidade

Clique nos links da tabela para ver detalhes:

Para este problema... O problema pode ser... Tente o seguinte...
Não é possível encontrar métricas para failover manual. Somente failovers automáticos entram nas métricas. N/D
CPU e RAM próximas de 100% de uso O tamanho da máquina da instância é pequeno demais para a carga. Faça upgrade no tamanho da máquina da instância.

Não é possível encontrar métricas para failover manual

Você executou um failover manual e não consegue encontrar uma entrada correspondente nas métricas de failover automático do Metrics Explorer.

O problema pode ser

Somente failovers automáticos entram nas métricas. Failovers iniciados manualmente não.

O que você deve tentar

N/D


CPU e RAM próximas de 100% de uso

Os recursos da instância do Cloud SQL (CPU e RAM) estão quase com 100% de uso, fazendo com que a instância de alta disponibilidade fique inativa.

O problema pode ser

O tamanho da máquina da instância é pequeno demais para a carga.

O que você deve tentar

Edite a instância para fazer upgrade para um tamanho de máquina maior e receber mais CPUs e memória.

Importar e exportar

Clique nos links da tabela para ver detalhes:

Para este problema... O problema pode ser... Tente o seguinte...
Não é possível ver o status da operação. A interface do usuário mostra apenas sucesso ou falha. Use estes comandos do banco de dados para saber mais.
A exportação está demorando muito. O Cloud SQL não é compatível com operações síncronas simultâneas. Use o descarregamento de exportação. Saiba mais.
A importação está demorando demais. Muitas conexões ativas podem interferir nas operações de importação. Feche as conexões não usadas ou reinicie a instância do Cloud SQL antes de começar uma operação de importação.
A importação falhou. O arquivo exportado pode conter usuários do banco de dados que ainda não existem. Crie os usuários do banco de dados antes de fazer a importação.
Conexão fechada durante a operação de exportação. A consulta precisa produzir dados nos primeiros sete minutos. Teste a consulta manualmente. Saiba mais.
Erro desconhecido durante a exportação. Possível problema de largura de banda. Verifique se a instância e o bucket do Cloud Storage estão na mesma região.
Você quer automatizar as exportações. O Cloud SQL não oferece uma maneira de automatizar exportações. Crie seu próprio pipeline para executar essa funcionalidade. Saiba mais.
ERROR_RDBMS: system error occurred. Permissões do Cloud Storage ou tabela não existente. Verifique as permissões OU verifique se a tabela existe.

Não é possível ver o status da operação

Não é possível ver o status de uma operação em andamento.

O problema pode ser

O Console do Google Cloud informa apenas o sucesso ou falha no momento da conclusão e não foi projetado para retornar avisos.

O que você deve tentar

Conecte-se ao banco de dados e execute SHOW WARNINGS.


A exportação está demorando muito

A exportação está demorando muito, bloqueando outras operações.

O problema pode ser

O Cloud SQL não é compatível com operações síncronas simultâneas.

O que você deve tentar

Tente exportar conjuntos de dados cada vez menores.


A importação está demorando demais

A importação está demorando muito, o que bloqueia outras operações.

O problema pode ser

Muitas conexões ativas podem interferir nas operações de importação. As conexões consomem CPU e memória, limitando os recursos disponíveis.

O que você deve tentar

Feche operações não usadas. Verifique o uso de CPU e da memória para garantir que há vários recursos disponíveis. A melhor maneira de garantir o máximo de recursos para a operação de importação é reiniciar a instância antes de começar a operação. Uma reinicialização:

  • fecha todas as conexões;
  • encerra todas as tarefas que possam estar consumindo recursos.


Falha na importação

A importação falha quando um ou mais usuários referenciados no arquivo de despejo SQL exportado não existem.

O problema pode ser

Antes de importar um arquivo de dump SQL, todos os usuários do banco de dados que têm objetos ou receberam permissões nos objetos no banco de dados despejado precisam existir. Caso contrário, a restauração não recriará os objetos com a propriedade e/ou as permissões originais.

O que você deve tentar

Crie os usuários do banco de dados antes de importar o dump SQL.


Conexão fechada durante a operação de exportação

Conexão fechada durante a operação de exportação.

O problema pode ser

A conexão com o Cloud Storage pode expirar porque a consulta em execução na exportação não está produzindo nenhum dado nos primeiros sete minutos desde que a exportação foi iniciada.

O que você deve tentar

Teste a consulta manualmente conectando-se a partir de qualquer cliente e enviando a saída da consulta para STDOUT com o comando abaixo:

COPY (INSERT_YOUR_QUERY_HERE) TO STDOUT WITH ( FORMAT csv, DELIMITER ',', ENCODING 'UTF8', QUOTE '"', ESCAPE '"' ).

Esse é o comportamento esperado, porque quando a exportação é iniciada, o cliente deve começar a enviar dados imediatamente. Caso a conexão continue sem dados enviados, ela acaba sendo interrompida e, por fim, resultando em falha na exportação e deixando a operação em um estado incerto. Além disso, é isso que a mensagem de erro do gcloud está tentando dizer com esta mensagem:

operation is taking longer than expected.


Erro desconhecido durante a exportação

Você verá a mensagem de erro Unknown error ao tentar exportar um banco de dados para um bucket do Cloud Storage.

O problema pode ser

A transferência pode falhar devido a um problema de largura de banda.

O que você deve tentar

A instância do Cloud SQL pode estar em uma região diferente do bucket do Cloud Storage. A leitura e a gravação de dados de um continente para outro envolve o uso excessivo de rede e pode causar problemas intermitentes como esse. Verifique as regiões da instância e do bucket.


Querer automatizar exportações

Você quer automatizar as exportações.

O problema pode ser

O Cloud SQL não oferece uma maneira de automatizar exportações.

O que você deve tentar

Use seu próprio sistema de exportação automatizado usando os produtos do Google Cloud: Cloud Scheduler, Pub/Sub e Cloud Functions, conforme descrito aqui.


Houve um erro de sistema ERROR_RDBMS

Você vê a mensagem de erro [ERROR_RDBMS] system error occurred.

O problema pode ser

  • O usuário pode não ter todas as permissões necessárias do Cloud Storage.
  • A tabela de banco de dados pode não existir.

O que você deve tentar

  1. Verifique se você tem pelo menos as permissões WRITER no bucket e READER no arquivo de exportação. Para mais informações sobre como configurar o controle de acesso no Cloud Storage, consulte Criar e gerenciar listas de controle de acesso.
  2. Verifique se a tabela existe. Se a tabela existir, confirme se você tem as permissões corretas no bucket.

Geração de registros

Clique nos links da tabela para ver detalhes:

Para este problema... O problema pode ser... Tente o seguinte...
A geração de registros está usando CPU e memória demais. A geração de registros precisa ser ajustada. Tente ajustar o uso de recursos de registro.
Registros de auditoria não encontrados. Autenticação de usuários. Verifique os papéis e permissões do usuário.
Informações de operações não encontradas nos registros. Os registros de auditoria não estão ativados. Ative os registros de auditoria.

A geração de registros está usando CPU e memória demais

A geração de registros está usando CPU e memória demais.

O problema pode ser

O uso da geração de registros precisa ser ajustado.

O que você deve tentar

A sinalização log_statement pode ser definida como nenhuma e a sinalização logging_collector pode ser desativada. Se a geração de registros ainda estiver ocorrendo, talvez haja outras sinalizações relacionadas a registros que podem ser ajustadas. Edite a instância para modificar essas sinalizações.


Geração de registros de auditoria

Você ativou a geração de registros de auditoria para o Cloud SQL, mas não consegue encontrar nenhum registro de auditoria no Cloud Logging

O problema pode ser

Os registros de acesso a dados só são gravados se a operação é uma chamada de API autenticada pelo usuário que cria, modifica ou lê dados criados pelo usuário ou se a operação acessa arquivos de configuração ou metadados de recursos.

O que você deve tentar

Verifique os papéis e as permissões do usuário que executa as operações.


Informações de operação não encontradas nos registros

Você quer encontrar mais informações sobre uma operação. Por exemplo, um usuário foi excluído, mas não é possível descobrir quem fez isso. Os registros mostram que a operação foi iniciada, mas não fornecem mais informações.

O problema pode ser

Você precisa ativar o registro de auditoria para que informações de identificação detalhadas e pessoais (PII, na sigla em inglês) sejam registradas.

O que você deve tentar

Ative a geração de registros de auditoria no projeto.

Como gerenciar instâncias

Clique nos links da tabela para ver detalhes:

Para este problema... O problema pode ser... Tente o seguinte...
O armazenamento temporário aumentou o armazenamento automático. O armazenamento automático está ativado. A reinicialização exclui os arquivos temporários, mas não reduz o armazenamento. Somente o suporte ao cliente pode redefinir o tamanho da instância. Saiba mais.
Os dados estão sendo excluídos automaticamente. Há um script em execução em algum lugar que está fazendo isso. Tente encontrar o script.
A instância não pode ser excluída. mais de uma causa possível. mais de uma solução possível.
A instância está travada devido ao grande tamanho dos dados temporários. Muitas tabelas temporárias foram criadas ao mesmo tempo. Reinicie a instância e teste esta opção de mitigação.
Erro fatal durante o upgrade. Há muitas causas possíveis. Os registros podem revelar mais. Talvez seja necessário entrar em contato com o suporte ao cliente para forçar uma reinicialização.
A instância trava na reinicialização quando acaba o espaço em disco. O recurso de aumento automático de armazenamento não está ativado. Ative o aumento automático de armazenamento.
Desligamento lento na reinicialização. Conexões pendentes que não são encerradas após 60 segundos podem causar erros no desligamento. Tenha apenas conexões que durem menos de 60 segundos.
Access denied for user. É possível que a autenticação do usuário ou certificados SSL/TLS tenham expirado. Verifique os status de usuário e certificado.
Não é possível excluir um usuário. Pode ser que o usuário seja proprietário de objetos no banco de dados. Talvez seja necessário descartar ou reatribuir objetos.
Não é possível atribuir um endereço IP particular a uma instância atual em uma VPC compartilhada. Os endereços das instâncias são vinculados aos projetos no momento da criação. Crie uma nova instância do Cloud SQL para substituir a atual.
As consultas específicas estão lentas. Problemas específicos do banco de dados ou latência de rede. Confira estas sugestões.
A falta de memória é indicada, mas os gráficos de monitoramento não mostram isso. Talvez parte da RAM esteja sendo usada por processos de sobrecarga interna. Garanta que a instância terá sobrecarga suficiente para a carga de trabalho.


O armazenamento temporário aumentou o armazenamento automático

Tabelas temporárias aumentaram o uso do armazenamento, e o armazenamento automático foi aumentado.

O problema pode ser

O armazenamento automático está ativado.

O que você precisa tentar

Reiniciar para excluir tabelas temporárias não reduz o tamanho do armazenamento automaticamente.


Os dados estão sendo excluídos automaticamente

Você percebe que os dados estão sendo excluídos automaticamente em intervalos regulares.

O problema pode ser

Provavelmente, um script está sendo executado em algum lugar no seu ambiente.

O que você precisa tentar

Procure nos registros próximos ao momento da exclusão e veja se há um script não autorizado em execução em um painel ou outro processo automatizado.


A instância não pode ser excluída

Você verá a mensagem de erro ERROR: (gcloud.sql.instances.delete) HTTP Error 409: The instance or operation is not in an appropriate state to handle the request ou a instância apresentará um status de sinalização INSTANCE_RISKY_FLAG_CONFIG.

O problema pode ser

  1. Outra operação está em andamento.
  2. O aviso INSTANCE_RISKY_FLAG_CONFIG é acionado sempre que pelo menos uma sinalização beta é usada.

O que você precisa tentar

  1. As operações do Cloud SQL não são executadas simultaneamente. Aguarde a conclusão da outra operação.
  2. Remova as configurações de sinalização arriscadas e reinicie a instância.

O sistema está travado devido ao grande tamanho dos dados temporários

O sistema está travado devido ao grande tamanho dos dados temporários.

O problema pode ser

O sistema pode criar muitas tabelas temporárias de uma só vez, dependendo das consultas e da carga.

O que você precisa tentar

Infelizmente, não é possível reduzir o arquivo ibtmp1 por nenhum método que não seja reiniciar o serviço.

Uma opção de mitigação é criar a tabela temporária com ROW_FORMAT=COMPRESSED, para que ela seja armazenada em tablespaces de arquivo por tabela, no diretório de arquivos temporários. No entanto, a desvantagem são os custos de desempenho associados à criação e remoção de um tablespace de arquivo por tabela para cada tabela temporária.


Erro fatal durante o upgrade

Você verá a mensagem de erro ERROR_INTERNAL_FATAL ao fazer upgrade dos recursos na instância.

O problema pode ser

Há muitas causas possíveis.

O que você precisa tentar

Os registros podem revelar mais. Mas, em qualquer caso, o suporte ao cliente pode ser necessário para forçar a recriação da instância.


A instância trava na reinicialização quando acaba o espaço em disco

A instância trava na reinicialização quando acaba o espaço em disco

O problema pode ser

O recurso de aumento automático de armazenamento não está ativado.

O que você precisa tentar

Se a instância ficar sem espaço de armazenamento e o recurso de aumento automático de armazenamento não estiver ativado, a instância ficará off-line. Para evitar esse problema, edite a instância para ativar o aumento automático de armazenamento.



Desligamento lento na reinicialização

Desligamento lento na reinicialização.

O problema pode ser

Quando uma instância é encerrada, todas as conexões pendentes que não são encerradas em até 60 segundos produzirão erros no desligamento.

O que você precisa tentar

Com apenas conexões que duram menos de 60 segundos, a maioria dos desligamentos com erros pode ser evitada, incluindo conexões do prompt de comando do banco de dados. Se você mantiver essas conexões abertas por horas ou dias, é possível que haja erros nos desligamentos.


Acesso negado para o usuário

Você vê a mensagem de erro Access denied for user 'XXX'@'XXX' (using password: XXX).

O problema pode ser

Há várias causas possíveis, incluindo:

  • o nome de usuário (ou senha) está incorreto;
  • o usuário está se conectando de algo diferente de @XXX;
  • o usuário não tem os privilégios corretos para o banco de dados a que está tentando se conectar.

O que você precisa tentar

  • Verifique o nome de usuário e a senha correspondente
  • Verifique a origem da conexão para ver se ela corresponde a onde o usuário recebeu privilégios de acesso.
  • Verifique os privilégios de concessão do usuário no banco de dados.

Não é possível excluir o usuário

Não é possível excluir um usuário do banco de dados.

O problema pode ser

O usuário tem objetos no banco de dados que dependem dele. Primeiro, você precisa descartar esses objetos ou reatribuí-los a outro usuário.

O que você deve tentar

Descubra quais objetos dependem do usuário e, em seguida, solte ou reatribua esses objetos a outro usuário.


Não é possível atribuir um endereço IP particular a uma instância atual em uma VPC compartilhada

Não é possível atribuir um endereço IP privado a uma instância atual em uma VPC compartilhada.

O problema pode ser

Isso acontece porque, quando uma instância do Cloud SQL é criada, ela é automaticamente anexada a um projeto de locatário, assim como todas as instâncias do Cloud SQL nesse mesmo projeto. No entanto, quando a instância criada usa IP particular em uma VPC compartilhada, ela é anexada ao projeto de locatário associado ao projeto host da VPC compartilhada.

O que você precisa tentar

Crie uma nova instância do Cloud SQL para substituir a atual.


Consultas específicas lentas

O uso da CPU está consistentemente alto.

O problema pode ser

As consultas podem ser lentas por vários motivos, principalmente devido a aspectos específicos do banco de dados. Um motivo que pode envolver o Cloud SQL é a latência da rede, quando o recurso de origem (gravador ou leitor) e o recurso de destino (Cloud SQL) estão em regiões diferentes.

O que você precisa tentar

Consulte as dicas gerais de desempenho, especialmente:

Para atualizações, exclusões ou inserções lentas no banco de dados, considere as seguintes ações:

  • Verifique os locais do gravador e do banco de dados. O envio de dados por uma longa distância gera latência.
  • Verifique o local do leitor e do banco de dados. A latência afeta o desempenho de leitura ainda mais do que o desempenho de gravação
Para reduzir a latência, recomenda-se que os recursos de origem e de destino estejam na mesma região.


A falta de memória é indicada, mas os gráficos de monitoramento não mostram isso

Uma instância falha e informa Out of memory, mas os gráficos do Console ou do Cloud Monitoring parecem mostrar que ainda há memória restante.

O problema pode ser

Há outros fatores, além da carga de trabalho, que podem afetar o uso de memória, como o número de conexões ativas e processos de sobrecarga interna. Eles nem sempre aparecem nos gráficos de monitoramento.

O que você precisa tentar

Verifique se a instância tem sobrecarga suficiente para suportar sua carga de trabalho e alguma sobrecarga adicional.

Replicação

Clique nos links da tabela para ver detalhes:

Para este problema... O problema pode ser... Tente o seguinte...
A réplica de leitura não começou a ser replicada na criação. Pelo menos um backup precisa ser criado após a ativação da geração de registros binários. Aguarde até que pelo menos um backup seja criado depois de ativar os registros binários.
Não foi possível criar a réplica de leitura: erro desconhecido. Há muitas causas possíveis. Verifique os registros para encontrar mais informações.
O disco está cheio. O tamanho do disco da instância principal pode ficar cheio durante a criação da réplica. Faça upgrade da instância principal para um tamanho de disco maior.
A instância da réplica está usando memória demais. As réplicas podem armazenar em cache as operações de leitura solicitadas com frequência. Reinicie a instância da réplica para recuperar o espaço de memória temporário.
Replicação interrompida. O espaço de armazenamento máximo foi atingido e o aumento automático de armazenamento não está ativado. Ative o aumento automático de armazenamento.
O atraso da replicação é consistentemente alto. muitas causas diferentes possíveis. Veja algumas dicas.

A réplica de leitura não começou a ser replicada na criação

A réplica de leitura não começou a ser replicada na criação.

O problema pode ser

A instância principal precisa ter pelo menos uma semana de binlogs. Caso contrário, as réplicas não poderão ser replicadas.

O que você deve tentar

Aguarde até que haja binlogs suficientes.


Não foi possível criar a réplica de leitura: erro desconhecido

Não foi possível criar a réplica de leitura: unknown error.

O problema pode ser

Provavelmente há um erro mais específico nos arquivos de registro.

O que você deve tentar

Inspecione os registros no Cloud Logging para encontrar o erro real. Se o erro for: set Service Networking service account as servicenetworking.serviceAgent role on consumer project, desative e reative o Service Networking API. Essa ação cria a conta de serviço necessária para continuar com o processo.


Disco cheio

error: disk is full

O problema pode ser

O tamanho do disco da instância principal pode ficar cheio durante a criação da réplica.

O que você deve tentar

Edite a instância principal com upgrade para um tamanho de disco maior.


A instância da réplica está usando memória demais

A instância da réplica está usando memória demais.

O problema pode ser

A réplica usa memória temporária para armazenar em cache as operações de leitura solicitadas com frequência, o que pode fazer com que ela use mais memória do que a instância principal.

O que você deve tentar

Reinicie a instância da réplica para recuperar o espaço de memória temporário.


Replicação interrompida

Replicação interrompida.

O problema pode ser

O limite máximo de armazenamento foi atingido e >automatic storage increase is disabled.

O que você deve tentar

Edite a instância para ativar automatic storage increase.


O atraso da replicação é consistentemente alto

O atraso da replicação é consistentemente alto.

O problema pode ser

A carga de gravação é alta demais para a réplica processar. O atraso de replicação ocorre quando a linha de execução SQL em uma réplica não consegue acompanhar a linha de execução de E/S. Alguns tipos de consultas ou cargas de trabalho podem causar um atraso de replicação longo ou temporário para um determinado esquema. Estas são algumas das causas comuns do atraso de replicação:

  • Todas as tabelas precisam ter uma chave primária/exclusiva. Cada atualização em uma tabela sem uma chave exclusiva/principal resulta em varreduras completas na tabela da réplica.
  • Consultas como DELETE ... WHERE field < 50000000 causam atraso de replicação com base em linha, já que um grande número de atualizações é acumulado na réplica.

O que você precisa tentar

Algumas soluções possíveis:

  • Edite a instância para aumentar o tamanho da réplica.
  • Reduza a carga no banco de dados.
  • Inclua as tabelas em um índice.
  • Identifique e corrija consultas lentas.
  • Recrie a réplica.