Monitorize o estado de saúde

As instâncias de blocos de notas geridas pelo utilizador oferecem vários métodos para monitorizar o estado dos seus blocos de notas. Esta página descreve como usar cada método.

Métodos de monitorização do estado de saúde

Pode monitorizar o estado das instâncias de blocos de notas geridos pelo utilizador de várias formas diferentes. Esta página descreve como usar os seguintes métodos:

Configure a CLI gcloud

Para concluir alguns dos passos nesta página, tem de usar a CLI Google Cloud.

Instale a CLI Google Cloud. Após a instalação, inicialize a CLI gcloud executando o seguinte comando:

gcloud init

Se estiver a usar um fornecedor de identidade (IdP) externo, primeiro tem de iniciar sessão na CLI gcloud com a sua identidade federada.

Use atributos de convidados para comunicar o estado de funcionamento do sistema

Pode usar atributos de convidado para comunicar o estado de funcionamento do sistema dos seguintes serviços principais:

  • Serviço Docker
  • Agente de proxy reverse do Docker
  • Serviço Jupyter
  • API Jupyter

Os atributos de convidados são um tipo específico de metadados personalizados que as aplicações podem escrever enquanto são executadas na instância de blocos de notas geridos pelo utilizador. Para saber mais acerca dos atributos de convidados, consulte o artigo Acerca dos metadados da VM.

Como as instâncias usam atributos de convidados para comunicar o estado de funcionamento do sistema

O serviço notebooks-collection-agent executa um processo Python em segundo plano que verifica o estado dos serviços principais da instância dos blocos de notas geridos pelo utilizador e atualiza os atributos convidados como 1 se não forem detetados problemas ou -1 se for detetada uma falha.

Para usar o serviço notebooks-collection-agent para criar relatórios sobre o estado da instância de blocos de notas geridos pelo utilizador, tem de ativar os seguintes atributos de convidado ao criar uma instância de blocos de notas geridos pelo utilizador:

  • enable-guest-attributes=TRUE: isto ativa os atributos de convidado na instância de blocos de notas gerida pelo utilizador. Todas as novas instâncias ativam este atributo por predefinição.
  • report-system-health=TRUE: Este sistema regista os resultados da verificação do estado de funcionamento nos atributos de hóspedes.

O serviço notebooks-collection-agent não precisa de autorizações especiais para escrever nos atributos de convidados da instância.

Crie uma instância de blocos de notas gerida pelo utilizador com atributos convidados do estado de funcionamento do sistema ativados

Para usar atributos convidados do estado de funcionamento do sistema para criar relatórios sobre o estado de funcionamento da instância de blocos de notas geridos pelo utilizador, tem de selecionar a caixa de verificação Ativar relatório do estado de funcionamento do sistema quando criar uma instância de blocos de notas geridos pelo utilizador.

Pode ativar o relatório de estado do sistema através da Google Cloud consola ou da CLI do Google Cloud.

Antes de começar

Antes de poder criar uma instância de notebooks gerida pelo utilizador, tem de ter um Google Cloud projeto e ativar a API Notebooks para esse projeto.
    Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.

    In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

    Verify that billing is enabled for your Google Cloud project.

    Enable the Notebooks API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

    In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

    Verify that billing is enabled for your Google Cloud project.

    Enable the Notebooks API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

  1. Se planeia usar GPUs com a instância de blocos de notas geridos pelo utilizador, consulte a página de quotas na Google Cloud consola para garantir que tem GPUs suficientes disponíveis no seu projeto. Se as GPUs não forem apresentadas na página de quotas ou precisar de uma quota de GPUs adicional, pode pedir um aumento da quota. Consulte o artigo Pedir um aumento da quota na página Quotas de recursos do Compute Engine.
  2. Funções necessárias

    Se criou o projeto, tem a função de IAM de proprietário (roles/owner) no projeto, que inclui todas as autorizações necessárias. Ignore esta secção e comece a criar a sua instância de blocos de notas geridos pelo utilizador. Se não criou o projeto, continue nesta secção.

    Para receber as autorizações de que precisa para criar uma instância do Vertex AI Workbench User Managed Notebooks, peça ao seu administrador para lhe conceder as seguintes funções de IAM no projeto:

    Para mais informações sobre a atribuição de funções, consulte o artigo Faça a gestão do acesso a projetos, pastas e organizações.

    Também pode conseguir as autorizações necessárias através de funções personalizadas ou outras funções predefinidas.

    Crie a instância

    Consola

    1. Na Google Cloud consola, aceda à página Blocos de notas geridos pelo utilizador. Em alternativa, aceda a notebook.new (https://notebook.new) e ignore o passo seguinte.

      Aceda aos blocos de notas geridos pelo utilizador

    2. Clique em  Novo bloco de notas e, de seguida, selecione Personalizar.

    3. Na página Crie um bloco de notas gerido pelo utilizador, na secção Detalhes, faculte as seguintes informações para a sua nova instância:

      • Nome: um nome para a nova instância
      • Região e Zona: selecione uma região e uma zona para a nova instância. Para o melhor desempenho da rede, selecione a região geograficamente mais próxima de si. Consulte as localizações de blocos de notas geridos pelo utilizador disponíveis.
    4. Selecione a secção Estado de funcionamento do sistema.

    5. Na secção Estado de funcionamento e relatórios do sistema, selecione a caixa de verificação Ativar relatório do estado de funcionamento do sistema.

    6. Conclua o resto da caixa de diálogo de criação da instância e, de seguida, clique em Criar.

    gcloud

    1. A partir do Cloud Shell ou de qualquer ambiente onde a CLI do Google Cloud esteja instalada, introduza o seguinte comando da CLI do Google Cloud:

      gcloud notebooks instances create INSTANCE_NAME \
          --vm-image-project=deeplearning-platform-release \
          --vm-image-family=IMAGE_FAMILY \
          --machine-type=MACHINE_TYPE \
          --location=ZONE \
          --metadata=enable-guest-attributes=TRUE,report-system-health=TRUE
      

      Substitua o seguinte:

      • INSTANCE_NAME: o nome da nova instância
      • IMAGE_FAMILY: o nome da família de imagens que quer usar para criar a sua instância
      • MACHINE_TYPE: o tipo de máquina da VM da sua instância; por exemplo, n1-standard-4
      • ZONE: a zona onde quer que a nova instância esteja localizada, por exemplo, us-west1-a
    2. Aceda à sua instância a partir da Google Cloud consola.

    Monitorize o estado do sistema através de atributos de hóspedes

    Para instâncias de blocos de notas geridas pelo utilizador que têm os atributos convidados relacionados ativados, pode obter os valores dos atributos convidados de estado do sistema através da Google Cloud consola, da Google Cloud CLI com comandos do Compute Engine ou da Google Cloud CLI com comandos do Vertex AI Workbench.

    Consola

    1. Na Google Cloud consola, aceda à página Blocos de notas geridos pelo utilizador.

      Aceda aos blocos de notas geridos pelo utilizador

    2. Clique no nome da instância cujo estado de funcionamento do sistema quer ver.

    3. Na página Detalhes do bloco de notas, clique no separador Estado. Reveja o estado da sua instância e dos respetivos serviços principais.

    gcloud com o Compute Engine

    gcloud compute instances get-guest-attributes INSTANCE_NAME \
        --zone ZONE
    

    Substitua o seguinte:

    • INSTANCE_NAME: o nome da sua instância
    • ZONE: a zona onde a sua instância está localizada

    Se os seus serviços principais estiverem em bom estado, os resultados têm o seguinte aspeto. Um valor de 1 significa que não foi detetada nenhuma falha.

     NAMESPACE   KEY                         VALUE
     notebooks   docker_proxy_agent_status   1
     notebooks   docker_status               1
     notebooks   jupyterlab_api_status       1
     notebooks   jupyterlab_status           1
     notebooks   system-health               1
     notebooks   updated                     2020-10-01 17:00:00.12345
    

    Se algum dos quatro serviços principais falhar, system-health comunica um valor -1 para indicar uma falha do sistema. Na maioria dos casos, uma falha do sistema significa que o JupyterLab não está acessível.

    Um exemplo de um resultado de falha pode ter o seguinte aspeto.

     NAMESPACE   KEY                         VALUE
     notebooks   docker_proxy_agent_status   -1
     notebooks   docker_status               -1
     notebooks   jupyterlab_api_status       1
     notebooks   jupyterlab_status           1
     notebooks   system-health               -1
     notebooks   updated                     2020-10-01 17:00:00.12345
    

    gcloud com o Vertex AI Workbench

    Para monitorizar o estado do sistema, pode usar o método getInstanceHealth para obter os valores dos atributos de convidado.

    O exemplo seguinte mostra como fazê-lo através da CLI gcloud.

    gcloud notebooks instances is-healthy example-instance \
        --location=ZONE
    

    Substitua ZONE pela zona onde a sua instância está localizada, por exemplo, us-west1-a.

    Se os seus serviços principais estiverem em bom estado, os resultados têm o seguinte aspeto. Um valor de 1 significa que não foi detetada nenhuma falha.

      {
              "health_state": HEALTHY,
              "docker-proxy-agent": 1,
              "docker-service": 1,
              "jupyter-service": 1,
              "jupyter-api": 1,
              "last-updated": "2020-10-01 17:00:30.12345"
      }
    

    Um exemplo de um resultado de falha pode ter o seguinte aspeto.

      {
              "healthy": UNHEALTHY,
              "docker-proxy-agent": 1,
              "docker-service": 1,
              "jupyter-service": -1,
              "jupyter-api": -1,
              "last-updated": "2020-10-01 17:00:30.12345"
      }
    

    Comunique métricas personalizadas à monitorização

    As instâncias de blocos de notas geridas pelo utilizador permitem-lhe recolher o estado do sistema e as métricas do JupyterLab e comunicá-los ao Cloud Monitoring. Estas métricas personalizadas são diferentes das métricas padrão comunicadas quando instala a monitorização na instância de blocos de notas gerida pelo utilizador.

    As métricas personalizadas comunicadas à monitorização incluem o seguinte:

    • O estado de funcionamento do sistema destes serviços principais de blocos de notas geridos pelo utilizador:

      • Serviço Docker
      • Agente de proxy reverse do Docker
      • Serviço Jupyter
      • API Jupyter
    • As seguintes métricas do JupyterLab:

      • Número de núcleos
      • Número de terminais
      • Número de associações
      • Número de sessões
      • Memória máxima
      • Memória elevada
      • Memória atual

    Como as instâncias comunicam métricas personalizadas ao Monitoring

    Para comunicar métricas personalizadas ao Monitoring, tem de ativar a report-notebook-metricsdefinição de metadadosenquantocria uma instância de blocos de notas gerida pelo utilizador.

    Também tem de se certificar de que a conta de serviço da instância de blocos de notas geridos pelo utilizador tem autorizações de escritor de métricas de monitorização (roles/monitoring.metricWriter). Para mais informações, consulte o artigo Faça a gestão do acesso a projetos, pastas e organizações.

    Crie uma instância de blocos de notas gerida pelo utilizador que comunique métricas personalizadas ao Monitoring

    Para comunicar métricas personalizadas ao Monitoring, tem de selecionar a caixa de verificação Comunicar métricas personalizadas ao Cloud Monitoring quando cria uma instância de notebooks geridos pelo utilizador.

    Pode ativar a criação de relatórios de métricas personalizadas no Cloud Monitoring através da Google Cloud consola ou da CLI Google Cloud.

    Antes de começar

    Antes de poder criar uma instância de notebooks gerida pelo utilizador, tem de ter um Google Cloud projeto e ativar a API Notebooks para esse projeto.
      Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.

      In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

      Roles required to select or create a project

      • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
      • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

      Go to project selector

      Verify that billing is enabled for your Google Cloud project.

      Enable the Notebooks API.

      Roles required to enable APIs

      To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

      Enable the API

      In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

      Roles required to select or create a project

      • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
      • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

      Go to project selector

      Verify that billing is enabled for your Google Cloud project.

      Enable the Notebooks API.

      Roles required to enable APIs

      To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

      Enable the API

    1. Se planeia usar GPUs com a instância de blocos de notas geridos pelo utilizador, consulte a página de quotas na Google Cloud consola para garantir que tem GPUs suficientes disponíveis no seu projeto. Se as GPUs não forem apresentadas na página de quotas ou precisar de uma quota de GPUs adicional, pode pedir um aumento da quota. Consulte o artigo Pedir um aumento da quota na página Quotas de recursos do Compute Engine.
    2. Funções necessárias

      Se criou o projeto, tem a função de IAM de proprietário (roles/owner) no projeto, que inclui todas as autorizações necessárias. Ignore esta secção e comece a criar a sua instância de blocos de notas geridos pelo utilizador. Se não criou o projeto, continue nesta secção.

      Para receber as autorizações de que precisa para criar uma instância do Vertex AI Workbench User Managed Notebooks, peça ao seu administrador para lhe conceder as seguintes funções de IAM no projeto:

      Para mais informações sobre a atribuição de funções, consulte o artigo Faça a gestão do acesso a projetos, pastas e organizações.

      Também pode conseguir as autorizações necessárias através de funções personalizadas ou outras funções predefinidas.

      Crie a instância

      Consola

      1. Na Google Cloud consola, aceda à página Blocos de notas geridos pelo utilizador. Em alternativa, aceda a notebook.new (https://notebook.new) e ignore o passo seguinte.

        Aceda aos blocos de notas geridos pelo utilizador

      2. Clique em  Novo bloco de notas e, de seguida, selecione Personalizar.

      3. Na página Crie um bloco de notas gerido pelo utilizador, na secção Detalhes, faculte as seguintes informações para a sua nova instância:

        • Nome: um nome para a nova instância
        • Região e Zona: selecione uma região e uma zona para a nova instância. Para o melhor desempenho da rede, selecione a região geograficamente mais próxima de si. Consulte as localizações de blocos de notas geridos pelo utilizador disponíveis.
      4. Selecione a secção Estado de funcionamento do sistema.

      5. Na secção Estado e relatórios do sistema, selecione a caixa de verificação Comunicar métricas personalizadas ao Cloud Monitoring.

      6. Conclua o resto da caixa de diálogo de criação da instância e, de seguida, clique em Criar.

      gcloud

      1. A partir do Cloud Shell ou de qualquer ambiente onde a CLI do Google Cloud esteja instalada, introduza o seguinte comando da CLI do Google Cloud:

        gcloud notebooks instances create INSTANCE_NAME \
            --vm-image-project=deeplearning-platform-release \
            --vm-image-family=IMAGE_FAMILY \
            --machine-type=MACHINE_TYPE \
            --location=ZONE \
            --metadata=report-notebook-metrics=TRUE
        

        Substitua o seguinte:

        • INSTANCE_NAME: o nome da nova instância
        • IMAGE_FAMILY: o nome da família de imagens que quer usar para criar a sua instância
        • MACHINE_TYPE: o tipo de máquina da VM da sua instância, por exemplo, n1-standard-4
        • ZONE: a zona onde quer que a nova instância esteja localizada, por exemplo, us-west1-a
      2. Aceda à sua instância a partir da Google Cloud consola.

      Conceda autorizações de escritor de métricas de monitorização à conta de serviço

      Depois de criar a nova instância de blocos de notas geridos pelo utilizador, conceda autorizações de gravação de métricas de monitorização (roles/monitoring.metricWriter) à conta de serviço da instância de blocos de notas geridos pelo utilizador. Para mais informações, consulte o artigo Faça a gestão do acesso a projetos, pastas e organizações.

      Monitorize métricas personalizadas através da Monitorização

      Para instâncias de blocos de notas geridas pelo utilizador que têm a criação de relatórios de métricas personalizadas ativada, pode monitorizar as suas métricas personalizadas através da Google Cloud consola.

      1. Na Google Cloud consola, aceda à página Blocos de notas geridos pelo utilizador.

        Aceda aos blocos de notas geridos pelo utilizador

      2. Clique no nome da instância cujas métricas personalizadas quer ver.

      3. Na página Detalhes do bloco de notas, clique no separador Monitorização. Reveja as métricas personalizadas da sua instância.

      Instale a monitorização numa instância

      Esta opção instala automaticamente a funcionalidade Monitorização. A instalação requer 256 MB de espaço em disco. É necessária uma ligação à Internet para que as métricas sejam comunicadas ao Monitoring.

      Como as instâncias comunicam métricas do sistema e da aplicação

      Para comunicar métricas do sistema e da aplicação instalando o Cloud Monitoring na instância de notebooks geridos pelo utilizador, tem de selecionar a caixa de verificação Instalar agente do Cloud Monitoring quando criar uma instância de notebooks geridos pelo utilizador. Estas métricas são diferentes das métricas personalizadas comunicadas quando ativa a definição de metadados report-notebook-metrics.

      Crie uma instância de blocos de notas gerida pelo utilizador que comunique métricas do sistema e da aplicação ao Monitoring

      Para instalar o Monitoring na instância de blocos de notas geridos pelo utilizador, pode usar a consola Google Cloud ou a Google Cloud CLI.

      Antes de começar

      Antes de poder criar uma instância de notebooks gerida pelo utilizador, tem de ter um Google Cloud projeto e ativar a API Notebooks para esse projeto.
        Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.

        In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

        Roles required to select or create a project

        • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
        • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

        Go to project selector

        Verify that billing is enabled for your Google Cloud project.

        Enable the Notebooks API.

        Roles required to enable APIs

        To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

        Enable the API

        In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

        Roles required to select or create a project

        • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
        • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

        Go to project selector

        Verify that billing is enabled for your Google Cloud project.

        Enable the Notebooks API.

        Roles required to enable APIs

        To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

        Enable the API

      1. Se planeia usar GPUs com a instância de blocos de notas geridos pelo utilizador, consulte a página de quotas na Google Cloud consola para garantir que tem GPUs suficientes disponíveis no seu projeto. Se as GPUs não forem apresentadas na página de quotas ou precisar de uma quota de GPUs adicional, pode pedir um aumento da quota. Consulte o artigo Pedir um aumento da quota na página Quotas de recursos do Compute Engine.
      2. Funções necessárias

        Se criou o projeto, tem a função de IAM de proprietário (roles/owner) no projeto, que inclui todas as autorizações necessárias. Ignore esta secção e comece a criar a sua instância de blocos de notas geridos pelo utilizador. Se não criou o projeto, continue nesta secção.

        Para receber as autorizações de que precisa para criar uma instância do Vertex AI Workbench User Managed Notebooks, peça ao seu administrador para lhe conceder as seguintes funções de IAM no projeto:

        Para mais informações sobre a atribuição de funções, consulte o artigo Faça a gestão do acesso a projetos, pastas e organizações.

        Também pode conseguir as autorizações necessárias através de funções personalizadas ou outras funções predefinidas.

        Crie a instância

        Consola

        1. Na Google Cloud consola, aceda à página Blocos de notas geridos pelo utilizador. Em alternativa, aceda a notebook.new (https://notebook.new) e ignore o passo seguinte.

          Aceda aos blocos de notas geridos pelo utilizador

        2. Clique em  Novo bloco de notas e, de seguida, selecione Personalizar.

        3. Na página Crie um bloco de notas gerido pelo utilizador, na secção Detalhes, faculte as seguintes informações para a sua nova instância:

          • Nome: um nome para a nova instância
          • Região e Zona: selecione uma região e uma zona para a nova instância. Para o melhor desempenho da rede, selecione a região geograficamente mais próxima de si. Consulte as localizações de blocos de notas geridos pelo utilizador disponíveis.
        4. Selecione a secção Estado de funcionamento do sistema.

        5. Na secção Estado de funcionamento do sistema e relatórios, selecione a caixa de verificação Instalar agente do Cloud Monitoring.

        6. Conclua o resto da caixa de diálogo de criação da instância e, de seguida, clique em Criar.

        gcloud

        1. A partir do Cloud Shell ou de qualquer ambiente onde a CLI do Google Cloud esteja instalada, introduza o seguinte comando da CLI do Google Cloud:

          gcloud notebooks instances create INSTANCE_NAME \
              --vm-image-project=deeplearning-platform-release \
              --vm-image-family=IMAGE_FAMILY \
              --machine-type=MACHINE_TYPE \
              --location=ZONE \
              --metadata=install-monitoring-agent=TRUE
          

          Substitua o seguinte:

          • INSTANCE_NAME: o nome da nova instância
          • IMAGE_FAMILY: o nome da família de imagens que quer usar para criar a sua instância
          • MACHINE_TYPE: o tipo de máquina da VM da sua instância; por exemplo, n1-standard-4
          • ZONE: a zona onde quer que a nova instância esteja localizada, por exemplo, us-west1-a
        2. Aceda à sua instância a partir da Google Cloud consola.

        Monitorize as métricas do sistema e da aplicação através da Monitorização

        Para instâncias de blocos de notas geridas pelo utilizador que têm o Monitoring instalado, pode monitorizar as métricas do sistema e da aplicação através da Google Cloud consola:

        1. Na Google Cloud consola, aceda à página Blocos de notas geridos pelo utilizador.

          Aceda aos blocos de notas geridos pelo utilizador

        2. Clique no nome da instância cujas métricas do sistema e da aplicação quer ver.

        3. Na página Detalhes do bloco de notas, clique no separador Monitorização. Reveja as métricas do sistema e da aplicação para a sua instância. Para saber como interpretar estas métricas, consulte Reveja as métricas de recursos.

        Use a ferramenta de diagnóstico para monitorizar o estado de funcionamento do sistema

        As instâncias de blocos de notas geridas pelo utilizador incluem uma ferramenta de diagnóstico incorporada que pode ajudar a monitorizar o estado do sistema das suas instâncias.

        Tarefas realizadas pela ferramenta de diagnóstico

        A ferramenta de diagnóstico realiza as seguintes tarefas:

        • Valida o estado dos seguintes serviços principais dos blocos de notas geridos pelo utilizador:

          • Serviço Docker
          • Agente de proxy reverse do Docker
          • Serviço Jupyter
          • API Jupyter
        • Verifica se o espaço em disco para discos de arranque e de dados é usado acima de um limite de 85%.

        • Instala lsof (é necessária uma ligação à Internet).

        • Recolhe os seguintes registos de instâncias:

          • Informações de rede (ifconfig, netstat)
          • Registos na pasta /var/log/
          • Informações de estado do Docker
          • Dados de lsof (abrir ficheiros)
          • Estado do serviço Docker
          • Estado do agente de proxy reverse
          • Estado do serviço Jupyter
          • Estado da API Jupyter
          • Ficheiro de configuração do agente de proxy
          • Processos Python
        • Executa os seguintes comandos e recolhe os resultados:

          • pip freeze
          • conda list
          • gcloud compute instances describe INSTANCE_NAME
          • gcloud config list

        Execute a ferramenta de diagnóstico

        Para executar a ferramenta de diagnóstico, conclua os passos seguintes:

        1. Use o ssh para se ligar à instância dos blocos de notas geridos pelo utilizador.

        2. No terminal SSH, execute os seguintes comandos:

          sudo -i
          cd /opt/deeplearning/bin/
          ./diagnostic_tool.sh

          A ferramenta de diagnóstico recolhe os registos, comprime-os num ficheiro .tar.gz e coloca o ficheiro na pasta /tmp/.

        3. Extraia o ficheiro e, em seguida, avalie o conteúdo. Os conteúdos incluem:

          • log pasta: registos da pasta var/log/
          • report.log: saída para todos os comandos recolhidos
          • proxy-agent-config.json: Informações de configuração do proxy
          • Registo do Docker: um ficheiro -json.log que inclui registos de contentores Docker

        Pode usar as seguintes opções com a ferramenta de diagnóstico.

        Opção Descrição
        -r Uma opção de reparação que tenta restaurar o estado dos serviços principais dos blocos de notas geridos pelo utilizador com falhas
        -s É executado sem confirmação
        -b Carrega o ficheiro .tar.gz para um contentor do Cloud Storage.
        -v Uma opção de depuração para resolver problemas da ferramenta em caso de falhas
        -c Captura 30 segundos de tráfego de pacotes na instância de notebooks geridos pelo utilizador, filtrando SSH
        -d Uma pasta de destino na qual guardar os registos
        -h Ajuda

        O que se segue?