A integração do Apache Hadoop recolhe métricas de nós de nomes relacionadas com o armazenamento, como a utilização da capacidade, os acessos a ficheiros e os blocos. A integração também recolhe registos do Hadoop e analisa-os num payload JSON. O resultado inclui campos para a origem, o nível e a mensagem.
Para mais informações sobre o Hadoop, consulte a documentação do Apache Hadoop.
Pré-requisitos
Para recolher telemetria do Hadoop, tem de instalar o agente de operações:
- Para métricas, instale a versão 2.11.0 ou superior.
- Para registos, instale a versão 2.11.0 ou superior.
Esta integração suporta as versões 2.10.x, 3.2.x e 3.3.x do Hadoop.
Configure a sua instância do Hadoop
Para expor um ponto final JMX, tem de definir a propriedade do sistema com.sun.management.jmxremote.port
quando iniciar a JVM. Também recomendamos que defina a propriedade do sistema com.sun.management.jmxremote.rmi.port para a mesma porta. Para
expôr um ponto final JMX remotamente, também tem de definir a propriedade do sistema java.rmi.server.hostname.
Por predefinição, estas propriedades são definidas no ficheiro hadoop-env.sh de uma implementação do Hadoop.
Para definir propriedades do sistema através de argumentos da linha de comandos, adicione -D antes do nome da propriedade ao iniciar a JVM. Por exemplo, para definir
com.sun.management.jmxremote.port para a porta 8004, especifique o seguinte quando
iniciar a JVM:
-Dcom.sun.management.jmxremote.port=8004
Configure o agente de operações para o Hadoop
Seguindo o guia para configurar o Ops Agent, adicione os elementos necessários para recolher telemetria de instâncias do Hadoop e reinicie o agente.
Exemplo de configuração
Os seguintes comandos criam a configuração para recolher e carregar telemetria para o Hadoop:
Para que estas alterações entrem em vigor, tem de reiniciar o agente de operações:
Linux
- Para reiniciar o agente, execute o seguinte comando na sua instância:
sudo systemctl restart google-cloud-ops-agent 
- Para confirmar que o agente foi reiniciado, execute o seguinte comando e
   verifique se os componentes "Agente de métricas" e "Agente de registo" foram iniciados:
sudo systemctl status "google-cloud-ops-agent*" 
Windows
- Estabeleça ligação à sua instância através do RDP ou de uma ferramenta semelhante e inicie sessão no Windows.
- Abra um terminal do PowerShell com privilégios de administrador: clique com o botão direito do rato no ícone do PowerShell e selecione Executar como administrador
- Para reiniciar o agente, execute o seguinte comando do PowerShell:
Restart-Service google-cloud-ops-agent -Force 
- Para confirmar que o agente foi reiniciado, execute o seguinte comando e
    verifique se os componentes "Agente de métricas" e "Agente de registo" foram iniciados:
Get-Service google-cloud-ops-agent* 
Configure a recolha de registos
Para carregar registos do Hadoop, tem de criar um recetor para os registos produzidos pelo Hadoop e, em seguida, criar um pipeline para o novo recetor.
Para configurar um recetor para os seus registos hadoop, especifique os seguintes campos:
| Campo | Predefinição | Descrição | 
|---|---|---|
| exclude_paths | Uma lista de padrões de caminhos do sistema de ficheiros a excluir do conjunto correspondente a include_paths. | |
| include_paths | [/opt/hadoop/logs/hadoop-*.log, /opt/hadoop/logs/yarn-*.log] | Uma lista de caminhos do sistema de ficheiros a ler através da análise detalhada de cada ficheiro. Pode usar um caráter universal ( *) nos caminhos. | 
| record_log_file_path | false | Se estiver definido como true, o caminho para o ficheiro específico a partir do qual o registo de registo foi obtido aparece na entrada de registo de saída como o valor da etiquetaagent.googleapis.com/log_file_path. Quando usa um caráter universal, apenas é registado o caminho do ficheiro a partir do qual o registo foi obtido. | 
| type | Este valor tem de ser hadoop. | |
| wildcard_refresh_interval | 60s | O intervalo no qual os caminhos de ficheiros com carateres universais em include_pathssão atualizados. Indicado como uma duração, por exemplo,30sou2m. Esta propriedade pode ser útil em débitos de registo elevados, em que os ficheiros de registo são rodados mais rapidamente do que o intervalo predefinido. | 
O que é registado
O logName é derivado dos IDs dos recetores especificados na configuração. Os campos detalhados no interior de
LogEntry
são os seguintes.
Os registos hadoop contêm os seguintes campos em LogEntry:
| Campo | Tipo | Descrição | 
|---|---|---|
| jsonPayload.message | de string | Mensagem de registo | 
| jsonPayload.severity | de string | Nível de entrada do registo | 
| jsonPayload.source | de string | A classe Java de origem da entrada do registo | 
| severity | string ( LogSeverity) | Nível de entrada de registo (traduzido). | 
Configure a recolha de métricas
Para carregar métricas do Hadoop, tem de criar um recetor para as métricas produzidas pelo Hadoop e, em seguida, criar um pipeline para o novo recetor.
Este recetor não suporta a utilização de várias instâncias na configuração, por exemplo, para monitorizar vários pontos finais. Todas essas instâncias escrevem na mesma série cronológica e o Cloud Monitoring não tem forma de as distinguir.
Para configurar um destinatário para as suas métricas hadoop, especifique os seguintes campos:
| Campo | Predefinição | Descrição | 
|---|---|---|
| collect_jvm_metrics | true | Configura o recetor para também recolher as métricas de JVM suportadas. | 
| collection_interval | 60s | Um valor de duração, como 30sou5m. | 
| endpoint | localhost:8004 | O URL do serviço JMX ou o anfitrião e a porta usados para criar o URL do serviço. Este valor tem de estar no formato service:jmx:<protocol>:<sap>ouhost:port. Os valores no formatohost:portsão usados para criar um URL de serviço deservice:jmx:rmi:///jndi/rmi://<host>:<port>/jmxrmi. | 
| password | A palavra-passe configurada se o JMX estiver configurado para exigir autenticação. | |
| type | Este valor tem de ser hadoop. | |
| username | O nome de utilizador configurado se o JMX estiver configurado para exigir autenticação. | 
O que é monitorizado
A tabela seguinte apresenta a lista de métricas que o agente de operações recolhe da instância do Hadoop.
| Tipo de métrica | |
|---|---|
| Tipo, Tipo Recursos monitorizados | Etiquetas | 
| workload.googleapis.com/hadoop.name_node.block.corrupt | |
| GAUGE,INT64gce_instance | node_name | 
| workload.googleapis.com/hadoop.name_node.block.count | |
| GAUGE,INT64gce_instance | node_name | 
| workload.googleapis.com/hadoop.name_node.block.missing | |
| GAUGE,INT64gce_instance | node_name | 
| workload.googleapis.com/hadoop.name_node.capacity.limit | |
| GAUGE,INT64gce_instance | node_name | 
| workload.googleapis.com/hadoop.name_node.capacity.usage | |
| GAUGE,INT64gce_instance | node_name | 
| workload.googleapis.com/hadoop.name_node.data_node.count | |
| GAUGE,INT64gce_instance | node_namestate | 
| workload.googleapis.com/hadoop.name_node.file.load | |
| GAUGE,INT64gce_instance | node_name | 
| workload.googleapis.com/hadoop.name_node.volume.failed | |
| GAUGE,INT64gce_instance | node_name | 
Valide a configuração
Esta secção descreve como verificar se configurou corretamente o recetor do Hadoop. O agente de operações pode demorar um ou dois minutos a começar a recolher telemetria.
Para verificar se os registos do Hadoop estão a ser enviados para o Cloud Logging, faça o seguinte:
- 
Na Google Cloud consola, aceda à página Explorador de registos: Aceda ao Explorador de registos Se usar a barra de pesquisa para encontrar esta página, selecione o resultado cuja legenda é Registo. 
- Introduza a seguinte consulta no editor e, de seguida, clique em Executar consulta:
      
 resource.type="gce_instance" log_id("hadoop")
Para verificar se as métricas do Hadoop estão a ser enviadas para o Cloud Monitoring, faça o seguinte:
- 
Na Google Cloud consola, aceda à página leaderboard Explorador de métricas: Se usar a barra de pesquisa para encontrar esta página, selecione o resultado cujo subtítulo é Monitorização. 
- Na barra de ferramentas do painel do criador de consultas, selecione o botão cujo nome é code MQL ou code PromQL.
- Verifique se a opção PromQL está selecionada no botão Idioma. O botão para alternar o idioma encontra-se na mesma barra de ferramentas que lhe permite formatar a consulta.
- Introduza a seguinte consulta no editor e, de seguida, clique em Executar consulta:
      
 {"workload.googleapis.com/hadoop.name_node.capacity.usage", monitored_resource="gce_instance"}
Ver o painel de controlo
Para ver as métricas do Hadoop, tem de ter um gráfico ou um painel de controlo configurado. A integração do Hadoop inclui um ou mais painéis de controlo para si. Todos os painéis de controlo são instalados automaticamente depois de configurar a integração e o agente de operações começar a recolher dados de métricas.
Também pode ver pré-visualizações estáticas de painéis de controlo sem instalar a integração.
Para ver um painel de controlo instalado, faça o seguinte:
- 
Na Google Cloud consola, aceda à página  Painéis de controlo: Painéis de controlo:Se usar a barra de pesquisa para encontrar esta página, selecione o resultado cujo subtítulo é Monitorização. 
- Selecione o separador Lista de painéis de controlo e, de seguida, escolha a categoria Integrações.
- Clique no nome do painel de controlo que quer ver.
Se configurou uma integração, mas o painel de controlo não foi instalado, verifique se o agente de operações está em execução. Quando não existem dados de métricas para um gráfico no painel de controlo, a instalação do painel de controlo falha. Depois de o agente de operações começar a recolher métricas, o painel de controlo é instalado para si.
Para ver uma pré-visualização estática do painel de controlo, faça o seguinte:
- 
Na Google Cloud consola, aceda à página  Integrações: Integrações:Se usar a barra de pesquisa para encontrar esta página, selecione o resultado cujo subtítulo é Monitorização. 
- Clique no filtro da plataforma de implementação Compute Engine.
- Localize a entrada para Hadoop e clique em Ver detalhes.
- Selecione o separador Painéis de controlo para ver uma pré-visualização estática. Se o painel de controlo estiver instalado, pode navegar até ele clicando em Ver painel de controlo.
Para mais informações acerca dos painéis de controlo no Cloud Monitoring, consulte o artigo Painéis de controlo e gráficos.
Para mais informações sobre como usar a página Integrações, consulte o artigo Gerir integrações.
Instale políticas de alerta
As políticas de alerta indicam ao Cloud Monitoring que lhe envie uma notificação quando ocorrerem condições especificadas. A integração do Hadoop inclui uma ou mais políticas de alerta para sua utilização. Pode ver e instalar estas políticas de alerta na página Integrações em Monitorização.
Para ver as descrições das políticas de alerta disponíveis e instalá-las, faça o seguinte:
- 
Na Google Cloud consola, aceda à página  Integrações: Integrações:Se usar a barra de pesquisa para encontrar esta página, selecione o resultado cujo subtítulo é Monitorização. 
- Localize a entrada para Hadoop e clique em Ver detalhes.
- Selecione o separador Alertas. Este separador apresenta descrições das políticas de alerta disponíveis e uma interface para as instalar.
- Instale políticas de alerta. As políticas de alerta precisam de saber para onde enviar notificações de que o alerta foi acionado, pelo que requerem informações suas para a instalação.
        Para instalar políticas de alerta, faça o seguinte:
        - Na lista de políticas de alerta disponíveis, selecione as que quer instalar.
- Na secção Configurar notificações, selecione um ou mais canais de notificação. Tem a opção de desativar a utilização de canais de notificação, mas, se o fizer, as suas políticas de alerta são acionadas silenciosamente. Pode verificar o respetivo estado em Monitorização, mas não recebe notificações. - Para mais informações sobre os canais de notificação, consulte o artigo Faça a gestão dos canais de notificação. 
- Clique em Criar políticas.
 
Para mais informações sobre as políticas de alerta no Cloud Monitoring, consulte o artigo Introdução aos alertas.
Para mais informações sobre como usar a página Integrações, consulte o artigo Gerir integrações.
O que se segue?
Para ver um passo a passo sobre como usar o Ansible para instalar o agente de operações, configurar uma aplicação de terceiros e instalar um painel de controlo de exemplo, consulte o vídeo Instale o agente de operações para resolver problemas de aplicações de terceiros.