Filtros de estado del proceso

En esta guía, se describe cómo contar la cantidad de procesos que se ejecutan en tus máquinas virtuales (VMs) que cumplen con las condiciones de filtro que especificas. Puedes crear políticas de alertas y gráficos que cuenten procesos mediante la API de Cloud Monitoring o la consola de Google Cloud.

Si te interesa obtener información sobre procesos en ejecución, por ejemplo, deseas conocer el uso de CPU para procesos específicos, consulta Métricas de procesos.

La estructura del filtro de Monitoring cuando se usa para contar procesos es similar a la que se usa cuando usas estos filtros para especificar recursos supervisados o tipos de métricas. Para obtener información general, consulta Filtros de supervisión.

Antes de comenzar

Si no estás familiarizado con las métricas, las series temporales y los recursos supervisados, consulta Métricas, series temporales y recursos.

Procesos que se cuentan

Monitoring cuenta los procesos mediante la aplicación de una expresión regular a la línea de comandos que invocó el proceso. Si un proceso no tiene un campo de línea de comandos disponible, ese proceso no se cuenta.

Una forma de determinar si se puede contar un proceso es ver el resultado del comando ps de Linux:

    ps aux | grep nfs
    USER      PID  %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMAND
    root      1598  0.0  0.0      0     0 ?        S<   Oct25   0:00 [nfsd4]
    root      1639  0.0  0.0      0     0 ?        S    Oct25   2:33 [nfsd]
    root      1640  0.0  0.0      0     0 ?        S    Oct25   2:36 [nfsd]

Cuando la entrada de la columna COMMAND se une entre corchetes, por ejemplo, [nfsd], la información de la línea de comandos para el proceso no está disponible y, por lo tanto, el proceso no se cuenta.

Estructura del filtro del estado del proceso

Un filtro de estado del proceso identifica qué procesos contar y uno o más recursos cuyos procesos se contarán. Por ejemplo, el siguiente JSON describe una política de alertas que envía una notificación si la cantidad de procesos es inferior a 30 en cualquier instancia de VM de Compute Engine:

     {
        "displayName": "Count all processes",
        "conditionThreshold": {
          "aggregations": [],
          "comparison": "COMPARISON_LT",
          "duration": "0s",
          "filter": "select_process_count(\"*\") resource.type=\"gce_instance\"",
          "thresholdValue": 30,
          "trigger": {
            "count": 1
          }
        }
     }

En este ejemplo, el valor de la declaración filter es una string con dos cláusulas. La primera cláusula, select_process_count(\"*\"), especifica que se cuentan todos los procesos. La segunda cláusula, resource.type=\"gce_instance\", identifica que las VM de Compute Engine se deben supervisar.

Si usas la consola de Google Cloud, utiliza el modo de filtro directo para ingresar el valor de un filtro de Monitoring. Sin embargo, asegúrate de quitar los caracteres de escape que protejan una subcadena. Por ejemplo, para contar todos los procesos de las VMs de Compute Engine, ingresa lo siguiente:

    select_process_count("*") resource.type="gce_instance"

Para obtener información sobre cómo acceder al modo de filtro directo cuando se usa el Explorador de métricas o cuando se crean políticas de alertas o gráficos en paneles, consulta los siguientes documentos:

Identificador de recursos

Un filtro de estado del proceso debe establecer el campo resource.type para especificar las VM cuyos procesos se cuentan. El valor de este filtro debe ser uno de los siguientes:

  • gce_instance
  • aws_ec2_instance

Si solo especificas el campo resource.type, se contarán los procesos en todas las VM:

  • Para seleccionar una sola instancia de VM, agrega un objeto de filtro metric.labels.instance_name.
  • Para seleccionar un grupo de VMs, agrega un objeto de filtro group.id.

Para obtener más información sobre el campo resource.type, consulta Filtros de supervisión.

Identificador de proceso

Un filtro de estado del proceso debe llamar a la función select_process_count. Los argumentos de esta función identifican los procesos que se deben contar.

Existen tres objetos de filtro que puedes especificar en una llamada a select_process_count:

  • command_line (o metric.labels.command_line): Este filtro se aplica a la línea de comandos que se usa para iniciar el proceso. Las líneas de comandos se truncan después de los 1,024 caracteres, por lo que el texto en una línea de comandos que supere ese límite no se podrá comparar.

  • command (o metric.labels.command): Este filtro se aplica a la línea de comandos que se usa para iniciar el proceso. Los comandos se truncan después de los 1,024 caracteres, por lo que el texto de un comando que supere ese límite no se podrá comparar.

  • user (o metric.labels.user): Este filtro se aplica al usuario que inició el proceso.

Puedes usar argumentos posicionales o con nombre en la llamada a select_process_count. Si usas argumentos con nombre, debes especificar el objeto de filtro, una declaración de igualdad, = y un valor. Si usas argumentos posicionales, solo especificas el valor. Una prueba de string que distingue mayúsculas de minúsculas determina si un proceso coincide con el filtro.

El valor de un objeto de filtro puede ser cualquiera de los siguientes:

  • string (concordancia exacta)
  • * (Comodín)
  • has_substring(string)
  • starts_with(string)
  • ends_with(string)
  • monitoring.regex.full_match(string)

Si especificas varios filtros, se aplican las siguientes reglas:

  • command_line se une a command mediante un OR lógico. Un proceso se cuenta cuando coincide con cualquiera de los filtros.
  • user se une a command_line (command) mediante un operador lógico AND. Un proceso es una coincidencia solo cuando coincide con el filtro user y el filtro command_line (command).
  • Si aplicas todos los filtros, se cuenta un proceso cuando coincide con el filtro user y con el filtro command_line o command.

Argumentos con nombre

Para usar argumentos con nombre, especifica el nombre del filtro, una declaración de igualdad, = y, luego, el valor del filtro. Puedes especificar argumentos con nombre en cualquier orden.

Por ejemplo, lo siguiente coincide con todos los procesos iniciados por raíz cuando la línea de comandos incluyó la cadena nginx:

     select_process_count("command_line=has_substring(\"nginx\")","user=root")

En este ejemplo, se usa una coincidencia de expresión regular en la línea de comandos:

     select_process_count("command_line=monitoring.regex.full_match(\".*nginx.*\")","user=starts_with(\"root\")")

En este ejemplo, se cuentan todos los procesos cuya línea de comandos fue /bin/bash:

     select_process_count("command=/bin/bash")

En este ejemplo, se cuentan todos los procesos que inició el usuario www cuya línea de comandos comienza con /bin/bash:

     select_process_count("user=www", "command_line=starts_with(\"/bin/bash \")")

Argumentos de posición

Para usar argumentos posicionales, proporciona solo el valor de filtro. Las siguientes reglas se aplican a los argumentos posicionales:

  • Si se proporciona un solo argumento, ese argumento se interpreta como un objeto de filtro de línea de comandos:
        select_process_count("*")
        select_process_count("/sbin/init")
        select_process_count("starts_with(\"/bin/bash -c\")")
        select_process_count("ends_with(\"--alsologtostderr\")")
        select_process_count("monitoring.regex.full_match(\".*nginx.*\")")
  • Si se proporcionan dos argumentos, el primero se interpreta como un filtro de línea de comandos y el segundo es un filtro de usuario. Un proceso se cuenta cuando coincide con ambos objetos de filtro:
        select_process_count("/sbin/init", "root")