此页面由 Cloud Translation API 翻译。

YARA-L 2.0 语言语法

支持的语言：

Google SecOps SIEM

本部分介绍 YARA-L 语法的主要元素。另请参阅 YARA-L 2.0 语言概览。

规则结构

对于 YARA-L 2.0，您必须按以下顺序指定变量声明、定义和用法：

meta
events
match（可选）
outcome（可选）
condition
options（可选）

以下示例说明了规则的通用结构：

rule <rule Name>
{
    meta:
    // Stores arbitrary key-value pairs of rule details, such as who wrote
    // it, what it detects on, version control, etc.

  events:
    // Conditions to filter events and the relationship between events.

  match:
    // Values to return when matches are found.

  outcome:
    // Additional information extracted from each detection.

  condition:
    // Condition to check events and the variables used to find matches.

  options:
    // Options to turn on or off while executing this rule.
}

元部分语法

元部分由多个行组成，其中每个行定义一个键值对。键部分必须是不带英文引号的字符串，而值部分必须是带英文引号的字符串：

<key> = "<value>"

以下是有效的 meta 部分行的示例：

meta:
    author = "Google"
    severity = "HIGH"

“事件”部分语法

在 events 部分中，列出谓词以指定以下内容：

变量声明
事件变量过滤条件
事件变量联接

变量声明

对于变量声明，请使用以下语法：

<EVENT_FIELD> = <VAR>
<VAR> = <EVENT_FIELD>

这两个示例是等效的，如以下示例所示：

$e.source.hostname = $hostname
$userid = $e.principal.user.userid

此声明表明此变量表示事件变量的指定字段。当事件字段是重复字段时，匹配变量可以表示数组中的任何值。也可以将多个事件字段分配给单个匹配或占位符变量。这是一个传递性联接条件。

例如，以下方法：

$e1.source.ip = $ip
$e2.target.ip = $ip

等效于：

$e1.source.ip = $ip
$e1.source.ip = $e2.target.ip

使用变量时，必须通过变量声明来声明该变量。如果使用变量时未做任何声明，则会被视为编译错误。

事件变量过滤条件

对单个事件变量起作用的布尔表达式会被视为过滤条件。

事件变量联接

规则中使用的所有事件变量必须采用以下任一方式与所有其他事件变量联接：

通过两个联接事件变量的事件字段之间的相等比较直接联接，例如：$e1.field = $e2.field。表达式不得包含算术。
通过仅涉及一个事件字段的传递联接间接联接（请参阅变量声明中的“传递联接”定义）。表达式不得包含算术。

例如，假设规则中使用了 $e1、$e2 和 $e3，以下 events 部分有效。

events:
  $e1.principal.hostname = $e2.src.hostname // $e1 joins with $e2
  $e2.principal.ip = $e3.src.ip // $e2 joins with $e3

events:
  // $e1 joins with $e2 using function to event comparison
  re.capture($e1.src.hostname, ".*") = $e2.target.hostname

events:
  // $e1 joins with $e2 using an `or` expression
  $e1.principal.hostname = $e2.src.hostname
  or $e1.principal.hostname = $e2.target.hostname
  or $e1.principal.hostname = $e2.principal.hostname

events:
  // all of $e1, $e2 and $e3 are transitively joined using the placeholder variable $ip
  $e1.src.ip = $ip
  $e2.target.ip = $ip
  $e3.about.ip = $ip

events:
  // $e1 and $e2 are transitively joined using function to event comparison
  re.capture($e2.principal.application, ".*") = $app
  $e1.principal.hostname = $app

但是，以下是示例 events 部分无效。

events:
  // Event to arithmetic comparison is an invalid join condition for $e1 and $e2.
  $e1.principal.port = $e2.src.port + 1

events:
  $e1.src.ip = $ip
  $e2.target.ip = $ip
  $e3.about.ip = "192.1.2.0" //$e3 is not joined with $e1 or $e2.

events:
  $e1.src.port = $port

  // Arithmetic to placeholder comparison is an invalid transitive join condition.
  $e2.principal.port + 800 = $port

匹配部分语法

在 match 部分中，列出群组事件的匹配变量，然后再检查匹配条件。这些字段随每个匹配项返回。

指定每个匹配变量在 events 部分中表示的内容。
指定用于在 over 关键字之后关联事件的时间段。时间范围之外的事件会被忽略。
使用以下语法指定时间时长：<number><m/h/d>

其中 m/h/d 分别表示分钟、小时和天。
您可以指定的最短时间为 1 分钟。
可指定的最长时间为 14 天。

以下是有效 match 的示例：

$var1, $var2 over 5m

当规则找到匹配项时，此语句返回 $var1 和 $var2（在 events 部分中定义）。指定时间为 5 分钟。相互间隔超过 5 分钟的事件是不相关的，因此规则会忽略这些事件。

下面是有效 match 部分的另一个示例：

$user over 1h

当规则找到匹配项时，此语句会返回 $user。指定的时间窗口为 1 小时。相互间隔超过一小时的活动之间没有关联。该规则不会将其视为检测。

下面是有效 match 部分的另一个示例：

$source_ip, $target_ip, $hostname over 2m

当规则找到匹配项时，此语句会返回 $source_ip、$target_ip 和 $hostname。指定的时间窗口为 2 分钟。间隔超过 2 分钟的事件不相关。该规则不会将其视为检测。

以下示例说明了无效的 match 部分：

var1, var2 over 5m // invalid variable name
$user 1h // missing keyword

“匹配”部分中的零值处理

规则引擎会隐式过滤掉匹配部分中使用的所有占位符的零值（"" 表示字符串，0 表示数字，false 表示布尔值，枚举类型表示位置 0 中的值）。以下示例展示了用于过滤掉零值的规则。

rule ZeroValuePlaceholderExample {
  meta:
  events:
    // Because $host is used in the match section, the rule behaves
    // as if the following predicate was added to the events section:
    // $host != ""
    $host = $e.principal.hostname

    // Because $otherPlaceholder was not used in the match section,
    // there is no implicit filtering of zero values for $otherPlaceholder.
    $otherPlaceholder = $e.principal.ip

  match:
    $host over 5m

  condition:
    $e
}

不过，如果为函数分配了占位符，规则不会隐式过滤掉匹配部分中使用的占位符的零值。以下示例展示了用于过滤掉零值的规则：

rule ZeroValueFunctionPlaceholder {
  meta:
  events:
    // Even though $ph is used in the match section, there is no
    // implicit filtering of zero values for $ph, because $ph is assigned to a function.
    $ph = re.capture($e.principal.hostname, "some-regex")

  match:
    $ph over 5m

  condition:
    $e
}

如需停用对零值的隐式过滤，您可以在“选项”部分中使用 allow_zero_values 选项。

跳跃窗口

默认情况下，包含匹配部分的 YARA-L 2.0 规则使用跃点窗口进行评估。规则的执行时间范围分为一组重叠的跃点窗口，每个窗口的持续时间都在 match 部分指定。然后，在每个跃点窗口中关联事件。

例如，对于在 [1:00, 2:00] 时间范围内运行的规则，如果 match 部分超过 30m，则可能生成的一组重叠的跳跃窗口为 [1:00, 1:30]、[1:03, 1:33] 和 [1:06, 1:36]。这些窗口用于关联多个事件。

滑动窗口

使用跃点窗口无法有效地搜索按特定顺序发生的事件（例如，e1 可在 e2 后最多 2 分钟内发生）。只有当事件 e1 与事件 e2 落在同一生成的跃点窗口中时，系统才会将它们相关联。

搜索此类事件序列的更有效方法是使用滑动窗口。在滑动窗口时，以指定的数据透视事件变量开始或结束时，会生成时长为 match 区段的滑动窗口。然后，在每个滑动窗口内，事件是相关的。这样，您就可以搜索按特定顺序发生的事件（例如，e1 会在 e2 的 2 分钟内发生）。如果事件 e1 发生在事件 e2 后的滑动窗口内，则事件 e1 与事件 e2 的发生是相关的。

在规则的 match 部分中指定滑动窗口，如下所示：

<match-var-1>, <match-var-2>, ... over <duration> before|after <pivot-event-var>

数据透视事件变量是滑动窗口所基于的事件变量。如果使用 before 关键字，则系统会生成滑动窗口，以每次执行数据透视事件结尾。如果使用了 after 关键字，则系统会从每次发生透视事件开始生成滑动窗口。

以下是有效滑动窗口用法的示例：

$var1, $var2 over 5m after $e1
$user over 1h before $e2

请参阅滑动窗口规则示例。

我们建议不要为单事件规则使用滑动窗口，因为滑动窗口旨在检测多个事件。如果您的某条规则属于此类别，我们建议您采取以下任一解决方法：

将规则转换为使用多个事件变量，并更新条件部分（如果规则需要多次发生事件）。
- 您可以考虑添加时间戳过滤条件，而不是使用滑动窗口。例如 $permission_change.metadata.event_timestamp.seconds < $file_creation.metadata.event_timestamp.seconds。
移除滑动窗口。

结果部分语法

在 outcome 部分中，您最多可以定义 20 个结果变量，并使用任意名称。这些结果将存储在规则生成的检测中。每项检测可能具有不同的结果值。

结果名称 $risk_score 是特殊名称。您可以选择性地定义使用此名称的结果；如果定义该结果，则必须是整数或浮点类型。如果填充了该名称，risk_score 将显示在来自规则检测的提醒的“企业数据洞察”视图中。

如果您未在规则的结果部分中添加 $risk_score 变量，系统会设置以下默认值之一：

如果规则配置为生成提醒，则 $risk_score 设置为 40。
如果规则未配置为生成提醒，则 $risk_score 会设置为 15。

$risk_score 的值存储在 security_result.risk_score UDM 字段中。

对于复合检测中的有针对性的风险评分，您可以定义一个可选的结果变量 $risk_entity_to_score。此变量可让规则有选择地将风险得分应用于结果中定义的特定实体。您可以将此结果变量定义为字符串或字符串列表。

如果您未在规则的结果部分中添加 $risk_entity_to_score 变量，请参阅风险得分计算示例，详细了解风险得分的归因方式。

例如，您可以按以下方式使用 $risk_entity_to_score： none events: $bad_host = $e.principal.hostname outcome: $risk_entity_to_score = $bad_host // only this entity will get a risk score $risk_score = 60

结果变量数据类型

每个结果变量可以具有不同的数据类型，该数据类型由用于计算结果变量的表达式决定。我们支持以下结果数据类型：

整数
浮点数
字符串
整数列表
浮点数列表
字符串列表

条件逻辑

您可以使用条件逻辑来计算结果的值。条件使用以下语法模式指定：

if(BOOL_CLAUSE, THEN_CLAUSE)
if(BOOL_CLAUSE, THEN_CLAUSE, ELSE_CLAUSE)

您可以将条件表达式理解为“如果 BOOL_CLAUSE 为 true，则返回 THEN_CLAUSE，否则返回 ELSE_CLAUSE”。

BOOL_CLAUSE 的求值结果必须为布尔值。BOOL_CLAUSE 表达式采用的格式与 events 部分中的表达式类似。例如，该表达式可以包含以下内容：

具有比较运算符的 UDM 字段名称，例如：

if($context.graph.entity.user.title = "Vendor", 100, 0)
events 部分中定义的占位符变量，例如：

if($severity = "HIGH", 100, 0)
outcome 部分中定义的其他结果变量，例如：

if($risk_score > 20, "HIGH", "LOW")
返回布尔值的函数，例如：

if(re.regex($e.network.email.from, `.*altostrat.com`), 100, 0)
在参考列表中查找，例如：

if($u.principal.hostname in %my_reference_list_name, 100, 0)
汇总比较，例如：

if(count($login.metadata.event_timestamp.seconds) > 5, 100, 0)

TheNN_CLAUSE 和 ELSE_CLAUSE 必须是相同的数据类型。我们支持整数、浮点数和字符串。

如果数据类型为整数或浮点数，则可以省略 ELSE_CLAUSE。如果省略，则 ELSE_CLAUSE 计算结果为 0。例如：

`if($e.field = "a", 5)` is equivalent to `if($e.field = "a", 5, 0)`

如果数据类型为字符串，或者 THEN_CLAUSE 是占位变量或结果变量，则必须提供 ELSE_CLAUSE。

数学运算

您可以使用数学运算来计算规则的 outcome 和 events 部分中的整数或浮点数据类型。Google Security Operations 支持将加法、减法、乘法、除法和模数作为计算中的顶级运算符。

以下代码段是 outcome 部分中的一个计算示例：

outcome:
  $risk_score = max(100 + if($severity = "HIGH", 10, 5) - if($severity = "LOW", 20, 0))

只要每个操作数和整个算术表达式都经过适当的汇总（请参阅汇总），就可以对以下类型的操作数执行数学运算：

数字事件字段
在 events 部分中定义的数值占位符变量
在 outcome 部分中定义的数值结果变量
返回整数或浮点数的函数
返回整数或浮点数的聚合

不允许对浮点数取模。

结果中的占位符变量

计算结果变量时，您可以使用在规则的事件部分中定义的占位符变量。在此示例中，假设在规则的事件部分定义了 $email_sent_bytes：

单事件示例：

// No match section, so this is a single-event rule.

outcome:
  // Use placeholder directly as an outcome value.
  $my_outcome = $email_sent_bytes

  // Use placeholder in a conditional.
  $other_outcome = if($file_size > 1024, "SEVERE", "MODERATE")

condition:
  $e

多事件示例：

match:
  // This is a multi event rule with a match section.
  $hostname over 5m

outcome:
  // Use placeholder directly in an aggregation function.
  $max_email_size = max($email_sent_bytes)

  // Use placeholder in a mathematical computation.
  $total_bytes_exfiltrated = sum(
    1024
    + $email_sent_bytes
    + $file_event.principal.file.size
  )

condition:
  $email_event and $file_event

结果分配表达式中的结果变量

结果变量可用于派生其他结果变量，类似于 events 部分中定义的占位符变量。您可以在分配另一个结果变量时引用某个结果变量，方法是使用 $ 令牌，后跟变量名称。必须先定义结果变量，然后才能在规则文本中引用它们。在赋值表达式中使用时，结果变量不得进行聚合（请参阅聚合）。

在以下示例中，结果变量 $risk_score 的值源自结果变量 $event_count：

多事件示例：

match:
  // This is a multi event rule with a match section.
  $hostname over 5m

outcome:
  // Aggregates all timestamp on login events in the 5 minute match window.
  $event_count = count($login.metadata.event_timestamp.seconds)

  // $event_count cannot be aggregated again.
  $risk_score = if($event_count > 5, "SEVERE", "MODERATE")

  // This is the equivalent of the two preceding outcomes combined.
  $risk_score2 = if(count($login.metadata.event_timestamp.seconds) > 5, "SEVERE", "MODERATE")

condition:
  $e

结果变量可用于结果分配右侧的任何类型的表达式，但以下表达式除外：

数据汇总
Arrays.length() 函数调用
使用 any 或 all 修饰符

数据汇总

重复事件字段是非标量值。也就是说，单个变量指向多个值。例如，事件字段变量 $e.target.ip 是一个重复字段，可以包含零个、一个或多个 IP 值。它是一个非标量值。而事件字段变量 $e.principal.hostname 不是重复字段，并且只有一个值（即标量值）。

同样，在具有匹配窗口的规则的结果部分中使用的非重复事件字段和重复事件字段都是非标量值。例如，以下规则使用匹配部分对事件进行分组，并在结果部分中引用非重复事件字段：

rule OutcomeAndMatchWindow{
  ...
  match:
    $userid over 5m
  outcome:
    $hostnames = array($e.principal.hostname)
  ...
}

规则执行的任何 5 分钟时间窗口都可能包含零个、一个或多个事件。结果部分会处理匹配窗口中的所有事件。结果部分中引用的任何事件字段变量都可以指向匹配窗口中每个事件的零个、一个或多个字段值。例如，如果 5 分钟的时间段内包含 5 个 $e 事件，则结果部分中的 $e.principal.hostname 会指向 5 个不同的主机名。在此规则的 outcome 部分中，事件字段变量 $e.principal.hostname 被视为非标量值。

由于结果变量必须始终产生单个标量值，因此任何结果分配所依赖的非标量值都必须进行聚合，以产生单个标量值。在结果部分中，以下是非标量值，必须进行汇总：

规则使用匹配部分时的事件字段（重复或非重复）
规则使用匹配部分时的事件占位符（重复或非重复）
规则未使用匹配部分时的重复事件字段
规则未使用匹配部分时的重复活动占位符

在不包含匹配部分的规则中，标量事件字段、标量事件占位符和常量可以封装在聚合函数中。不过，在大多数情况下，这些聚合会返回封装的值，因此没有必要使用它们。不过，array() 聚合函数是一个例外，您可以使用它将标量值显式转换为数组。

结果变量的处理方式与聚合类似：在其他结果分配中引用时，不得重新聚合。

您可以使用以下聚合函数：

max()：输出所有可能值的最大值。仅适用于整数和浮点数。
min()：输出所有可能值的最小值。仅适用于整数和浮点数。
sum()：输出所有可能值的总和。仅适用于整数和浮点数。
count_distinct()：收集所有可能的值，然后输出不同数量的可能的值。
count()：行为类似于 count_distinct()，但会返回相同数量的可能的值。
array_distinct()：收集所有可能的不同值，然后输出这些值的列表。它会将不同值的列表截断为 1,000 个随机元素。系统会先进行去重以获得不重复的列表，然后再进行截断。
array()：其行为类似于 array_distinct()，但会返回相同的值列表。它还会将值列表截断为 1,000 个随机元素。
period_start_for_max()：列出值的最大值出现的时间段的开始时间。
period_start_for_min()：列出值的最小值出现的时间段的开始时间。

当规则包含指定必须存在多个事件的 condition 部分时，聚合函数很重要，因为聚合函数会对生成检测的所有事件进行运算。

例如，如果 outcome 和 condition 部分包含以下内容：

outcome:
  $asset_id_count = count($event.principal.asset_id)
  $asset_id_distinct_count = count_distinct($event.principal.asset_id)

  $asset_id_list = array($event.principal.asset_id)
  $asset_id_distinct_list = array_distinct($event.principal.asset_id)

condition:
  #event > 1

由于条件部分要求每项检测存在多个 event，因此聚合函数将对多个事件进行运算。假设以下事件生成了一项检测：

event:
  // UDM event 1
  asset_id="asset-a"

event:
  // UDM event 2
  asset_id="asset-b"

event:
  // UDM event 3
  asset_id="asset-b"

则结果的值将是：

$asset_id_count = 3
$asset_id_distinct_count = 2
$asset_id_list = ["asset-a", "asset-b", "asset-b"]
$asset_id_distinct_list = ["asset-a", "asset-b"]

使用结果部分时的注意事项：

其他说明和限制：

outcome 部分不能引用尚未在 events 部分或 outcome 部分中定义的新占位符变量。
outcome 部分不能使用尚未在 events 部分中定义的事件变量。
outcome 部分可以使用未在 events 部分中使用的事件字段，前提是该事件字段所属的事件变量已在 events 部分中定义。
outcome 部分只能关联已在 events 部分中关联的事件变量。当来自不同事件变量的两个事件字段相等时，就会发生相关性。

您可以使用 YARA-L 2.0 概览中的结果部分找到示例。如需详细了解如何通过结果部分对检测进行重复数据删除，请参阅创建情境感知分析。

条件部分语法

指定 events 部分中定义的事件和占位符的匹配条件。如需了解详情，请参阅下一部分：事件和占位变量条件。
（可选）使用 and 关键字指定使用 outcome 部分中定义的结果变量的匹配条件。如需了解详情，请参阅下文中的结果条件部分。

统计字符

# 字符是 condition 部分中的特殊字符。如果在任何事件或占位符变量名称之前使用，它表示满足所有 events 部分条件的不同事件或值的数量。

例如，#c > 1 表示变量 c 必须出现 1 次以上。

值字符

$ 字符是 condition 部分中的特殊字符。如果它在任何结果变量名称之前使用，则表示相应结果的值。

如果在任何事件或占位符变量名称（例如 $event）之前使用，它表示 #event > 0。

活动和占位符条件

在此处列出事件和占位符变量的条件谓词。

您可以使用关键字 and 或 or 联接这些谓词。

在任意两个条件之间使用关键字 and。
仅当规则包含单个事件变量时，才使用关键字 or。

在同一事件的两个占位符之间使用 or 的有效示例：

rule ValidConditionOr {
  meta:
  events:
      $e.metadata.event_type = "NETWORK_CONNECTION"

      // Note that all placeholders use the same event variable.
      $ph = $e.principal.user.userid  // Define a placeholder variable to put in match section.
      $ph2 = $e.principal.ip  // Define a second placeholder variable to put in condition section.
      $ph3 = $e.principal.hostname  // Define a third placeholder variable to put in condition section.

  match:
    $ph over 5m

  condition:
    $ph2 or $ph3
}

以下示例展示了在不同事件的两个条件之间使用 or 的无效方式：

rule InvalidConditionOr {
  meta:
  events:
      $e.metadata.event_type = "NETWORK_CONNECTION"
      $e2.graph.metadata.entity_type = "FILE"
      $e2.graph.entity.hostname  = $e.principal.hostname

      $ph = $e.principal.user.userid  // Define a placeholder variable to put in match section.

  match:
    $ph over 5m

  condition:
    $e or $e2 // This line will cause an error because there is an or between events.
}

有界限和无界限条件

以下条件为有界限条件。它们强制关联事件变量的存在，这意味着任何检测都必须显示相应事件的发生实例。

$var // equivalent to #var > 0
#var > n // where n >= 0
#var >= m // where m > 0

以下条件为无界限条件。它们允许关联的事件变量不存在，这意味着检测中可能不会出现该事件，并且对事件变量上字段的任何引用都将产生零值。无界条件可用于检测一段时间内是否缺少某个事件。例如，在 10 分钟的时间窗口内，有威胁事件但没有缓解事件。使用无界限条件的规则称为“不存在规则”。

!$var // equivalent to #var = 0
#var >= 0
#var < n // where n > 0
#var <= m // where m >= 0

不存在的要求

如果规则包含不存在条件，则必须满足以下要求才能进行编译：

至少一个 UDM 事件必须具有有界条件（即必须存在至少一个 UDM 事件）。
如果占位符具有无界条件，则必须与至少一个有界 UDM 事件相关联。
如果实体具有无界条件，则必须与至少一个有界 UDM 事件相关联。

请考虑以下省略了条件部分的规则：

rule NonexistenceExample {
  meta:
  events:
      $u1.metadata.event_type = "NETWORK_CONNECTION" // $u1 is a UDM event.
      $u2.metadata.event_type = "NETWORK_CONNECTION" // $u2 is a UDM event.
      $e1.graph.metadata.entity_type = "FILE"        // $e1 is an Entity.
      $e2.graph.metadata.entity_type = "FILE"        // $e2 is an Entity.

      $user = $u1.principal.user.userid // Match variable is required for Multi-Event Rule.

      // Placeholder Associations:
      //   u1        u2
      //   |  \    /
      // port   ip
      //   |       \
      //   e1        e2
      $u1.target.port = $port
      $e1.graph.entity.port = $port
      $u1.principal.ip = $ip
      $u2.target.ip = $ip
      $e2.graph.entity.ip = $ip

      // UDM-Entity Associations:
      // u1 - u2
      // |  \  |
      // e1   e2
      $u1.metadata.event_type = $u2.metadata.event_type
      $e1.graph.entity.hostname = $u1.principal.hostname
      $e2.graph.entity.hostname = $u1.target.hostname
      $e2.graph.entity.hostname = $u2.principal.hostname

  match:
    $user over 5m

  condition:
      <condition_section>
}

以下是 <condition_section> 的有效示例：

$u1 and !$u2 and $e1 and $e2
- 条件部分中包含所有 UDM 事件和实体。
- 至少有一个 UDM 事件有界限。
$u1 and !$u2 and $e1 and !$e2
- $e2是无界变量，但由于它与有界变量$u1相关联，因此允许使用。如果 $e2 未与 $u1 相关联，则此值无效。
#port > 50 and #ip = 0
- 条件部分中没有 UDM 事件和实体；不过，其中存在的占位符涵盖了所有 UDM 事件和实体。
- $ip 同时分配给 $u1 和 $u2，并且 #ip = 0 是无界限条件。不过，有界限条件比无界限条件更强。由于 $port 已分配给 $u1，且 #port > 50 是有界条件，因此 $u1 仍然是有界的。

以下是 <condition_section> 的无效示例：

$u1 and $e1
- “事件”部分中显示的每个 UDM 事件和实体都必须显示在“条件”部分中（或分配给“条件”部分中显示的占位符）。
$u1, $u2, $e1, $u2, #port > 50
- 不允许使用英文逗号作为条件分隔符。
!$u1 and !$u2 and $e1 and $e2
- 违反了“至少有一个 UDM 事件是有界限的”这一首要条件。
($u1 or #port < 50) and $u2 and $e1 and $e2
- or 关键字不支持无界条件。
($u1 or $u2) and $e1 and $e2
- 不支持在不同的事件变量之间使用 or 关键字。
not $u1 and $u2 and $e1 and $e2
- 不允许将 not 关键字用于事件和占位符条件。
#port < 50 and #ip = 0
- 存在的占位符涵盖了所有 UDM 事件和实体；不过，所有条件都是无界限的。这意味着没有一个 UDM 事件是有界限的，导致规则无法编译。

结果条件

此处列出结果变量的条件谓词，这些谓词与关键字 and 或 or 联接，或以关键字 not 开头。

根据结果变量的类型，以不同的方式指定结果条件：

整数：使用运算符 =, >, >=, <, <=, != 与整数文字进行比较，例如：

$risk_score > 10
float：使用运算符 =, >, >=, <, <=, != 与浮点字面量进行比较，例如：

$risk_score <= 5.5
string：与包含 = 或 != 的字符串字面量进行比较，例如：

$severity = "HIGH"
整数或数组列表：使用 arrays.contains 函数指定条件，例如：

arrays.contains($event_ids, "id_1234")

规则分类

在具有匹配部分的规则中指定结果条件意味着，该规则将归类为多事件规则，并计入规则配额。如需详细了解单事件和多事件分类，请参阅单事件规则和多事件规则。

选项部分语法

在 options 部分中，您可以指定规则的选项。以下示例展示了如何指定“options”部分：

rule RuleOptionsExample {
  // Other rule sections

  options:
    allow_zero_values = true
}

您可以使用 key = value 语法指定选项，其中 key 必须是预定义的选项名称，value 必须是该选项的有效值，如下列选项所示：

allow_zero_values

此选项的有效值为 true 和 false，用于确定是否启用此选项。默认值为 false。如果未在规则中指定此选项，则该选项处于停用状态。

如需启用此设置，请将以下内容添加到规则的“选项”部分：allow_zero_values = true。这样做可防止规则隐式过滤掉匹配部分中使用的占位符的零值，如匹配部分中的零值处理中所述。

suppression_window

借助 suppression_window 选项，您可以控制规则触发检测的频率。即使规则的条件多次得到满足，它也能防止同一规则在指定时间窗口内生成多次检测结果。抑制窗口化采用翻滚窗口方法，可在固定大小的非重叠窗口中抑制重复项。

您可以选择提供 suppression_key，以进一步细化在抑制窗口内抑制哪些规则实例。如果未指定，则抑制规则的所有实例。此键定义为结果变量。

在以下示例中，suppression_window 设置为 5m，suppression_key 设置为 $hostname 变量。当规则针对 $hostname 触发检测后，在接下来的 5 分钟内，系统会抑制针对 $hostname 的任何进一步检测。不过，如果规则因具有不同主机名的事件而触发，系统会创建检测。

suppression_window 的默认值为 0，即默认情况下禁止显示抑制窗口。此选项仅适用于没有 match 部分的单次活动规则。

示例：

rule SuppressionWindowExample {
  // Other rule sections

  outcome:
    $suppression_key = $hostname

  options:
    suppression_window = 5m
}

复合检测规则

Google SecOps 中的复合检测涉及关联多个 YARA-L 规则。本部分介绍了如何构建复合规则。如需简要了解复合检测，请参阅复合检测概览。

了解规则结构

复合检测规则始终是多事件规则，并遵循相同的结构和语法。

复合规则包含以下基本组成部分：

events block：定义输入内容；规则分析的具体检测结果或事件。
match 块：指定应如何在定义的时间窗口内连接输入源。
condition 代码块：包含最终逻辑，用于确定联接的事件是否符合触发提醒的条件。

在 `events` 代码块中定义输入

第一步是在 events 块中定义规则的输入。复合规则的输入来自集合，这些集合存储了其他规则生成的检测结果。Google SecOps 提供以下两种方法来访问集合中的数据。

使用结果变量、匹配变量或元标签引用检测内容

如需访问检测中的数据，但不想引用原始 UDM 事件，请使用 outcome 变量、match 变量或 meta 标签。我们建议您采用这种方法，因为它可以提高灵活性，并更好地兼容不同类型的规则。

例如，如果您需要在不同上下文中查找某个字符串（例如网址、文件名或注册表项），则多个规则可以将该字符串存储在通用 outcome 变量中。如需从复合规则访问此字符串，请从 detection 开始，并使用集合资源中的元素找到相关信息。

示例：例如，假设某检测规则生成了以下信息：

结果变量：dest_domain = "cymbal.com"
UDM 字段：target.hostname = "cymbal.com"

在复合规则中，您可以使用以下路径访问此数据：

detection.detection.outcomes["dest_domain"] 来访问 dest_domain 结果变量。
detection.collection_elements.references.event.target.hostname 访问 target.hostname UDM 字段。
detection.time_window.start_time.seconds 可访问检测时间戳。

Collection API 和 SecurityResult API 均可用于访问以下内容：

检测元数据和结果值 (detection.detection)
引用规则中的基础 UDM 事件 (collection_elements)

使用规则 ID 或规则名称引用检测内容

您可以通过规则名称或 ID 引用规则。如果您的检测逻辑依赖于特定规则，我们建议您采用此方法。按名称或 ID 引用相关规则可减少分析的数据量，从而提高性能并防止超时。例如，您可以直接从已知的先前检测结果中查询 target.url 或 principal.ip 等字段。

按规则 ID 引用规则（推荐）：使用 detection.detection.rule_id 字段按 ID 引用规则。您可以在 Google SecOps 中规则的网址中找到规则 ID。用户生成的规则的 ID 采用 ru_UUID 格式，而精选检测的 ID 采用 ur_UUID 格式。例如：

detection.detection.rule_id = "ru_e0d3f371-6832-4d20-b0ad-1f4e234acb2b"
按规则名称引用规则：使用 detection.detection.rule_name 字段按名称引用规则。您可以指定确切的规则名称，也可以使用正则表达式来匹配该名称。例如：
- detection.detection.rule_name = "My Rule Name"
- detection.detection.rule_name = "/PartOfName/"

在 `match` 部分中加入您的输入内容

如需在复合规则中关联相关的检测结果、事件或实体，请使用 events 部分中定义的变量来定义 match 部分。这些变量可以包括规则标签、结果变量、匹配变量、检测字段或集合元素。

如需了解语法，请参阅匹配部分语法。

定义 `condition` 部分

定义 condition 部分，以评估 match 部分的结果。如果条件为 true，则会生成提醒。如需了解语法，请参阅条件部分语法。

使用高级技巧

本部分介绍如何在构建复合规则时应用高级技巧。

合并事件和检测结果

复合规则可以组合多个数据源，包括 UDM 事件、实体图数据和检测字段。需遵守以下指南：

为每个来源使用不同的变量：为每个数据源（例如，$e 表示事件，$d 表示检测结果）分配唯一的事件变量，其中数据源包括事件、实体和检测结果。
基于共享上下文联接来源：使用规则条件中的常见值（例如用户 ID、IP 地址或域名）连接数据源。
定义匹配时间范围：始终包含一个 match 子句，且时间范围不得超过 14 天。

例如：

rule CheckCuratedDetection_with_EDR_and_EG {
  meta:
    author = "noone@cymbal.com"
  events:
    $d.detection.detection.rule_name = /SCC: Custom Modules: Configurable Bad Domain/
    $d.detection.collection_elements.references.event.network.dns.questions.name = $domain
    $d.detection.collection_elements.references.event.principal.asset.hostname = $hostname

    $e.metadata.log_type = "LIMACHARLIE_EDR"
    $e.metadata.product_event_type = "NETWORK_CONNECTIONS"
    $domain = re.capture($e.principal.process.command_line, "\\s([a-zA-Z0-9.-]+\\.[a-zA-Z0-9.-]+)$")
    $hostname = re.capture($e.principal.hostname, "([^.]*)")

    $prevalence.graph.metadata.entity_type = "DOMAIN_NAME"
    $prevalence.graph.metadata.source_type = "DERIVED_CONTEXT"
    $prevalence.graph.entity.hostname = $domain
    $prevalence.graph.entity.domain.prevalence.day_count = 10
    $prevalence.graph.entity.domain.prevalence.rolling_max <= 5
    $prevalence.graph.entity.domain.prevalence.rolling_max > 0

  match:
    $hostname over 1h

  outcome:
    $risk_score = 80
    $CL_target = array($domain)

  condition:
    $e and $d and $prevalence
}

创建顺序复合检测

顺序复合检测用于识别相关事件的模式，其中检测顺序非常重要，例如检测到暴力破解登录尝试后，又检测到成功登录。这些模式可以组合使用多个基本检测、原始 UDM 事件或同时使用两者。

如需创建顺序复合检测，您必须在规则中强制执行该顺序。如需强制执行预期序列，请使用以下方法之一：

滑动窗口：在 match 条件中使用滑动窗口定义检测序列。
时间戳比较：比较规则逻辑中的检测时间戳，以验证它们是否按所选顺序发生。

例如：

events:
    $d1.detection.detection.rule_name = "fileEvent_rule"
    $userid = $d1.detection.detection.outcomes["user"]
    $hostname = $d1.detection.detection.outcomes["hostname"]

    $d2.detection.detection.rule_name = "processExecution_rule"
    $userid = $d2.detection.detection.outcomes["user"]
    $hostname = $d2.detection.detection.outcomes["hostname"]

    $d3.detection.detection.rule_name = "networkEvent_rule"
    $userid = $d3.detection.detection.outcomes["user"]
    $hostname = $d3.detection.detection.outcomes["hostname"]

$d3.detection.collection_elements.references.event.metadata.event_timestamp.seconds > $d2.detection.collection_elements.references.event.metadata.event_timestamp.seconds

  match:
    $userid over 24h after $d1

风险评分

risk_score 是一个介于 0 到 100 之间的整数，表示检测到的潜在严重程度或影响。假设检测结果为 true，则得分越高，表示发现的问题越严重。

为确保整个平台的一致性，我们建议您在为自定义检测分配 risk_score 时使用以下得分范围。这种一致性有助于标准化警报优先级和响应工作流程。

严重程度	得分范围	说明	示例
提醒 - 严重	90 - 100	正在进行的入侵，可能会对单个用户账号或端点以外的范围造成影响。需要立即审核。	在网域控制器上执行的 Mimikatz。
提醒 - 高	80 - 89	单个端点或实体的活跃入侵。应立即接受审核。	生产环境服务器调用了最近已知的 C2。
提醒 - 中	50 - 79	需要调查的潜在安全问题。未确认设备被破解，但可能会升级。	凭据泄露，但未发现滥用迹象。
非提醒 - 低	20 - 49	低影响安全事件，如果与其他指标或观测结果相结合，可能会导致更严重的事件。一般无需审核，可通过复合规则与其他检测结果相结合来创建提醒。	内部端口扫描。
非提醒型观测结果	1 - 19	通常，基于信息的检测旨在建立对威胁的情境感知。通常不需要审核；可以通过复合规则与其他检测结果结合使用，以生成提醒。	登录事件，无滥用迹象。

布尔表达式

布尔表达式是具有布尔类型的表达式。

比较

对于用作条件的二进制表达式，请使用以下语法：

<EXPR> <OP> <EXPR>

表达式可以是事件字段、变量、字面量或函数表达式。

例如：

$e.source.hostname = "host1234"
$e.source.port < 1024
1024 < $e.source.port
$e1.source.hostname != $e2.target.hostname
$e1.metadata.collected_timestamp.seconds > $e2.metadata.collected_timestamp.seconds
$port >= 25
$host = $e2.target.hostname
"google-test" = strings.concat($e.principal.hostname, "-test")
"email@google.org" = re.replace($e.network.email.from, "com", "org")

如果双方均为字面量，则将其视为编译错误。

函数

某些函数表达式会返回布尔值，可用作 events 部分中的单个谓词。此类函数包括：

re.regex()
net.ip_in_range_cidr()

例如：

re.regex($e.principal.hostname, `.*\.google\.com`)
net.ip_in_range_cidr($e.principal.ip, "192.0.2.0/24")

参考列表表达式

您可以在“活动”部分中使用参考列表。如需了解详情，请参阅参考列表部分。

逻辑表达式

您可以在 events 部分中使用逻辑 and 和逻辑 or 运算符，如以下示例所示：

$e.metadata.event_type = "NETWORK_DNS" or $e.metadata.event_type = "NETWORK_DHCP"
($e.metadata.event_type = "NETWORK_DNS" and $e.principal.ip = "192.0.2.12") or ($e.metadata.event_type = "NETWORK_DHCP" and $e.principal.mac = "AB:CD:01:10:EF:22")
not $e.metadata.event_type = "NETWORK_DNS"

默认情况下，优先级从高到低的顺序是 not、and、or。

例如，如果表达式中明确定义了运算符 or 和 and，“a or b and c”的计算结果为“a or (b and c)”。

在 events 部分中，如果未明确定义运算符，则使用 and 运算符联接谓词。

如果表达式中隐含了 and 运算符，则求值顺序可能会有所不同。

例如，请考虑以下比较表达式，其中 or 是明确定义的。系统会隐式使用 and 运算符。

$e1.field = "bat"
or $e1.field = "baz"
$e2.field = "bar"

此示例的解读如下：

($e1.field = "bat" or $e1.field = "baz")
and ($e2.field = "bar")

由于 or 是明确定义的，因此系统会先对 or 周围的谓词进行分组和评估。最后一个谓词 $e2.field = "bar" 使用 and 隐式联接。结果是评估顺序发生变化。

枚举类型

您可以将这些运算符与枚举类型搭配使用。它可以应用于规则，以简化和优化性能（使用运算符代替参考列表）。

在以下示例中，“USER_UNCATEGORIZED”和“USER_RESOURCE_DELETION”分别对应于 15000 和 15014，因此该规则将查找列出的所有事件：

$e.metadata.event_type >= "USER_CATEGORIZED" and $e.metadata.event_type <= "USER_RESOURCE_DELETION"

活动列表：

USER_RESOURCE_DELETION
USER_RESOURCE_UPDATE_CONTENT
USER_RESOURCE_UPDATE_PERMISSIONS
USER_STATS
USER_UNCATEGORIZED

Nocase 修饰符

在字符串值或正则表达式之间使用比较表达式时，您可以在表达式的末尾附加 nocase，以忽略大小写。

$e.principal.hostname != "http-server" nocase
$e1.principal.hostname = $e2.target.hostname nocase
$e.principal.hostname = /dns-server-[0-9]+/ nocase
re.regex($e.target.hostname, `client-[0-9]+`) nocase

当字段类型是枚举值时，不能使用此字段。以下示例无效，会产生编译错误：

$e.metadata.event_type = "NETWORK_DNS" nocase
$e.network.ip_protocol = "TCP" nocase

重复字段

在统一数据模型 (UDM) 中，某些字段被标记为重复，这表示它们是值列表或其他类型的消息。

重复字段和布尔值表达式

有 2 种针对重复字段的布尔值表达式：

修改时间
未修改

请考虑以下事件：

event_original {
  principal {
    // ip is a repeated field
    ip: [ "192.0.2.1", "192.0.2.2", "192.0.2.3" ]

    hostname: "host"
  }
}

修改后的表达式

以下部分介绍了表达式中 any 和 all 修饰符的用途和使用方法。

任意

如果重复字段的任何元素满足条件，则整个事件都满足条件。

event_original 满足 any $e.principal.ip = "192.0.2.1"。
event_original 失败 any $e.repeated_field.field_a = "9.9.9.9。

全部

如果重复字段的所有元素都满足条件，则整个事件都满足条件。

event_original 满足 net.ip_in_range_cidr(all $e.principal.ip, "192.0.2.0/8")。
event_original 失败 all $e.principal.ip = "192.0.2.2"。

使用 any 或 all 编写条件时，请注意使用 not 来排除条件的含义可能与使用否定运算符不同。

例如：

not all $e.principal.ip = "192.168.12.16" 会检查是否并非所有 IP 地址都与 192.168.12.16 匹配，这意味着规则会检查是否至少有一个 IP 地址与 192.168.12.16 不匹配。
all $e.principal.ip != "192.168.12.16" 会检查是否所有 IP 地址都与 192.168.12.16 不匹配，这意味着规则会检查是否没有 IP 地址与 192.168.12.16 匹配。

限制：

any 和 all 运算符仅与重复字段（而非标量字段）兼容。
any 和 all 不能用于联接两个重复字段。例如，any $e1.principal.ip = $e2.principal.ip 无效。
引用列表表达式不支持 any 和 all 运算符。

未修改的表达式

对于未修改的表达式，重复字段中的每个元素都是单独处理的。如果某个事件的重复字段包含 n 个元素，则系统会对该事件的 n 个副本应用相应规则，其中每个副本都包含重复字段中的一个元素。这些副本是临时性的，不会存储。

该规则适用于以下副本：

活动文案	principal.ip	principal.hostname
event_copy_1	"192.0.2.1"	“host”
event_copy_2	“192.0.2.2”	“host”
event_copy_3	“192.0.2.3”	“host”

如果任何事件副本满足重复字段中的所有未修改的条件，则整个事件满足所有条件。这意味着，如果您对重复字段设置了多个条件，则事件副本必须满足所有条件。以下规则示例使用上述示例数据集来演示此行为。

以下规则针对 event_original 示例数据集运行时会返回一个匹配项，因为 event_copy_1 满足所有事件谓词：

rule repeated_field_1 {
  meta:
  events:
    net.ip_in_range_cidr($e.principal.ip, "192.0.2.0/8") // Checks if IP address matches 192.x.x.x
    $e.principal.ip = "192.0.2.1"
  condition:
    $e
}

以下规则针对 event_original 示例数据集运行时不会返回匹配结果，因为 $e.principal.ip 中没有满足所有事件谓词的事件副本。

rule repeated_field_2 {
  meta:
  events:
    $e.principal.ip = "192.0.2.1"
    $e.principal.ip = "192.0.2.2"
  condition:
    $e
}

对重复字段的修改后表达式与对重复字段的未修改表达式兼容，因为每个事件副本的元素列表都相同。请参考以下规则：

rule repeated_field_3 {
  meta:
  events:
    any $e.principal.ip = "192.0.2.1"
    $e.principal.ip = "192.0.2.3"
  condition:
    $e
}

该规则适用于以下副本：

活动文案	principal.ip	任何 $e.principal.ip
event_copy_1	"192.0.2.1"	["192.0.2.1", "192.0.2.2", "192.0.2.3"]
event_copy_2	“192.0.2.2”	["192.0.2.1", "192.0.2.2", "192.0.2.3"]
event_copy_3	“192.0.2.3”	["192.0.2.1", "192.0.2.2", "192.0.2.3"]

在这种情况下，所有副本都满足 any $e.principal.ip = "192.0.2.1"，但只有 event_copy_3 满足 $e.principal.ip = "192.0.2.3"。这样一来，整个活动就会匹配。

还可以从以下方面考虑这些表达式类型：

使用 any 或 all 的重复字段表达式在 event_original 中的列表上运行。
不使用 any 或 all 的重复字段表达式针对的是各个 event_copy_n 事件。

重复字段和占位符

重复字段可与占位变量分配搭配使用。与重复字段上未修改的表达式类似，系统会为每个元素创建一个事件副本。以 event_copy 为例，占位符会获取 event_copy_n 的重复字段值，其中 n 是事件副本编号。如果在匹配部分中使用占位符，可能会导致多个匹配项。

以下示例会生成一个匹配项。对于 event_copy_1，$ip 占位符等于 192.0.2.1，满足规则中的谓词。相应匹配的事件样本包含一个元素，即 event_original。

// Generates 1 match.
rule repeated_field_placeholder1 {
  meta:
  events:
    $ip = $e.principal.ip
    $ip = "192.0.2.1"
    $host = $e.principal.hostname

  match:
    $host over 5m

  condition:
    $e
}

以下示例会生成三项匹配结果。$ip 占位符等于不同值，对应于每个不同的 event_copy_n 副本。由于 $ip 位于匹配部分，因此分组是基于 $ip 完成的。因此，您会获得三个匹配项，其中每个匹配项的 $ip 匹配变量的值都不同。每个匹配项都具有相同的事件样本：单个元素 event_original。

// Generates 3 matches.
rule repeated_field_placeholder2 {
  meta:
  events:
    $ip = $e.principal.ip
    net.ip_in_range_cidr($ip, "192.0.2.0/8") // Checks if IP matches 192.x.x.x

  match:
    $ip over 5m

  condition:
    $e
}

使用分配给重复字段的占位变量时的结果

占位符会分配给每个重复字段的每个元素，而不是整个列表。因此，当它们在结果部分中使用时，系统会仅使用满足前面部分条件的元素来计算结果。

请参考以下规则：

rule outcome_repeated_field_placeholder {
  meta:
  events:
    $ip = $e.principal.ip
    $ip = "192.0.2.1" or $ip = "192.0.2.2"
    $host = $e.principal.hostname

  match:
    $host over 5m

  outcome:
    $o = array_distinct($ip)

  condition:
    $e
}

此规则的执行分为 4 个阶段。第一阶段是事件复制：

活动文案	$ip	$host	$e
event_copy_1	"192.0.2.1"	“host”	event_id
event_copy_2	“192.0.2.2”	“host”	event_id
event_copy_3	“192.0.2.3”	“host”	event_id

然后，“活动”部分将过滤掉与过滤条件不匹配的行：

活动文案	$ip	$host	$e
event_copy_1	"192.0.2.1"	“host”	event_id
event_copy_2	“192.0.2.2”	“host”	event_id

event_copy_3 已被滤除，因为 "192.0.2.3" 不满足 $ip = "192.0.2.1" or $ip = "192.0.2.2"。

然后，匹配部分将按匹配变量进行分组，结果部分将对每个组执行聚合：

$host	$o	$e
“host”	["192.0.2.1", "192.0.2.2"]	event_id

$o = array_distinct($ip) 是使用上一阶段（而非事件复制阶段）的 $ip 计算得出的。

最后，条件部分将过滤每个组。由于此规则仅检查是否存在 $e，因此之前的行将生成一次检测。

$o 不包含 $e.principal.ip 中的所有元素，因为并非所有元素都满足了“事件”部分中的所有条件。不过，由于事件样本使用 event_original，因此 e.principal.ip 的所有元素都会显示在事件样本中。

数组索引

您可以对重复字段执行数组索引。如需访问第 n 个重复字段元素，请使用标准列表语法（元素从 0 开始编制索引）。超出范围的元素会返回默认值。

$e.principal.ip[0] = "192.168.12.16"
$e.principal.ip[999] = "" 如果元素少于 1000 个，则此函数的计算结果为 true。

限制：

索引必须是非负整数字面量。例如，$e.principal.ip[-1] 无效。
具有 int 类型的价值（例如，设置为 int 的占位符）不计入在内。
数组索引不能与 any 或 all 结合使用。例如，any $e.intermediary.ip[0] 无效。
数组索引不能与映射语法结合使用。例如，$e.additional.fields[0]["key"] 无效。
如果字段路径包含多个重复字段，则所有重复字段都必须使用数组索引。例如，$e.intermediary.ip[0] 无效，因为 intermediary 和 ip 都是重复字段，但只有 ip 有索引。

重复消息

当 message 字段重复时，会产生意外影响，即降低匹配的可能性。以下示例对此进行了说明。

请考虑以下事件：

event_repeated_message {
  // about is a repeated message field.
  about {
    // ip is a repeated string field.
    ip: [ "192.0.2.1", "192.0.2.2", "192.0.2.3" ]

    hostname: "alice"
  }
  about {
    hostname: "bob"
  }
}

如上文针对重复字段中的未修改表达式所述，系统会为重复字段的每个元素创建一个临时事件副本。请参考以下规则：

rule repeated_message_1 {
  meta:
  events:
    $e.about.ip = "192.0.2.1"
    $e.about.hostname = "bob"
  condition:
    $e
}

该规则适用于以下副本：

活动文案	about.ip	about.hostname
event_copy_1	"192.0.2.1"	"alice"
event_copy_2	“192.0.2.2”	"alice"
event_copy_3	“192.0.2.3”	"alice"
event_copy_4	""	"bob"

该事件与规则不匹配，因为不存在满足所有表达式的事件副本。

重复消息和数组索引

在重复消息字段上使用未修改的表达式进行数组索引时，可能会出现另一种意外行为。请参考以下使用数组索引的规则示例：

rule repeated_message_2 {
  meta:
  events:
    $e.about.ip = "192.0.2.1"
    $e.about[1].hostname = "bob"
  condition:
    $e
}

相应规则会应用于以下副本：

活动文案	about.ip	about[1].hostname
event_copy_1	"192.0.2.1"	"bob"
event_copy_2	“192.0.2.2”	"bob"
event_copy_3	“192.0.2.3”	"bob"
event_copy_4	""	"bob"

由于 event_copy_1 满足 repeated_message_2 中的所有表达式，因此该事件与规则匹配。

这可能会导致意外行为，因为规则 repeated_message_1 缺少数组索引，因此未产生匹配项，而规则 repeated_message_2 使用了数组索引，因此产生了匹配项。

使用两个斜杠字符 (// comment) 或用斜杠星号 (/* comment */) 发出的多行注释来指定注释，就像在 C 中那样。

字面量

支持非负整数和浮点数、字符串、布尔值和正则表达式字面量。

字符串和正则表达式字面量

您可以使用以下任一引号字符将字符串括在 YARA-L 2.0 中。不过，引用文字的解释方式因所使用的文字而异。

双引号 (") - 用于普通字符串。必须包含转义字符。
例如：“hello\tworld”-\t 将被解释为一个标签页
反引号 (`) - 用于按字面解释所有字符。
例如：“hello\tworld”-\t 不会被解释为标签页

对于正则表达式，您有两种选择。

如果您想在不使用 re.regex() 函数的情况下直接使用正则表达式，请使用 /regex/ 作为正则表达式字面量。

使用 re.regex() 函数时，您还可以使用字符串字面量作为正则表达式字面量。请注意，对于双引号字符串字面量，您必须用反斜杠字符转义反斜杠字符，这看起来很奇怪。

例如，以下正则表达式是等效的：

re.regex($e.network.email.from, `.*altostrat\.com`)
re.regex($e.network.email.from, ".*altostrat\\.com")
$e.network.email.from = /.*altostrat\.com/

Google 建议对正则表达式中的字符串使用英文反引号字符，以便于阅读。

运算符

您可以在 YARA-L 中使用以下运算符：

运算符	说明
=	等于/声明
!=	不等于
<	小于
<=	小于或等于
>	大于
>=	大于或等于

变量

在 YARA-L 2.0 中，所有变量均表示为 $<variable name>。

您可以定义以下类型的变量：

事件变量 - 以归一化形式 (UDM) 或实体事件表示事件组。在 events 部分指定事件变量的条件。您可以使用名称、事件来源和事件字段来标识事件变量。允许的来源为 udm（用于规范化事件）和 graph（用于实体事件）。如果省略来源，则 udm 设置为默认来源。事件字段表示为 .<field name> 链（例如 $e.field1.field2）。事件字段链始终从顶级来源（UDM 或实体）开始。
匹配变量 - 在 match 部分声明。匹配变量会成为查询的分组字段，因为对于每组唯一的匹配变量（以及每个时间范围），都会返回一行。当规则找到匹配项时，将返回匹配变量值。指定每个匹配变量在 events 部分中表示的内容。
占位符变量 - 在 events 部分声明和定义。占位符变量与匹配变量类似。不过，您可以使用 condition 部分中的占位符变量来指定匹配条件。

使用匹配变量和占位符变量可以通过传递联接条件来声明事件字段之间的关系（请参阅事件部分语法了解更多详情）。

关键字

YARA-L 2.0 中的关键字不区分大小写。例如，and 和 AND 是等效的。变量名称不得与关键字冲突。例如，$AND 或 $outcome 无效。

以下是检测引擎规则的关键字：rule、meta、match、over、events、condition、outcome、options、and、or、not、nocase、in、regex、cidr、before、after、all、any、if、max、min、sum、array、array_distinct、count、count_distinct、is 和 null。

地图

YARA-L 支持对结构体和标签进行映射访问。

结构体和标签

部分 UDM 字段使用 Struct 或 Label 数据类型。

如需在结构体和标签中搜索特定的键值对，请使用标准映射语法：

// A Struct field.
$e.udm.additional.fields["pod_name"] = "kube-scheduler"
// A Label field.
$e.metadata.ingestion_labels["MetadataKeyDeletion"] = "startup-script"

地图访问始终返回字符串。

支持的情况

活动和结果部分

// Using a Struct field in the events section
events:
  $e.udm.additional.fields["pod_name"] = "kube-scheduler"

// Using a Label field in the outcome section
outcome:
  $value = array_distinct($e.metadata.ingestion_labels["MetadataKeyDeletion"])

将地图值分配给占位符

$placeholder = $u1.metadata.ingestion_labels["MetadataKeyDeletion"]

在联接条件中使用映射字段

// using a Struct field in a join condition between two udm events $u1 and $u2
$u1.metadata.event_type = $u2.udm.additional.fields["pod_name"]

不支持的情况

在以下情况下，不支持地图。

将 `any` 或 `all` 关键字与地图结合使用

例如，不支持以下内容：

all $e.udm.additional.fields["pod_name"] = "kube-scheduler"

其他类型的值

映射语法只能返回字符串值。对于 Struct 数据类型，映射语法只能访问值为字符串的键。无法访问值是其他原始类型（例如整数）的键。

重复值处理

映射访问始终返回单个值。在极少数情况下，如果地图访问可能引用多个值，则地图访问将确定性地返回第一个值。

这可能发生在以下任一情况下：

标签具有重复的键。

标签结构表示一个映射，但不强制要求键的唯一性。按照惯例，映射应具有唯一的键，因此 Google SecOps 不建议使用重复的键填充标签。

如果对以下数据示例运行规则文本 $e.metadata.ingestion_labels["dupe-key"]，则会返回第一个可能的值 val1：
```
// Disrecommended usage of label with a duplicate key:
event {
  metadata{
    ingestion_labels{
      key: "dupe-key"
      value: "val1" // This is the first possible value for "dupe-key"
    }
    ingestion_labels{
      key: "dupe-key"
      value: "val2"
    }
  }
}
```

标签具有祖先重复字段。

重复字段可能包含一个标签作为子字段。顶级重复字段中的两个不同条目可能包含具有相同键的标签。如果对以下数据示例运行规则文本 $e.security_result.rule_labels["key"]，则会返回第一个可能的值 val3：

event {
  // security_result is a repeated field.
  security_result {
    threat_name: "threat1"
    rule_labels {
      key: "key"
      value: "val3" // This is the first possible value for "key"
    }
  }
  security_result {
    threat_name: "threat2"
    rule_labels {
      key: "key"
      value: "val4"
    }
  }
}

在地图中访问结果变量

本部分介绍如何以原始数据类型（例如整数、布尔值或这些类型的列表）而非仅以字符串形式访问映射中的结果变量。您可以利用此功能，使规则逻辑更加灵活和准确。

结果数据包含在以下两个字段中：

结果值在 variables 字段中保留其原始类型。
outcomes 字段存储 string 版本，以实现向后兼容性。

您可以使用 variables 映射来访问这些结果值，以检索特定类型或使用数组索引访问序列中的元素。您可以按索引访问序列中的特定项，也可以选择整个序列来单独评估每个值。

语法：

$d.detection.detection.variables[OUTCOME_NAME].TYPE_SUFFIX

序列的语法：

$d.detection.detection.variables[OUTCOME_NAME].SEQUENCE_TYPE_SUFFIX.TYPE_VALS_SUFFIX

示例：

访问字符串结果：
```
$my_string_outcome = $d.detection.detection.variables["outcome_ip"].string_val
```
此示例直接检索字符串值（例如，如果 outcome_ip 是单个字符串，则检索 "1.1.1.1"）。

访问整数结果：

$my_int_outcome = $d.detection.detection.variables["outcome_port"].int64_value

此示例检索整数值（例如 30）。

访问整数列表 (Int64Sequence)：
```
$my_int_list = $d.detection.detection.variables["outcome_ports"].int64_seq.int64_vals
```
此示例检索完整的整数列表，并像重复字段一样将其取消嵌套（例如 [2, 3, 4]）。
从整数列表中访问特定元素：
```
$first_int = $d.detection.detection.variables["outcome_ports"].int64_seq.int64_vals[0]
```
此示例从列表中检索第一个整数（例如 2）。
访问字符串列表 (StringSequence)：
```
$my_string_list = $d.detection.detection.variables["outcome_ips"].string_seq.string_vals
```
此示例检索完整的字符串列表，并像重复字段（例如 ["1.1.1.1", "2.2.2.2"]）一样取消嵌套。
从字符串列表中访问特定元素：
```
$first_ip = $d.detection.detection.variables["outcome_ips"].string_seq.string_vals[0]
```
此示例从列表中检索第一个 IP 地址（例如 "1.1.1.1"）。

`variables` 的可用类型后缀

如需查看支持的后缀的完整列表，请参阅 FindingVariable。

函数

本部分介绍了可在检测引擎规则和搜索中使用的 YARA-L 2.0 函数。

这些函数可用于 YARA-L 规则的以下部分：

events 部分。
结果部分中条件的 BOOL_CLAUSE。

arrays.concat

支持的语言：

规则搜索

arrays.concat(string_array, string_array)

说明

通过复制原始字符串数组中的元素来返回新的字符串数组。

形参数据类型

ARRAY_STRINGS，ARRAY_STRINGS

返回类型

ARRAY_STRINGS

代码示例

示例 1

以下示例串联了两个不同的字符串数组。

arrays.concat(["test1", "test2"], ["test3"]) = ["test1", "test2", "test3"]

示例 2

以下示例将数组与空字符串串联。

arrays.concat([""], [""]) = ["", ""]

示例 3

以下示例串联了空数组。

arrays.concat([], []) = []

arrays.join_string

支持的语言：

规则搜索

arrays.join_string(array_of_strings, optional_delimiter)

说明

将字符串数组转换为单个字符串，并使用可选参数进行分隔。如果未提供分隔符，则使用空字符串。

形参数据类型

ARRAY_STRINGS，STRING

返回类型

STRING

代码示例

以下是一些有关如何使用该函数的示例：

示例 1

此示例将包含非 null 元素的数组与分隔符联接起来。

arrays.join_string(["foo", "bar"], ",") = "foo,bar"

示例 2

此示例将包含 null 元素和分隔符的数组联接起来。

arrays.join_string(["foo", NULL, "bar"], ",") = "foo,bar"

示例 3

此示例将一个包含非 null 元素且没有分隔符的数组联接起来。

arrays.join_string(["foo", "bar"]) = "foobar"

arrays.length

支持的语言：

规则搜索

arrays.length(repeatedField)

说明

返回重复字段元素的数量。

形参数据类型

LIST

返回类型

NUMBER

代码示例

示例 1

返回重复字段元素的数量。

arrays.length($e.principal.ip) = 2

示例 2

如果路径中存在多个重复字段，则返回重复字段元素的总数。

arrays.length($e.intermediary.ip) = 3

arrays.max

支持的语言：

规则搜索

arrays.max(array_of_ints_or_floats)

说明

返回数组中的最大元素；如果数组为空，则返回 0。

形参数据类型

ARRAY_INTS|ARRAY_FLOATS

返回类型

FLOAT

代码示例

以下是一些有关如何使用该函数的示例：

示例 1

此示例返回整数数组中较大的元素。

arrays.max([10, 20]) = 20.000000

示例 2

此示例返回浮点数数组中较大的元素。

arrays.max([10.000000, 20.000000]) = 20.000000

arrays.min

支持的语言：

规则搜索

arrays.min(array_of_ints_or_floats[, ignore_zeros=false])

说明

返回数组中的最小元素；如果数组为空，则返回 0。如果将第二个可选实参设置为 true，则会忽略等于零的元素。

形参数据类型

ARRAY_INTS|ARRAY_FLOATS，BOOL

返回类型

FLOAT

代码示例

以下是一些有关如何使用该函数的示例：

示例 1

此示例返回整数数组中的最小元素。

arrays.min([10, 20]) = 10.000000

示例 2

此示例返回浮点数数组中的最小元素。

arrays.min([10.000000, 20.000000]) = 10.000000

示例 3

此示例返回浮点数数组中的最小元素，同时忽略零。

arrays.min([10.000000, 20.000000, 0.0], true) = 10.000000

arrays.size

支持的语言：

规则搜索

arrays.size( array )

说明

返回数组的大小。如果数组为空，则返回 0。

形参数据类型

ARRAY_STRINGS|ARRAY_INTS|ARRAY_FLOATS

返回类型

INT

代码示例

示例 1

此示例使用包含两个元素的字符串数组。

arrays.size(["test1", "test2"]) = 2

示例 2

此示例使用包含 3 个元素的 int 数组。

arrays.size([1, 2, 3]) = 3

示例 3

此示例使用包含 1 个元素的浮点数组

arrays.size([1.200000]) = 1

示例 4

此示例使用了空数组。

arrays.size([]) = 0

arrays.index_to_float

支持的语言：

规则搜索

arrays.index_to_float(array, index)

说明

返回数组中指定索引处的元素。相应索引处的元素将以浮点数形式返回。

索引是一个整数值，表示数组中元素的位置。默认情况下，数组的第一个元素的索引为 0，最后一个元素的索引为 n-1，其中 n 是数组的大小。负索引可用于访问相对于数组末尾的数组元素。例如，索引 -1 表示数组中的最后一个元素，索引 -2 表示数组中的倒数第二个元素。

形参数据类型

ARRAY_STRINGS|ARRAY_INTS|ARRAY_FLOATS，INT

返回类型

FLOAT

代码示例

示例 1

以下示例从浮点数数组中提取索引为 1 的元素。

arrays.index_to_float([1.2, 2.1, 3.5, 4.6], 1) // 2.1

示例 2

以下示例从浮点数数组中提取索引为 -1 的元素。

arrays.index_to_float([1.2, 2.1, 3.5, 4.6], 0-1) // 4.6

示例 3

以下示例提取的元素的索引大于数组的大小。

arrays.index_to_float([1.2, 2.1, 3.5, 4.6], 6) // 0.0

示例 4

以下示例从空数组中提取元素。

arrays.index_to_float([], 0) // 0.0

示例 5

以下示例从字符串数组中提取索引为 1 的元素。

arrays.index_to_float(["1.2", "3.3", "2.4"], 1) // 3.3

示例 6

以下示例从整数数组中提取索引为 2 的元素。

arrays.index_to_float([1, 3, 2], 2) // 2.0

arrays.index_to_int

支持的语言：

规则搜索

arrays.index_to_int(array_of_inputs, index)

说明

以整数形式返回数组中指定索引处的值。

形参数据类型

ARRAY_STRINGS|ARRAY_INTS|ARRAY_FLOATS，INT

返回类型

INT

代码示例

示例 1

当索引处的值为非数字字符串时，此函数调用会返回 0。

arrays.index_to_int(["str0", "str1", "str2"], 1) = 0

示例 2

此函数返回索引为 -1 的元素。

arrays.index_to_int(["44", "11", "22", "33"], 0-1) = 33

示例 3

对于越界元素，返回 0。

arrays.index_to_int(["44", "11", "22", "33"], 5) = 0

示例 4

此函数从浮点数组中提取索引为 1 的元素。

arrays.index_to_int([1.100000, 1.200000, 1.300000], 1) = 1

示例 5

此函数从索引 0 处的 int 数组中提取元素。

arrays.index_to_int([1, 2, 3], 0) = 1

arrays.index_to_str

支持的语言：

规则搜索

arrays.index_to_str(array, index)

说明

以字符串形式返回数组中指定索引处的元素。索引是一个整数值，表示数组中元素的位置。默认情况下，数组的第一个元素的索引为 0，最后一个元素的索引为 n-1，其中 n 是数组的大小。负索引可用于从数组末尾访问数组元素。例如，索引 -1 表示数组中的最后一个元素，索引 -2 表示数组中的倒数第二个元素。

形参数据类型

ARRAY_STRINGS|ARRAY_INTS|ARRAY_FLOATS，INT

返回类型

STRING

代码示例

示例 1

以下示例从字符串数组中提取索引为 1 的元素。

arrays.index_to_str(["test1", "test2", "test3", "test4"], 1) // "test2"

示例 2

以下示例从字符串数组中提取索引为 -1（数组的最后一个元素）的元素。

arrays.index_to_str(["test1", "test2", "test3", "test4"], 0-1) // "test4"

示例 3

以下示例提取的元素对应的索引大于数组的大小，因此返回一个空字符串。

arrays.index_to_str(["test1", "test2", "test3", "test4"], 6) // ""

示例 4

以下示例从空数组中提取元素。

arrays.index_to_str([], 0) // ""

示例 5

以下示例从浮点数数组中提取索引为 0 的元素。输出以字符串形式返回。

arrays.index_to_str([1.200000, 3.300000, 2.400000], 0) // "1.2"

示例 6

以下示例从整数数组中提取索引为 2 的元素。输出采用字符串形式。

arrays.index_to_str([1, 3, 2], 2) // "2"

cast.as_bool

支持的语言：

规则搜索

cast.as_bool(string_or_int)

说明

函数将 int 或字符串值转换为布尔值。如果函数调用中使用的值无法进行转换，则会返回 FALSE。仅当值为整数 1 和不区分大小写的字符串“true”时，返回 TRUE。

形参数据类型

INT|STRING

返回类型

BOOL

代码示例

示例 1

此示例展示了如何转换非布尔值字符串

cast.as_bool("123") = false

示例 2

Truthy 整数 (1)

cast.as_bool(1) = true

示例 3

Truthy 字符串

cast.as_bool("true") = true

示例 4

大写真实值字符串

cast.as_bool("TRUE") = true

示例 5

负整数

cast.as_bool(0-1) = false

示例 6

假整数 (0)

cast.as_bool(0) = false

示例 7

空字符串

cast.as_bool("") = false

cast.as_float

支持的语言：

规则搜索

cast.as_float(string_to_cast)

说明

将数字字符串转换为浮点数。任何包含无法转换的值的函数调用都会返回 0。浮点数可保持最多 7 位小数的精度。

形参数据类型

STRING

返回类型

FLOAT

代码示例

示例 1

转换非数字字符串会返回 0。

cast.as_float("str") = 0.0000000

示例 2

转换空字符串会返回 0。

cast.as_float("") = 0.0000000

示例 3

转换有效的数字字符串会返回浮点值。

cast.as_float("1.012345678") = 1.0123456

cast.as_string

支持的语言：

规则搜索

cast.as_string(int_or_bytes_or_bool, optional_default_string)

说明

cast.as_string 函数将 INT、BYTES 或 BOOL 值转换为其字符串表示形式。您可以提供可选的 default_string 实参来处理转换失败的情况。如果您省略 default_string 实参，或者输入无效的 UTF-8 或 BASE64 字节序列，该函数会返回一个空字符串。

形参数据类型

INT|BYTES|BOOL，STRING

返回类型

STRING

代码示例

整数到字符串的转换

该函数将整数 123 转换为字符串 "123"。

cast.as_string(123) = "123"

浮点数到字符串的转换

该函数将浮点数 2.25 转换为字符串 "2.25"。

cast.as_string(2.25) = "2.25"

字节到字符串转换

该函数将原始二进制 b'01 转换为字符串 "\x01"。

cast.as_string(b'01, "") = "\x01"

布尔值到字符串的转换

该函数将布尔值 true 转换为字符串 "true"。

cast.as_string(true, "") = "true"

转化失败（默认为可选提供的字符串）

如果提供的值无效，该函数会默认使用字符串 "casting error"。

cast.as_string(9223372036854775808, "casting error") = "casting error"

指纹

支持的语言：

规则

hash.fingerprint2011(byteOrString)

说明

此函数用于计算输入字节序列或字符串的 fingerprint2011 哈希值。此函数返回范围为 [2, 0xFFFFFFFFFFFFFFFF] 的无符号 INT 值。

形参数据类型

BTYE，STRING

返回类型

INT

代码示例

id_fingerprint = hash.fingerprint2011("user123")

群组

支持的语言：

搜索

group(field1, field2, field3, ...)

说明

将类型相似的字段分组到占位变量中。

在 UDM 搜索中，分组字段用于搜索多个类似类型的字段。组函数与分组字段类似，但它允许您选择要分组在一起以触发检测的字段。您可以使用 group 函数来收集有关不同名词类型中特定实体（例如主机名、IP 地址或用户 ID）的信息。

代码示例

示例 1

将所有 IP 地址归为一组，并按降序提供所扫描时间范围内最常见的 IP 地址的计数。

$ip = group(principal.ip, about.ip, target.ip)
$ip != ""
match:
  $ip
outcome:
  $count = count_distinct(metadata.id)
order:
  $count desc

hash.sha256

支持的语言：

规则

hash.sha256(string)

说明

返回输入字符串的 SHA-256 哈希值。

形参数据类型

STRING

返回类型

STRING

代码示例

示例 1

此示例显示了输入为有效字符串时的 SHA-256 哈希值。

hash.sha256("str") = "8c25cb3686462e9a86d2883c5688a22fe738b0bbc85f458d2d2b5f3f667c6d5a"

示例 2

此示例显示了输入为空字符串时的 SHA-256 哈希值。

hash.sha256("") = "e3b0c44298fc1c149afbf4c8996fb92427ae41e4649b934ca495991b7852b855"

math.abs

支持的语言：

规则搜索

math.abs(numericExpression)

说明

返回整数或浮点数表达式的绝对值。

形参数据类型

NUMBER

返回类型

NUMBER

代码示例

示例 1

如果事件发生时间与指定时间（自 Unix 纪元以来的秒数）相差超过 5 分钟，则无论事件发生在指定时间之前还是之后，以下示例都会返回 True。对 math.abs 的调用不能依赖于多个变量或占位符。例如，您无法将以下示例中硬编码的时间值 1643687343 替换为 $e2.metadata.event_timestamp.seconds。

300 < math.abs($e1.metadata.event_timestamp.seconds - 1643687343)

math.ceil

支持的语言：

规则搜索

math.ceil(number)

说明

返回不小于给定数字的最小整数（向上舍入）。如果输入为 null 或太大而无法放入 int64 中，则返回 0。

形参数据类型

FLOAT

返回类型

INT

代码示例

本部分包含使用 math.ceil 的示例。

示例 1

此示例返回整数的上限。

math.ceil(2.000000) = 2

示例 2

此示例返回负数的上限。

math.ceil(0-1.200000) = -1

示例 3

此示例返回 0，因为该数字对于 64 位整数来说过大，无法计算其上限。

math.ceil(184467440737095516160.0) = 0

math.floor

支持的语言：

规则搜索

math.floor(float_val)

说明

返回不大于所提供值的最大整数值（向下舍入）。如果输入为 null 或过大而无法放入 int64 中，则返回 0。

形参数据类型

FLOAT

返回类型

INT

代码示例

示例 1

此示例展示了正数的情况。

math.floor(1.234568) = 1

示例 2

此示例展示了负数的情况。

math.floor(0-1.234568) = -2

示例 3

此示例展示了零值情况。

math.floor(0.000000) = 0

math.geo_distance

支持的语言：

规则

math.geo_distance(longitude1, latitude1, longitude2, latitude2))

说明

返回两个地理位置（坐标）之间的距离（以米为单位）。如果坐标无效，则返回 -1。

形参数据类型

FLOAT、FLOAT、FLOAT、FLOAT

返回类型

FLOAT

代码示例

示例 1

以下示例返回了所有参数均为有效坐标时的距离：

math.geo_distance(-122.020287, 37.407574, -122.021810, 37.407574) = 134.564318

示例 2

以下示例展示了当其中一个参数是截断的坐标时，如何返回距离：

math.geo_distance(-122.000000, 37.407574, -122.021810, 37.407574) = 1926.421905

示例 3

以下示例展示了当其中一个参数为无效坐标时，函数返回 -1 的情况：

math.geo_distance(0-122.897680, 37.407574, 0-122.021810, 97.407574) = -1.000000

示例 4

以下示例在坐标相同时返回 0：

math.geo_distance(-122.897680, 37.407574, -122.897680, 37.407574) = 0.000000

math.is_increasing

支持的语言：

规则搜索

math.is_increasing(num1, num2, num3)

说明

接受一个数值（整数或双精度浮点数）列表，如果这些值按升序排列，则返回 True，否则返回 False。

形参数据类型

INT|FLOAT、INT|FLOAT、INT|FLOAT

返回类型

BOOL

代码示例

示例 1

此示例包含以秒为单位的时间戳类值。

math.is_increasing(1716769112, 1716769113, 1716769114) = true

示例 2

此示例包含一个负双精度值、一个零 INT64 值和一个正 INT64 值。

math.is_increasing(-1.200000, 0, 3) = true

示例 3

此示例包含一个负双精度浮点值、一个零 INT64 值和一个负 INT64 值。

math.is_increasing(0-1.200000, 0, 0-3) = false

示例 4

此示例包含两个负双精度浮点数和一个零 INT64 值。

math.is_increasing(0-1.200000, 0-1.50000, 0) = false

示例 5

此示例包含一个负双精度浮点数和两个相同的值。

math.is_increasing(0-1.200000, 0, 0) = false

math.log

支持的语言：

规则搜索

math.log(numericExpression)

说明

返回整数或浮点数表达式的自然对数值。

形参数据类型

NUMBER

返回类型

NUMBER

代码示例

示例 1

math.log($e1.network.sent_bytes) > 20

math.pow

支持的语言：

规则搜索

math.pow(base, exponent)

说明

返回第一个实参的第二个实参次幂的值。如果发生溢出，则返回 0。

形参数据类型

底数：INT|FLOAT 指数：INT|FLOAT

返回类型

FLOAT

代码示例

示例 1

此示例展示了整数情况。

math.pow(2, 2) // 4.00

示例 2

此示例展示了分数基本情形。

math.pow(2.200000, 3) // 10.648

示例 3

此示例展示了分数底数和指数情况。

math.pow(2.200000, 1.200000) // 2.575771

示例 4

此示例展示了负指数情况。

math.pow(3, 0-3) // 0.037037

示例 5

此示例展示了分数指数的情况。

math.pow(3, 0-1.200000) // 0.267581

示例 6

此示例展示了一个负基准情形。

math.pow(0-3, 0-3) // -0.037037

示例 7

此示例展示了零基准情形。

math.pow(0, 3) // 0

示例 8

此示例展示了零幂的情况。

math.pow(9223372036854775807, 0) // 1

示例 9

此示例展示了一个较大的基本情况。

math.pow(9223372036854775807, 1.200000) // 57262152889751593549824

math.random

支持的语言：

规则搜索

math.random()

说明

在范围 [0, 1)（包含 0，不包含 1）内生成 DOUBLE 类型的伪随机值。

返回类型

FLOAT

代码示例

以下示例检查随机值是否在 [0, 1) 范围内。none if(math.random() >= 0 and math.random() < 1) = true

math.round

支持的语言：

搜索

math.round(numericExpression, decimalPlaces)

说明

返回舍入到最接近的整数或指定小数位数的数值。

形参数据类型

NUMBER

返回类型

NUMBER

代码示例

math.round(10.7) // returns 11
math.round(1.2567, 2) // returns 1.25
math.round(0-10.7) // returns -11
math.round(0-1.2) // returns -1
math.round(4) // returns 4, math.round(integer) returns the integer

math.sqrt

支持的语言：

规则搜索

math.sqrt(number)

说明

返回给定数字的平方根。如果数字为负数，则返回 0。

形参数据类型

INT|FLOAT

返回类型

FLOAT

代码示例

示例 1

此示例返回 int 实参的平方根。

math.sqrt(3) = 1.732051

示例 2

此示例返回负整数实参的平方根。

math.sqrt(-3) = 0.000000

示例 3

此示例返回零实参的平方根。

math.sqrt(0) = 0.000000

示例 4

此示例返回浮点实参的平方根。

math.sqrt(9.223372) = 3.037000

示例 5

此示例返回负浮点实参的平方根。

math.sqrt(0-1.200000) = 0.000000

指标

支持的语言：

规则

指标函数可以聚合大量历史数据。您可以在规则中使用此变量，方法是在结果部分使用 metrics.functionName()。

如需了解详情，请参阅 YARA-L 指标。

net.ip_in_range_cidr

支持的语言：

规则搜索

net.ip_in_range_cidr(ipAddress, subnetworkRange)

说明

如果给定 IP 地址在指定的子网内，则返回 true。

您可以使用 YARA-L 通过 net.ip_in_range_cidr() 语句搜索子网内所有 IP 地址中的 UDM 事件。支持使用 IPv4 和 IPv6。

如需在 IP 地址范围中搜索，请指定 IP UDM 字段和 CIDR 范围。YARA-L 可以处理单数和重复 IP 地址字段。

如需在 IP 地址范围中搜索，请指定 ip UDM 字段和无类别域间路由 (CIDR) 范围。YARA-L 可以处理单数和重复 IP 地址字段。

形参数据类型

STRING，STRING

返回类型

BOOL

代码示例

示例 1

IPv4 示例：

net.ip_in_range_cidr($e.principal.ip, "192.0.2.0/24")

示例 2

IPv6 示例：

net.ip_in_range_cidr($e.network.dhcp.yiaddr, "2001:db8::/32")

如需查看使用 net.ip_in_range_cidr() 语句的示例规则，请参阅IP 地址范围内的单个事件中的示例规则。）

re.regex

支持的语言：

规则搜索

您可以在 YARA-L 2.0 中使用以下任一语法定义正则表达式匹配：

使用 YARA-L 语法 - 与事件相关。以下是此语法的通用表示形式：
```
$e.field = /regex/
```
使用 YARA-L 语法 - 作为接受以下参数的函数：
- 应用正则表达式的字段。
- 以字符串指定的正则表达式。
以下是此语法的通用表示形式：
```
re.regex($e.field, `regex`)
```

说明

如果字符串包含与所提供正则表达式匹配的子字符串，则此函数返回 true。无需在正则表达式的开头或结尾添加 .*。

备注

如需匹配确切的字符串，或仅匹配前缀或后缀，请在正则表达式中添加 ^（开头）和 $（结尾）定位字符。例如，/^full$/ 与 "full" 完全匹配，而 /full/ 可以与 "fullest"、"lawfull" 和 "joyfully" 匹配。
如果 UDM 字段包含换行符，则 regexp 仅匹配 UDM 字段的第一行。如需强制执行完整的 UDM 字段匹配，请将 (?s) 添加到正则表达式。例如，将 /.*allUDM.*/ 替换为 /(?s).*allUDM.*/。
您可以在字符串之后使用 nocase 修饰符，以指示搜索应忽略大小写。

形参数据类型

STRING，STRING

参数表达式类型

ANY，ANY

返回类型

BOOL

代码示例

示例 1

// Equivalent to $e.principal.hostname = /google/
re.regex($e.principal.hostname, "google")

re.capture

支持的语言：

规则搜索

re.capture(stringText, regex)

说明

使用参数中提供的正则表达式模式从字符串捕获（提取）数据。

此函数接受两个参数：

stringText：要搜索的原始字符串。
regex：指示要搜索的模式的正则表达式。

正则表达式可以在括号中包含 0 或 1 个捕获组。如果正则表达式包含 0 个捕获组，则该函数返回第一个整个匹配的子字符串。如果正则表达式包含 1 个捕获组，则它将返回捕获组的第一个匹配的子字符串。定义两个或多个捕获组会返回编译器错误。

形参数据类型

STRING，STRING

返回类型

STRING

代码示例

示例 1

在此示例中，如果 $e.principal.hostname 包含“aaa1bbaa2”，则该示例为 true，因为此函数会返回第一个实例。此示例不包含捕获组。

"aaa1" = re.capture($e.principal.hostname, "a+[1-9]")

示例 2

以下示例会捕获电子邮件地址中 @ 符号后面的所有内容。如果 $e.network.email.from 字段为 test@google.com，则该示例返回 google.com。以下示例包含一个捕获组。

"google.com" = re.capture($e.network.email.from , "@(.*)")

示例 3

如果正则表达式与文本中的任何子字符串都不匹配，则该函数会返回空字符串。排除空字符串使您可以省略没有发生匹配的事件，这在使用 re.capture() 和“不等于”运算时尤其重要：

// Exclude the empty string to omit events where no match occurs.
"" != re.capture($e.network.email.from , "@(.*)")

// Exclude a specific string with an inequality.
"google.com" != re.capture($e.network.email.from , "@(.*)")

re.replace

支持的语言：

规则搜索

re.replace(stringText, replaceRegex, replacementText)

说明

执行正则表达式替换。

此函数接受三个参数：

stringText：原始字符串。
replaceRegex：指示要搜索的模式的正则表达式。
replacementText：要插入到每个匹配项中的文本。

返回源自原始 stringText 的新字符串，其中与 replaceRegex 中的模式匹配的所有子字符串都会替换为 replacementText 中的值。您可以在 replacementText 中使用反斜杠转义的数字（\1 至 \9），将与 replaceRegex 模式中用英文括号括起来的对应组匹配的文本插入到 replacementText 中。使用 \0 可引用整个匹配文本。

该函数会替换非重叠的匹配项，并优先替换第一个找到的出现项。例如，re.replace("banana", "ana", "111") 会返回字符串“b111na”。

形参数据类型

STRING、STRING、STRING

返回类型

STRING

代码示例

示例 1

以下示例会捕获电子邮件地址中 @ 符号后面的所有内容，将 com 替换为 org，然后返回结果。请注意使用嵌套函数。

"email@google.org" = re.replace($e.network.email.from, "com", "org")

示例 2

以下示例在 replacementText 实参中使用反斜杠转义数字来引用 replaceRegex 模式的匹配项。

"test1.com.google" = re.replace(
                       $e.principal.hostname, // holds "test1.test2.google.com"
                       "test2\.([a-z]*)\.([a-z]*)",
                       "\\2.\\1"  // \\1 holds "google", \\2 holds "com"
                     )

示例 3

在处理空字符串和 re.replace() 时，请注意以下情况：

使用空字符串作为 replaceRegex：

// In the function call below, if $e.principal.hostname contains "name",
// the result is: 1n1a1m1e1, because an empty string is found next to
// every character in `stringText`.
re.replace($e.principal.hostname, "", "1")

如需替换空字符串，您可以使用 "^$" 作为 replaceRegex：

// In the function call below, if $e.principal.hostname contains the empty
// string, "", the result is: "none".
re.replace($e.principal.hostname, "^$", "none")

sample_rate

支持的语言：

规则

optimization.sample_rate(byteOrString, rateNumerator, rateDenominator)

说明

此函数用于根据确定性抽样策略确定是否包含某个事件。此函数返回：

true 表示一部分输入值，相当于 (rateNumerator / rateDenominator)，表示相应事件应纳入样本中。
false 表示不应将相应事件纳入样本中。

此函数适用于您只想处理部分事件的优化方案。等效于：

hash.fingerprint2011(byteOrString) % rateDenominator < rateNumerator

形参数据类型

byteOrString：计算结果为 BYTE 或 STRING 的表达式。
rateNumerator: 'INT'
rateDenominator: 'INT'

返回类型

BOOL

代码示例

events:
    $e.metadata.event_type = "NETWORK_CONNECTION"
    $asset_id = $e.principal.asset.asset_id
    optimization.sample_rate($e.metadata.id, 1, 5) // Only 1 out of every 5 events

  match:
    $asset_id over 1h

  outcome:
    $event_count = count_distinct($e.metadata.id)
  // estimate the usage by multiplying by the inverse of the sample rate
    $usage_past_hour = sum(5.0 * $e.network.sent_bytes)

 condition:
  // Requiring a certain number of events after sampling avoids bias (e.g. a
  // device with just 1 connection will still show up 20% of the time and
  // if we multiply that traffic by 5, we'll get an incorrect estimate)
  $e and ($usage_past_hour > 1000000000) and $event_count >= 100

strings.base64_decode

支持的语言：

规则搜索

strings.base64_decode(encodedString)

说明

返回包含编码字符串的 base64 解码版本的字符串。

此函数接受一个 base64 编码的字符串作为参数。如果 encodedString 不是有效的 base64 编码字符串，则该函数会返回未更改的 encodedString。

形参数据类型

STRING

返回类型

STRING

代码示例

示例 1

"test" = strings.base64_decode($e.principal.domain.name)

strings.coalesce

支持的语言：

规则搜索

strings.coalesce(a, b, c, ...)

说明

此函数可接受任意数量的实参，并返回第一个计算结果不为空字符串（例如“非零值”）的表达式的值。如果所有实参的计算结果均为一个空字符串，则函数调用会返回一个空字符串。

参数可以是字面量、事件字段或函数调用。所有实参都必须是 STRING 类型。如果任何实参是事件字段，则这些属性必须来自同一事件。

形参数据类型

STRING

返回类型

STRING

代码示例

示例 1

以下示例包含字符串变量作为实参。在以下情况下，该条件的计算结果为 true：(1) $e.network.email.from 为 suspicious@gmail.com；(2) $e.network.email.from 为空且 $e.network.email.to 为 suspicious@gmail.com。

"suspicious@gmail.com" = strings.coalesce($e.network.email.from, $e.network.email.to)

示例 2

以下示例调用了具有两个以上实参的 coalesce 函数。此条件会将事件 $e 中的第一个非 null IP 地址与参考列表 ip_watchlist 中的值进行比较。此调用中实参的合并顺序与它们在规则条件中的枚举顺序相同：

系统会先评估 $e.principal.ip。
接下来，系统会评估 $e.src.ip。
接下来，系统会评估 $e.target.ip。
最后，如果之前的 ip 字段未设置，则返回字符串“No IP”作为默认值。

strings.coalesce($e.principal.ip, $e.src.ip, $e.target.ip, "No IP") in %ip_watchlist

示例 3

以下示例尝试合并事件 $e1 和事件 $e2 中的 principal.hostname。该示例会返回编译器错误，因为参数是不同的事件变量。

// returns a compiler error
"test" = strings.coalesce($e1.principal.hostname, $e2.principal.hostname)

strings.concat

支持的语言：

规则搜索

strings.concat(a, b, c, ...)

说明

返回任意数量的项的串联，每项可以是字符串、整数或浮点数。

如果任何实参是事件字段，则这些属性必须来自同一事件。

形参数据类型

STRING、FLOAT、INT

返回类型

STRING

代码示例

示例 1

以下示例包含字符串变量和整数变量作为实参。principal.hostname 和 principal.port 都来自同一事件 $e，并串联在一起以返回字符串。

"google:80" = strings.concat($e.principal.hostname, ":", $e.principal.port)

示例 2

以下示例包含字符串变量和字符串字面量作为实参。

"google-test" = strings.concat($e.principal.hostname, "-test") // Matches the event when $e.principal.hostname = "google"

示例 3

以下示例包含字符串变量和浮点字面量作为参数。以字符串表示时，整数形式的浮点数不包含小数点（例如，1.0 表示为“1”）。此外，超过 16 位小数的浮点数会被截断到第 16 位小数。

"google2.5" = strings.concat($e.principal.hostname, 2.5)

示例 4

以下示例包含字符串变量、字符串字面量、整数变量和浮点字面量作为实参。所有变量都来自同一事件 $e，并与字面量串联在一起以返回字符串。

"google-test802.5" = strings.concat($e.principal.hostname, "-test", $e.principal.port, 2.5)

示例 5

以下示例尝试将来自事件 $e1 的 principal.port 与来自事件 $e2 的 principal.hostname 串联。该示例会返回编译器错误，因为参数是不同的事件变量。

// Will not compile
"test" = strings.concat($e1.principal.port, $e2.principal.hostname)

strings.contains

支持的语言：

规则搜索

strings.contains( str, substr )

说明

如果给定字符串包含指定的子字符串，则返回 true。否则，返回 false。

形参数据类型

STRING，STRING

返回类型

BOOL

代码示例

示例 1

此示例返回 true，因为该字符串包含子字符串“is”。

strings.contains("thisisastring", "is") = true

示例 2

此示例返回 false，因为该字符串不包含子字符串“that”。

strings.contains("thisisastring", "that") = false

strings.count_substrings

支持的语言：

规则搜索

strings.count_substrings(string_to_search_in, substring_to_count)

说明

给定一个字符串和一个子字符串时，返回该子字符串在字符串中非重叠出现的次数（int64 类型）。

形参数据类型

STRING，STRING

返回类型

INT

代码示例

本部分包含一些示例，用于计算子字符串在给定字符串中出现的次数。

示例 1

此示例使用非 null 字符串和非 null 单个子字符串字符。

strings.count_substrings("this`string`has`four`backticks", "`") = 4

示例 2

此示例使用非 null 字符串和长度大于 1 个字符的非 null 子字符串。

strings.count_substrings("str", "str") = 1

示例 3

此示例使用非 null 字符串和空子字符串。

strings.count_substrings("str", "") = 0

示例 4

此示例使用空字符串和长度大于 1 个字符的非 null 子字符串。

strings.count_substrings("", "str") = 0

示例 5

此示例使用空字符串和空子字符串。

strings.count_substrings("", "") = 0

示例 6

此示例使用一个非 null 字符串和一个非 null 子字符串，该子字符串的长度大于 1 个字符，且出现次数大于 1 次。

strings.count_substrings("fooABAbarABAbazABA", "AB") = 3

示例 7

此示例使用一个非 null 字符串和一个非 null 子字符串，该子字符串包含多个字符且出现多次。它突出了重叠子字符串出现次数的限制

strings.count_substrings("ABABABA", "ABA") = 2

strings.extract_domain

支持的语言：

规则搜索

strings.extract_domain(url_string)

说明

从字符串中提取网域。

形参数据类型

STRING

返回类型

STRING

代码示例

示例 1

此示例显示了一个空字符串

strings.extract_domain("") = ""

示例 2

随机字符串，而非网址

strings.extract_domain("1234") = ""

示例 3

多个反斜杠

strings.extract_domain("\\\\") = ""

示例 4

妥善处理非字母字符

strings.extract_domain("http://例子.卷筒纸.中国") = "卷筒纸.中国"

示例 5

处理 URI

strings.extract_domain("mailto:?to=&subject=&body=") = ""

示例 6

实际网址前有多个字符

strings.extract_domain("     \t   !$5*^)&dahgsdfs;http://www.google.com") = "google.com"

示例 7

URI 中的特殊字符 #

strings.extract_domain("test#@google.com") = ""

示例 8

网址中的特殊字符 #

strings.extract_domain("https://test#@google.com") = ""

示例 9

正向测试用例

strings.extract_domain("https://google.co.in") = "google.co.in"

strings.extract_hostname

支持的语言：

规则搜索

strings.extract_hostname(string)

说明

从字符串中提取主机名。此函数区分大小写。

形参数据类型

STRING

返回类型

STRING

代码示例

示例 1

此示例会返回一个空字符串。

strings.extract_hostname("") = ""

示例 2

随机字符串，而非网址

strings.extract_hostname("1234") = "1234"

示例 3

多个反斜杠

strings.extract_hostname("\\\\") = ""

示例 4

妥善处理非英文字符

strings.extract_hostname("http://例子.卷筒纸.中国") = "例子.卷筒纸.中国"

示例 5

处理 URI

strings.extract_hostname("mailto:?to=&subject=&body=") = "mailto"

示例 6

实际网址前有多个字符

strings.extract_hostname("     \t   !$5*^)&dahgsdfs;http://www.google.com") = "www.google.com"

示例 7

URI 中的特殊字符 #

strings.extract_hostname("test#@google.com") = "test"

示例 8

网址中的特殊字符 #

strings.extract_hostname("https://test#@google.com") = "test"

strings.from_base64

支持的语言：

规则搜索

strings.from_base64(base64_encoded_string)

说明

该函数将 base64 编码的 STRING 值转换为原始二进制 BYTES 值。如果函数调用包含无法转换的值，则默认情况下会返回空 BYTES。

形参数据类型

STRING

返回类型

BYTES

代码示例

Base64 编码的字符串到字节的转换

该函数将 base64 编码的字符串转换为其原始二进制字节表示形式。

strings.from_base64("AAAAAG+OxVhtAm+d2sVuny/hW4oAAAAAAQAAAM0AAAA=") = b'000000006f8ec5586d026f9ddac56e9f2fe15b8a0000000001000000cd000000

失败的转换（默认为空字节）

如果提供的值无效，该函数会默认返回空字节。

strings.from_base64("invalid-value") = b'

strings.from_hex

支持的语言：

规则搜索

strings.from_hex(hex_string)

说明

返回与给定十六进制字符串关联的字节。

形参数据类型

STRING

返回类型

BYTES

代码示例

获取与给定十六进制字符串关联的字节。

示例 1

此示例展示了非十六进制字符转换。

strings.from_hex("str") // returns empty bytes

示例 2

此示例显示了输入为空字符串的情况。

strings.from_hex("") // returns empty bytes

示例 3

此示例展示了十六进制字符串转换。

strings.from_hex("1234") // returns 1234 bytes

示例 4

此示例展示了非 ASCII 字符转换。

strings.from_hex("筒纸.中国") // returns empty bytes

strings.ltrim

支持的语言：

规则搜索

strings.ltrim(string_to_trim, cutset)

说明

从给定字符串中剪裁前导空格。此函数会移除 cutset 中存在的前导字符。

形参数据类型

STRING，STRING

返回类型

STRING

代码示例

以下是示例用例。

示例 1

此示例使用相同的第一个和第二个实参。

strings.ltrim("str", "str") = ""

示例 2

此示例使用空字符串作为第二个实参。

strings.ltrim("str", "") = "str"

示例 3

此示例使用空字符串作为第一个实参，并使用字符串作为第二个实参。

strings.ltrim("", "str") = ""

示例 4

此示例使用包含空格的字符串，并将一个字符串作为第二个实参。

strings.ltrim("a aastraa aa ", " a") = "straa aa "

strings.reverse

支持的语言：

规则搜索

strings.reverse(STRING)

说明

返回输入字符串的反转字符串。

形参数据类型

STRING

返回类型

STRING

代码示例

示例 1

以下示例传递了一个短字符串。

strings.reverse("str") = "rts"  // The function returns 'rts'.

示例 2

以下示例传递了一个空字符串。

strings.reverse("") = ""

示例 3

以下示例传递了一个回文。

strings.reverse("tacocat") = "tacocat"

strings.rtrim

支持的语言：

规则搜索

strings.rtrim(string_to_trim, cutset)

说明

从给定字符串中剪掉尾随空格。移除该 cutset 中存在的尾随字符。

形参数据类型

STRING，STRING

返回类型

STRING

代码示例

以下是示例用例。

示例 1

以下示例将同一字符串作为第一个和第二个实参传递。

strings.rtrim("str", "str") = ""

示例 2

以下示例传递了一个空字符串作为第二个实参。

strings.rtrim("str", "") = "str"

示例 3

以下示例将空字符串作为第一个实参传递，并将非空字符串作为第二个实参传递。

strings.rtrim("", "str") = ""

示例 4

以下示例传递一个包含空格的字符串作为第一个实参，并传递一个非空字符串作为第二个实参。

strings.rtrim("a aastraa aa ", " a") = "a aasstr"

strings.to_lower

支持的语言：

规则搜索

strings.to_lower(stringText)

说明

此函数接受一个输入字符串，并将所有字符更改为小写，然后返回一个字符串

形参数据类型

STRING

返回类型

STRING

代码示例

示例 1

以下示例返回 true。

"test@google.com" = strings.to_lower($e.network.email.to)

strings.to_upper

支持的语言：

规则搜索

strings.to_upper(string_val)

说明

返回所有字母字符均为大写的原始字符串。

形参数据类型

STRING

返回类型

STRING

代码示例

示例 1

以下示例以大写形式返回提供的实参。

strings.to_upper("example") = "EXAMPLE"

strings.trim

支持的语言：

规则搜索

strings.trim(string_to_trim, cutset)

说明

从给定字符串中剪掉开头和结尾处的空格。此外，还会从输入字符串中移除不需要的字符（由 cutset 实参指定）。

形参数据类型

STRING，STRING

返回类型

STRING

代码示例

以下是示例用例。

示例 1

在以下示例中，同一字符串作为输入字符串和 cutset 传递，从而生成一个空字符串。

strings.trim("str", "str") // ""

示例 2

在以下示例中，传递了一个空字符串作为切分集，这会生成原始字符串 str，因为切分集中未指定要移除的字符。

strings.trim("str", "") = "str"

示例 3

在以下示例中，该函数会生成一个空字符串，因为输入字符串已为空，并且没有要移除的字符。

strings.trim("", "str") = ""

示例 4

在以下示例中，该函数会生成 str，因为 trim 函数会移除以下内容：

“a aastraa aa ”中的尾随空格
cutset 中指定的字符（空格、a）

strings.trim("a aastraa aa ", " a") = "str"

strings.url_decode

支持的语言：

规则搜索

strings.url_decode(url_string)

说明

给定一个网址字符串，解码转义字符并处理已编码的 UTF-8 字符。如果解码失败，则返回空字符串。

形参数据类型

STRING

返回类型

STRING

代码示例

示例 1

此示例展示了一个正向测试用例。

strings.url_decode("three%20nine%20four") = "three nine four"

示例 2

此示例展示了空字符串的情况。

strings.url_decode("") // ""

示例 3

此示例展示了非字母字符处理。

strings.url_decode("%E4%B8%8A%E6%B5%B7%2B%E4%B8%AD%E5%9C%8B") // "上海+中國"

示例 4

此示例展示了网址解码示例。

strings.url_decode("http://www.google.com%3Fparam1%3D%22+1+%3E+2+%22%26param2%3D2%3B") // 'http://www.google.com?param1="+1+>+2+"&param2=2;'

timestamp.as_unix_seconds

支持的语言：

规则搜索

timestamp.as_unix_seconds(timestamp [, time_zone])

说明

此函数返回一个整数，表示指定时间戳字符串自 Unix 纪元以来经过的秒数。

timestamp 是一个字符串，表示有效的纪元时间戳。格式需要为 %F %T。
time_zone 是可选的，是表示时区的字符串。如果省略，则默认值为 GMT。您可以使用字符串字面量来指定时区。选项如下：
- TZ 数据库名称，例如 America/Los_Angeles。如需了解详情，请参阅维基百科上的 tz 数据库时区列表。
- 相对于世界协调时间 (UTC) 的时区偏离值，格式为 (+|-)H[H][:M[M]]，例如“-08:00”。

以下是有效 time_zone 说明符的示例，您可以将其作为第二个实参传递给时间提取函数：

"America/Los_Angeles", or "-08:00". ("PST" is not supported)
"America/New_York", or "-05:00". ("EST" is not supported)
"Europe/London"
"UTC"
"GMT"

形参数据类型

STRING，STRING

返回类型

INT

代码示例

示例 1

有效的纪元时间戳

timestamp.as_unix_seconds("2024-02-22 10:43:00") = 1708598580

示例 2

有效的纪元时间戳，时区为 America/New_York

timestamp.as_unix_seconds("2024-02-22 10:43:00", "America/New_York") = 1708616580

timestamp.current_seconds

支持的语言：

规则搜索

timestamp.current_seconds()

说明

返回一个表示当前时间（以 Unix 秒为单位）的整数。大致相当于检测时间戳，并基于规则的运行时间。此函数是函数 timestamp.now() 的同义函数。

形参数据类型

NONE

返回类型

INT

代码示例

示例 1

以下示例在证书过期时间超过 24 小时时会返回 true。该示例通过减去当前的 Unix 秒数并使用大于运算符进行比较来计算时间差。

86400 < timestamp.current_seconds() - $e.network.tls.certificate.not_after

timestamp.get_date

支持的语言：

规则搜索

timestamp.get_date(unix_seconds [, time_zone])

说明

此函数会返回一个格式为 YYYY-MM-DD 的字符串，表示时间戳所在的日期。

unix_seconds 是一个表示经过 Unix 计时原点的秒数（例如 $e.metadata.event_timestamp.seconds）的整数，或一个包含该值的占位符。
time_zone 是可选的，是表示时区的字符串。如果省略，则默认值为“GMT”。您可以使用字符串字面量来指定时区。选项包括：
- TZ 数据库名称，例如“America/Los_Angeles”。如需了解详情，请参阅本页中的“TZ 数据库名称”列
- 相对于世界协调时间 (UTC) 的时区偏离值，格式为 (+|-)H[H][:M[M]]，例如“-08:00”。

以下是有效 time_zone 说明符的示例，您可以将其作为第二个实参传递给时间提取函数：

"America/Los_Angeles", or "-08:00". ("PST" is not supported)
"America/New_York", or "-05:00". ("EST" is not supported)
"Europe/London"
"UTC"
"GMT"

形参数据类型

INT，STRING

返回类型

STRING

代码示例

示例 1

在此示例中，省略了 time_zone 实参，因此默认值为“GMT”。

$ts = $e.metadata.collected_timestamp.seconds

timestamp.get_date($ts) = "2024-02-19"

示例 2

以下示例使用字符串字面量来定义 time_zone。

$ts = $e.metadata.collected_timestamp.seconds

timestamp.get_date($ts, "America/Los_Angeles") = "2024-02-20"

timestamp.get_minute

支持的语言：

规则搜索

timestamp.get_minute(unix_seconds [, time_zone])

说明

此函数会返回一个介于 [0, 59] 之间的整数，表示分钟。

unix_seconds 是一个表示经过 Unix 计时原点的秒数（例如 $e.metadata.event_timestamp.seconds）的整数，或一个包含该值的占位符。
time_zone 是可选的，是表示时区的字符串。如果省略，则默认值为“GMT”。您可以使用字符串字面量来指定时区。选项包括：
- TZ 数据库名称，例如“America/Los_Angeles”。如需了解详情，请参阅本页中的“TZ 数据库名称”列
- 相对于世界协调时间 (UTC) 的时区偏离值，格式为 (+|-)H[H][:M[M]]，例如“-08:00”。

以下是有效 time_zone 说明符的示例，您可以将其作为第二个实参传递给时间提取函数：

"America/Los_Angeles", or "-08:00". ("PST" is not supported)
"America/New_York", or "-05:00". ("EST" is not supported)
"Europe/London"
"UTC"
"GMT"

形参数据类型

INT，STRING

返回类型

INT

代码示例

示例 1

在此示例中，省略了 time_zone 实参，因此默认值为“GMT”。

$ts = $e.metadata.collected_timestamp.seconds

timestamp.get_hour($ts) = 15

示例 2

以下示例使用字符串字面量来定义 time_zone。

$ts = $e.metadata.collected_timestamp.seconds

timestamp.get_hour($ts, "America/Los_Angeles") = 15

timestamp.get_hour

支持的语言：

规则搜索

timestamp.get_hour(unix_seconds [, time_zone])

说明

此函数会返回 [0, 23] 范围内的整数，表示小时。

unix_seconds 是一个表示经过 Unix 计时原点的秒数（例如 $e.metadata.event_timestamp.seconds）的整数，或一个包含该值的占位符。
time_zone 是可选的，是表示时区的字符串。如果省略，则默认值为“GMT”。您可以使用字符串字面量来指定时区。选项包括：
- TZ 数据库名称，例如“America/Los_Angeles”。如需了解详情，请参阅本页中的“TZ 数据库名称”列
- 相对于世界协调时间 (UTC) 的时区偏离值，格式为 (+|-)H[H][:M[M]]，例如“-08:00”。

以下是有效 time_zone 说明符的示例，您可以将其作为第二个实参传递给时间提取函数：

"America/Los_Angeles", or "-08:00". ("PST" is not supported)
"America/New_York", or "-05:00". ("EST" is not supported)
"Europe/London"
"UTC"
"GMT"

形参数据类型

INT，STRING

返回类型

INT

代码示例

示例 1

在此示例中，省略了 time_zone 实参，因此默认值为“GMT”。

$ts = $e.metadata.collected_timestamp.seconds

timestamp.get_hour($ts) = 15

示例 2

以下示例使用字符串字面量来定义 time_zone。

$ts = $e.metadata.collected_timestamp.seconds

timestamp.get_hour($ts, "America/Los_Angeles") = 15

timestamp.get_day_of_week

支持的语言：

规则搜索

timestamp.get_day_of_week(unix_seconds [, time_zone])

说明

此函数会返回一个介于 [1, 7] 之间的整数，表示一周中的某天（从星期日开始算起）。例如，1 = 星期日，2 = 星期一。

unix_seconds 是一个表示经过 Unix 计时原点的秒数（例如 $e.metadata.event_timestamp.seconds）的整数，或一个包含该值的占位符。
time_zone 是可选的，是表示时区的字符串。如果省略，则默认值为“GMT”。您可以使用字符串字面量来指定时区。选项包括：
- TZ 数据库名称，例如“America/Los_Angeles”。如需了解详情，请参阅本页中的“TZ 数据库名称”列
- 相对于世界协调时间 (UTC) 的时区偏离值，格式为 (+|-)H[H][:M[M]]，例如“-08:00”。

以下是有效 time_zone 说明符的示例，您可以将其作为第二个实参传递给时间提取函数：

"America/Los_Angeles", or "-08:00". ("PST" is not supported)
"America/New_York", or "-05:00". ("EST" is not supported)
"Europe/London"
"UTC"
"GMT"

形参数据类型

INT，STRING

返回类型

INT

代码示例

示例 1

在此示例中，省略了 time_zone 实参，因此默认值为“GMT”。

$ts = $e.metadata.collected_timestamp.seconds

timestamp.get_day_of_week($ts) = 6

示例 2

以下示例使用字符串字面量来定义 time_zone。

$ts = $e.metadata.collected_timestamp.seconds

timestamp.get_day_of_week($ts, "America/Los_Angeles") = 6

timestamp.get_timestamp

支持的语言：

规则搜索

timestamp.get_timestamp(unix_seconds, optional timestamp_format/time_granularity, optional timezone)

说明

此函数会返回一个格式为 YYYY-MM-DD 的字符串，表示时间戳所在的日期。

unix_seconds 是一个表示经过 Unix 计时原点的秒数（例如 $e.metadata.event_timestamp.seconds）的整数，或一个包含该值的占位符。
timestamp_format 是可选的，是表示时间戳格式的字符串。如果省略，则默认为 %F %T。您可以使用日期时间格式字符串或以下任一时间粒度来指定格式：SECOND、MINUTE、HOUR、DATE、WEEK、MONTH 或 YEAR。如需了解更多格式设置选项，请参阅设置日期和时间部分的元素格式
time_zone 是可选的，是表示时区的字符串。如果省略，则默认值为 GMT。您可以使用字符串字面量来指定时区。选项如下：
- IANA 时区 (TZ) 数据库名称，例如 America/Los_Angeles。如需了解详情，请参阅维基百科上的 tz 数据库时区列表。
- 相对于世界协调时间 (UTC) 的时区偏离值，格式为 (+|-)H[H][:M[M]]，例如“-08:00”。

以下是有效 time_zone 说明符的示例，您可以将其作为第二个实参传递给时间提取函数：

"America/Los_Angeles", or "-08:00". ("PST" is not supported)
"America/New_York", or "-05:00". ("EST" is not supported)
"Europe/London"
"UTC"
"GMT"

形参数据类型

INT、STRING、STRING

返回类型

STRING

代码示例

示例 1

在此示例中，省略了 time_zone 实参，因此默认值为 GMT。

$ts = $e.metadata.collected_timestamp.seconds

timestamp.get_timestamp($ts) = "2024-02-22 10:43:51"

示例 2

以下示例使用字符串字面量来定义 time_zone。

$ts = $e.metadata.collected_timestamp.seconds

timestamp.get_timestamp($ts, "%F %T", "America/Los_Angeles") = "2024-02-22 10:43:51"

示例 3

以下示例使用字符串字面量来定义 timestamp_format。

$ts = $e.metadata.collected_timestamp.seconds

timestamp.get_timestamp($ts, "%Y-%m", "GMT") = "2024-02"

示例 4

此示例将 Unix 时间戳格式化为精确到秒的字符串。

timestamp.get_timestamp(1708598631, "SECOND", "GMT") = "2024-02-22 10:43:51"

示例 5

此示例将 Unix 时间戳格式化为以分钟为粒度的字符串。

timestamp.get_timestamp(1708598631, "MINUTE", "GMT") = "2024-02-22 10:43"

示例 6

此示例将 Unix 时间戳格式化为小时粒度的字符串。

timestamp.get_timestamp(1708598631, "HOUR", "GMT") = "2024-02-22 10"

示例 7

此示例将 Unix 时间戳格式化为以天为粒度的字符串。

timestamp.get_timestamp(1708598631, "DATE", "GMT") = "2024-02-22"

示例 8

此示例将 Unix 时间戳格式化为字符串，粒度为周。

timestamp.get_timestamp(1708598631, "WEEK", "GMT") = "2024-02-18"

示例 9

此示例将 Unix 时间戳格式化为字符串（以月为粒度）。

timestamp.get_timestamp(1708598631, "MONTH", "GMT") = "2024-02"

示例 10

此示例将 UNIX 时间戳格式化为字符串，精确到年。

timestamp.get_timestamp(1708598631, "YEAR", "GMT") = "2024"

timestamp.get_week

支持的语言：

规则搜索

timestamp.get_week(unix_seconds [, time_zone])

说明

此函数会返回 [0, 53] 范围内的整数，表示一年中的某周。一周从星期日开始算起。一年中第一个星期日之前的日期属于第 0 周。

unix_seconds 是一个表示经过 Unix 计时原点的秒数（例如 $e.metadata.event_timestamp.seconds）的整数，或一个包含该值的占位符。
time_zone 是可选的，是表示时区的字符串。如果省略，则默认值为“GMT”。您可以使用字符串字面量来指定时区。选项包括：
- TZ 数据库名称，例如“America/Los_Angeles”。如需了解详情，请参阅本页中的“TZ 数据库名称”列
- 相对于世界协调时间 (UTC) 的时区偏离值，格式为 (+|-)H[H][:M[M]]，例如“-08:00”。

以下是有效 time_zone 说明符的示例，您可以将其作为第二个实参传递给时间提取函数：

"America/Los_Angeles", or "-08:00". ("PST" is not supported)
"America/New_York", or "-05:00". ("EST" is not supported)
"Europe/London"
"UTC"
"GMT"

形参数据类型

INT，STRING

返回类型

INT

代码示例

示例 1

在此示例中，省略了 time_zone 实参，因此默认值为“GMT”。

$ts = $e.metadata.collected_timestamp.seconds

timestamp.get_week($ts) = 0

示例 2

以下示例使用字符串字面量来定义 time_zone。

$ts = $e.metadata.collected_timestamp.seconds

timestamp.get_week($ts, "America/Los_Angeles") = 0

timestamp.now

支持的语言：

规则搜索

timestamp.now()

说明

返回自 1970-01-01 00:00:00 UTC 以来的秒数。这也称为 Unix 纪元时间。

返回类型

INT

代码示例

示例 1

以下示例返回了 2024 年 5 月 22 日 18:16:59 执行的代码的时间戳。

timestamp.now() = 1716401819 // Unix epoch time in seconds for May 22, 2024 at 18:16:59

window.avg

支持的语言：

规则

window.avg(numeric_values [, should_ignore_zero_values])

说明

返回输入值（可以是整数或浮点数）的平均值。将可选的第二个实参设置为 true 可忽略零值。

形参数据类型

INT|FLOAT

返回类型

FLOAT

代码示例

示例 1

此示例显示了整数平均值。

// This rule sets the outcome $size_mode to the average
// file size in the 5 minute match window.
events:
 $e.user.userid = $userid
match:
 $userid over 5m
outcome:
  $size_mode = window.avg($e.file.size) // yields 2.5 if the event file size values in the match window are 1, 2, 3 and 4

示例 2

此示例显示了浮点平均值。

events:
 $e.user.userid = $userid
match:
 $userid over 5m
outcome:
  $size_mode = window.avg($e.file.size) // yields 1.75 if the event file size values in the match window are 1.1 and 2.4

示例 3

负输入平均值

events:
 $e.user.userid = $userid
match:
 $userid over 5m
outcome:
  $size_mode = window.avg($e.file.size) // yields 0.6 if the event file size values in the match window are -1.1, 1.1, 0.0 and 2.4

示例 4

0 返回 0

events:
 $e.user.userid = $userid
match:
 $userid over 5m
outcome:
  $size_mode = window.avg($e.file.size) // yields 0 if the event file size values in the match window is 0

示例 5

忽略 0 个值

events:
 $e.user.userid = $userid
match:
 $userid over 5m
outcome:
  $size_mode = window.avg($e.file.size, true) // yields 394 if the event file size values in the match window are 0, 0, 0 and 394

window.first

支持的语言：

规则

window.first(values_to_sort_by, values_to_return)

说明

此聚合函数会返回一个字符串值，该值源自匹配窗口中相关性最低的整数值对应的事件。一个用例示例是，从匹配窗口中时间戳最低的事件（最早的事件）获取用户 ID。

形参数据类型

INT，STRING

返回类型

STRING

代码示例

获取在匹配窗口中与最低相关整数值对应的事件派生的字符串值。

// This rule sets the outcome $first_event to the lowest correlated int value
// in the 5 minute match window.
events:
 $e.user.userid = $userid
match:
 $userid over 5m
outcome:
  $first_event = window.first($e.metadata.timestamp.seconds, $e.metadata.event_type) // yields v1 if the events in the match window are 1, 2 and 3 and corresponding values v1, v2, and v3.

window.last

支持的语言：

规则

window.last(values_to_sort_by, values_to_return)

说明

此聚合函数会返回一个字符串值，该值源自匹配窗口中相关性最高的整数值所对应的事件。一个使用场景示例是，从匹配窗口中时间戳最低（时间戳最高）的事件中获取用户 ID。

形参数据类型

INT，STRING

返回类型

STRING

代码示例

获取在匹配窗口中与相关性最高的整数值对应的事件派生的字符串值。

// This rule sets the outcome $last_event to the highest correlated int value
// in the 5 minute match window.
events:
 $e.user.userid = $userid
match:
 $userid over 5m
outcome:
  $last_event = window.first($e.metadata.timestamp.seconds, $e.metadata.event_type) // yields v3 if the events in the match window are 1, 2 and 3 and corresponding values v1, v2, and v3.

window.median

支持的语言：

规则

window.median(numeric_values, should_ignore_zero_values)

说明

返回输入值的中位数。如果有 2 个中位数值，则只会随机选择 1 个作为返回值。

形参数据类型

INT|FLOAT，BOOL

返回类型

FLOAT

代码示例

示例 1

此示例会在输入值不为零时返回中位数。

rule median_file_size {
    meta:
    events:
      $e.metadata.event_type = "FILE_COPY"
        $userid = $e.principal.user.userid
    match:
      $userid over 1h
    outcome:
      $median_file_size = window.median($e.principal.file.size) // returns 2 if the file sizes in the match window are [1, 2, 3]
  condition:
      $e
}

示例 2

此示例展示了当输入包含一些不应忽略的零值时，如何返回中位数。

rule median_file_size {
    meta:
    events:
      $e.metadata.event_type = "FILE_COPY"
        $userid = $e.principal.user.userid
    match:
      $userid over 1h
    outcome:
      $median_file_size = window.median($e.principal.file.size) // returns 1 if the file sizes in the match window are [0,0, 1, 2, 3]
  condition:
      $e
}

示例 3

此示例返回中位数，前提是输入包含一些应忽略的零值。

rule median_file_size {
    meta:
    events:
      $e.metadata.event_type = "FILE_COPY"
        $userid = $e.principal.user.userid
    match:
      $userid over 1h
    outcome:
      $median_file_size = window.median($e.principal.file.size, true) // returns 2 if the file sizes in the match window are [0,0, 1, 2, 3]
  condition:
      $e
}

示例 4

此示例返回输入包含应忽略的所有零值时的中位数。

rule median_file_size {
    meta:
    events:
      $e.metadata.event_type = "FILE_COPY"
        $userid = $e.principal.user.userid
    match:
      $userid over 1h
    outcome:
      $median_file_size = window.median($e.principal.file.size) // returns 0 if the file sizes in the match window are [0,0]
  condition:
      $e
}

示例 5

此示例表明，当存在多个中位数时，系统只会返回一个中位数。

rule median_file_size {
    meta:
    events:
      $e.metadata.event_type = "FILE_COPY"
        $userid = $e.principal.user.userid
    match:
      $userid over 1h
    outcome:
      $median_file_size = window.median($e.principal.file.size) // returns 1 if the file sizes in the match window are [1, 2, 3, 4]
  condition:
      $e
}

window.mode

支持的语言：

规则

window.mode(values)

说明

返回输入值的众数。如果存在多个可能的众数值，则只会以不确定的方式选择其中一个值作为返回值。

形参数据类型

INT|FLOAT|STRING

返回类型

STRING

代码示例

示例 1

获取匹配窗口中值的众数。

// This rule sets the outcome $size_mode to the most frequently occurring
// file size in the 5 minute match window.
events:
 $e.user.userid = $userid
match:
 $userid over 5m
outcome:
  $size_mode = window.mode($e.file.size) // yields 1.6 if the event file size values in the match window are 1.6, 2, and 1.6

window.stddev

支持的语言：

规则

window.stddev(numeric_values)

说明

返回匹配窗口中输入值的标准差。

形参数据类型

INT|FLOAT

返回类型

FLOAT

代码示例

示例 1

此示例返回匹配窗口中整数的标准差。

// This rule creates a detection when the file size stddev in 5 minutes for a user is over a threshold.
events:
 $e.user.userid = $userid
match:
 $userid over 5m
outcome:
  $p1 = window.stddev($e.file.size) // yields 4.0 if the event file size values in the match window are [10, 14, 18].
condition:
  $e and #p1 > 2

示例 2

此示例返回匹配窗口中浮点数的标准差。

events:
 $e.user.userid = $userid
match:
 $userid over 5m
outcome:
  $p1 = window.stddev($e.file.size) // yields 4.488686 if the event file size values in the match window are [10.00, 14.80, 18.97].
condition:
  $e and #p1 > 2

示例 3

此示例返回包含负数的匹配窗口中的标准差。

events:
 $e.user.userid = $userid
match:
 $userid over 5m
outcome:
  $p1 = window.stddev($e.file.size) // yields 48.644972 if the event file size values in the match window are [-1, -56, -98].
condition:
  $e and #p1 > 2

示例 4

如果匹配窗口中的所有值都相同，此示例会返回零标准差。

events:
 $e.user.userid = $userid
match:
 $userid over 5m
outcome:
  $p1 = window.stddev($e.file.size) // yields 0.000000 if the event file size values in the match window are [1, 1, 1].
condition:
  $e and #p1 > 2

示例 5

此示例返回包含正数和负数的匹配窗口的标准差。

events:
 $e.user.userid = $userid
match:
 $userid over 5m
outcome:
  $p1 = window.stddev($e.file.size) // yields 1.000000 if the event file size values in the match window are [1, 0, -1].
condition:
  $e and #p1 > 10

window.variance

支持的语言：

规则

window.variance(values)

说明

此函数返回输入值的指定方差。

形参数据类型

INT|FLOAT

返回类型

FLOAT

代码示例

示例 1

此示例返回所有整数的方差。

// This rule creates a detection when the file size variance in 5 minutes for a user is over a threshold.
events:
 $e.user.userid = $userid
match:
 $userid over 5m
outcome:
  $p1 = window.variance($e.file.size) // yields 16 if the event file size values in the match window are [10, 14, 18].
condition:
  $e and #p1 > 10

示例 2

此示例返回所有浮点数的方差。

events:
 $e.user.userid = $userid
match:
 $userid over 5m
outcome:
  $p1 = window.variance($e.file.size) // yields 20.148300 if the event file size values in the match window are [10.00, 14.80, 18.97].
condition:
  $e and #p1 > 10

示例 3

此示例返回负数的方差。

events:
 $e.user.userid = $userid
match:
 $userid over 5m
outcome:
  $p1 = window.variance($e.file.size) // yields 2366.333333 if the event file size values in the match window are [-1, -56, -98].
condition:
  $e and #p1 > 10

示例 4

此示例返回较小的方差值。

events:
 $e.user.userid = $userid
match:
 $userid over 5m
outcome:
  $p1 = window.variance($e.file.size) // yields 0.000000 if the event file size values in the match window are [0.000000, 0.000000, 0.000100].
condition:
  $e and #p1 > 10

示例 5

此示例返回零方差。

events:
 $e.user.userid = $userid
match:
 $userid over 5m
outcome:
  $p1 = window.variance($e.file.size) // yields 0.000000 if the event file size values in the match window are [1, 1, 1].
condition:
  $e and #p1 > 10

示例 6

此示例返回正数和负数的方差。

events:
 $e.user.userid = $userid
match:
 $userid over 5m
outcome:
  $p1 = window.variance($e.file.size) // yields 1.000000 if the event file size values in the match window are [1, 0, -1].
condition:
  $e and #p1 > 10

bytes.to_base64

支持的语言：

规则搜索

bytes.to_base64(bytes, optional_default_string)

说明

函数将 bytes 值转换为 base64 encoded string。如果函数调用包含无法转换的值，则默认返回空字符串。

形参数据类型

BYTES，STRING

返回类型

STRING

代码示例

从原始二进制字节到 Base64 编码的字符串

该函数将原始二进制字节转换为 base64 编码的字符串。

bytes.to_base64(b'000000006f8ec5586d026f9ddac56e9f2fe15b8a0000000001000000cd000000) = "AAAAAG+OxVhtAm+d2sVuny/hW4oAAAAAAQAAAM0AAAA="

转化失败（默认为可选提供的字符串）

如果提供的字节值无效，该函数会默认返回 "invalid bytes"。

bytes.to_base64(b'000000006f8ec5586d", "invalid bytes") = "invalid bytes"

函数到占位符分配

您可以在 events 部分中将函数调用的结果分配给占位符。例如：

$placeholder = strings.concat($e.principal.hostname, "my-string").

然后，您可以在 match、condition 和 outcome 部分中使用占位符变量。但是，函数到占位符的分配有两个限制：

函数到占位符分配的每个占位符都必须分配给包含事件字段的表达式。例如，以下示例有效：

$ph1 = $e.principal.hostname
$ph2 = $e.src.hostname

// Both $ph1 and $ph2 have been assigned to an expression containing an event field.
$ph1 = strings.concat($ph2, ".com")

$ph1 = $e.network.email.from
$ph2 = strings.concat($e.principal.hostname, "@gmail.com")

// Both $ph1 and $ph2 have been assigned to an expression containing an event field.
$ph1 = strings.to_lower($ph2)

不过，以下示例无效：

$ph1 = strings.concat($e.principal.hostname, "foo")
$ph2 = strings.concat($ph1, "bar") // $ph2 has NOT been assigned to an expression containing an event field.

函数调用应依赖于一个且仅一个事件。但是，函数调用参数中可以使用来自同一事件的多个字段。例如，以下内容有效：

$ph = strings.concat($event.principal.hostname, "string2")

$ph = strings.concat($event.principal.hostname, $event.src.hostname)

但是，以下内容无效：

$ph = strings.concat("string1", "string2")

$ph = strings.concat($event.principal.hostname, $anotherEvent.src.hostname)

参考列表语法

如需详细了解参考列表行为和参考列表语法，请参阅我们的参考列表页面。

您可以在 events 或 outcome 部分中使用参考列表。以下是在规则中使用各种类型的参考列表的语法：

// STRING reference list
$e.principal.hostname in %string_reference_list

// regular expression reference list
$e.principal.hostname in regex %regex_reference_list

// CIDR reference list
$e.principal.ip in cidr %cidr_reference_list

您还可以将 not 运算符和 nocase 运算符与参考列表搭配使用，如以下示例所示：

// Exclude events whose hostnames match substrings in my_regex_list.
not $e.principal.hostname in regex %my_regex_list

// Event hostnames must match at least 1 string in my_string_list (case insensitive).
$e.principal.hostname in %my_string_list nocase

nocase 运算符与 STRING 列表和 REGEX 列表兼容。

出于性能方面的考虑，检测引擎会限制参考列表的使用。

规则中 in 语句的最大数量（无论是否包含特殊运算符）：7
含 regex 运算符的 in 语句数上限：4
使用 cidr 运算符的 in 语句数上限：2

类型检查

当您在界面中创建规则时，Google SecOps 会根据 YARA-L 语法执行类型检查。显示的类型检查错误可帮助您修改规则，以确保它能正常运行。

以下是无效谓词的示例：

// $e.target.port is of type integer which cannot be compared to a string.
$e.target.port = "80"

// "LOGIN" is not a valid event_type enum value.
$e.metadata.event_type = "LOGIN"

检测事件抽样

多事件规则的检测结果包含事件样本，可提供有关导致检测结果的事件的背景信息。规则中定义的每个事件变量最多可包含 10 个事件样本。例如，如果某条规则定义了 2 个事件变量，则每次检测最多可以有 20 个事件样本。此限制分别适用于每个事件变量。如果一个事件变量在此检测中有 2 个适用事件，而另一个事件变量有 15 个适用事件，则检测结果包含 12 个事件样本 (2 + 10)。

检测时会忽略任何超出此上限的事件样本。

如果您想详细了解导致检测结果的事件，可以使用结果部分中的聚合功能在检测结果中输出更多信息。

如果您在界面中查看检测结果，可以下载检测结果的所有事件样本。如需了解详情，请参阅下载活动。

YARA-L 2.0 语言语法

规则结构

元部分语法

“事件”部分语法

变量声明

事件变量过滤条件

事件变量联接

匹配部分语法

“匹配”部分中的零值处理

跳跃窗口

滑动窗口

结果部分语法

结果变量数据类型

条件逻辑

数学运算

结果中的占位符变量

结果分配表达式中的结果变量

数据汇总

使用结果部分时的注意事项：

条件部分语法

统计字符

值字符

活动和占位符条件

有界限和无界限条件

不存在的要求

结果条件

规则分类

选项部分语法

allow_zero_values

suppression_window

复合检测规则

了解规则结构

在 events 代码块中定义输入

使用结果变量、匹配变量或元标签引用检测内容

使用规则 ID 或规则名称引用检测内容

在 match 部分中加入您的输入内容

定义 condition 部分

使用高级技巧

合并事件和检测结果

创建顺序复合检测

风险评分

布尔表达式

比较

函数

参考列表表达式

逻辑表达式

枚举类型

Nocase 修饰符

重复字段

重复字段和布尔值表达式

修改后的表达式

任意

全部

未修改的表达式

重复字段和占位符

使用分配给重复字段的占位变量时的结果

数组索引

重复消息

重复消息和数组索引

评论

字面量

字符串和正则表达式字面量

运算符

变量

关键字

地图

结构体和标签

支持的情况

活动和结果部分

将地图值分配给占位符

在联接条件中使用映射字段

不支持的情况

将 any 或 all 关键字与地图结合使用

其他类型的值

重复值处理

在地图中访问结果变量

variables 的可用类型后缀

函数

arrays.concat

说明

在 `events` 代码块中定义输入

在 `match` 部分中加入您的输入内容

定义 `condition` 部分

将 `any` 或 `all` 关键字与地图结合使用

`variables` 的可用类型后缀