Esta página foi traduzida pela API Cloud Translation.

Coletar arquivos CSV de IOC personalizados

Compatível com:

Google SecOps SIEM

Este documento explica como ingerir arquivos CSV de IOC personalizados no Google Security Operations usando o Amazon S3. Em seguida, ele mapeia esses campos para a UDM, processando vários tipos de dados, como IPs, domínios e hashes, e enriquecendo a saída com detalhes de ameaças, informações de entidades e níveis de gravidade.

Antes de começar

Instância do Google SecOps
Acesso privilegiado à AWS (S3, IAM, Lambda, EventBridge)
Acesso a um ou mais URLs de feed de IOC CSV (HTTPS) ou a um endpoint interno que veicula CSV

Configurar o bucket do AWS S3 e o IAM para o Google SecOps

Crie um bucket do Amazon S3 seguindo este guia do usuário: Como criar um bucket
Salve o Nome e a Região do bucket para referência futura (por exemplo, csv-ioc).
Crie um usuário seguindo este guia: Como criar um usuário do IAM.
Selecione o usuário criado.
Selecione a guia Credenciais de segurança.
Clique em Criar chave de acesso na seção Chaves de acesso.
Selecione Serviço de terceiros como o Caso de uso.
Clique em Próxima.
Opcional: adicione uma tag de descrição.
Clique em Criar chave de acesso.
Clique em Fazer o download do arquivo CSV para salvar a chave de acesso e a chave de acesso secreta para uso posterior.
Clique em Concluído.
Selecione a guia Permissões.
Clique em Adicionar permissões na seção Políticas de permissões.
Selecione Adicionar permissões.
Selecione Anexar políticas diretamente.
Pesquise e selecione a política AmazonS3FullAccess.
Clique em Próxima.
Clique em Adicionar permissões

Configurar a política e o papel do IAM para uploads do S3

Acesse Console da AWS > IAM > Políticas > Criar política > guia JSON.

Insira a seguinte política:

{
  "Version": "2012-10-17",
  "Statement": [
    {
      "Sid": "AllowPutCsvIocObjects",
      "Effect": "Allow",
      "Action": "s3:PutObject",
      "Resource": "arn:aws:s3:::csv-ioc/*"
    }
  ]
}

Substitua csv-ioc se você tiver inserido um nome de bucket diferente.

Clique em Próxima > Criar política.
Acesse IAM > Funções > Criar função > Serviço da AWS > Lambda.
Anexe a política recém-criada.
Nomeie a função como WriteCsvIocToS3Role e clique em Criar função.

Criar a função Lambda

No console da AWS, acesse Lambda > Functions > Create function.
Clique em Criar do zero.
Informe os seguintes detalhes de configuração:

Configuração Valor

Nome csv_custom_ioc_to_s3

Ambiente de execução Python 3.13

Arquitetura x86_64

Função de execução WriteCsvIocToS3Role

Configuração	Valor
Nome	`csv_custom_ioc_to_s3`
Ambiente de execução	Python 3.13
Arquitetura	x86_64
Função de execução	`WriteCsvIocToS3Role`

Depois que a função for criada, abra a guia Código, exclua o stub e insira o seguinte código (csv_custom_ioc_to_s3.py):

#!/usr/bin/env python3
# Lambda: Pull CSV IOC feeds over HTTPS and write raw CSV to S3 (no transform)
# - Multiple URLs (comma-separated)
# - Optional auth header
# - Retries for 429/5xx
# - Unique filenames per page
# - Sets ContentType=text/csv

import os, time, json
from urllib.request import Request, urlopen
from urllib.error import HTTPError, URLError
import boto3

BUCKET = os.environ["S3_BUCKET"]
PREFIX = os.environ.get("S3_PREFIX", "csv-ioc/").strip("/")
IOC_URLS = [u.strip() for u in os.environ.get("IOC_URLS", "").split(",") if u.strip()]
AUTH_HEADER = os.environ.get("AUTH_HEADER", "")  # e.g., "Authorization: Bearer <token>" OR just "Bearer <token>"
TIMEOUT = int(os.environ.get("TIMEOUT", "60"))

s3 = boto3.client("s3")

def _build_request(url: str) -> Request:
    if not url.lower().startswith("https://"):
        raise ValueError("Only HTTPS URLs are allowed in IOC_URLS")
    req = Request(url, method="GET")
    # Auth header: either "Header-Name: value" or just "Bearer token" -> becomes Authorization
    if AUTH_HEADER:
        if ":" in AUTH_HEADER:
            k, v = AUTH_HEADER.split(":", 1)
            req.add_header(k.strip(), v.strip())
        else:
            req.add_header("Authorization", AUTH_HEADER.strip())
    req.add_header("Accept", "text/csv, */*")
    return req

def _http_bytes(req: Request, timeout: int = TIMEOUT, max_retries: int = 5) -> bytes:
    attempt, backoff = 0, 1.0
    while True:
        try:
            with urlopen(req, timeout=timeout) as r:
                return r.read()
        except HTTPError as e:
            if (e.code == 429 or 500 <= e.code <= 599) and attempt < max_retries:
                time.sleep(backoff); attempt += 1; backoff *= 2; continue
            raise
        except URLError:
            if attempt < max_retries:
                time.sleep(backoff); attempt += 1; backoff *= 2; continue
            raise

def _safe_name(url: str) -> str:
    # Create a short, filesystem-safe token for the URL
    return url.replace("://", "_").replace("/", "_").replace("?", "_").replace("&", "_")[:100]

def _put_csv(blob: bytes, url: str, run_ts: int, idx: int) -> str:
    key = f"{PREFIX}/{time.strftime('%Y/%m/%d/%H%M%S', time.gmtime(run_ts))}-url{idx:03d}-{_safe_name(url)}.csv"
    s3.put_object(
        Bucket=BUCKET,
        Key=key,
        Body=blob,
        ContentType="text/csv",
    )
    return key

def lambda_handler(event=None, context=None):
    assert IOC_URLS, "IOC_URLS must contain at least one HTTPS URL"
    run_ts = int(time.time())
    written = []
    for i, url in enumerate(IOC_URLS):
        req = _build_request(url)
        data = _http_bytes(req)
        key = _put_csv(data, url, run_ts, i)
        written.append({"url": url, "s3_key": key, "bytes": len(data)})
    return {"ok": True, "written": written}

if __name__ == "__main__":
    print(json.dumps(lambda_handler(), indent=2))

Acesse Configuração > Variáveis de ambiente > Editar > Adicionar nova variável de ambiente.

Insira as seguintes variáveis de ambiente, substituindo pelos seus valores:

Chave	Exemplo
`S3_BUCKET`	`csv-ioc`
`S3_PREFIX`	`csv-ioc/`
`IOC_URLS`	`https://ioc.example.com/feed.csv,https://another.example.org/iocs.csv`
`AUTH_HEADER`	`Authorization: Bearer <token>`
`TIMEOUT`	`60`

Depois que a função for criada, permaneça na página dela ou abra Lambda > Functions > sua-função.
Selecione a guia Configuração.
No painel Configuração geral, clique em Editar.
Mude Tempo limite para 5 minutos (300 segundos) e clique em Salvar.

Observação: o tempo limite é um limite máximo fixo. Isso significa que, se a função ainda estiver em execução quando o timer atingir 5 minutos, o AWS Lambda vai encerrá-la. Execuções mais curtas terminam normalmente, e você só recebe cobranças pelo tempo de execução real.

Criar uma programação do EventBridge

Acesse Amazon EventBridge > Scheduler > Criar programação.
Informe os seguintes detalhes de configuração:
- Programação recorrente: Taxa (1 hour).
- Destino: sua função Lambda.
- Nome: csv-custom-ioc-1h.
Clique em Criar programação.

Opcional: criar um usuário e chaves do IAM somente leitura para o Google SecOps

No console da AWS, acesse IAM > Usuários e clique em Adicionar usuários.
Informe os seguintes detalhes de configuração:
- Usuário: insira um nome exclusivo (por exemplo, secops-reader)
- Tipo de acesso: selecione Chave de acesso - Acesso programático.
- Clique em Criar usuário.
Anexe a política de leitura mínima (personalizada): Usuários > selecione secops-reader > Permissões > Adicionar permissões > Anexar políticas diretamente > Criar política

No editor JSON, insira a seguinte política:

{
  "Version": "2012-10-17",
  "Statement": [
    {
      "Effect": "Allow",
      "Action": ["s3:GetObject"],
      "Resource": "arn:aws:s3:::<your-bucket>/*"
    },
    {
      "Effect": "Allow",
      "Action": ["s3:ListBucket"],
      "Resource": "arn:aws:s3:::<your-bucket>"
    }
  ]
}

Defina o nome como secops-reader-policy.
Acesse Criar política > pesquise/selecione > Próxima > Adicionar permissões.
Acesse Credenciais de segurança > Chaves de acesso > Criar chave de acesso.
Faça o download do CSV (esses valores são inseridos no feed).

Configurar um feed no Google SecOps para ingerir arquivos CSV de IOC personalizados

Acesse Configurações do SIEM > Feeds.
Clique em Adicionar novo feed.
No campo Nome do feed, insira um nome para o feed (por exemplo, CSV Custom IOC).
Selecione Amazon S3 V2 como o Tipo de origem.
Selecione IOC personalizado em CSV como o Tipo de registro.
Clique em Próxima.
Especifique valores para os seguintes parâmetros de entrada:
- URI do S3: s3://csv-ioc/csv-ioc/
- Opções de exclusão de fontes: selecione a opção de exclusão de acordo com sua preferência.
- Idade máxima do arquivo: padrão de 180 dias.
- ID da chave de acesso: chave de acesso do usuário com acesso ao bucket do S3.
- Chave de acesso secreta: chave secreta do usuário com acesso ao bucket do S3.
- Namespace do recurso: o namespace do recurso.
- Rótulos de ingestão: o rótulo a ser aplicado aos eventos deste feed.
Clique em Próxima.
Revise a nova configuração do feed na tela Finalizar e clique em Enviar.

Tabela de mapeamento da UDM

Campo de registro	Mapeamento do UDM	Lógica
`asn`	entity.metadata.threat.detection_fields.asn_label.value	Mapeado diretamente do campo "asn".
`category`	entity.metadata.threat.category_details	Mapeado diretamente do campo "category".
`classification`	entity.metadata.threat.category_details	Adicionada a "classification - " e mapeada para o campo "entity.metadata.threat.category_details".
`column2`	entity.entity.hostname	Mapeado para "entity.entity.hostname" se [category] corresponder a ".?ip" ou ".?proxy" e [not_ip] for verdadeiro.
`column2`	entity.entity.ip	Unido a "entity.entity.ip" se [category] corresponder a ".?ip" ou ".?proxy" e [not_ip] for falso.
`confidence`	entity.metadata.threat.confidence_score	Convertido para ponto flutuante e mapeado para o campo "entity.metadata.threat.confidence_score".
`country`	entity.entity.location.country_or_region	Mapeado diretamente do campo "país".
`date_first`	entity.metadata.threat.first_discovered_time	Analisado como ISO8601 e mapeado para o campo "entity.metadata.threat.first_discovered_time".
`date_last`	entity.metadata.threat.last_updated_time	Analisado como ISO8601 e mapeado para o campo "entity.metadata.threat.last_updated_time".
`detail`	entity.metadata.threat.summary	Mapeado diretamente do campo "detail".
`detail2`	entity.metadata.threat.description	Mapeado diretamente do campo "detail2".
`domain`	entity.entity.hostname	Mapeado diretamente do campo "domain".
`email`	entity.entity.user.email_addresses	Unido ao campo "entity.entity.user.email_addresses".
`id`	entity.metadata.product_entity_id	Adicionado a "id - " e mapeado para o campo "entity.metadata.product_entity_id".
`import_session_id`	entity.metadata.threat.detection_fields.import_session_id_label.value	Mapeado diretamente do campo "import_session_id".
`itype`	entity.metadata.threat.detection_fields.itype_label.value	Mapeado diretamente do campo "itype".
`lat`	entity.entity.location.region_latitude	Convertido para ponto flutuante e mapeado para o campo "entity.entity.location.region_latitude".
`lon`	entity.entity.location.region_longitude	Convertido para ponto flutuante e mapeado para o campo "entity.entity.location.region_longitude".
`maltype`	entity.metadata.threat.detection_fields.maltype_label.value	Mapeado diretamente do campo "maltype".
`md5`	entity.entity.file.md5	Mapeado diretamente do campo "md5".
`media`	entity.metadata.threat.detection_fields.media_label.value	Mapeado diretamente do campo "media".
`media_type`	entity.metadata.threat.detection_fields.media_type_label.value	Mapeado diretamente do campo "media_type".
`org`	entity.metadata.threat.detection_fields.org_label.value	Mapeado diretamente do campo "org".
`resource_uri`	entity.entity.url	Mapeado para "entity.entity.url" se [itype] não corresponder a "(ip
`resource_uri`	entity.metadata.threat.url_back_to_product	Mapeado para "entity.metadata.threat.url_back_to_product" se [itype] corresponder a "(ip
`score`	entity.metadata.threat.confidence_details	Mapeado diretamente do campo "score".
`severity`	entity.metadata.threat.severity	Convertido para maiúsculas e mapeado para o campo "entity.metadata.threat.severity" se corresponder a "LOW", "MEDIUM", "HIGH" ou "CRITICAL".
`source`	entity.metadata.threat.detection_fields.source_label.value	Mapeado diretamente do campo "source".
`source_feed_id`	entity.metadata.threat.detection_fields.source_feed_id_label.value	Mapeado diretamente do campo "source_feed_id".
`srcip`	entity.entity.ip	Unido a "entity.entity.ip" se [srcip] não estiver vazio e não for igual a [value].
`state`	entity.metadata.threat.detection_fields.state_label.value	Mapeado diretamente do campo "state".
`trusted_circle_ids`	entity.metadata.threat.detection_fields.trusted_circle_ids_label.value	Mapeado diretamente do campo "trusted_circle_ids".
`update_id`	entity.metadata.threat.detection_fields.update_id_label.value	Mapeado diretamente do campo "update_id".
`value`	entity.entity.file.full_path	Mapeado para "entity.entity.file.full_path" se [category] corresponder a ".*?file".
`value`	entity.entity.file.md5	Mapeado para "entity.entity.file.md5" se [category] corresponder a ".*?md5" e [value] for uma string hexadecimal de 32 caracteres.
`value`	entity.entity.file.sha1	Mapeado para "entity.entity.file.sha1" se ([category] corresponder a ".?md5" e [value] for uma string hexadecimal de 40 caracteres) ou ([category] corresponder a ".?sha1" e [value] for uma string hexadecimal de 40 caracteres).
`value`	entity.entity.file.sha256	Mapeado para "entity.entity.file.sha256" se ([category] corresponder a ".?md5" e [value] for uma string hexadecimal e [file_type] não for "md5") ou ([category] corresponder a ".?sha256" e [value] for uma string hexadecimal).
`value`	entity.entity.hostname	Mapeado para "entity.entity.hostname" se ([category] corresponder a ".?domain") ou ([category] corresponder a ".?ip" ou ".*?proxy" e [not_ip] for verdadeiro).
`value`	entity.entity.url	Mapeado para "entity.entity.url" se ([category] corresponder a ".*?url") ou ([category] corresponder a "url" e [resource_uri] não estiver vazio).
N/A	entity.metadata.collected_timestamp	Preenchido com o carimbo de data/hora do evento.
N/A	entity.metadata.interval.end_time	Definido como um valor constante de 253402300799 segundos.
N/A	entity.metadata.interval.start_time	Preenchido com o carimbo de data/hora do evento.
N/A	entity.metadata.vendor_name	Definido como um valor constante de "IOC personalizado".

Precisa de mais ajuda? Receba respostas de membros da comunidade e profissionais do Google SecOps.