Box 공동작업 JSON 로그 수집
이 문서에서는 Lambda 및 EventBridge 일정을 사용하여 AWS S3를 통해 Box Collaboration JSON 로그를 Google Security Operations에 수집하는 방법을 설명합니다. 파서는 JSON 형식의 Box 이벤트 로그를 처리하여 통합 데이터 모델 (UDM)에 매핑합니다. 구조화된 이벤트 데이터를 출력하기 전에 원시 로그에서 관련 필드를 추출하고, 이름 바꾸기 및 병합과 같은 데이터 변환을 실행하고, 중간 정보를 사용하여 데이터를 보강합니다.
시작하기 전에
- Google SecOps 인스턴스
- Box에 대한 권한 있는 액세스 (관리자 + 개발자 콘솔)
- 로그를 저장할 리전과 동일한 리전의 AWS (S3, IAM, Lambda, EventBridge)에 대한 권한 있는 액세스
Box Developer Console 구성 (클라이언트 사용자 인증 정보)
- Box Developer Console에 로그인합니다.
- 서버 인증 (클라이언트 사용자 인증 정보 권한 부여)을 사용하여 맞춤 앱을 만듭니다.
- 애플리케이션 액세스를 앱 + 엔터프라이즈 액세스로 설정합니다.
- 애플리케이션 범위에서 엔터프라이즈 속성 관리를 사용 설정합니다.
- 관리 콘솔 > 앱 > 맞춤 앱 관리자에서 클라이언트 ID로 앱을 승인합니다.
- 클라이언트 ID와 * 클라이언트 보안 비밀번호를 복사하여 안전한 위치에 저장합니다.
- 관리 콘솔 > 계정 및 결제 > 계정 정보로 이동합니다.
- Enterprise ID를 복사하여 안전한 위치에 저장합니다.
Google SecOps용 AWS S3 버킷 및 IAM 구성
- 이 사용자 가이드(버킷 만들기)에 따라 Amazon S3 버킷을 만듭니다.
- 나중에 참조할 수 있도록 버킷 이름과 리전을 저장합니다 (예:
box-collaboration-logs
). - 이 사용자 가이드(IAM 사용자 만들기)에 따라 사용자를 만듭니다.
- 생성된 사용자를 선택합니다.
- 보안 사용자 인증 정보 탭을 선택합니다.
- 액세스 키 섹션에서 액세스 키 만들기를 클릭합니다.
- 사용 사례로 서드 파티 서비스를 선택합니다.
- 다음을 클릭합니다.
- 선택사항: 설명 태그를 추가합니다.
- 액세스 키 만들기를 클릭합니다.
- CSV 파일 다운로드를 클릭하여 나중에 사용할 수 있도록 액세스 키와 비밀 액세스 키를 저장합니다.
- 완료를 클릭합니다.
- 권한 탭을 선택합니다.
- 권한 정책 섹션에서 권한 추가를 클릭합니다.
- 권한 추가를 선택합니다.
- 정책 직접 연결을 선택합니다.
- AmazonS3FullAccess 정책을 검색하여 선택합니다.
- 다음을 클릭합니다.
- 권한 추가를 클릭합니다.
S3 업로드용 IAM 정책 및 역할 구성
- AWS 콘솔에서 IAM > 정책 > 정책 만들기 > JSON 탭으로 이동합니다.
다음 정책을 입력합니다.
{ "Version": "2012-10-17", "Statement": [ { "Sid": "AllowPutBoxObjects", "Effect": "Allow", "Action": ["s3:PutObject"], "Resource": "arn:aws:s3:::box-collaboration-logs/*" }, { "Sid": "AllowGetStateObject", "Effect": "Allow", "Action": ["s3:GetObject"], "Resource": "arn:aws:s3:::box-collaboration-logs/box/collaboration/state.json" } ] }
- 다른 버킷 이름을 입력한 경우
box-collaboration-logs
을 해당 이름으로 바꿉니다.
- 다른 버킷 이름을 입력한 경우
다음 > 정책 만들기를 클릭합니다.
IAM > 역할 > 역할 생성 > AWS 서비스 > Lambda로 이동합니다.
새로 만든 정책을 연결합니다.
역할 이름을
WriteBoxToS3Role
로 지정하고 역할 만들기를 클릭합니다.
Lambda 함수 만들기
- AWS 콘솔에서 Lambda > 함수 > 함수 만들기로 이동합니다.
- 처음부터 작성을 클릭합니다.
다음 구성 세부정보를 제공합니다.
설정 값 이름 box_collaboration_to_s3
런타임 Python 3.13 아키텍처 x86_64 실행 역할 WriteBoxToS3Role
함수가 생성되면 코드 탭을 열고 스텁을 삭제한 후 다음 코드를 입력합니다 (
box_collaboration_to_s3.py
).#!/usr/bin/env python3 # Lambda: Pull Box Enterprise Events to S3 (no transform) import os, json, time, urllib.parse from urllib.request import Request, urlopen from urllib.error import HTTPError, URLError import boto3 TOKEN_URL = "https://api.box.com/oauth2/token" EVENTS_URL = "https://api.box.com/2.0/events" CID = os.environ["BOX_CLIENT_ID"] CSECRET = os.environ["BOX_CLIENT_SECRET"] ENT_ID = os.environ["BOX_ENTERPRISE_ID"] STREAM_TYPE = os.environ.get("STREAM_TYPE", "admin_logs_streaming") LIMIT = int(os.environ.get("LIMIT", "500")) BUCKET = os.environ["S3_BUCKET"] PREFIX = os.environ.get("S3_PREFIX", "box/collaboration/") STATE_KEY = os.environ.get("STATE_KEY", "box/collaboration/state.json") s3 = boto3.client("s3") def get_state(): try: obj = s3.get_object(Bucket=BUCKET, Key=STATE_KEY) data = json.loads(obj["Body"].read()) return data.get("stream_position") except Exception: return None def put_state(pos): body = json.dumps({"stream_position": pos}, separators=(",", ":")).encode("utf-8") s3.put_object(Bucket=BUCKET, Key=STATE_KEY, Body=body, ContentType="application/json") def get_token(): body = urllib.parse.urlencode({ "grant_type": "client_credentials", "client_id": CID, "client_secret": CSECRET, "box_subject_type": "enterprise", "box_subject_id": ENT_ID, }).encode() req = Request(TOKEN_URL, data=body, method="POST") req.add_header("Content-Type", "application/x-www-form-urlencoded") with urlopen(req, timeout=30) as r: tok = json.loads(r.read().decode()) return tok["access_token"] def fetch_events(token, stream_position=None, timeout=60, max_retries=5): params = {"stream_type": STREAM_TYPE, "limit": LIMIT, "stream_position": stream_position or "now"} qs = urllib.parse.urlencode(params) attempt, backoff = 0, 1.0 while True: try: req = Request(f"{EVENTS_URL}?{qs}", method="GET") req.add_header("Authorization", f"Bearer {token}") with urlopen(req, timeout=timeout) as r: return json.loads(r.read().decode()) except HTTPError as e: if e.code == 429 and attempt < max_retries: ra = e.headers.get("Retry-After") delay = int(ra) if (ra and ra.isdigit()) else int(backoff) time.sleep(max(1, delay)); attempt += 1; backoff *= 2; continue if 500 <= e.code <= 599 and attempt < max_retries: time.sleep(backoff); attempt += 1; backoff *= 2; continue raise except URLError: if attempt < max_retries: time.sleep(backoff); attempt += 1; backoff *= 2; continue raise def write_chunk(data): ts = time.strftime("%Y/%m/%d/%H%M%S", time.gmtime()) key = f"{PREFIX}/{ts}-box-events.json" s3.put_object(Bucket=BUCKET, Key=key, Body=json.dumps(data, separators=(",", ":")).encode("utf-8"), ContentType="application/json") return key def lambda_handler(event=None, context=None): token = get_token() pos = get_state() total, idx = 0, 0 while True: page = fetch_events(token, pos) entries = page.get("entries") or [] if not entries: next_pos = page.get("next_stream_position") or pos if next_pos and next_pos != pos: put_state(next_pos) break # уникальный ключ ts = time.strftime("%Y/%m/%d/%H%M%S", time.gmtime()) key = f"{PREFIX}/{ts}-box-events-{idx:03d}.json" s3.put_object(Bucket=BUCKET, Key=key, Body=json.dumps(page, separators=(",", ":")).encode("utf-8"), ContentType="application/json") idx += 1 total += len(entries) pos = page.get("next_stream_position") or pos if pos: put_state(pos) if len(entries) < LIMIT: break return {"ok": True, "written": total, "next_stream_position": pos}
구성 > 환경 변수 > 수정 > 새 환경 변수 추가로 이동합니다.
다음 환경 변수를 입력하고 값으로 바꿉니다.
키 예 S3_BUCKET
box-collaboration-logs
S3_PREFIX
box/collaboration/
STATE_KEY
box/collaboration/state.json
BOX_CLIENT_ID
Box 클라이언트 ID 입력 BOX_CLIENT_SECRET
Box 클라이언트 보안 비밀번호 입력 BOX_ENTERPRISE_ID
Box Enterprise ID 입력 STREAM_TYPE
admin_logs_streaming
LIMIT
500
함수가 생성된 후 해당 페이지에 머무르거나 Lambda > 함수 > your-function을 엽니다.
구성 탭을 선택합니다.
일반 구성 패널에서 수정을 클릭합니다.
시간 제한을 10분 (600초)으로 변경하고 저장을 클릭합니다.
Lambda 함수 예약 (EventBridge 스케줄러)
- Amazon EventBridge > 스케줄러 > 일정 만들기로 이동합니다.
- 다음 구성 세부정보를 제공합니다.
- 반복 일정: 요율 (
15 min
) - 타겟: Lambda 함수
- 이름:
box-collaboration-schedule-15min
.
- 반복 일정: 요율 (
- 일정 만들기를 클릭합니다.
Box 로그를 수집하도록 Google SecOps에서 피드 구성
- SIEM 설정> 피드로 이동합니다.
- 새 피드 추가를 클릭합니다.
- 피드 이름 필드에 피드 이름을 입력합니다 (예:
Box Collaboration
). - 소스 유형으로 Amazon S3 V2를 선택합니다.
- 로그 유형으로 Box를 선택합니다.
- 다음을 클릭합니다.
- 다음 입력 파라미터의 값을 지정합니다.
- S3 URI: 버킷 URI (형식은
s3://box-collaboration-logs/box/collaboration/
이어야 함).box-collaboration-logs
바꾸기: 버킷의 실제 이름을 사용합니다. - 소스 삭제 옵션: 환경설정에 따라 삭제 옵션을 선택합니다.
- 최대 파일 기간: 지난 일수 동안 수정된 파일을 포함합니다. 기본값은 180일입니다.
- 액세스 키 ID: S3 버킷에 액세스할 수 있는 사용자 액세스 키입니다.
- 보안 비밀 액세스 키: S3 버킷에 액세스할 수 있는 사용자 보안 비밀 키입니다.
- 애셋 네임스페이스: 애셋 네임스페이스입니다.
- 수집 라벨: 이 피드의 이벤트에 적용할 라벨입니다.
- S3 URI: 버킷 URI (형식은
- 다음을 클릭합니다.
- 확정 화면에서 새 피드 구성을 검토한 다음 제출을 클릭합니다.
UDM 매핑 테이블
로그 필드 | UDM 매핑 | 논리 |
---|---|---|
additional_details.ekm_id | additional.fields | additional_details.ekm_id에서 가져온 값 |
additional_details.service_id | additional.fields | additional_details.service_id에서 가져온 값 |
additional_details.service_name | additional.fields | additional_details.service_name에서 가져온 값 |
additional_details.shared_link_id | additional.fields | additional_details.shared_link_id에서 가져온 값 |
additional_details.size | target.file.size | additional_details.size에서 가져온 값 |
additional_details.version_id | additional.fields | additional_details.version_id에서 가져온 값 |
created_at | metadata.event_timestamp | created_at에서 가져온 값 |
created_by.id | principal.user.userid | created_by.id에서 가져온 값 |
created_by.login | principal.user.email_addresses | created_by.login에서 가져온 값 |
created_by.name | principal.user.user_display_name | created_by.name에서 가져온 값 |
event_id | metadata.product_log_id | event_id에서 가져온 값 |
event_type | metadata.product_event_type | event_type에서 가져온 값 |
ip_address | principal.ip | ip_address에서 가져온 값 |
source.item_id | target.file.product_object_id | source.item_id에서 가져온 값 |
source.item_name | target.file.full_path | source.item_name에서 가져온 값 |
source.item_type | 매핑되지 않음 | |
source.login | target.user.email_addresses | source.login에서 가져온 값 |
source.name | target.user.user_display_name | source.name에서 가져온 값 |
source.owned_by.id | target.user.userid | source.owned_by.id에서 가져온 값 |
source.owned_by.login | target.user.email_addresses | source.owned_by.login에서 가져온 값 |
source.owned_by.name | target.user.user_display_name | source.owned_by.name에서 가져온 값 |
source.parent.id | 매핑되지 않음 | |
source.parent.name | 매핑되지 않음 | |
source.parent.type | 매핑되지 않음 | |
source.type | 매핑되지 않음 | |
유형 | metadata.log_type | 유형에서 가져온 값 |
metadata.vendor_name | 하드코딩된 값 | |
metadata.product_name | 하드코딩된 값 | |
security_result.action | event_type에서 파생됩니다. event_type이 FAILED_LOGIN이면 BLOCK, event_type이 USER_LOGIN이면 ALLOW, 그 외에는 UNSPECIFIED입니다. | |
extensions.auth.type | event_type에서 파생됩니다. event_type이 USER_LOGIN 또는 ADMIN_LOGIN이면 MACHINE이고, 그렇지 않으면 UNSPECIFIED입니다. | |
extensions.auth.mechanism | event_type에서 파생됩니다. event_type이 USER_LOGIN 또는 ADMIN_LOGIN이면 USERNAME_PASSWORD이고, 그렇지 않으면 UNSPECIFIED입니다. |
도움이 더 필요하신가요? 커뮤니티 회원 및 Google SecOps 전문가로부터 답변을 받으세요.