Box 공동작업 JSON 로그 수집

다음에서 지원:

이 문서에서는 LambdaEventBridge 일정을 사용하여 AWS S3를 통해 Box Collaboration JSON 로그를 Google Security Operations에 수집하는 방법을 설명합니다. 파서는 JSON 형식의 Box 이벤트 로그를 처리하여 통합 데이터 모델 (UDM)에 매핑합니다. 구조화된 이벤트 데이터를 출력하기 전에 원시 로그에서 관련 필드를 추출하고, 이름 바꾸기 및 병합과 같은 데이터 변환을 실행하고, 중간 정보를 사용하여 데이터를 보강합니다.

시작하기 전에

  • Google SecOps 인스턴스
  • Box에 대한 권한 있는 액세스 (관리자 + 개발자 콘솔)
  • 로그를 저장할 리전과 동일한 리전의 AWS (S3, IAM, Lambda, EventBridge)에 대한 권한 있는 액세스

Box Developer Console 구성 (클라이언트 사용자 인증 정보)

  1. Box Developer Console에 로그인합니다.
  2. 서버 인증 (클라이언트 사용자 인증 정보 권한 부여)을 사용하여 맞춤 앱을 만듭니다.
  3. 애플리케이션 액세스앱 + 엔터프라이즈 액세스로 설정합니다.
  4. 애플리케이션 범위에서 엔터프라이즈 속성 관리를 사용 설정합니다.
  5. 관리 콘솔 >> 맞춤 앱 관리자에서 클라이언트 ID로 앱을 승인합니다.
  6. 클라이언트 ID와 * 클라이언트 보안 비밀번호를 복사하여 안전한 위치에 저장합니다.
  7. 관리 콘솔 > 계정 및 결제 > 계정 정보로 이동합니다.
  8. Enterprise ID를 복사하여 안전한 위치에 저장합니다.

Google SecOps용 AWS S3 버킷 및 IAM 구성

  1. 이 사용자 가이드(버킷 만들기)에 따라 Amazon S3 버킷을 만듭니다.
  2. 나중에 참조할 수 있도록 버킷 이름리전을 저장합니다 (예: box-collaboration-logs).
  3. 이 사용자 가이드(IAM 사용자 만들기)에 따라 사용자를 만듭니다.
  4. 생성된 사용자를 선택합니다.
  5. 보안 사용자 인증 정보 탭을 선택합니다.
  6. 액세스 키 섹션에서 액세스 키 만들기를 클릭합니다.
  7. 사용 사례서드 파티 서비스를 선택합니다.
  8. 다음을 클릭합니다.
  9. 선택사항: 설명 태그를 추가합니다.
  10. 액세스 키 만들기를 클릭합니다.
  11. CSV 파일 다운로드를 클릭하여 나중에 사용할 수 있도록 액세스 키비밀 액세스 키를 저장합니다.
  12. 완료를 클릭합니다.
  13. 권한 탭을 선택합니다.
  14. 권한 정책 섹션에서 권한 추가를 클릭합니다.
  15. 권한 추가를 선택합니다.
  16. 정책 직접 연결을 선택합니다.
  17. AmazonS3FullAccess 정책을 검색하여 선택합니다.
  18. 다음을 클릭합니다.
  19. 권한 추가를 클릭합니다.

S3 업로드용 IAM 정책 및 역할 구성

  1. AWS 콘솔에서 IAM > 정책 > 정책 만들기 > JSON 탭으로 이동합니다.
  2. 다음 정책을 입력합니다.

    {
      "Version": "2012-10-17",
      "Statement": [
        {
          "Sid": "AllowPutBoxObjects",
          "Effect": "Allow",
          "Action": ["s3:PutObject"],
          "Resource": "arn:aws:s3:::box-collaboration-logs/*"
        },
        {
          "Sid": "AllowGetStateObject",
          "Effect": "Allow",
          "Action": ["s3:GetObject"],
          "Resource": "arn:aws:s3:::box-collaboration-logs/box/collaboration/state.json"
        }
      ]
    }
    
    
    • 다른 버킷 이름을 입력한 경우 box-collaboration-logs을 해당 이름으로 바꿉니다.
  3. 다음 > 정책 만들기를 클릭합니다.

  4. IAM > 역할 > 역할 생성 > AWS 서비스 > Lambda로 이동합니다.

  5. 새로 만든 정책을 연결합니다.

  6. 역할 이름을 WriteBoxToS3Role로 지정하고 역할 만들기를 클릭합니다.

Lambda 함수 만들기

  1. AWS 콘솔에서 Lambda > 함수 > 함수 만들기로 이동합니다.
  2. 처음부터 작성을 클릭합니다.
  3. 다음 구성 세부정보를 제공합니다.

    설정
    이름 box_collaboration_to_s3
    런타임 Python 3.13
    아키텍처 x86_64
    실행 역할 WriteBoxToS3Role
  4. 함수가 생성되면 코드 탭을 열고 스텁을 삭제한 후 다음 코드를 입력합니다 (box_collaboration_to_s3.py).

    #!/usr/bin/env python3
    # Lambda: Pull Box Enterprise Events to S3 (no transform)
    
    import os, json, time, urllib.parse
    from urllib.request import Request, urlopen
    from urllib.error import HTTPError, URLError
    import boto3
    
    TOKEN_URL = "https://api.box.com/oauth2/token"
    EVENTS_URL = "https://api.box.com/2.0/events"
    
    CID         = os.environ["BOX_CLIENT_ID"]
    CSECRET     = os.environ["BOX_CLIENT_SECRET"]
    ENT_ID      = os.environ["BOX_ENTERPRISE_ID"]
    STREAM_TYPE = os.environ.get("STREAM_TYPE", "admin_logs_streaming")
    LIMIT       = int(os.environ.get("LIMIT", "500"))
    BUCKET      = os.environ["S3_BUCKET"]
    PREFIX      = os.environ.get("S3_PREFIX", "box/collaboration/")
    STATE_KEY   = os.environ.get("STATE_KEY", "box/collaboration/state.json")
    
    s3 = boto3.client("s3")
    
    def get_state():
        try:
            obj = s3.get_object(Bucket=BUCKET, Key=STATE_KEY)
            data = json.loads(obj["Body"].read())
            return data.get("stream_position")
        except Exception:
            return None
    
    def put_state(pos):
        body = json.dumps({"stream_position": pos}, separators=(",", ":")).encode("utf-8")
        s3.put_object(Bucket=BUCKET, Key=STATE_KEY, Body=body, ContentType="application/json")
    
    def get_token():
        body = urllib.parse.urlencode({
            "grant_type": "client_credentials",
            "client_id": CID,
            "client_secret": CSECRET,
            "box_subject_type": "enterprise",
            "box_subject_id": ENT_ID,
        }).encode()
        req = Request(TOKEN_URL, data=body, method="POST")
        req.add_header("Content-Type", "application/x-www-form-urlencoded")
        with urlopen(req, timeout=30) as r:
            tok = json.loads(r.read().decode())
        return tok["access_token"]
    
    def fetch_events(token, stream_position=None, timeout=60, max_retries=5):
        params = {"stream_type": STREAM_TYPE, "limit": LIMIT, "stream_position": stream_position or "now"}
        qs = urllib.parse.urlencode(params)
        attempt, backoff = 0, 1.0
        while True:
            try:
                req = Request(f"{EVENTS_URL}?{qs}", method="GET")
                req.add_header("Authorization", f"Bearer {token}")
                with urlopen(req, timeout=timeout) as r:
                    return json.loads(r.read().decode())
            except HTTPError as e:
                if e.code == 429 and attempt < max_retries:
                    ra = e.headers.get("Retry-After")
                    delay = int(ra) if (ra and ra.isdigit()) else int(backoff)
                    time.sleep(max(1, delay)); attempt += 1; backoff *= 2; continue
                if 500 <= e.code <= 599 and attempt < max_retries:
                    time.sleep(backoff); attempt += 1; backoff *= 2; continue
                raise
            except URLError:
                if attempt < max_retries:
                    time.sleep(backoff); attempt += 1; backoff *= 2; continue
                raise
    
    def write_chunk(data):
        ts = time.strftime("%Y/%m/%d/%H%M%S", time.gmtime())
        key = f"{PREFIX}/{ts}-box-events.json"  
        s3.put_object(Bucket=BUCKET, Key=key,
                      Body=json.dumps(data, separators=(",", ":")).encode("utf-8"),
                      ContentType="application/json")  
        return key
    
    def lambda_handler(event=None, context=None):
        token = get_token()
        pos = get_state()
        total, idx = 0, 0
        while True:
            page = fetch_events(token, pos)
            entries = page.get("entries") or []
            if not entries:
                next_pos = page.get("next_stream_position") or pos
                if next_pos and next_pos != pos:
                    put_state(next_pos)
                break
    
            # уникальный ключ
            ts = time.strftime("%Y/%m/%d/%H%M%S", time.gmtime())
            key = f"{PREFIX}/{ts}-box-events-{idx:03d}.json"
            s3.put_object(Bucket=BUCKET, Key=key,
                          Body=json.dumps(page, separators=(",", ":")).encode("utf-8"),
                          ContentType="application/json")
            idx += 1
            total += len(entries)
    
            pos = page.get("next_stream_position") or pos
            if pos:
                put_state(pos)
    
            if len(entries) < LIMIT:
                break
    
        return {"ok": True, "written": total, "next_stream_position": pos}
    
    
  5. 구성 > 환경 변수 > 수정 > 새 환경 변수 추가로 이동합니다.

  6. 다음 환경 변수를 입력하고 값으로 바꿉니다.

    S3_BUCKET box-collaboration-logs
    S3_PREFIX box/collaboration/
    STATE_KEY box/collaboration/state.json
    BOX_CLIENT_ID Box 클라이언트 ID 입력
    BOX_CLIENT_SECRET Box 클라이언트 보안 비밀번호 입력
    BOX_ENTERPRISE_ID Box Enterprise ID 입력
    STREAM_TYPE admin_logs_streaming
    LIMIT 500
  7. 함수가 생성된 후 해당 페이지에 머무르거나 Lambda > 함수 > your-function을 엽니다.

  8. 구성 탭을 선택합니다.

  9. 일반 구성 패널에서 수정을 클릭합니다.

  10. 시간 제한10분 (600초)으로 변경하고 저장을 클릭합니다.

Lambda 함수 예약 (EventBridge 스케줄러)

  1. Amazon EventBridge > 스케줄러 > 일정 만들기로 이동합니다.
  2. 다음 구성 세부정보를 제공합니다.
    • 반복 일정: 요율 (15 min)
    • 타겟: Lambda 함수
    • 이름: box-collaboration-schedule-15min.
  3. 일정 만들기를 클릭합니다.

Box 로그를 수집하도록 Google SecOps에서 피드 구성

  1. SIEM 설정> 피드로 이동합니다.
  2. 새 피드 추가를 클릭합니다.
  3. 피드 이름 필드에 피드 이름을 입력합니다 (예: Box Collaboration).
  4. 소스 유형으로 Amazon S3 V2를 선택합니다.
  5. 로그 유형으로 Box를 선택합니다.
  6. 다음을 클릭합니다.
  7. 다음 입력 파라미터의 값을 지정합니다.
    • S3 URI: 버킷 URI (형식은 s3://box-collaboration-logs/box/collaboration/이어야 함). box-collaboration-logs 바꾸기: 버킷의 실제 이름을 사용합니다.
    • 소스 삭제 옵션: 환경설정에 따라 삭제 옵션을 선택합니다.
    • 최대 파일 기간: 지난 일수 동안 수정된 파일을 포함합니다. 기본값은 180일입니다.
    • 액세스 키 ID: S3 버킷에 액세스할 수 있는 사용자 액세스 키입니다.
    • 보안 비밀 액세스 키: S3 버킷에 액세스할 수 있는 사용자 보안 비밀 키입니다.
    • 애셋 네임스페이스: 애셋 네임스페이스입니다.
    • 수집 라벨: 이 피드의 이벤트에 적용할 라벨입니다.
  8. 다음을 클릭합니다.
  9. 확정 화면에서 새 피드 구성을 검토한 다음 제출을 클릭합니다.

UDM 매핑 테이블

로그 필드 UDM 매핑 논리
additional_details.ekm_id additional.fields additional_details.ekm_id에서 가져온 값
additional_details.service_id additional.fields additional_details.service_id에서 가져온 값
additional_details.service_name additional.fields additional_details.service_name에서 가져온 값
additional_details.shared_link_id additional.fields additional_details.shared_link_id에서 가져온 값
additional_details.size target.file.size additional_details.size에서 가져온 값
additional_details.version_id additional.fields additional_details.version_id에서 가져온 값
created_at metadata.event_timestamp created_at에서 가져온 값
created_by.id principal.user.userid created_by.id에서 가져온 값
created_by.login principal.user.email_addresses created_by.login에서 가져온 값
created_by.name principal.user.user_display_name created_by.name에서 가져온 값
event_id metadata.product_log_id event_id에서 가져온 값
event_type metadata.product_event_type event_type에서 가져온 값
ip_address principal.ip ip_address에서 가져온 값
source.item_id target.file.product_object_id source.item_id에서 가져온 값
source.item_name target.file.full_path source.item_name에서 가져온 값
source.item_type 매핑되지 않음
source.login target.user.email_addresses source.login에서 가져온 값
source.name target.user.user_display_name source.name에서 가져온 값
source.owned_by.id target.user.userid source.owned_by.id에서 가져온 값
source.owned_by.login target.user.email_addresses source.owned_by.login에서 가져온 값
source.owned_by.name target.user.user_display_name source.owned_by.name에서 가져온 값
source.parent.id 매핑되지 않음
source.parent.name 매핑되지 않음
source.parent.type 매핑되지 않음
source.type 매핑되지 않음
유형 metadata.log_type 유형에서 가져온 값
metadata.vendor_name 하드코딩된 값
metadata.product_name 하드코딩된 값
security_result.action event_type에서 파생됩니다. event_type이 FAILED_LOGIN이면 BLOCK, event_type이 USER_LOGIN이면 ALLOW, 그 외에는 UNSPECIFIED입니다.
extensions.auth.type event_type에서 파생됩니다. event_type이 USER_LOGIN 또는 ADMIN_LOGIN이면 MACHINE이고, 그렇지 않으면 UNSPECIFIED입니다.
extensions.auth.mechanism event_type에서 파생됩니다. event_type이 USER_LOGIN 또는 ADMIN_LOGIN이면 USERNAME_PASSWORD이고, 그렇지 않으면 UNSPECIFIED입니다.

도움이 더 필요하신가요? 커뮤니티 회원 및 Google SecOps 전문가로부터 답변을 받으세요.