이 페이지에서는 예측 출력을 생성하는 데 필요한 데이터 세트를 준비하는 방법을 설명합니다.
시작하기 전에
시작하기 전에 다음이 필요합니다.
- 모델
- 예측에 사용하는 데이터 세트에 표시되는 모든 당사자를 등록하기 위해서입니다.
예측용 데이터 세트 만들기
기존 데이터 세트(예: 백테스트에 사용한 데이터 세트)를 사용하여 예측을 만들 수 있습니다. 하지만 프로덕션 환경에서는 예측 실행 각각에 대해 새 데이터 세트를 만드는 것이 좋습니다.
- 고객은 데이터 세트에서 모델로 이어지는 모든 계보를 추적해야 합니다. 데이터가 변경되지 않도록 하려면 데이터 검증을 통과한 후 BigQuery 테이블의 BigQuery 테이블 스냅샷을 만들고 AML AI 데이터 세트에서 스냅샷을 참조하는 것이 좋습니다. 정기적으로 업데이트되는 테이블을 참조하는 경우 AML AI 작업이 AML AI 데이터 세트를 사용할 때마다 BigQuery 테이블을 읽으므로 기본 BigQuery 테이블 변경사항이 튜닝, 학습, 백테스트, 예측에 영향을 줄 수 있습니다.
- AML AI용 데이터 준비의 안내에 따라 BigQuery 테이블을 준비한 다음 1단계에서 스냅샷을 만든 테이블을 사용하여 예측용으로 별도의 AML AI 데이터 세트를 만듭니다. BigQuery 데이터 세트와 테이블을 만들려면 BigQuery 데이터 세트 및 테이블 준비의 명령어를 사용하면 됩니다.
출력 대상 준비
예측 결과 리소스를 만들 때 AML AI는 BigQuery에 예측 출력(위험 점수 및 설명 기능)을 생성합니다.
예측 결과를 만들려면 먼저 이러한 출력에 대한 BigQuery 데이터 세트를 만들어야 합니다. 올바른 권한이 부여되어 있고 API가 사용 설정된 동일한 프로젝트와 AML AI 인스턴스와 동일한 위치에 데이터 세트가 있다면 모든 BigQuery 데이터 세트를 예측 출력에 사용할 수 있습니다.
위험도 점수 생성 및 설명 기능
이제 예측용 데이터 세트, 학습된 모델 리소스, 출력용 BigQuery 데이터 세트가 준비되었으므로 예측 결과를 만들 수 있습니다. 이렇게 하려면 예측 결과 만들기 및 관리를 참조하세요.