콘텐츠로 이동하기
AI 및 머신러닝

DataFrame 만들기, 데이터 생성하기, 클러스터링을 Duet AI로 더 수월하게

2024년 1월 18일
Debi Cabrera

Developer Relations Engineer

Jeff Nelson

Developer Relations Engineer

Try Gemini 1.5 Pro

Google's most advanced multimodal model in Vertex AI

Try it

*본 아티클의 원문은 2023년 12월 21일 Google Cloud 블로그(영문)에 게재되었습니다.

이 블로그 게시물에서 다루는 프로세스를 자세하게 설명한 동영상을 여기에서 시청하고 학습 과정에서 직접 실습할 수 있습니다

바다에서 길을 잃다

방대한 데이터의 바다에서 허우적대며 복잡한 파이프라인을 힘겹게 탐색하느라 데이터 현기증을 느낀 경험이 있으실 것입니다. 다양한 도구와 Google 검색 결과로 가득한 수많은 탭을 관리해야 하고, 니즈에 맞는 모델을 만들기 위해 데이터와 코드를 샅샅이 뒤지는 데 많은 시간을 소비해야 한다면 데이터 탐색에 쉽게 흥미를 잃을 수밖에 없습니다.

과연 이런 시간을 줄이고 약간의 재미까지 선사할 수 있는 방법이 있을까요? Duet AI라면 가능합니다. Duet AI는 익숙하지 않은 Google Cloud 기능까지 자세하게 알려 주는 개인 맞춤형 데이터 사이언스 가이드와 같습니다.

Duet AI는 사용자의 고충을 이해합니다. 기술적인 문제로 골머리를 앓는 대신 데이터에서 값진 지식을 추출하는 데 시간을 할애하도록 도와줍니다. 이를 위해 설계된 것이 바로 Duet AI입니다.

새로운 지평

잠재력이 넘치는 새로운 데이터 세트가 제시되고 어떤 미션이 주어졌다고 상상해 보세요. 미션을 수락하면 마케팅 팀에 5개의 잠재고객 그룹과 이들 그룹에 대한 기술 인사이트를 제공해야 합니다.

도구와 씨름하며 조사하는 데 몇 시간씩 허비하는 대신 Duet AI에 도움을 요청하면 됩니다. 미션을 수락하세요.

먼저 BigQuery Studio를 열고, 새로운 Python 노트북을 생성한 후(BigQuery Studio 내부 기능) 코드를 붙여넣어 변수를 정의하고, Vertex AI에 연결하여 기본 테이블을 만듭니다.

https://storage.googleapis.com/gweb-cloudblog-publish/images/Image_1_-_Python_Notebook.max-1700x1700.png

이제 Duet AI를 사용하여 개발 주기를 단축합니다. Duet AI에 프롬프트를 입력해 기본 테이블을 BigQuery DataFrame으로 변환하는 데 필요한 도움을 요청하면 상위 10개 기록을 확인할 수 있습니다.

진행과정의 차트화

Duet AI는 코드도 생성해 줍니다. 사용자는 출력을 검토하고 필요에 따라 편집하기만 하면 됩니다. 몇 분 만에 DataFrame 결과물이 노트북에 테이블로 표시됩니다.

https://storage.googleapis.com/gweb-cloudblog-publish/images/maxresdefault_EvbWiTi.max-1300x1300.jpg

Duet AI의 코드 생성 기능은 더 깊이 파고들수록 귀중한 자산이 됩니다. K-평균 클러스터링 모델을 원활하게 생성하여 고객을 5개의 구분된 그룹으로 세분화합니다. Duet AI는 이러한 클러스터를 산점도 그래프로 시각화하는 코드를 작성해 주므로 데이터 관련 인사이트를 보다 심층적으로 파악하기에 유용합니다.

클러스터를 요약하는 코드를 추가하면 기술 인사이트를 얻을 수 있습니다. 예를 들어 각 클러스터의 평균 구매 가치와 주문 수 같은 전자상거래 데이터를 요약할 수 있습니다. 이는 마케팅 팀의 본래 요청을 충족하는 데이터입니다.

하지만 아직 끝이 아닙니다. 여기서 더 나아가 마케팅 팀이 각 고객 그룹에 대해 취할 수 있는 향후 조치를 제안할 수 있습니다.

다행히 BigQuery Studio에서 직접 text-bison과 같은 Vertex AI의 대규모 언어 모델(LLM)을 쉽게 참조할 수 있습니다. LLM을 사용하면 마케팅 팀이 취할 향후 조치를 빠르게 생성해 줍니다.

필요한 LLM을 준비하기 위해 요약 데이터를 문자열로 변환합니다. 또한 프롬프트를 정의하면 LLM이 컨텍스트를 확보하여 맞춤형 대답을 생성해 줍니다.

로드 중...

프롬프트 정의

마지막으로, 정의한 프롬프트 변수를 사용하여 마케팅 캠페인을 생성하도록 BigQuery Studio 노트북에서 Duet AI에 프롬프트를 입력합니다.

Use the Vertex AI language_models API to call the PaLM2 text-bison model and generate a marketing campaign using the variable prompt. Use the following model settings: max_output_tokens=1024, temperature=0.4

모델이 반환하는 코드가 양호해 보이므로 이를 실행하면 됩니다.

로드 중...

완료했습니다. LLM은 제목, 대상, 향후 마케팅 단계가 포함된 5개의 클러스터를 마케팅 팀에서 쉽게 실행할 수 있는 형식으로 반환합니다. 프롬프트를 자유롭게 수정하여 창의력을 발휘해 보세요. 전자상거래 사이트에서 식물을 판매한다는 프롬프트를 추가할 수도 있습니다.

https://storage.googleapis.com/gweb-cloudblog-publish/images/Image_2_-_Model_Cluster_Output.max-1100x1100.png

잘하셨습니다. Duet AI의 도움으로 하루 종일 걸리던 업무를 단 몇 분 안에 완료할 수 있었습니다.

여정을 시작하세요

이 블로그를 읽는 데 그치지 않고 Duet AI를 직접 사용해 볼 준비가 되셨나요? 이 포괄적인 학습 과정을 살펴보고 이 동영상을 참고하여 Duet AI를 직접 경험해 보세요. 필요한 모든 정보가 명확하고 간결하게 효율적인 방식으로 정리되어 있습니다.

Duet AI를 데이터 사이언스 파트너로 활용하여 데이터 탐색의 미래를 여는 새로운 탐색 여정을 시작해 보세요.

게시 위치