Google Cloud에서 생성형 AI 애플리케이션 빌드
Google Cloud는 엔터프라이즈급 확장, 보안, 관측 가능성을 갖춘 생성형 AI 애플리케이션을 빌드하기 위한 다양한 제품과 도구를 제공합니다.
이 페이지를 사용하여 생성형 AI 애플리케이션 개발 단계를 알아보고, 사용 사례에 가장 적합한 제품과 도구를 선택하고, 시작하는 데 필요한 문서에 액세스하세요.
생성형 AI 개발의 기본사항 알아보기
생성형 AI 또는 기존 AI를 사용해야 하는 경우
생성형 AI 애플리케이션 개발의 개요
생성형 AI 애플리케이션의 인프라 선택
생성형 AI 애플리케이션 빌드에 가장 적합한 제품, 프레임워크, 도구를 알아보세요. 클라우드 호스팅 생성형 AI 애플리케이션의 일반적인 구성요소는 다음과 같습니다.
- 애플리케이션 호스팅: 애플리케이션을 호스팅하기 위한 컴퓨팅입니다. 애플리케이션은 Google Cloud의 클라이언트 라이브러리 및 SDK를 사용하여 다양한 Cloud 제품과 통신할 수 있습니다.
- 모델 호스팅: 생성 모델을 위한 확장 가능하고 안전한 호스팅입니다.
- 모델: 텍스트, 채팅, 이미지, 코드, 임베딩, 멀티모달을 위한 생성 모델입니다.
- 그라운딩 솔루션: 검증 가능하고 업데이트된 정보 소스로 모델 출력을 고정합니다.
- 데이터베이스: 애플리케이션의 데이터를 저장합니다. SQL 쿼리를 통해 프롬프트를 보강하거나 pgvector와 같은 확장 프로그램을 사용하여 데이터를 벡터 임베딩으로 저장하여 기존 데이터베이스를 그라운딩 솔루션으로 재사용할 수도 있습니다.
- 스토리지: 이미지, 동영상, 정적 웹 프런트엔드 등의 파일을 저장합니다. 원시 그라운딩 데이터(예: PDF)는 나중에 임베딩으로 변환하여 벡터 데이터베이스에 저장할 수 있습니다.
아래 섹션에서는 사용할 Google Cloud 제품을 선택하는 데 도움이 되는 각 구성요소를 살펴봅니다.
애플리케이션 호스팅 인프라
시작하기:
모델 호스팅 인프라
시작하기:
모델
시작하기:
- Gemini
- Codey
- Imagen
- text-embedding
- Vertex AI Model Garden(오픈소스 모델)
- HuggingFace Model Hub(오픈소스 모델)
그라운딩
정보에 입각하고 정확한 모델 응답을 보장하기 위해서 생성형 AI 애플리케이션을 실시간 데이터로 그라운딩할 수 있습니다. 이를 검색 증강 생성(RAG)이라고 합니다.
유사성 검색과 같은 작업에 최적화된 형식인 벡터 데이터베이스에서 자체 데이터로 그라운딩을 구현할 수 있습니다. Google Cloud는 다양한 사용 사례에 대해 여러 가지 벡터 데이터베이스 솔루션을 제공합니다.
참고: Cloud SQL 또는 Firestore와 같은 기존 데이터베이스를 쿼리하고 모델 프롬프트에서 결과를 사용하여 기존(벡터 이외) 데이터베이스를 그라운딩할 수도 있습니다.
시작하기:
- Vertex AI Agent Builder(이전 명칭: 엔터프라이즈 검색, 생성형 AI 앱 빌더, 검색 엔진)
- 벡터 검색(이전 명칭: Matching Engine)
- PostgreSQL용 AlloyDB
- Cloud SQL
- BigQuery
API로 그라운딩
Vertex AI 확장 프로그램(비공개 미리보기)
Vertex AI에서 그라운딩
빌드 시작
개발 환경 설정
Google Cloud CLI 설치
IDE에 Cloud Code 확장 프로그램 설치
인증 설정
LangChain 설정
프롬프트 설계 및 모델 평가
프롬프트 설계 소개
Vertex AI Studio
생성형 AI 프롬프트 샘플
Vertex AI의 생성형 모델을 사용한 아이디어 구상
Vertex AI에서 모델 평가
코드 샘플
웹 챗봇: Google 스토어 관련 질문에 답하기
Vertex AI Agent Builder 및 Firebase를 사용하여 웹 기반 질의 응답 챗봇을 빌드하는 방법을 알아봅니다.
Eventarc 및 Vertex AI를 사용한 채팅 앱
Vertex AI에서 선행 학습된 기반 모델을 호출하는 간단한 Python Flask 애플리케이션을 빌드하는 방법을 알아봅니다.
Gemini로 마케팅 캠페인 생성
Vertex AI, Cloud Run, Streamlit에서 Gemini를 사용하여 마케팅 캠페인 아이디어를 생성하는 웹 앱을 빌드합니다.
'MLOps 실무자 가이드'가 포함된 질의 응답 앱
Vertex AI Search 및 LangChain을 사용하여 모델 프롬프트를 검증 가능한 지식 소스로 그라운딩하는 방법을 알아봅니다(Google Cloud 백서).
Weather API 요청 도우미: Gemini를 사용한 함수 호출
LLM을 사용하여 외부 API로 보낼 수 있는 요청 본문을 채우는 프로세스인 함수 호출을 구현하는 방법을 알아봅니다.
아키텍처 안내 및 점프 스타트 솔루션
Vertex AI를 사용하는 RAG 지원 생성형 AI 애플리케이션을 위한 인프라
이 참조 아키텍처를 사용해 Vertex AI 및 PostgreSQL용 AlloyDB를 사용한 검색 증강 생성 (RAG)으로 생성형 AI 애플리케이션을 실행하기 위한 인프라를 설계합니다.
GKE를 사용하는 RAG 지원 생성형 AI 애플리케이션을 위한 인프라
이 참조 아키텍처를 사용하여 GKE, Cloud SQL, 오픈소스 도구(예: Ray, Hugging Face, LangChain)를 사용하여 검색 증강 생성(RAG)으로 생성형 AI 애플리케이션을 실행하는 인프라를 설계합니다.
Google Cloud의 AI 및 ML 워크로드를 위한 스토리지 설계
이 문서에서는 주요 AI 및 ML 워크로드에 Google Cloud에서 제공하는 다양한 스토리지 옵션을 사용하고 통합하는 방법에 대한 설계 안내를 제공합니다.
점프 스타트 솔루션: 문서 요약
클릭 한 번으로 긴 문서를 요약하는 샘플 애플리케이션을 Vertex AI로 배포합니다.
점프 스타트 솔루션: Cloud SQL을 사용한 생성형 AI RAG
Cloud SQL에 저장된 벡터 임베딩을 사용하는 원클릭 샘플 애플리케이션을 배포하여 채팅 애플리케이션의 응답 정확성을 높입니다.
점프 스타트 솔루션: 생성형 AI 기술 자료
문서가 업로드될 때 애플리케이션을 트리거하는 파이프라인과 함께 문서 모음에서 질문 및 답변 쌍을 추출하는 원클릭 샘플 애플리케이션을 배포합니다.