Google Cloud는 엔터프라이즈급 확장, 보안, 관측 가능성을 갖춘 생성형 AI 애플리케이션을 빌드하기 위한 다양한 제품과 도구를 제공합니다.

이 페이지를 사용하여 생성형 AI 애플리케이션 개발 단계를 알아보고, 사용 사례에 가장 적합한 제품과 도구를 선택하고, 시작하는 데 필요한 문서에 액세스하세요.

생성형 AI 개발의 기본사항 알아보기

생성형 AI 애플리케이션을 개발하는 방법을 알아봅니다.
일반적인 생성형 AI 사용 사례와 모델 유형에 대해 알아봅니다.
생성형 AI, 기존 AI 또는 이 두 가지의 조합이 비즈니스 사용 사례에 적합한지 확인합니다.
생성형 AI 애플리케이션을 개발하는 각 단계에서 발생하는 과제를 해결하는 방법을 알아봅니다.

생성형 AI 애플리케이션의 인프라 선택

생성형 AI 애플리케이션 빌드에 가장 적합한 제품, 프레임워크, 도구를 알아보세요. 클라우드 호스팅 생성형 AI 애플리케이션의 일반적인 구성요소는 다음과 같습니다.

  1. 애플리케이션 호스팅: 애플리케이션을 호스팅하기 위한 컴퓨팅입니다. 애플리케이션은 Google Cloud의 클라이언트 라이브러리 및 SDK를 사용하여 다양한 Cloud 제품과 통신할 수 있습니다.
  2. 모델 호스팅: 생성 모델을 위한 확장 가능하고 안전한 호스팅입니다.
  3. 모델: 텍스트, 채팅, 이미지, 코드, 임베딩, 멀티모달을 위한 생성 모델입니다.
  4. 그라운딩 솔루션: 검증 가능하고 업데이트된 정보 소스로 모델 출력을 고정합니다.
  5. 데이터베이스: 애플리케이션의 데이터를 저장합니다. SQL 쿼리를 통해 프롬프트를 보강하거나 pgvector와 같은 확장 프로그램을 사용하여 데이터를 벡터 임베딩으로 저장하여 기존 데이터베이스를 그라운딩 솔루션으로 재사용할 수도 있습니다.
  6. 스토리지: 이미지, 동영상, 정적 웹 프런트엔드 등의 파일을 저장합니다. 원시 그라운딩 데이터(예: PDF)는 나중에 임베딩으로 변환하여 벡터 데이터베이스에 저장할 수 있습니다.

모델 및 모델 호스팅 인프라, 그라운딩 솔루션, 데이터베이스, 스토리지, 애플리케이션 호스팅을 포함한 생성형 AI 애플리케이션 호스팅 인프라의 대략적인 개요를 보여주는 다이어그램

아래 섹션에서는 사용할 Google Cloud 제품을 선택하는 데 도움이 되는 각 구성요소를 살펴봅니다.

애플리케이션 호스팅 인프라

애플리케이션 워크로드를 호스팅하고 서빙할 제품을 선택하여 생성 모델을 호출합니다.
사용자에게 애플리케이션 호스팅에 적합한 서비스를 선택하는 과정을 안내하는 결정 트리

시작하기:

모델 호스팅 인프라

Google Cloud는 대표적인 Vertex AI 플랫폼부터 Google Kubernetes Engine의 맞춤설정 가능하고 이식 가능한 호스팅에 이르기까지 생성 모델을 호스팅하는 여러 방법을 제공합니다.

사용자가 우선순위 및 요구사항에 따라 클라우드 서비스를 호스팅하는 적합한 모델을 선택할 수 있도록 안내하는 결정 트리입니다.

시작하기:

모델

Google Cloud는 Gemini를 포함하여 Vertex AI를 통해 최신 기반 모델 집합을 제공합니다. 또한 타사 모델을 Vertex AI Model Garden, GKE의 자체 호스팅, Cloud Run 또는 Compute Engine에 배포할 수 있습니다.

사용자가 텍스트 임베딩, 이미지, 동영상 사용 옵션을 포함하여 Vertex AI 서비스를 선택하고 텍스트 또는 코드를 생성하도록 안내하는 결정 트리

시작하기:

그라운딩

정보에 입각하고 정확한 모델 응답을 보장하기 위해서 생성형 AI 애플리케이션을 실시간 데이터그라운딩할 수 있습니다. 이를 검색 증강 생성(RAG)이라고 합니다.

유사성 검색과 같은 작업에 최적화된 형식인 벡터 데이터베이스에서 자체 데이터로 그라운딩을 구현할 수 있습니다. Google Cloud는 다양한 사용 사례에 대해 여러 가지 벡터 데이터베이스 솔루션을 제공합니다.

참고: Cloud SQL 또는 Firestore와 같은 기존 데이터베이스를 쿼리하고 모델 프롬프트에서 결과를 사용하여 기존(벡터 이외) 데이터베이스를 그라운딩할 수도 있습니다.

사용자에게 요구사항에 맞는 벡터 데이터베이스 솔루션을 선택하는 방법을 안내하는 결정 트리입니다.

시작하기:

API로 그라운딩

그라운딩에 자체 데이터를 단독으로 사용하거나 추가로 사용하는 대신, 그라운딩 데이터를 검색하여 모델 프롬프트를 보강하는 데 사용할 수 있는 API를 제공하는 온라인 서비스가 많습니다.
대규모 언어 모델을 외부 시스템의 API에 연결하는 확장 프로그램을 생성, 배포, 관리합니다.
YouTube에서 Google 학술검색에 이르기까지 생성형 AI 앱을 위한 다양한 문서 로더API 통합을 살펴보세요.
Vertex AI에서 호스팅되는 모델을 사용하는 경우 Vertex AI Search, Google 검색 또는 인라인/인파일 텍스트를 사용하여 모델 응답을 그라운딩할 수 있습니다.

빌드 시작

개발 환경 설정

Google Cloud에서 생성형 AI 애플리케이션을 빌드하는 데 필요한 도구를 설치합니다.
로컬 개발 환경을 설정하고 Cloud API와 상호작용하는 명령줄 도구입니다.
IDE에서 API 참고 리소스 및 샘플을 보고 GKE 및 Cloud Run 로컬 개발 속도를 높이세요.
로컬 환경 및 호스팅된 워크로드에서 Google Cloud API에 인증하는 방법을 알아봅니다.
LangChain은 프롬프트에 컨텍스트를 빌드하고 모델의 응답에 반응할 수 있는 생성형 AI 앱용 오픈소스 프레임워크입니다.

프롬프트 설계 및 모델 평가

프롬프팅 전략을 알아보고 다양한 모델을 실험해 봅니다.
텍스트 및 코드부터 멀티모달까지 다양한 데이터 유형에 대한 프롬프트를 설계하는 전략을 알아봅니다.
Vertex AI Studio에서 프롬프트를 설계, 테스트, 관리하는 방법을 알아봅니다.
분류, 아이디어 구상, 요약 등의 사용 사례를 포괄하는 수십 가지 프롬프트 예시를 확인합니다.
새로운 아이디어를 창출하고 발전시키고 소통하는 프롬프트 예시를 살펴봅니다.
Vertex AI를 사용하여 측정항목 기반 평가 또는 대조 평가를 수행할 수 있습니다.

코드 샘플

GitHub에서 샘플을 포크하고 빌드를 시작합니다.

Vertex AI Agent Builder 및 Firebase를 사용하여 웹 기반 질의 응답 챗봇을 빌드하는 방법을 알아봅니다.

초급 Node.js

Vertex AI에서 선행 학습된 기반 모델을 호출하는 간단한 Python Flask 애플리케이션을 빌드하는 방법을 알아봅니다.

초급 Python

Vertex AI, Cloud Run, Streamlit에서 Gemini를 사용하여 마케팅 캠페인 아이디어를 생성하는 웹 앱을 빌드합니다.

초급 Python

Vertex AI Search 및 LangChain을 사용하여 모델 프롬프트를 검증 가능한 지식 소스로 그라운딩하는 방법을 알아봅니다(Google Cloud 백서).

중급 Python

LLM을 사용하여 외부 API로 보낼 수 있는 요청 본문을 채우는 프로세스인 함수 호출을 구현하는 방법을 알아봅니다.

중급 Python

PostgreSQL용 AlloyDB 및 Vertex AI를 사용한 검색 증강 생성을 위한 샘플 앱입니다. (블로그 게시물, Codelab)

중급 Python

아키텍처 안내 및 점프 스타트 솔루션

보안성, 효율성, 복원력, 성능, 비용 효율성이 뛰어난 생성형 AI 애플리케이션에 대한 추천 및 예시입니다.

이 참조 아키텍처를 사용해 Vertex AI 및 PostgreSQL용 AlloyDB를 사용한 검색 증강 생성 (RAG)으로 생성형 AI 애플리케이션을 실행하기 위한 인프라를 설계합니다.

중급

이 참조 아키텍처를 사용하여 GKE, Cloud SQL, 오픈소스 도구(예: Ray, Hugging Face, LangChain)를 사용하여 검색 증강 생성(RAG)으로 생성형 AI 애플리케이션을 실행하는 인프라를 설계합니다.

중급

이 문서에서는 주요 AI 및 ML 워크로드에 Google Cloud에서 제공하는 다양한 스토리지 옵션을 사용하고 통합하는 방법에 대한 설계 안내를 제공합니다.

고급

클릭 한 번으로 긴 문서를 요약하는 샘플 애플리케이션을 Vertex AI로 배포합니다.

중급

Cloud SQL에 저장된 벡터 임베딩을 사용하는 원클릭 샘플 애플리케이션을 배포하여 채팅 애플리케이션의 응답 정확성을 높입니다.

중급

문서가 업로드될 때 애플리케이션을 트리거하는 파이프라인과 함께 문서 모음에서 질문 및 답변 쌍을 추출하는 원클릭 샘플 애플리케이션을 배포합니다.

중급