데이터 과학 솔루션

AI 워크플로를 위한 데이터, 분석, ML 통합 플랫폼

복잡성을 통합 데이터 및 AI 플랫폼으로 이전하여 데이터팀의 부담을 덜어주세요. Google Cloud의 포괄적인 관리형 서비스 제품군과 통합 워크플로를 사용하면 데이터 과학 솔루션을 쉽게 빌드, 관리, 확장할 수 있습니다.

개요

데이터 과학 솔루션은 무엇인가요?

데이터 과학 솔루션은 머신러닝, AI, 통계 모델링을 활용하여 복잡한 비즈니스 과제를 해결하고 운영 효율성을 높이는 포괄적인 기술 중심 접근 방식입니다. 이를 통해 기본 데이터 분석에서 전체 수명 주기 엔터프라이즈 실행으로 초점을 전환하여 데이터 엔지니어링, 예측 모델링, MLOps의 핵심 프로세스를 강조하여 원시 데이터를 자동화된 전략적 이점으로 전환할 수 있습니다.

데이터 과학에 Google Cloud를 사용해야 하는 이유

비즈니스의 속도와 민첩성을 개선하고 장단기적인 가치를 실현할 수 있습니다. 기존 접근 방식에서는 5~7개의 개별 도구를 함께 묶어야 하는 경우가 많지만, Google Cloud의 데이터 과학 플랫폼은 데이터 수집부터 모델 배포에 이르는 전체 수명 주기를 단일 멀티모달 데이터 기반에서 다루어 통합 거버넌스를 보장합니다.

모든 비즈니스 과제를 위한 데이터 과학 솔루션

수익 증대, 비용 절감, 위험 관리 등 목표가 무엇이든 Google Cloud는 데이터 모델을 산업화하고 고립된 실험에서 실제 MLOps 파이프라인으로 초점을 전환하는 데 필요한 도구를 제공합니다.

작동 방식

  • 맞춤설정 및 의사 결정 가속화: 실시간 AI/ML로 고객 경험 향상
  • 풀 스택 엔터프라이즈 통합: 강력한 전체 수명 주기 실행으로 프로덕션 환경에 오픈소스 AI 배포
  • 확장 가능한 데이터 처리: 하나의 통합된 데이터 사본에서 BigQuery SQL 및 Spark와 같은 여러 엔진 활용

데이터 과학을 위한 실용적인 가이드
이 가이드는 Google Cloud에서 데이터 과학 워크플로를 시작하는 데 도움이 됩니다.
일반적인 용도

엔드 투 엔드 데이터 과학 워크플로를 위한 통합 플랫폼

통합 거버넌스를 보장하는 멀티모달 데이터 기반을 토대로 빌드된 전체 데이터 과학 및 머신러닝 수명 주기를 위한 통합 솔루션입니다.

BigQuery SQL 및 Apache Spark와 같은 강력한 분석 엔진을 활용한 다음 BigQuery ML 또는 Gemini Enterprise Agent Platform을 사용하여 모델을 빌드합니다. 업계 최고의 AI로 구동되는 강력한 MLOps와 함께 AI 우선 Colab Enterprise 노트북으로 개발을 간소화하세요.

데이터 과학을 위한 통합 도구
    통합 거버넌스를 보장하는 멀티모달 데이터 기반을 토대로 빌드된 전체 데이터 과학 및 머신러닝 수명 주기를 위한 통합 솔루션입니다.

    BigQuery SQL 및 Apache Spark와 같은 강력한 분석 엔진을 활용한 다음 BigQuery ML 또는 Gemini Enterprise Agent Platform을 사용하여 모델을 빌드합니다. 업계 최고의 AI로 구동되는 강력한 MLOps와 함께 AI 우선 Colab Enterprise 노트북으로 개발을 간소화하세요.

    데이터 과학을 위한 통합 도구

      AI 중심 노트북을 갖춘 중앙 집중식 작업공간

      엔터프라이즈 데이터 과학을 위한 다양한 노트북 솔루션 중에서 선택하세요.

      Colab Enterprise는 Gemini Enterprise Agent Platform 및 BigQuery와 통합된 안전한 관리형 환경을 제공합니다. Workbench는 맞춤설정 가능한 JupyterLab 인스턴스를 제공하며, Cloud Workstations는 전체 IDE를 지원합니다. 또한 확장 프로그램은 자체 호스팅 도구를 Google Cloud 서비스에 직접 연결합니다.

      Gemini Enterprise Agent Platform의 Colab Enterprise 소개
        엔터프라이즈 데이터 과학을 위한 다양한 노트북 솔루션 중에서 선택하세요.

        Colab Enterprise는 Gemini Enterprise Agent Platform 및 BigQuery와 통합된 안전한 관리형 환경을 제공합니다. Workbench는 맞춤설정 가능한 JupyterLab 인스턴스를 제공하며, Cloud Workstations는 전체 IDE를 지원합니다. 또한 확장 프로그램은 자체 호스팅 도구를 Google Cloud 서비스에 직접 연결합니다.

        Gemini Enterprise Agent Platform의 Colab Enterprise 소개

          통합 데이터 과학 에이전트

          데이터 탐색, 변환, ML 모델링을 용이하게 하는 에이전트 기능을 통해 데이터 과학 개발을 가속화하세요.

          영어로 된 개략적인 목표로 시작하면 데이터 과학 에이전트가 데이터 로드, 탐색, 정리, 시각화, 특성 추출, 데이터 분할, 모델 학습/최적화, 평가에 이르는 데이터 과학 모델링의 모든 측면을 다루는 상세한 계획을 생성합니다.

          데이터 과학 에이전트
            데이터 탐색, 변환, ML 모델링을 용이하게 하는 에이전트 기능을 통해 데이터 과학 개발을 가속화하세요.

            영어로 된 개략적인 목표로 시작하면 데이터 과학 에이전트가 데이터 로드, 탐색, 정리, 시각화, 특성 추출, 데이터 분할, 모델 학습/최적화, 평가에 이르는 데이터 과학 모델링의 모든 측면을 다루는 상세한 계획을 생성합니다.

            데이터 과학 에이전트

              사일로 없는 AI 지원 데이터 준비

              통합된 데이터 기반을 활용하여 SQL을 사용해 분석하고 AI 함수를 사용해 처리함으로써 정형 데이터와 비정형 데이터(이미지, 문서 등)를 모두 관리할 수 있습니다.

              AI 지원 데이터 준비는 데이터 정리 및 변환에 대한 추천을 제공합니다. 데이터 엔지니어링 에이전트는 자연어 안내를 통해 수집 및 파이프라인 생성을 포함한 데이터 엔지니어링 작업을 자동화합니다.

              데이터 엔지니어링 에이전트
                통합된 데이터 기반을 활용하여 SQL을 사용해 분석하고 AI 함수를 사용해 처리함으로써 정형 데이터와 비정형 데이터(이미지, 문서 등)를 모두 관리할 수 있습니다.

                AI 지원 데이터 준비는 데이터 정리 및 변환에 대한 추천을 제공합니다. 데이터 엔지니어링 에이전트는 자연어 안내를 통해 수집 및 파이프라인 생성을 포함한 데이터 엔지니어링 작업을 자동화합니다.

                데이터 엔지니어링 에이전트

                  여러 엔진을 사용한 유연한 데이터 처리

                  통합된 데이터 사본

                  BigQuery의 SQL 엔진이든 Apache Spark와 같은 오픈소스 프레임워크이든 원하는 처리 엔진을 선택하여 단일 통합 데이터 사본으로 직접 작업할 수 있습니다. 이렇게 하면 서로 다른 시스템에 대해 별도의 데이터 사본을 유지할 필요가 없습니다.

                  관리형 Dataproc 및 서버리스 Spark
                    통합된 데이터 사본

                    BigQuery의 SQL 엔진이든 Apache Spark와 같은 오픈소스 프레임워크이든 원하는 처리 엔진을 선택하여 단일 통합 데이터 사본으로 직접 작업할 수 있습니다. 이렇게 하면 서로 다른 시스템에 대해 별도의 데이터 사본을 유지할 필요가 없습니다.

                    관리형 Dataproc 및 서버리스 Spark

                      Python용 BigQuery DataFrames를 사용한 데이터 과학 확장

                      Python 네이티브 라이브러리를 선호하시나요?

                      BigQuery DataFrames는 Python 코드를 최적화된 SQL로 변환하여 BigQuery 엔진에서 실행하는 Pandas와 유사한 API를 제공합니다. 이를 통해 동일한 기본 데이터로 작업하면서 SQL, PySpark, Pandas 스타일의 DataFrame 등 작업에 적합한 도구를 유연하게 사용할 수 있습니다.

                      Python용 BigQuery DataFrames를 사용한 데이터 과학 확장
                        Python 네이티브 라이브러리를 선호하시나요?

                        BigQuery DataFrames는 Python 코드를 최적화된 SQL로 변환하여 BigQuery 엔진에서 실행하는 Pandas와 유사한 API를 제공합니다. 이를 통해 동일한 기본 데이터로 작업하면서 SQL, PySpark, Pandas 스타일의 DataFrame 등 작업에 적합한 도구를 유연하게 사용할 수 있습니다.

                        Python용 BigQuery DataFrames를 사용한 데이터 과학 확장

                          ML 모델 빌드, 학습, 조정, 실행

                          SQL을 사용하여 BigQuery ML로 모델을 빌드, 학습, 평가, 배포하여 데이터 이동을 없앱니다.

                          기본 제공되는 사전 학습된 모델 또는 데이터 분석/보강을 위해 Gemini를 호출하는 SQL 함수를 활용하세요. 커스텀 모델의 경우 Agent Platform은 PyTorch, TensorFlow 및 기타 ML 라이브러리를 지원합니다. 원활한 통합을 통해 BigQuery에서 특성 추출을 수행하고, Agent Platform에서 커스텀 모델을 학습시키고, SQL을 통해 BigQuery에서 추론을 다시 수행할 수 있습니다.

                          BQML
                            SQL을 사용하여 BigQuery ML로 모델을 빌드, 학습, 평가, 배포하여 데이터 이동을 없앱니다.

                            기본 제공되는 사전 학습된 모델 또는 데이터 분석/보강을 위해 Gemini를 호출하는 SQL 함수를 활용하세요. 커스텀 모델의 경우 Agent Platform은 PyTorch, TensorFlow 및 기타 ML 라이브러리를 지원합니다. 원활한 통합을 통해 BigQuery에서 특성 추출을 수행하고, Agent Platform에서 커스텀 모델을 학습시키고, SQL을 통해 BigQuery에서 추론을 다시 수행할 수 있습니다.

                            BQML

                              통합 MLOps로 모델에서 프로덕션까지

                              BigQuery와 Gemini Enterprise Agent Platform이 통합되어 MLOps를 간소화합니다.

                              Gemini Enterprise Agent Platform Feature Store에서 특성을 중앙 집중화하여 학습-서빙 편향과 중복 작업을 방지합니다. AutoML을 사용하여 테이블 형식 데이터의 모델 빌드를 자동화합니다. BigQuery ML 모델이든 Gemini Enterprise Agent Platform 모델이든 모든 모델은 플랫폼 Model Registry에 자동으로 등록됩니다. 여기에서 손쉽게 버전을 관리하고, 평가하고, 배포하여 단일 플랫폼에서 원활한 엔드 투 엔드 수명 주기를 만들 수 있습니다.

                              MLOps를 사용한 엔드 투 엔드 워크플로
                                BigQuery와 Gemini Enterprise Agent Platform이 통합되어 MLOps를 간소화합니다.

                                Gemini Enterprise Agent Platform Feature Store에서 특성을 중앙 집중화하여 학습-서빙 편향과 중복 작업을 방지합니다. AutoML을 사용하여 테이블 형식 데이터의 모델 빌드를 자동화합니다. BigQuery ML 모델이든 Gemini Enterprise Agent Platform 모델이든 모든 모델은 플랫폼 Model Registry에 자동으로 등록됩니다. 여기에서 손쉽게 버전을 관리하고, 평가하고, 배포하여 단일 플랫폼에서 원활한 엔드 투 엔드 수명 주기를 만들 수 있습니다.

                                MLOps를 사용한 엔드 투 엔드 워크플로

                                  Google Cloud로 다음 단계 수행

                                  $300의 무료 크레딧과 20여 개의 항상 무료 제품으로 Google Cloud에서 빌드하세요.

                                  시작하는 데 도움이 필요하신가요?

                                  데이터 탐색부터 MLOps까지 데이터 과학에 관한 Google Cloud 리소스를 살펴보세요.

                                  ML 워크플로 전반에 걸쳐 커스텀 학습 모델을 개발하는 방법을 알아봅니다.

                                  단계별 둘러보기, 튜토리얼, 코딩 실습을 통해 Google Cloud를 사용해 보세요.

                                  비즈니스 사례

                                  성과 중심의 성공


                                  더보기

                                  레거시에서 클라우드로: Deutsche Telekom이 PySpark에서 BigQuery DataFrames로 전환한 방법

                                  더보기

                                  '몇 달에서 몇 분으로: 2천만 개 이상의 소비자 리뷰를 AI를 통해 인사이트로 전환'

                                  더보기

                                  맞춤화된 고객 경험과 효율적인 운영을 위한 실시간 AI/ML 지원

                                  지금 보기

                                  • Deutsche Telekom 로고
                                  • Mattel 로고
                                  • Flipkart 로고
                                  • Snap 로고
                                  • Wayfair 로고
                                  업계 역할

                                  데이터 과학팀의 모든 역할을 위해 빌드 

                                  업계 역할

                                  FAQ

                                  데이터 과학자 및 ML 엔지니어

                                  Colab Enterprise 노트북, PyTorch 및 TensorFlow와 같은 프레임워크 지원, BigQuery DataFrames를 통해 개발자 경험에 집중합니다. 팀은 프로젝트 전반에서 노트북, 데이터 연결, 컴퓨팅 리소스를 공유할 수 있으므로 Google Cloud는 진정한 협업형 데이터 과학 플랫폼입니다.

                                  ROI와 거버넌스를 극대화하세요. 통합 플랫폼은 도구 확산과 공급업체 비용을 줄여주며 거버넌스가 기본 제공됩니다. 별도의 MLOps팀 없이 노트북에서 프로덕션으로 모델을 이동하여 3배/4배/10배의 성능 통계를 직접 지원합니다.

                                  통합과 유연성의 이점을 누리세요. 하나의 데이터 사본에서 오픈소스 호환성(Apache Spark, Airflow, Kafka)과 멀티 엔진 처리를 지원하므로 프레임워크에 대한 공급업체 종속이 없습니다.

                                  Google Cloud