BigQuery는 AI 지원 데이터 분석 플랫폼입니다

통합 데이터 분석 플랫폼으로 기업 데이터를 AI에 연결하세요. BigQuery는 멀티 엔진, 멀티 포맷, 멀티 클라우드로 설계되어 모든 비즈니스 데이터를 더 쉽게 저장, 분석, 변환할 수 있습니다.

통합된 단일 데이터-AI 플랫폼

BigQuery는 엔드 투 엔드 데이터 수명 주기를 지원하는 통합 데이터 분석 플랫폼입니다. BigQuery와 Vertex AI의 퍼스트 파티 통합을 사용하면 데이터 복사나 이동 없이 기업 데이터로 멀티 모달 LLM을 미세 조정, 학습, 그라운딩할 수 있습니다.


단일 플랫폼에서 모든 데이터와 워크로드를 관리할 수 있는 단순성과 확장성

서로 연동되지 않는 데이터 워크로드의 복잡성을 줄이고 비용을 절감하며 위험을 완화할 수 있습니다. BigQuery는 단순성과 확장성을 갖추고 있어 정형, 비정형, 스트리밍 워크로드를 최적의 가격과 성능으로 관리할 수 있습니다.



AI를 더 많은 기업 데이터에 연결

규모에 맞게 효율적인 생성형 AI를 데이터에 적용하여 LLM으로 비즈니스 데이터를 활용하세요. BigQuery는 Vertex AI와의 퍼스트 파티 통합을 통해 AI를 기반으로 엔터프라이즈 데이터를 보호합니다.



모든 데이터팀을 위한 상시 인텔리전스

활용 가능한 데이터의 사용을 늘려 생산성을 개선합니다. BigQuery의 Gemini를 사용하면 데이터를 자연어로 대화할 수 있으며 코드 지원, 추천, 데이터 탐색 등에 도움이 됩니다.

단일 통합 환경에서의 데이터 분석 및 AI

카테고리분야주요 사항
AI를 위한 데이터 분석 기반 구축

고객은 점점 더 많은 데이터 사본에서 여러 분석 및 AI 사용 사례를 실행하고 싶어 합니다. BigQuery를 사용하면 BigQuery에서 직접 사용할 수 있는 서버리스 Spark 를 사용하여 SQL을 사용하는 것처럼 Python에서 데이터를 쉽게 처리할 수 있습니다. 통합 Metastore는 SQL, 오픈소스 엔진, AI/ML을 위한 런타임 메타데이터와 커넥터를 제공합니다.

  • 클러스터를 가동하거나 관리할 필요가 없는 완전한 서버리스

  • 모든 워크로드를 위한 단일 사용자 환경

  • 다른 도구 간에 데이터를 복사할 수 없음

BigQuery는 기존 오픈소스 형식을 사용할 수 있는 유연성을 제공합니다. BigQuery의 스토리지 엔진인 BigLake는 분석 및 AI 엔진이 멀티포맷, 멀티 클라우드, 멀티모달 데이터를 쿼리할 수 있는 통합 인터페이스를 제공합니다. BigQuery는 Iceberg, Delta, Hudi와 함께 모든 처리 엔진과 이러한 모든 테이블 형식의 전체 기능을 지원합니다.

  • 세분화된 액세스 제어로 Apache Iceberg, Delta, Hudi 형식 쿼리

  • 지속적인 최적화로 Apache Iceberg 성능 가속화

  • 높은 처리량의 스트리밍을 지원하는 Iceberg의 완전 관리형 환경

BigQuery Studio는 모든 데이터 실무자가 사용할 수 있는 원스톱 서비스입니다. BigQuery Studio에는 Python Notebooks뿐만 아니라 우수한 SQL 편집기가 포함되어 있습니다. 따라서 데이터팀에서 SQL, Python, Spark, 자연어를 선택할 수 있습니다. 데이터팀은 BigQuery 내에서 Gemini를 지원하는 채팅 및 코드 어시스턴트로 공동작업하여 생산성을 극대화할 수 있습니다.

  • Gemini 지원 채팅 및 코드 어시스턴트를 갖춘 단일 통합 작업공간

  • 분석을 위해 SQL, Python, Spark, JavaScript, 자연어 사용

  • 중앙 집중식 소스 제어 및 업데이트 기록

BigQuery를 사용하면 BigQuery에 기본 제공되는 데이터 거버넌스 기능을 통해 데이터를 쉽게 관리, 탐색, 제어할 수 있습니다. 여기에는 데이터 품질, 계보, 프로파일링은 물론 BigQuery 리소스에 대한 정책을 관리하기 위한 거버넌스 규칙도 포함됩니다.

  • 데이터에 대한 심층적인 이해를 위한 데이터 프로파일링

  • 자동 데이터 품질로 규모에 맞는 데이터에 대한 신뢰 구축

  • 엔드 투 엔드 계보로 데이터 이동 이해

BigQuery의 실시간 기능으로 데이터 유용성과 접근성을 높이기 위해 이벤트 스트림을 실시간으로 수집, 처리, 분석합니다. BigQuery 연속 쿼리는 BigQuery에서 수신 이벤트를 분석하고 변환하는 실시간 처리 레이어를 제공합니다. 고객은 BigQuery용 Apache Kafka를 사용하여 버전 업그레이드, 재분산, 모니터링 및 기타 운영 문제에 대한 걱정 없이 스트리밍 데이터 워크로드를 관리할 수 있습니다.

  • SQL을 사용하여 수신되는 데이터 스트림에서 무제한 서버리스 분석 수행

  • Dataflow를 사용한 통합 일괄 및 스트리밍 처리와 실시간 ETL

  • Pub/Sub로 초당 수억 개의 이벤트 수집

  • 추가 유지보수가 필요 없는 Managed Apache Kafka

데이터-AI 통합

BigQuery ML을 사용하면 익숙한 SQL을 사용하여 머신러닝 모델을 만들고, 학습시키고, 실행할 수 있습니다. Vertex AI를 통해 Gemini 1.0 Pro를 비롯한 원하는 모델과 통합됩니다. 이 모델은 높은 입출력 규모와 텍스트 요약 또는 감정 분석 태스크에서 더 나은 결과 품질을 제공하도록 설계되었습니다. 정형 데이터, 비정형 데이터, 생성형 AI 모델을 결합하는 데이터 파이프라인을 빌드하여 새로운 유형의 분석 애플리케이션을 만들 수 있습니다.

  • 추론 엔진 및 Vertex AI Model Registry를 사용한 데이터-AI 통합

  • ARIMA+ 시계열 모델링, Explainable AI 등을 사용한 모델링 기능

  • 텍스트 및 텍스트 임베딩을 생성하는 LLM의 원격 추론

BigLake는 단일 관리 프레임워크로 데이터 레이크와 웨어하우스를 통합하여 비정형 데이터를 분석, 검색, 보호, 제어, 공유할 수 있도록 지원합니다. 고객들은 이미 다양한 AI 모델을 사용해 이미지를 분석하고 있습니다. BigLake는 Vertex AI의 문서 처리 및 음성 텍스트 변환 API를 사용하여 문서 및 오디오 파일에서 유용한 정보를 쉽게 추출할 수 있도록 기능을 확장했습니다.

  • 문서 및 오디오 파일에서 유용한 정보 추출

  • 콘텐츠 생성, 분류, 감정 분석을 위한 새로운 앱 만들기

  • 요약, 임베딩 생성 등을 위한 새로운 앱을 만드세요.

BigQuery 벡터 검색은 Vertex AI와 통합되어 BigQuery 데이터에 대한 벡터 유사성 검색을 지원합니다. 이 기능은 시맨틱 검색, 유사성 감지, LLM을 사용한 검색 보강(RAG)과 같은 사용 사례를 지원할 수 있습니다. 벡터 검색은 컨텍스트 이해를 개선하고, 모호성을 줄이고, 사실의 정확성을 보장하고, 다양한 작업과 도메인에 대한 적응성을 지원하여 AI 모델의 품질을 향상할 수 있습니다.

  • 여러 데이터베이스 및 Cloud Storage에서 벡터를 수집하고 표준화합니다.

  • 질문과 관련된 데이터를 가져와 LLM에 컨텍스트 제공

  • 완전 관리형 색인은 임베딩을 자동으로 생성하고 Vertex와 동기화된 상태로 유지

기업 역량

BigQuery는 데이터 센터 수준의 재해 발생 시 고가용성을 제공할 수 있는 충분한 대기 컴퓨팅 용량과 함께 데이터의 동기식 사본을 두 번째 영역에 자동으로 보관합니다. 리전 간 재해 복구는 드물게 리전 재해가 발생할 경우 관리형 장애 조치를 제공합니다. 리전 간 재해 복구를 사용하면 BigQuery가 유지할 데이터 세트 모음과 예약을 두 번째 리전에서 지정할 수 있습니다.

  • 대기 상태 보장

  • 리전별 서비스 중단 SLA

  • 조정된 장애 조치

BigQuery를 사용하면 규모에 맞춰 데이터 애셋을 공동작업하고 안전하게 교환할 수 있습니다. 데이터 클린룸을 사용하여 개인 정보 보호 중심의 데이터 공유 및 분석을 위한 환경을 만들고 관리할 수 있습니다. 데이터 제공업체는 데이터 목록 구독을 관리하고 공유 데이터의 구독자 사용량을 모니터링할 수 있습니다. BigQuery Omni를 사용하면 클라우드 간에 데이터를 공유할 수 있으며 연결된 데이터 세트에 대한 사용자 정의 함수, 시간 이동, 구체화된 뷰가 지원됩니다.

  • 클릭 몇 번으로 데이터 클린룸 구축

  • 이동 없이 비용을 절감하고 데이터를 효율적으로 공유

  • 공유 데이터 세트 사용 모니터링

BigQuery Migration Service는 BigQuery로 마이그레이션하는 데 도움이 되는 무료 도구 모음입니다. Google Cloud는 지속적으로 새로운 기능을 추가하고 Amazon Redshift, Apache HiveQL, Netezza, Teradata, Azure Synapse, Oracle, Presto, Snowflake, SQL Server, Vertica를 비롯한 다양한 소스를 지원합니다. 생성형 AI로 향상된 번역은 쿼리 컴파일러를 선택적으로 지원하고 온프렘 및 클라우드 소스에서 마이그레이션을 지원하는 출력 옵션을 자동으로 제안합니다.

  • 널리 사용되는 데이터 웨어하우스와 데이터 레이크의 쿼리 변환 소스 15개

  • 소유 비용과 마이그레이션 작업이 포함된 자동 평가 소스 4개

  • 생성형 AI로 향상된 쿼리 번역

단일 통합 환경에서의 데이터 분석 및 AI

고객은 점점 더 많은 데이터 사본에서 여러 분석 및 AI 사용 사례를 실행하고 싶어 합니다. BigQuery를 사용하면 BigQuery에서 직접 사용할 수 있는 서버리스 Spark 를 사용하여 SQL을 사용하는 것처럼 Python에서 데이터를 쉽게 처리할 수 있습니다. 통합 Metastore는 SQL, 오픈소스 엔진, AI/ML을 위한 런타임 메타데이터와 커넥터를 제공합니다.

  • 클러스터를 가동하거나 관리할 필요가 없는 완전한 서버리스

  • 모든 워크로드를 위한 단일 사용자 환경

  • 다른 도구 간에 데이터를 복사할 수 없음

BigQuery ML을 사용하면 익숙한 SQL을 사용하여 머신러닝 모델을 만들고, 학습시키고, 실행할 수 있습니다. Vertex AI를 통해 Gemini 1.0 Pro를 비롯한 원하는 모델과 통합됩니다. 이 모델은 높은 입출력 규모와 텍스트 요약 또는 감정 분석 태스크에서 더 나은 결과 품질을 제공하도록 설계되었습니다. 정형 데이터, 비정형 데이터, 생성형 AI 모델을 결합하는 데이터 파이프라인을 빌드하여 새로운 유형의 분석 애플리케이션을 만들 수 있습니다.

  • 추론 엔진 및 Vertex AI Model Registry를 사용한 데이터-AI 통합

  • ARIMA+ 시계열 모델링, Explainable AI 등을 사용한 모델링 기능

  • 텍스트 및 텍스트 임베딩을 생성하는 LLM의 원격 추론

BigQuery는 데이터 센터 수준의 재해 발생 시 고가용성을 제공할 수 있는 충분한 대기 컴퓨팅 용량과 함께 데이터의 동기식 사본을 두 번째 영역에 자동으로 보관합니다. 리전 간 재해 복구는 드물게 리전 재해가 발생할 경우 관리형 장애 조치를 제공합니다. 리전 간 재해 복구를 사용하면 BigQuery가 유지할 데이터 세트 모음과 예약을 두 번째 리전에서 지정할 수 있습니다.

  • 대기 상태 보장

  • 리전별 서비스 중단 SLA

  • 조정된 장애 조치

애널리스트 보고서

Gartner, Google Cloud를 선두 제품으로 선정

Google Cloud가 2023년 Gartner® Magic Quadrant™의 클라우드 데이터베이스 관리 시스템(DBMS) 부문에서 리더로 선정되었습니다.

Google Cloud, 2023년 Forrester Wave에서 리더로 선정

Google Cloud가 The Forrester Wave™: 2023년 4분기 스트리밍 데이터 플랫폼 보고서에서 리더로 선정되었습니다.

BigQuery는 AI를 위한 견고한 데이터 기반을 제공했습니다. 당사의 데이터는 필요한 곳에 있었습니다. 호텔 정보, 마케팅 콘텐츠, 고객 서비스 채팅에서 수백만 개의 고객 데이터 포인트를 연결하고 비즈니스 데이터를 사용하여 LLM을 접지할 수 있었습니다.

Allie Surina Dixon, Priceline 데이터 부문 이사

다음 단계 수행

신규 고객에게 $300의 무료 크레딧을 제공합니다.

Google Cloud