Gemini in BigQuery

本文档介绍了 BigQuery 中的 Gemini(适用于 Google Cloud 的 Gemini 产品组合中的一款产品)如何提供 AI 赋能的协助来帮助您处理数据。

在 BigQuery 中使用 Gemini 获得 AI 协助

BigQuery 中的 Gemini 通过以下方式提供 AI 协助:

  • 利用数据分析探索和理解您的数据。数据分析提供了一种自动化、直观的方法,通过使用基于表的元数据生成的富有洞察力的查询,来发现模式、评估数据质量并执行统计分析。此功能特别有助于解决早期数据探索的冷启动挑战。如需了解详情,请参阅在 BigQuery 中生成数据分析
  • 使用 BigQuery 数据画布发现、转换、查询和直观呈现数据。您可以使用自然语言查找、联接和查询表格资源,直观呈现结果,并在整个过程中与他人无缝协作。如需了解详情,请参阅使用数据画布进行分析
  • 获取 SQL 和 Python 辅助数据分析。您可以使用 BigQuery 中的 Gemini 生成或建议 SQL 或 Python 代码,以及解释现有 SQL 查询。您也可以使用自然语言查询来开始数据分析。如需了解如何生成、补全和汇总代码,请参阅在 Gemini 协助下编写查询
  • 通过分区、聚类和具体化视图建议优化数据基础架构。您可以让 BigQuery 监控您的 SQL 工作负载,寻找提高性能和降低费用的机会。如需了解详情,请参阅查看分区和集群建议管理具体化视图建议
  • 对无服务器 Apache Spark 工作负载进行自动调优和问题排查。自动调整可以根据最佳实践和分析之前运行的工作负载,将配置设置应用于周期性 Spark 工作负载,从而自动优化 Spark 作业。使用 Gemini 进行高级问题排查可以解释和显示作业错误,并提供切实可行的建议来修复运行缓慢或失败的作业。如需了解详情,请参阅自动调整 Spark 工作负载以及监控 Dataproc 无服务器工作负载并对其进行问题排查
  • 使用转换规则自定义 SQL 转换。创建 Gemini 增强型转换规则,以便在使用交互式 SQL 转换工具时自定义 SQL 转换。您可以使用自然语言提示来描述 SQL 转换输出的更改,或指定要查找和替换的 SQL 模式。如需了解详情,请参阅创建转换规则
BigQuery 中的 Genmini 使用 Google 开发的大语言模型 (LLM)。LLM 使用数十亿行开源代码、安全数据和 Google Cloud 专有内容(如文档和示例代码)进行微调。

Gemini 不会将您的提示或其回答作为数据来训练模型。如需了解详情,请参阅 适用于 Google Cloud 的 Gemini 如何使用您的数据。作为一项处于早期阶段的技术,Gemini 可以生成看似合理但事实不符的输出。我们建议您在使用 Gemini 之前验证其所有输出。如需了解详情,请参阅适用于 Google Cloud 和 Responsible AI 的 Gemini

在哪里与 Gemini 互动

在 BigQuery 中设置 Gemini 后,您可以在 BigQuery 中使用 Gemini 执行以下操作:

  • 如需使用数据分析,请转到表条目的数据分析标签页,您可以在其中确定模式、评估质量以及对 BigQuery 数据运行统计分析。
  • 如需使用数据画布,请从表或查询中创建数据画布或使用数据画布,以使用自然语言探索数据资源并共享画布。
  • 如需获取辅助 SQL 查询,请使用帮助我编写代码工具,该工具可让您迭代查询、指定源数据,然后将查询插入 BigQuery Studio。
  • 如需查看有关分区、聚类具体化视图的建议,请点击 Google Cloud 控制台工具栏中的 建议
  • 如需使用自然语言生成 SQL 或 Python 代码,或在输入时借助自动补全功能接收建议,请使用“帮我编写代码”工具运行 SQL 查询Python 代码。Gemini 也可以用自然语言解释您的 SQL 代码。

对 Spark 作业进行自动调优和问题排查

自动扩缩可以帮助您优化 Spark 工作负载,以提高性能和弹性。您无需手动配置设置,Gemini 可以针对周期性工作负载应用最佳实践,然后帮助您了解和监控自动调节。高级问题排查功能可以用自然语言回答“什么是自动调优的?”“现在发生什么?”和“我该怎么办?”

在 BigQuery 中设置 Gemini

如需了解详细设置步骤,请参阅在 BigQuery 中设置 Gemini

后续步骤