Gemini 2.0 Flash Thinking 是一种实验性模型,经过训练后,该模型会生成“思考过程”,并将其作为回答的一部分。因此,Gemini 2.0 Flash Thinking 的回答比 Gemini 2.0 Flash 基本模型具备更强的推理能力。
使用 Flash Thinking
闪电般的思考模型在 Vertex AI 中作为实验性模型提供。如需使用最新的 Flash Thinking 模型,请在模型下拉菜单中选择 gemini-2.0-flash-thinking-exp-01-21
模型。
Gen AI SDK for Python
了解如何安装或更新 Gen AI SDK for Python。
如需了解详情,请参阅 SDK 参考文档。设置环境变量以将 Gen AI SDK 与 Vertex AI 搭配使用:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=us-central1 export GOOGLE_GENAI_USE_VERTEXAI=True
限制
Flash Thinking 是一种实验性模型,存在以下限制:
- 100 万个 token 输入限制
- 文本、图片、音频和视频输入
- 64000 个 token 输出限制
- 仅文本输出
- 未使用搜索或代码执行等内置工具
后续步骤
您可以使用我们的 Colab 笔记本试用闪电思考功能,也可以打开 Vertex AI 控制台,尝试自行提示模型。