什么是智能体编码？

智能体编码是一种软件开发方法，其中自主 AI 智能体在极少的人工干预下规划、编写、测试和修改代码。与等待用户输入代码或提出问题的传统 AI 编码助理不同，智能体编码工具会接收高级指令并执行它。这些智能体更像是技术娴熟的承包商，而不是被动的顾问。他们了解目标，将其分解为多个步骤，并执行必要的操作来完成工作。

虽然标准 AI 工具可能会建议代码段或完整的单个函数，但智能体代码解决方案可以管理复杂的工作流。他们可以浏览文件系统、管理依赖项和运行终端命令。如果智能体编写的代码导致错误，它可以读取错误消息，推理问题，并自动应用修复。这种从“与 AI 对话”到“向 AI 分配任务”的转变，有助于开发者专注于架构和逻辑，而让智能体处理实现详细信息。

38:28

使用 Gemini CLI（Google 的终端智能体编码工具）进行 AI 编码

什么是编码智能体？

编码智能体是一种由大语言模型 (LLM) 提供支持的高级软件程序，可自主执行软件开发任务。这些智能体不仅能生成文本，还能使用通常称为“推理和行动”循环的过程。在给定目标后，智能体将请求分解为更小、更易于管理的子任务。然后，它会使用特定工具来完成这些任务，例如访问文件系统、运行 bash 命令或与版本控制系统互动。

编码智能体的显著特点是其迭代反馈环。它不会简单地输出代码就停止。而是执行自动化操作来验证其工作。例如，智能体可能会编写测试用例、运行代码、观察失败情况，然后重写代码以通过测试。这种自我纠正的能力使编码智能体能够帮助处理复杂的指令，而这些指令可能会让标准的基于文本的 AI 模型感到困惑。

智能体编码与“氛围编程”

“氛围编程 (vibe coding)”是指一种编码体验，其特点是高度流畅、直观且不受干扰。它指的是一种编码方法，让您能够完全专注于逻辑和创造力（应用的“氛围”），而不会陷入语法错误或样板代码的困扰。

相比之下，智能体编码是一种技术方法，通常可以实现这种状态。这是一个结构化的自主流程，由 AI 处理执行。氛围编程 (vibe coding) 是目标或感觉，而智能体编码是引擎。“智能体氛围编程 (vibe coding)”是指使用这些自主智能体来帮助处理繁重的工作，让您能够不受干扰地保持创作状态。

关于保障智能体编码工作流安全性的最佳实践

在企业环境中采用智能体编码通常需要更严格的安全措施和治理。由于从技术上讲，智能体可以自主修改文件和执行命令，因此组织必须像对待自己的员工、聘用的承包商或自动脚本一样，对智能体进行严格审查。

治理和使用范围控制

定义范围和保护措施：管理员应限制智能体可以访问的内容，并阻止其运行危险命令，例如删除数据库或将更改直接推送到实际生产环境中。
实施严格的依赖项治理：安全团队必须确保智能体只能从可信且经过批准的来源安装软件，以防止引入恶意依赖项或“误植域名”攻击。
要求提供合规证明：组织应设置智能体来记录操作和决策过程，创建审核跟踪记录，以证明代码更改符合合规标准。

监督和集成

在工作流中添加人工检查：在将 AI 智能体生成的任何代码添加到主项目之前，团队中的某个人应使用标准拉取请求流程对其进行审核。
使用企业级洞察工具：公司可以使用集中式信息中心跟踪不同开发团队的智能体活动、用量配和性能指标。
监控新类型的漏洞：安全团队应注意提示注入攻击或“幻觉”代码路径，这些路径可能会引入 AI 生成的软件特有的逻辑错误。

测试和保障

运行受控的红队演练：安全专业人员可以模拟对智能体工作流的攻击，看看智能体是否会被诱骗编写不安全的代码或泄露敏感数据。
执行分层安全测试：开发者应使用静态应用安全保障测试 (SAST) 和动态应用安全保障测试 (DAST) 工具自动扫描智能体生成的代码。
不断完善控制措施：团队应根据检查和测试结果，定期更新安全政策和向 AI 智能体发出的指令（系统提示）。

使用智能体编码的优势

提高效率和可伸缩性

智能体可以快速处理重复的编码任务，让团队无需增加员工人数即可构建更大的系统。

自主实现复杂工作流自动化

智能体可以管理多步流程，例如跨多个文件升级库，而无需持续的人工输入或指导。

让开发者能够专注于高价值任务

通过卸载实现详细信息，工程师可以将精力投入到解决复杂问题和战略架构上。

改进代码质量和安全审核

智能体可以始终如一地应用风格指南和安全最佳实践，而人类有时可能会忽略这些。

更快地交付功能并自动修复 bug

智能体可以在几分钟内找出 bug 的根本原因并提出修复建议，从而缩短开发生命周期。

减少开发者的工作量，专注于高级设计

开发者可以更像架构师，定义结构，而智能体可以奠定基础，从而减少倦怠。

使用 Google Cloud 进行智能体编码

Google Cloud 提供支持智能体编码工作流的工具，旨在为您的开发环境带来自主性。这项服务主要围绕 Gemini CLI、Google Antigravity 和 Gemini Enterprise 展开，可以改变开发者与代码库的互动方式。

Gemini CLI 如何实现智能体编码

Gemini CLI 改变了动态，从寻求帮助转变为分配工作。以下是它管理智能体任务的方式：

工具使用：该智能体可以自主运行 ls、grep 和 cat 等命令，也可以直接写入文件。它没有建议您运行测试，而是自行运行 npm 测试并读取日志。
记忆和上下文：它支持项目根目录中的 GEMINI.md 文件。此文件充当长期记忆或系统提示，您可以在其中定义编码标准、架构规则或特定“请勿执行此操作”指令，供智能体在每个任务中遵循。
自我纠正：如果智能体编写的代码导致构建失败，它会在终端中看到错误消息。然后，它会分析失败原因，并自动尝试其他解决方案。
可扩展性 (MCP)：支持 Model Context Protocol (MCP)。这样，您就可以将智能体连接到 PostgreSQL、GitHub 或 Slack 等外部数据源，以便从本地文件系统之外提取上下文。

Gemini CLI 的应用场景

Gemini CLI 可适应开发生命周期的各个阶段，无论您是从头开始构建，还是维护已建立的代码库，它都能提供独特的优势。

绿地开发（新应用）

在启动新项目时，Gemini CLI 可以发挥强大的助力作用，帮助您快速进行原型设计和架构设置。

基架和初始化：您可以指示该智能体设置完整的项目结构，包括配置文件、目录层次结构和初始依赖项。例如，只需一个提示，即可生成一个连接了数据库并具有基本路由的 Python Flask 应用。
减少样板：开发者可以指派智能体生成重复的代码结构（例如数据模型、API 端点或表单验证逻辑），让开发者专注于独特的业务逻辑。
快速原型设计：团队可以使用自然语言描述功能，从而快速验证想法。该智能体可以构建功能原型、运行原型，并根据反馈进行迭代，从而显著缩短从概念到演示的时间。

Brownfield 现代化改造（现有应用）

对于旧版或已建立的应用，Gemini CLI 可帮助简化维护、重构和知识传授。

重构和优化：您可以让智能体对特定模块进行现代化改造，例如将旧的 JavaScript 文件转换为 TypeScript，或更新已弃用的 API 调用。智能体可以读取现有代码，应用所请求的更改，并验证逻辑是否保持一致。
测试生成和覆盖率：为了提高稳定性，开发者可以要求智能体分析文件并编写全面的单元测试。通过引用包含测试惯例的 GEMINI.md 文件，该智能体可确保新测试符合团队的标准。
文档和新手入门：新工程师可能很难理解大型代码库。该智能体可以扫描目录以生成最新文档、解释复杂函数或创建架构图，从而使团队能够更轻松地理解和维护软件。

绿地开发（新应用）

在启动新项目时，Gemini CLI 可以发挥强大的助力作用，帮助您快速进行原型设计和架构设置。

基架和初始化：您可以指示该智能体设置完整的项目结构，包括配置文件、目录层次结构和初始依赖项。例如，只需一个提示，即可生成一个连接了数据库并具有基本路由的 Python Flask 应用。
减少样板：开发者可以指派智能体生成重复的代码结构（例如数据模型、API 端点或表单验证逻辑），让开发者专注于独特的业务逻辑。
快速原型设计：团队可以使用自然语言描述功能，从而快速验证想法。该智能体可以构建功能原型、运行原型，并根据反馈进行迭代，从而显著缩短从概念到演示的时间。

Brownfield 现代化改造（现有应用）

对于旧版或已建立的应用，Gemini CLI 可帮助简化维护、重构和知识传授。

重构和优化：您可以让智能体对特定模块进行现代化改造，例如将旧的 JavaScript 文件转换为 TypeScript，或更新已弃用的 API 调用。智能体可以读取现有代码，应用所请求的更改，并验证逻辑是否保持一致。
测试生成和覆盖率：为了提高稳定性，开发者可以要求智能体分析文件并编写全面的单元测试。通过引用包含测试惯例的 GEMINI.md 文件，该智能体可确保新测试符合团队的标准。
文档和新手入门：新工程师可能很难理解大型代码库。该智能体可以扫描目录以生成最新文档、解释复杂函数或创建架构图，从而使团队能够更轻松地理解和维护软件。

Google Antigravity：以智能体为核心的平台

Google Antigravity 代表着从具有助理功能的 IDE 到专用智能体开发平台的转变。它由 Gemini 3 提供支持，将 AI 智能体视为主要工作者，而不是简单的助手。

经理视图（任务控制）：开发者可以使用集中式信息中心来生成、编排和观察在不同工作区中并行工作的多个智能体。您可以分配一个智能体来研究文档，另一个智能体来重构代码库。
可验证的制品：Antigravity 智能体不会生成不透明的日志，而是会生成结构化的“制品”，即计划、代码更改和测试结果的可验证记录。这可以提供透明度，让开发者能够快速审核智能体的推理和“工作证明”。
浏览器和终端自主性：Antigravity 智能体能够控制浏览器进行视觉验证，并执行复杂的终端命令，从而实现包括部署和测试在内的端到端任务完成。

Gemini Enterprise：安全地进行扩缩

对于大规模部署智能体的组织，Gemini Enterprise 可帮助提供必要的治理和集成层。

集中式保护措施：管理员可以定义智能体必须遵守的政策即代码，确保没有智能体工作流违反公司合规性或安全标准。
专用知识接地：智能体可以基于您组织的专用代码库和文档，从而编写符合内部库和架构模式的代码，而不会泄露数据。
赔偿和合规性：Gemini Enterprise 可提供知识产权赔偿，并符合严格的合规性认证，因此大型企业可以安全地在生产环境中采用智能体编码。

AI 聊天机器人与编码智能体的使用效果比较

如需了解智能体编码的强大功能，请将标准 AI 聊天体验与 Gemini CLI 智能体工作流进行比较。

标准 AI 聊天体验：

您：“如何为我的 Express 应用添加速率限制器？”
AI：“下面是使用 express-rate-limit 的代码段…”
您：复制代码，打开编辑器，粘贴代码，运行服务器。
您：看到崩溃。复制错误消息。
您：将错误粘贴回 AI…

智能体 Gemini CLI：

您（在终端中）：gemini“使用 express-rate-limit 为服务器添加速率限制器，并确保通过测试。”

Gemini CLI：

读取 package.json 以检查依赖项。
运行 npm install express-rate-limit。
修改 server.js 以导入和配置中间件。
运行 npm 测试。
（如果测试失败）读取错误日志，再次修改代码，然后再次运行测试。

最终输出：“任务已完成。我已安装该软件包并更新了 server.js。测试通过。”

如何获取 Gemini CLI

Gemini CLI 是一款独立于标准 Google Cloud SDK 的开源工具。

安装：您需要安装 Node.js（版本 18 或更高版本）。

正在加载...

身份验证：运行一次命令，使用您的 Google 账号登录。免费层级不需要 API 密钥。