Gemini CLI:终端里的 AI 超能力

June 27, 2025

数字世界瞬息万变,随着强大人工智能模型的问世,开发者们正积极探索创新方法,将AI智能无缝融入日常工作流程。由此应运而生的便是 Gemini CLI,这是一个由谷歌发起的雄心勃勃的开源项目,它将Gemini AI模型的强大功能直接带到你的命令行界面。

什么是 Gemini CLI?

Gemini CLI 的核心是一个专为终端环境设计的AI代理。它不仅仅是一个聊天界面;它是一个复杂的流工具,能够理解你的代码,与各种开发者工具连接,旨在显著加速你的开发进程。想象一下,你拥有一个智能助手,它不仅能回答你的编程问题,还能直接执行操作,所有这些都无需离开你熟悉的命令行界面。

主要功能和特性:

Gemini CLI 旨在解决开发者日常面临的多个痛点。以下是其突出的一些功能:

  • 大型代码库交互:它擅长查询和编辑大型代码库,其能力超越了许多AI模型典型的上下文窗口限制。这使得开发者能够高效地在大型项目中获取洞察并进行修改。

  • 多模态应用生成:利用 Gemini 的多模态能力,CLI 可以根据PDF甚至草图等非传统输入生成全新的应用程序。这为快速原型设计和想法实现开辟了激动人心的可能性。

  • 操作任务自动化:从日常琐碎到复杂任务,Gemini CLI 可以自动化各种操作任务。例如,查询拉取请求、管理复杂的 Git rebase,甚至根据项目数据生成全面的报告。

  • 工具和服务器集成:CLI 旨在具备可扩展性。它支持与各种工具和 MCP(多客户端协议)服务器集成,允许你连接新的功能,如使用 Imagen、Veo 或 Lyria 等工具进行媒体生成,从而扩展其效用。

  • 谷歌搜索集成:Gemini CLI 内置了谷歌搜索工具,确保其响应基于真实世界数据,所提供的信息和建议及时且准确。

Gemini CLI 入门:

设置 Gemini CLI 非常简单:

  1. 先决条件:确保你的系统上已安装 Node.js 18 或更高版本。

  2. 安装:你可以直接使用 npx 运行 CLI:

    npx https://github.com/google-gemini/gemini-cli
    
    或者,进行持久安装:
    npm install -g @google/gemini-cli
    gemini
    

  3. 身份验证:CLI 将提示你使用个人谷歌账户进行身份验证,为你提供充足的模型请求配额。

对于更高的限额或特定模型的使用,你可以从 Google AI Studio 生成API密钥,并将其设置为环境变量(export GEMINI_API_KEY="你的API密钥")。

实用示例:

Gemini CLI 的真正强大之处在于其实际应用:

  • 新项目初始化cd new-project/ && gemini > Write me a Gemini Discord bot that answers questions using a FAQ.md file I will provide (进入新项目目录,并让Gemini编写一个Discord机器人,能根据我提供的FAQ.md文件回答问题)

  • 代码库摘要git clone https://github.com/google-gemini/gemini-cli && cd gemini-cli && gemini > Give me a summary of all of the changes that went in yesterday (克隆Gemini CLI,进入其目录,并让Gemini总结昨天所有提交的代码变更)

  • 代码实现草稿gemini > Implement a first draft for GitHub issue #123. (让Gemini为GitHub #123 问题实现一个初步草稿)

  • 工作流自动化gemini > Make me a slide deck showing the git history from the last 7 days, grouped by feature and team member. (让Gemini制作一个幻灯片,展示过去7天的Git历史,并按功能和团队成员分组)

  • 系统交互gemini > Convert all the images in this directory to png, and rename them to use dates from the exif data. (让Gemini将此目录中所有图片转换为PNG格式,并使用EXIF数据中的日期重命名它们)

Gemini CLI 是开发者工具向前迈出的激动人心的一步,它将命令行的灵活性与高级AI模型的智能相结合。它赋能开发者,使其能够直接从自己偏好的编码环境中以前所未有的效率进行自动化、分析和创作。

原创文章: 查看原文

分享本文