OpenLess:面向开发者的开源 AI 语音输入工具

停止打字,开始说话。OpenLess 是一款跨平台、注重隐私的工具,可将你的语音直接转化为结构化、经 AI 润色的文本,并自动输入到光标所在位置。

对于开发者和高阶用户来说,从“产生想法”到“将其输入编辑器”之间的阻力是真实存在的。虽然 Wispr Flow 和 Typeless 等商业工具普及了“按住说话,获取润色文本”的工作流,但它们往往伴随着订阅费用、闭源黑盒以及对数据去向的担忧。

隆重介绍 OpenLess:这是一款完全开源、本地优先的 macOS 和 Windows 替代方案,将 AI 驱动的语音听写功能直接带到你的光标处。

为什么 OpenLess 很重要

OpenLess 不仅仅是一个语音转文字工具,它更是一座生产力桥梁。其核心价值在于它的 AI 提示词模式 (AI-Prompt Mode)。它不会仅仅转录你的碎碎念,而是利用大语言模型(LLM)将你的语音重构为清晰、上下文丰富的提示词。

工作流程:

  1. 按住全局快捷键。
  2. 说出你的需求(例如:“我需要一个查询上个月订单的 SQL,按客户分组,并按金额降序排列。”)。
  3. 松开按键。
  4. 结果: 应用会自动转录、润色,并立即将结构化的提示词粘贴到你的 IDE、ChatGPT 或 Notion 中。

关键技术特性

OpenLess 基于 Tauri 2、Rust 和 React/TypeScript 构建,专为高性能和可扩展性而设计:

  • 自带模型 (BYOM): 与 SaaS 竞争对手不同,你掌控整个流水线。你可以配置自己的火山引擎 (Volcengine) ASR API 密钥以及任何兼容 OpenAI 的 LLM 端点(如 DeepSeek、Ark、Anthropic 等)。
  • 隐私至上: 数据保留在本地。凭据存储在操作系统原生的保险库中(macOS Keychain、Windows Credential Manager),而不是明文文件中。
  • 本地优先架构: 该应用支持通过捆绑的 Qwen3-ASR 模型进行本地语音识别,确保即使在没有高延迟云连接的情况下也能进行听写。
  • 智能词典: 你可以定义自定义术语、产品名称或技术术语。这些词汇会被注入到 ASR 上下文中作为热词,从而显著提高开发者特定词汇的识别准确率。
  • 剪贴板兜底: 如果应用检测到无法向当前窗口注入文本(由于安全限制或特定应用的限制),它会自动将结果复制到剪贴板,确保你的工作成果不会丢失。

快速上手

OpenLess 既适合喜欢折腾的开发者,也适合追求稳定工具的用户。

面向终端用户

你可以从 GitHub Releases 获取最新版本。

  • macOS: brew install --cask openless
  • Windows: 使用提供的 .exe 安装程序。

注意:安装后,请确保在系统设置中授予必要的辅助功能和麦克风权限。

面向开发者

如果你想贡献代码或从源码构建,该项目采用了简洁的模块化结构。开始步骤:

# 克隆并初始化子模块
git submodule update --init --recursive

# 安装依赖
cd openless-all/app
npm ci

# 以开发模式运行
npm run tauri dev

“结构化”的差异

大多数语音转文字工具追求逐字转录,而 OpenLess 追求的是 实用性。通过使用“润色”提供商,它会剔除口头禅(如“嗯”、“啊”、“那个”),修正标点符号,并将你的想法整理成要点或代码块。它不会试图回答你的问题,而是简单地整理你的输入,以便真正的 AI(ChatGPT/Claude)能够提供最佳的响应。

如果你厌倦了现代 AI 工具的订阅疲劳,并想要一个透明、可定制且快速的语音输入解决方案,OpenLess 是一个值得关注的项目。

来源

Open-Less/openless: 按住快捷键说话,松开即得润色后的文字。适用于 macOS 和 Windows 的开源语音输入工具。