OpenLess:面向开发者的开源 AI 语音输入工具
停止打字,开始说话。OpenLess 是一款跨平台、注重隐私的工具,可将你的语音直接转化为结构化、经 AI 润色的文本,并自动输入到光标所在位置。
对于开发者和高阶用户来说,从“产生想法”到“将其输入编辑器”之间的阻力是真实存在的。虽然 Wispr Flow 和 Typeless 等商业工具普及了“按住说话,获取润色文本”的工作流,但它们往往伴随着订阅费用、闭源黑盒以及对数据去向的担忧。
隆重介绍 OpenLess:这是一款完全开源、本地优先的 macOS 和 Windows 替代方案,将 AI 驱动的语音听写功能直接带到你的光标处。
为什么 OpenLess 很重要
OpenLess 不仅仅是一个语音转文字工具,它更是一座生产力桥梁。其核心价值在于它的 AI 提示词模式 (AI-Prompt Mode)。它不会仅仅转录你的碎碎念,而是利用大语言模型(LLM)将你的语音重构为清晰、上下文丰富的提示词。
工作流程:
- 按住全局快捷键。
- 说出你的需求(例如:“我需要一个查询上个月订单的 SQL,按客户分组,并按金额降序排列。”)。
- 松开按键。
- 结果: 应用会自动转录、润色,并立即将结构化的提示词粘贴到你的 IDE、ChatGPT 或 Notion 中。
关键技术特性
OpenLess 基于 Tauri 2、Rust 和 React/TypeScript 构建,专为高性能和可扩展性而设计:
- 自带模型 (BYOM): 与 SaaS 竞争对手不同,你掌控整个流水线。你可以配置自己的火山引擎 (Volcengine) ASR API 密钥以及任何兼容 OpenAI 的 LLM 端点(如 DeepSeek、Ark、Anthropic 等)。
- 隐私至上: 数据保留在本地。凭据存储在操作系统原生的保险库中(macOS Keychain、Windows Credential Manager),而不是明文文件中。
- 本地优先架构: 该应用支持通过捆绑的 Qwen3-ASR 模型进行本地语音识别,确保即使在没有高延迟云连接的情况下也能进行听写。
- 智能词典: 你可以定义自定义术语、产品名称或技术术语。这些词汇会被注入到 ASR 上下文中作为热词,从而显著提高开发者特定词汇的识别准确率。
- 剪贴板兜底: 如果应用检测到无法向当前窗口注入文本(由于安全限制或特定应用的限制),它会自动将结果复制到剪贴板,确保你的工作成果不会丢失。
快速上手
OpenLess 既适合喜欢折腾的开发者,也适合追求稳定工具的用户。
面向终端用户
你可以从 GitHub Releases 获取最新版本。
- macOS:
brew install --cask openless - Windows: 使用提供的
.exe安装程序。
注意:安装后,请确保在系统设置中授予必要的辅助功能和麦克风权限。
面向开发者
如果你想贡献代码或从源码构建,该项目采用了简洁的模块化结构。开始步骤:
# 克隆并初始化子模块
git submodule update --init --recursive
# 安装依赖
cd openless-all/app
npm ci
# 以开发模式运行
npm run tauri dev
“结构化”的差异
大多数语音转文字工具追求逐字转录,而 OpenLess 追求的是 实用性。通过使用“润色”提供商,它会剔除口头禅(如“嗯”、“啊”、“那个”),修正标点符号,并将你的想法整理成要点或代码块。它不会试图回答你的问题,而是简单地整理你的输入,以便真正的 AI(ChatGPT/Claude)能够提供最佳的响应。
如果你厌倦了现代 AI 工具的订阅疲劳,并想要一个透明、可定制且快速的语音输入解决方案,OpenLess 是一个值得关注的项目。
来源
Open-Less/openless: 按住快捷键说话,松开即得润色后的文字。适用于 macOS 和 Windows 的开源语音输入工具。