OpenLess: 開発者向けのオープンソースAI音声入力ツール

タイピングをやめて、話そう。OpenLessは、あなたの声をAIで構造化・洗練されたテキストに変換し、カーソル位置に直接出力する、プライバシー重視のクロスプラットフォームツールです。

開発者やパワーユーザーにとって、「アイデアがある」状態から「エディタに書き出す」までの摩擦は現実的な課題です。Wispr FlowやTypelessのような商用ツールが「プッシュ・トゥ・トークで洗練されたテキストを得る」ワークフローを普及させましたが、これらにはサブスクリプション料金、クローズドソースのブラックボックス化、データがどこへ行くのかという懸念がつきまといます。

そこで登場したのが OpenLess です。これはmacOSとWindows向けの完全オープンソースかつローカルファーストな代替ツールで、AIを活用した音声入力をあなたのカーソル位置に直接提供します。

OpenLessが重要な理由

OpenLessは単なる音声認識ツールではなく、生産性を高める架け橋です。その最大の価値は AIプロンプトモード にあります。単にあなたの話した内容を書き起こすだけでなく、LLMを使用して、あなたの言葉を整理されたコンテキスト豊富なプロンプトに再構築します。

ワークフロー:

  1. グローバルホットキーを長押しします。
  2. リクエストを話します(例:「先月の注文データを顧客ごとにグループ化し、金額の降順で並べ替えたSQLクエリが必要」)。
  3. キーを離します
  4. 結果: アプリが書き起こし、洗練させ、構造化されたプロンプトをIDE、ChatGPT、またはNotionに即座に貼り付けます。

主な技術的特徴

Tauri 2、Rust、React/TypeScript で構築されたOpenLessは、パフォーマンスと拡張性を重視して設計されています:

  • モデルの持ち込み: SaaS競合製品とは異なり、パイプラインを完全に制御できます。Volcengine (ASR) や、OpenAI互換のあらゆるLLMエンドポイント(DeepSeek、Ark、Anthropicなど)のAPIキーを設定可能です。
  • プライバシーファースト: データはすべてローカルで処理されます。認証情報はプレーンテキストファイルではなく、OS標準の保管場所(macOS Keychain、Windows Credential Manager)に保存されます。
  • ローカルファースト設計: バンドルされたQwen3-ASRモデルによるローカルASRをサポートしており、高遅延なクラウド接続がない環境でも音声入力が可能です。
  • スマート辞書: カスタム用語、製品名、専門用語を定義できます。これらはホットワードとしてASRコンテキストに注入され、開発者特有の語彙の認識精度を大幅に向上させます。
  • クリップボードへのフォールバック: セキュリティ制限やアプリ固有の制限により現在のウィンドウにテキストを注入できない場合、自動的に結果をクリップボードにコピーするため、作業内容が失われることはありません。

はじめ方

OpenLessは、カスタマイズしたい開発者と、安定したツールを求めるユーザーの両方に向けて設計されています。

エンドユーザー向け

最新のリリースは GitHub Releases から入手できます。

  • macOS: brew install --cask openless
  • Windows: 提供されている .exe インストーラーを使用してください。

注意: インストール後、OSの設定で必要なアクセシビリティとマイクの権限を許可してください。

開発者向け

貢献したい、またはソースからビルドしたい場合、プロジェクトはクリーンなモジュール構造を採用しています。開始するには以下を実行してください:

# サブモジュールの更新と初期化
git submodule update --init --recursive

# 依存関係のインストール
cd openless-all/app
npm ci

# 開発モードで実行
npm run tauri dev

「構造化」という違い

ほとんどの音声認識ツールは逐語的な書き起こしを目指しますが、OpenLessは 実用性 を目指します。「洗練(Polish)」プロバイダーを使用することで、フィラーワード(「えーと」「その」など)を取り除き、句読点を修正し、思考を箇条書きやコードブロックに整理します。質問に直接答えるのではなく、実際のAI(ChatGPT/Claude)が最適な回答を提供できるように入力を整える役割を果たします。

現代のAIツールのサブスクリプション疲れを感じており、透明性が高く、ハック可能で高速な音声入力ソリューションを求めているなら、OpenLessは注目すべきプロジェクトです。

ソース

Open-Less/openless: Hold a key, speak, release — AI-polished text appears at your cursor in any app. Open-source voice input for macOS & Windows. (按住快捷键说话,松开即得润色后的文字)