MimiClaw:$5 の ESP32‑S3 チップ上にある小型 AI アシスタント

MimiClaw:$5 の ESP32‑S3 チップ上にある小型 AI アシスタント

世界初の、$5 だけで動作する単一ボードのチャットボットです。MimiClaw は Claude の会話力、ローカルメモリ、柔軟なツール使用プロトコルをエッジに持ち込み、質問への回答、タスクのスケジューリング、Web ブラウジング(Telegram ボットを介して)すべてを実現します。

なぜ MimiClaw がゲームチェンジャーなのか

  • ゼロボルト – 100% 純粋 C コードを ESP32‑S3 にコンパイル。Linux も Node.js も外部サーバーも不要。
  • コストとサイズ – 16 MB フラッシュ、8 MB PSRAM のデベロップメントボード (~$10) で、片指サイズのチップに収容。
  • プライバシー優先 – データは内部フラッシュにすべて保存され、クラウドへアップロードされることはありません。
  • 省エネ – USB 5 V で動作し、0.5 W 未満。24/7 でオンラインを保つことが可能。
  • 拡張可能 – Web 検索(Brave Search API)、現在時刻取得、OTA ファームウェア更新、WebSocket ゲートウェイ、HTTP プロキシをサポート。

システム概要

MimiClaw は OpenClaw アーキテクチャを中心に構築されています。Telegram API を介してメッセージが届いた際に、ESP32‑S3 は以下の手順で処理します。

  1. Wi‑Fi 経由でメッセージを取得。
  2. Claude にテキストを渡し、Anthropic API を通じて処理。
  3. ReAct ループを実行:Claude はツール(例:web_search、get_current_time)を呼び出し、タスクが完了するまで繰り返します。
  4. ユーザーへ返信をストリーム送信。

すべてのセッションデータ(チャット履歴、メモリファイル、ログ)はフラッシュ上のプレーンテキストファイルとして保持されます。

  • SOUL.md はボットの個性を制御します。
  • USER.md はユーザー設定を保存します。
  • MEMORY.md は長期知識を保持します。
  • 日次ログは日付ごとに保存されます。

ファームウェアは 2 つの CPU コアに分割され、1 コアはネットワーク I/O、2 コアは AI 推論とツール実行を担当し、スムーズな動作を実現します。

クイックスタートガイド

初めての MimiClaw を動かす手順をステップバイステップで紹介します。

  1. ハードウェア – 16 MB フラッシュ / 8 MB PSRAM の ESP32‑S3 デベロップメントボード(例:Xiaozhi AI ボード)を購入し、USB‑C ケーブルを用意。
  2. ソフトウェア – 公式ガイドに従い ESP‑IDF 5.5+ をインストール。
  3. リポジトリをクローン
    git clone https://github.com/memovai/mimiclaw.git
    cd mimiclaw
    idf.py set-target esp32s3
    
  4. 秘密情報を設定 – サンプルファイルをコピーし、認証情報を書き込む。
    cp main/mimi_secrets.h.example main/mimi_secrets.h
    
  5. MIMI_SECRET_WIFI_SSID – Wi‑Fi SSID
  6. MIMI_SECRET_WIFI_PASS – Wi‑Fi パスワード
  7. MIMI_SECRET_TG_TOKEN – Telegram ボットトークン(@BotFather から取得)
  8. MIMI_SECRET_API_KEY – Anthropic API キー
  9. (オプション) MIMI_SECRET_SEARCH_KEY – Brave Search API キー
  10. ビルド & フラッシュ
    idf.py fullclean && idf.py build
    idf.py -p <PORT> flash monitor
    
  11. 操作 – Telegram でボットにメッセージを送ると、1 分以内に回答を受け取れます。

ランタイム設定

デバイス起動後、シリアル CLI を介して設定を調整できます。 * wifi_set SSID PASS – Wi‑Fi を切替 * set_tg_token TOKEN – Telegram トークンを変更 * set_api_key KEY – Anthropic キーまたは LLM モデルを変更 * set_proxy IP PORT – HTTP プロキシを設定 * set_search_key KEY – Web 検索を有効化 * config_show – 現在のランタイム設定を表示 * memory_read / memory_write "text" – 長期メモリの閲覧・編集

設定は NVS フラッシュに永続化され、再起動しても保持されます。

使い方と例

個人知識ベース

MEMORY.md にメモを追加したり、アシスタントに事実を追加してもらうことで、再起動間でも情報を保持します。

タスク自動化

ReAct ループを利用して MimiClaw にイベントをスケジュールしたり、メールを送信したり、API からデータを取得したりできます。すべてシンプルなメッセージで実行。

ブラウジング・ファクトチェック

Brave Search を有効化し、最新ニュースを検索すると、外部サーバーへクエリを露出せずに最新データを取得できます。

教育プロジェクト

学生は LLM が制約のあるハードウェアとどのように相互作用するかを学び、OTA 更新プロセスを研究し、独自ツールのためにアーキテクチャをカスタマイズできます。

今後のロードマップ

MimiClaw リポジトリには既に docs/TODO.md があり、以下の機能が計画されています。 * 拡張されたツールセット(例:ファイル I/O、GPS、センサーデータ) * 追加の LLM プロバイダーのサポート * HTTP/WebSocket を介した UI ゲートウェイでリッチフロントエンドを実現 * 8 MB フラッシュ版のパフォーマンス最適化

オープンソースの貢献者は、これらの機能構築、メモリ処理の微調整、他のマイクロコントローラへの MimiClaw カスタマイズを歓迎します。

まとめ

MimiClaw は、$5 の ESP32‑S3 にマッチするパワフルかつプライバシー第一の AI アシスタントが実現できることを示しています。サーバー不要ですべてローカル、完全オープンソース。趣味人、教育者、初期採用開発者など、エッジ AI と組込み会話エージェントへの実践的な入り口として最適です。

コードを探索し、メモリファイルを調整し、独自のボットを自分で学習させましょう。データは安全に、オフラインで保護されます。

この記事を共有