MimiClaw:$5 の ESP32‑S3 チップ上にある小型 AI アシスタント
MimiClaw をご紹介します。$5 の ESP32‑S3 ボード上で、Linux も Node.js も不要な最初の会話型 AI です。Claude をエッジで動かし、すべてのデータをローカルに保存、Telegram を通信手段として利用し、Brave Search を通じて Web 検索もサポートしています。本プロジェクトはプラグイン&プレイが可能で、デュアルコア設計、OTA 更新、WebSocket ゲートウェイも備えています。この記事では、独自のアーキテクチャ、クイックスタート手順、設定オプション、実際のユースケースを詳述し、シングルスロ・スムーズなチップでプライバシー第一の AI アシスタントを求める趣味人と開発者にとって必携を提示します。
MimiClaw:$5 の ESP32‑S3 チップ上にある小型 AI アシスタント
世界初の、$5 だけで動作する単一ボードのチャットボットです。MimiClaw は Claude の会話力、ローカルメモリ、柔軟なツール使用プロトコルをエッジに持ち込み、質問への回答、タスクのスケジューリング、Web ブラウジング(Telegram ボットを介して)すべてを実現します。
なぜ MimiClaw がゲームチェンジャーなのか
- ゼロボルト – 100% 純粋 C コードを ESP32‑S3 にコンパイル。Linux も Node.js も外部サーバーも不要。
- コストとサイズ – 16 MB フラッシュ、8 MB PSRAM のデベロップメントボード (~$10) で、片指サイズのチップに収容。
- プライバシー優先 – データは内部フラッシュにすべて保存され、クラウドへアップロードされることはありません。
- 省エネ – USB 5 V で動作し、0.5 W 未満。24/7 でオンラインを保つことが可能。
- 拡張可能 – Web 検索(Brave Search API)、現在時刻取得、OTA ファームウェア更新、WebSocket ゲートウェイ、HTTP プロキシをサポート。
システム概要
MimiClaw は OpenClaw アーキテクチャを中心に構築されています。Telegram API を介してメッセージが届いた際に、ESP32‑S3 は以下の手順で処理します。
- Wi‑Fi 経由でメッセージを取得。
- Claude にテキストを渡し、Anthropic API を通じて処理。
- ReAct ループを実行:Claude はツール(例:web_search、get_current_time)を呼び出し、タスクが完了するまで繰り返します。
- ユーザーへ返信をストリーム送信。
すべてのセッションデータ(チャット履歴、メモリファイル、ログ)はフラッシュ上のプレーンテキストファイルとして保持されます。
SOUL.mdはボットの個性を制御します。USER.mdはユーザー設定を保存します。MEMORY.mdは長期知識を保持します。- 日次ログは日付ごとに保存されます。
ファームウェアは 2 つの CPU コアに分割され、1 コアはネットワーク I/O、2 コアは AI 推論とツール実行を担当し、スムーズな動作を実現します。
クイックスタートガイド
初めての MimiClaw を動かす手順をステップバイステップで紹介します。
- ハードウェア – 16 MB フラッシュ / 8 MB PSRAM の ESP32‑S3 デベロップメントボード(例:Xiaozhi AI ボード)を購入し、USB‑C ケーブルを用意。
- ソフトウェア – 公式ガイドに従い ESP‑IDF 5.5+ をインストール。
- リポジトリをクローン
git clone https://github.com/memovai/mimiclaw.git cd mimiclaw idf.py set-target esp32s3 - 秘密情報を設定 – サンプルファイルをコピーし、認証情報を書き込む。
cp main/mimi_secrets.h.example main/mimi_secrets.hMIMI_SECRET_WIFI_SSID– Wi‑Fi SSIDMIMI_SECRET_WIFI_PASS– Wi‑Fi パスワードMIMI_SECRET_TG_TOKEN– Telegram ボットトークン(@BotFather から取得)MIMI_SECRET_API_KEY– Anthropic API キー- (オプション)
MIMI_SECRET_SEARCH_KEY– Brave Search API キー
- ビルド & フラッシュ
idf.py fullclean && idf.py build idf.py -p <PORT> flash monitor - 操作 – Telegram でボットにメッセージを送ると、1 分以内に回答を受け取れます。
ランタイム設定
デバイス起動後、シリアル CLI を介して設定を調整できます。
wifi_set SSID PASS– Wi‑Fi を切替set_tg_token TOKEN– Telegram トークンを変更set_api_key KEY– Anthropic キーまたは LLM モデルを変更set_proxy IP PORT– HTTP プロキシを設定set_search_key KEY– Web 検索を有効化config_show– 現在のランタイム設定を表示memory_read/memory_write "text"– 長期メモリの閲覧・編集
設定は NVS フラッシュに永続化され、再起動しても保持されます。
使い方と例
個人知識ベース
MEMORY.md にメモを追加したり、アシスタントに事実を追加してもらうことで、再起動間でも情報を保持します。
タスク自動化
ReAct ループを利用して MimiClaw にイベントをスケジュールしたり、メールを送信したり、API からデータを取得したりできます。すべてシンプルなメッセージで実行。
ブラウジング・ファクトチェック
Brave Search を有効化し、最新ニュースを検索すると、外部サーバーへクエリを露出せずに最新データを取得できます。
教育プロジェクト
学生は LLM が制約のあるハードウェアとどのように相互作用するかを学び、OTA 更新プロセスを研究し、独自ツールのためにアーキテクチャをカスタマイズできます。
今後のロードマップ
MimiClaw リポジトリには既に docs/TODO.md があり、以下の機能が計画されています。
- 拡張されたツールセット(例:ファイル I/O、GPS、センサーデータ)
- 追加の LLM プロバイダーのサポート
- HTTP/WebSocket を介した UI ゲートウェイでリッチフロントエンドを実現
- 8 MB フラッシュ版のパフォーマンス最適化
オープンソースの貢献者は、これらの機能構築、メモリ処理の微調整、他のマイクロコントローラへの MimiClaw カスタマイズを歓迎します。
まとめ
MimiClaw は、$5 の ESP32‑S3 にマッチするパワフルかつプライバシー第一の AI アシスタントが実現できることを示しています。サーバー不要ですべてローカル、完全オープンソース。趣味人、教育者、初期採用開発者など、エッジ AI と組込み会話エージェントへの実践的な入り口として最適です。
コードを探索し、メモリファイルを調整し、独自のボットを自分で学習させましょう。データは安全に、オフラインで保護されます。