Peekaboo:AI駆動のmacOS CLI(スクリーンショット&GUI用)

Peekaboo:AI駆動のmacOS CLI(スクリーンショット&GUI用)

AIがますます業務に組み込まれる現代、デスクトップを見て行動できる軽量かつスクリプト化可能なツールはゲームチェンジャーです。Peekaboo がそのツールです。無料でMITライセンス、macOS専用のコマンドラインインタフェース(CLI)およびオプションのMCPサーバーで、スクリーンショット取得、UI要素の検査、正確なコマンド送信を行い、GPTスタイルまたはローカルOllamaモデルを使って画面を解析します。

なぜ Peekaboo? 差別化ポイント

機能 動作内容 重要性
ピクセル単位の正確なキャプチャ ウィンドウ、メニュー、または画面全体のスクリーンショットを取得(Retinaスケールオプション付き) AIに必要な忠実度を提供し、信頼性の高い可視理解を可能にする
自然言語によるナビゲーション peekaboo "Open Notes and create a TODO list" のようなコマンド 非技術者が英語で自動化を作成できる
豊富なツールセット seeclicktypescrollmenudock など 各ツールはUIアクションに対応し、複雑なワークフローを可能にする
複数AIプロバイダー対応 GPT‑5.1、Claude 4.x、Grok 4‑fast、Gemini 2.5、ローカルOllama プライバシーや予算に合わせたモデルを選択できる
CLI + MCPサーバー 1つのバイナリでCLIスクリプトとClaude DesktopやCursorのプラグイン両方に対応 ダブルツール不要の汎用性
オープンソース、コミュニティ優先 2,000+ スター、アクティブな貢献者、MITライセンス ロックイン無し、フォークや機能追加が可能

Getting Started

1. macOS アプリと CLI のインストール

brew install steipete/tap/peekaboo

Homebrew フォーミュラはネイティブの Swift バイナリ、ドラッグ&ドロップで使用できる macOS アプリ、CLI ツールの Homebrew 管理コピーを含みます。

2. MCP サーバーとしてインストール(Node 22+)

JavaScript 環境から Peekaboo を実行したい、または Claude Desktop/Cursor の MCP インタフェースに統合したい場合:

npx -y @steipete/peekaboo

これによりデフォルトポートで MCP サーバーが起動し、好みのデスクトップ AI からリクエストを受け付けるようになります。

Quick‑Start Examples

以下は Peekaboo の最も一般的なユースケースを示すコマンドラインスニペットです。

# Retina 2x で画面全体をキャプチャし保存
peekaboo image --mode screen --retina --path ~/Desktop/screen.png
# Safari のスクリーンショットを取得し、スナップショット ID を抽出してラベルをクリック
snapshot_id=$(peekaboo see --app Safari --json-output | jq -r '.data.snapshot_id')
peekaboo click --on "Reload this page" --snapshot "$snapshot_id"
# 完全な自然言語自動化スクリプトを実行
peekaboo "Open Notes and create a TODO list with three items"
# CLI を使って現在の全ウィンドウを一覧表示
peekaboo list windows

4. .peekaboo.json Automation Scripts の作成

Peekaboo の run サブコマンドは、決定論的でテスト可能なワークフローを作成できます:

{
  "steps": [
    {"click": {"on": "Google Search", "app": "Safari"}},
    {"type": {"text": "OpenAI API", "delay_ms": 200}},
    {"press": {"key": "Enter", "repeat": 1}}
  ]
}

そして peekaboo run script.json を実行します。

カスタム AI モデルでツールを拡張

Peekaboo はデフォルトで GPT‑5.1 を使用しますが、PEEKABOO_AI_PROVIDERS 環境変数を設定するか peekaboo config add を使えば、OpenAI、Anthropic、xAI、Gemini、ローカル Ollama モデルを簡単に指定できます。

peekaboo config add openai/gpt-5.1
peekabou config add anthropic/claude-opus-4
peekaboo config add ollama/llava

JSON スクリプトやインタラクティブプロンプト内で、AI にスクリーンショット座標生成、ビジョン解釈、次のアクション提案を依頼できるようになります。

Common Use Cases

シナリオ Peekaboo がどのように役立つか
自動 UI テスト see で DOM‑似たツリーを取得し、clicktype アクションでユーザーフローをシミュレート、アサーションスクリプトを使ってスナップショットを比較
音声制御ワークフロー 音声認識出力を Peekaboo プロンプトにパイプし、AI が対象となる UI 要素を決定
デスクトップボット robotjsexpect などと組み合わせて macOS と AI を横断するエンド‑ツー‑エンド自動化
アクセシビリティ監査 see でアクセシビリティツリーを検査し、AI に報告書作成を依頼

Contributing & Community

Peekaboo は @steipete と数名のコントリビューターによって継続的にメンテナンスされています。新機能を追加したい、プルリクエストを送る、あるいは問題を報告したい場合は、CONTRIBUTING.md をご覧ください。

このプロジェクトの MIT ライセンスはフォーク、変更、配布を制限なく可能にし、趣味からプロフェッショナルまで幅広く利用できます。

Wrap‑Up

Peekaboo は生のスクリーンショットをプログラム可能な UI に変換します。1行で自動化する場合も、AI 主導のデスクトップアシスタントを構築する場合も、オープンソース CLI で生の力と AI インテリジェンスを無料で手に入ります。macOS 上で Grab して使い、あなたの生産性を急上昇させてください。

自動化をお楽しみください!

この記事を共有