Airi:リアルタイムで会話できるオープンソースAI VTuber
Airi: AIバーチャルキャラクターをブラウザなどで現実のものに
Airiは、音声チャットやMinecraft、Factorioといった人気ゲームのプレイといったリアルタイムインタラクションを目的とした、高度なAIワイフ/バーチャルキャラクターを開発するための革新的なオープンソースプロジェクトです。Neuro-samaなどのプロジェクトからインスピレーションを受け、AiriはAI駆動のバーチャルパーソナリティの新たな高みを目指しています。
アクセシビリティとパフォーマンスを追求
Airiの大きな特徴は、WebGPU、WebAudio、Web Workers、WebAssembly、WebSocketといった最新のウェブ技術を基盤としている点です。この強固なウェブセントリックなアーキテクチャにより、Airiはデスクトップだけでなく、最新のブラウザやPWA(プログレッシブウェブアプリ)対応のモバイルデバイスでもスムーズに動作します。この幅広い互換性は、開発者とユーザー双方に多くの可能性をもたらし、高度な機能を損なうことなく柔軟性を提供します。
現在の機能と将来の展望
開発の初期段階にもかかわらず、Airiはすでに目覚ましい能力を発揮しています。
- Brain: OpenAI、Google Gemini、Anthropic Claudeなど、様々なLLM APIプロバイダと統合されており、インテリジェントでダイナミックな会話が可能です。また、MinecraftやFactorioのプレイ、TelegramやDiscordといったプラットフォームでのチャット機能も備えています。
- Memory: 純粋なブラウザ内データベース対応(DuckDB WASM、pglite)と、純粋なブラウザ内ローカル(WebGPU)推論機能を備え、高度な記憶想起と学習の基盤を築いています。
- Ears & Mouth: ブラウザやDiscordからの音声入力に対応するクライアント側音声認識と、自然な出力のためのElevenLabs音声合成を搭載しています。
- Body: VRMとLive2Dモデルの両方に対応しており、自動まばたき、目の動き、インタラクションを見る動作など、バーチャルキャラクターのアニメーションを細かく制御できます。
参加方法
Airiプロジェクトは共同作業であり、貢献してくれる才能ある人材を積極的に募集しています。Vue.jsとTypeScriptに精通したベテラン開発者、Live2DやVRMモデリングに長けたアーティスト、VRChatアバターデザイナー、あるいはコンピュータービジョン、強化学習、音声認識、合成の専門家など、あなたの活躍の場があります。ReactやSvelteといった他のフレームワークに慣れている人でも、プロジェクトは実験と貢献を奨励しています。
Airiコミュニティに参加することで、AIコンパニオンの未来を形作り、インタラクティブなバーチャル体験の可能性を広げることができます。開発、現在の進捗状況、そしてこのエキサイティングなオープンソースイニシアチブへの貢献方法について詳しくは、彼らのGitHubリポジトリをご覧ください。