カテゴリ
- すべての投稿 549
- 実用的なオープンソースプロジェクト 478
- チュートリアル記事 22
- オンラインユーティリティ 13
- AIニュース 7
- Tiny Startups Showcase 7
- Claude Code Skills 6
- プロンプトテンプレート 5
- Hugging Face Spaces 3
- OpenClaw Use Cases 3
- LLM Learning Resources 1
- Online AI Image Tools 1
- OpenClaw Master Skills Collection 1
- Rust Training Resources 1
- AI Short Drama Tools 1
- お気に入り 0
タグ付けされた投稿: Voice AI
Content related to Voice AI
VibeVoice:Microsoftのオープンソース音声AIスイート
Explore VibeVoice, Microsoft’s cutting‑edge open‑source toolkit that brings long‑form ASR, multi‑speaker TTS, and real‑time streaming to developers and researchers. Learn how to harness its 60‑minute ASR pipeline, 90‑minute TTS, and lightweight real‑time model, and discover integration with Hugging Face Transformers for seamless deployment.
RCLI:macOS用オンデバイス音声AI – Zero-Cloud、高速
RCLI は、あなたの Mac を完全ローカル化した音声アシスタント&ドキュメント探索ツールに変えます。Apple Silicon の MetalRT GPU エンジンをパワーとし、最先端の STT、LLM、TTS をローカルで実行——クラウド不要、API キー不要。Homebrew でのインストール方法、38 個の macOS アクション制御、サブ 4 ms の RAG で PDF 埋め込み、MetalRT と llama.cpp のベンチマーク比べ方を紹介。開発者、パワーユーザー、AI 熱心者の皆さんへ。設定は最小限で、デスクトップにこれまでの最新ローカル AI を持ち込むことができます。repo への取り込む価値をぜひご確認ください。
NeuTTS Air:瞬時の音声クローン作成が可能なオンデバイスAI
Neuphonicが提供する画期的なオープンソース、オンデバイス型テキスト音声変換(TTS)モデル「NeuTTS Air」をご紹介します。この革新的なAIは、超リアルな音声合成と瞬時の音声クローン作成を、スマートフォンからRaspberry Piまで、お使いのローカルデバイスに直接もたらします。NeuTTS Airが0.5B LLMを基盤として、いかに自然な音声、リアルタイム性能、そして組み込みのセキュリティを実現しているかをご覧ください。その主要機能、対応言語、効率的なGGMLフォーマット、そしてこの強力な音声AIをプロジェクトに統合するためのクイックスタートガイドをご確認ください。