タグ付きの投稿: Alibaba

Content related to Alibaba

Qwen3‑ASR: アリババのオープンソース52言語ASRモデル

January 31, 2026

Alibaba Cloudの最新リリース、Qwen3‑ASRは、オープンソースコミュニティに最先端の多言語音声認識を提供します。52言語と22の中国方言に対応し、1.7B/0.6Bの2モデルはベンチマークで優れた性能を示し、商用APIと肩を並べます。リポジトリには、transformerか高速vLLMバックエンドで動作する完全な推論ツールキット、Qwen3‑ForcedAlignerによる自動タイムスタンプ機能、そしてすぐに実行できるGradioデモが同梱されています。研究者・開発者・趣味のユーザーを問わず、本ガイドではQwen3‑ASRをダウンロードし、設定し、ベンチマークし、Dockerもしくは直接GPU上でデプロイする方法を案内します。これにより、音声・音楽・歌の文字起こしを容易に開始できます。

通義千問:アリババのオープンソースAIエージェント

September 19, 2025

Alibabaが開発した画期的なオープンソースAIエージェント「Tongyi DeepResearch」をご紹介します。この305億パラメータモデルは、トークンあたり33億パラメータという効率的なアクティベーションを持ち、長期間にわたる深い情報探索タスクに優れています。Humanity's Last ExamやBrowserCompといった様々なエージェント探索ベンチマークで最先端のパフォーマンスを発揮するTongyi DeepResearchは、WebAgentプロジェクトの進歩を基盤としています。自動合成データ生成、エージェントデータでの継続的プリトレーニング、堅牢な強化学習技術などの特徴をご覧ください。ReActやHeavy推論パラダイムとの互換性を活用して、独自のディープリサーチニーズに合わせてモデルをセットアップおよび実行する方法を学びましょう。