Magenta RT : Bibliothèque de génération musicale IA en temps réel par Google

Libérez votre créativité avec Magenta RT : Le générateur musical IA open-source de Google

Google DeepMind a dévoilé Magenta RT, une bibliothèque Python open-source révolutionnaire, appelée à transformer la façon dont musiciens et développeurs créent de la musique. Conçue pour la génération d'audio musical en direct directement sur votre appareil local, Magenta RT met à votre disposition des capacités avancées de synthèse sonore basées sur l'IA, servant de complément local à des systèmes puissants comme MusicFX DJ Mode et l'API Lyria RealTime.

Qu'est-ce que Magenta RT ?

À la base, Magenta RT est un outil sophistiqué mais accessible pour la génération audio en temps réel. Contrairement aux méthodes de production musicale traditionnelles, cette bibliothèque se concentre sur la création de musique « à la volée », offrant un aperçu de l'avenir des expériences musicales interactives. Elle permet la génération continue d'audio, ce qui la rend idéale pour les performances live, les installations interactives ou la création de contenu dynamique.

Comment ça fonctionne ?

Magenta RT fonctionne en générant de l'audio par courts segments gérables, d'environ 2 secondes, basés sur une quantité limitée de contexte passé. Pour garantir une expérience d'écoute fluide, elle utilise astucieusement le crossfade pour atténuer tout artefact lié aux transitions entre ces segments générés. Cette approche innovante permet une création musicale fluide et continue sans coupures perceptibles.

La bibliothèque intègre plusieurs modèles d'IA de pointe pour atteindre ses capacités :

  • MusicCoCa pour le mélange de styles : Cette fonctionnalité puissante permet aux utilisateurs de fusionner sans effort différents styles de texte et d'audio. MusicCoCa, un modèle d'intégration conjointe de texte et d'audio, conditionne Magenta RT, permettant aux créateurs de combiner différentes influences de genres ou caractéristiques sonores à l'aide de prompts pondérés. Imaginez mélanger du « heavy metal » avec votre mélodie de jazz préférée – MusicCoCa le rend possible.
  • SpectroStream pour la tokenisation audio haute fidélité : La qualité de Magenta RT repose sur SpectroStream, un modèle de codec audio discret qui traite de la musique haute fidélité à 48 kHz stéréo. En modélisant les tokens audio de SpectroStream à l'aide d'un modèle de langage, Magenta RT garantit que la sortie générée conserve une clarté et des détails remarquables.

Premiers pas avec Magenta RT

Google DeepMind a rendu la prise en main de Magenta RT incroyablement simple :

  1. Démo Colab : Le moyen le plus rapide de découvrir Magenta RT est via sa démo officielle Colab. Ceci vous permet d'exécuter la bibliothèque en temps réel sur des TPU accessibles gratuitement, sans nécessiter aucune installation locale hormis un navigateur web.
  2. Installation locale : Pour ceux qui préfèrent travailler localement ou qui nécessitent des configurations matérielles spécifiques, Magenta RT peut être installé avec le support GPU ou TPU via pip. Une option uniquement CPU est également disponible, la rendant polyvalente pour divers environnements de développement.

Que vous soyez un chercheur en IA, un producteur de musique à la recherche d'outils novateurs, ou un développeur désireux d'intégrer l'IA dans des applications audio, Magenta RT offre une nouvelle voie prometteuse pour l'expression créative.

Open-source et paré pour l'avenir

Magenta RT est publiée sous une combinaison de licences : le code source est licencié sous Apache 2.0, tandis que les poids du modèle relèvent de la licence Creative Commons Attribution 4.0 International. Cette approche open-source encourage les contributions de la communauté et favorise l'innovation.

En tant qu'« aperçu », Magenta RT est toujours en évolution, avec des fonctionnalités à venir prévues, notamment un rapport technique, des environnements Colab pour le réglage fin, et le conditionnement sur l'entrée audio en temps réel. Ce projet témoigne de l'engagement de Google DeepMind à faire progresser l'IA dans les domaines créatifs.

Plongez dès aujourd'hui dans le monde de la génération musicale par IA en temps réel. Explorez le dépôt GitHub, essayez la démo Colab, et commencez à expérimenter avec Magenta RT pour en libérer tout le potentiel.

Original Article: Voir l’original

Partager cet article