Edge-TTS : Synthèse vocale gratuite depuis Python

Exploiter la puissance de la synthèse vocale de Microsoft Edge avec la bibliothèque Python edge-tts

Pour les développeurs à la recherche d'une solution polyvalente et gratuite de synthèse vocale (TTS), la bibliothèque Python edge-tts constitue une offre open-source exceptionnelle. Ce projet exploite intelligemment le service TTS en ligne de Microsoft Edge, permettant aux utilisateurs de convertir du texte en parole directement depuis leurs applications Python, sans nécessiter de matériel spécialisé, de dépendances du système d'exploitation Windows ou de clés API coûteuses.

Installation et utilisation simplifiées

Commencer avec edge-tts est un jeu d'enfant. Une simple commande pip install edge-tts suffit à intégrer ses fonctionnalités dans votre environnement de développement. Pour ceux qui utilisent principalement l'interface en ligne de commande, pipx install edge-tts est une alternative recommandée.

La bibliothèque propose une interface en ligne de commande conviviale pour une génération audio rapide. Vous pouvez facilement créer des fichiers audio et leurs fichiers de sous-titres correspondants avec des commandes telles que :

$ edge-tts --text "Bonjour le monde !" --write-media hello.mp3 --write-subtitles hello.srt

Pour une lecture immédiate, la commande edge-playback peut être utilisée :

$ edge-playback --text "Bonjour le monde !"

Il convient de noter que edge-playback nécessite le lecteur en ligne de commande mpv pour la lecture, sauf sur les systèmes Windows.

Personnalisation et sélection des voix

edge-tts brille par sa flexibilité. Vous pouvez facilement basculer entre le vaste éventail de voix prises en charge par le service de Microsoft en utilisant l'option --voice. Pour explorer les voix disponibles et leurs caractéristiques, exécutez simplement :

$ edge-tts --list-voices

Cette commande affiche une liste complète des voix, y compris leurs noms, genres, catégories de contenu et personnalités vocales, vous permettant de sélectionner le profil vocal idéal pour vos besoins.

De plus, l'ajustement fin de la sortie vocale est facilement réalisable. Des paramètres tels que le débit de la parole, le volume et la tonalité peuvent être ajustés à l'aide des options --rate, --volume et --pitch, respectivement. Une attention particulière est nécessaire lors de l'utilisation de valeurs négatives, où vous devez ajouter un signe pourcentage (par exemple, --rate=-50%) pour éviter toute mauvaise interprétation par la ligne de commande.

Intégration programmatique

Au-delà de son utilité en ligne de commande, edge-tts est conçu pour une intégration transparente dans les projets Python. Les développeurs peuvent importer et utiliser le module directement dans leur code, ouvrant la voie à la création de fonctionnalités de synthèse vocale dynamiques dans un large éventail d'applications, des bots interactifs aux outils de création de contenu.

Plusieurs autres projets, tels que hass-edge-tts et Podcastfy, exploitent déjà la puissance du module edge-tts, démontrant sa praticité et son adoption généralisée au sein de la communauté des développeurs.

Avec ses fonctionnalités robustes, sa facilité d'utilisation et sa nature open-source, edge-tts s'impose comme un outil précieux pour quiconque cherche à intégrer des capacités de synthèse vocale de haute qualité et accessibles dans ses projets Python.

Original Article: Voir l’original

Partager cet article