Catégories
- Toutes les publications 549
- Projets Open Source Pratiques 478
- Articles Tutoriels 22
- Utilitaires en ligne 13
- Actualités IA 7
- Tiny Startups Showcase 7
- Claude Code Skills 6
- Modèles d'Invites 5
- Espaces Hugging Face 3
- OpenClaw Use Cases 3
- LLM Learning Resources 1
- Online AI Image Tools 1
- OpenClaw Master Skills Collection 1
- Rust Training Resources 1
- AI Short Drama Tools 1
- Mes favoris 0
Projets Open Source Pratiques
Projets Open Source Pratiques
OpenCLI : Transformez n'importe quel site web en outil CLI
Découvrez OpenCLI, l'outil CLI révolutionnaire qui transforme les sites web, applications Electron et outils locaux en interfaces en ligne de commande. Réutilisez en toute sécurité vos sessions de connexion Chrome tout en accédant à plus de 50 plateformes comme Bilibili, Twitter, Reddit, et plus encore. Parfait pour les agents IA avec zéro coût LLM, sorties déterministes et découverte automatique de CLI externes (gh, docker, obsidian). Installez via npm et commencez à transformer votre expérience navigateur en CLI dès aujourd'hui !
Recordly : Enregistreur d'écran open-source avec montage pro
Recordly révolutionne l'enregistrement d'écran avec des outils de montage professionnel intégrés. Capturez votre écran ou fenêtre, puis montez instantanément avec des zooms automatiques, effets de curseur fluides, superpositions webcam dynamiques, coupe timeline et cadres stylisés. Exportez des MP4 ou GIF polis prêts pour les tutoriels, démos et clips sociaux. Le support multiplateforme pour macOS, Windows et Linux le rend accessible à tous les développeurs et créateurs de contenu. Découvrez pourquoi 3,1k étoiles ne peuvent pas se tromper !
FFmpeg Auto-Builds : Binaires statiques Windows et Linux
Découvrez BtbN/FFmpeg-Builds, le dépôt GitHub ultime qui fournit des builds statiques FFmpeg quotidiens pour Windows (x86_64, ARM64) et Linux. Avec 10,6k étoiles, il offre des variantes GPL/LGPL/nonfree, des auto-releases et des builds personnalisés faciles basés sur Docker. Parfait pour les développeurs ayant besoin de binaires FFmpeg fiables et chargés en dépendances sans les maux de tête de la compilation. Apprenez à générer vos propres builds en quelques minutes.
Page Agent : Contrôlez les interfaces web avec un langage naturel
Découvrez Page Agent, l'agent GUI révolutionnaire en page d'Alibaba qui transforme les interfaces web en terrains de jeu en langage naturel. Pas d'extensions de navigateur, pas de Python, pas de navigateurs headless — juste de la magie JavaScript pure. Avec 10,5k étoiles GitHub et licence MIT, ce powerhouse TypeScript permet les copilotes IA SaaS, le remplissage intelligent de formulaires, les améliorations d'accessibilité et l'automatisation multi-pages. Intégrez en une ligne de code et exécutez des commandes comme 'Cliquez sur le bouton de connexion'. Parfait pour les développeurs construisant des expériences web intelligentes.
FunCineForge : Pipeline de doublage de films en zero-shot
Découvrez FunCineForge, la boîte à outils open-source révolutionnaire pour créer des datasets de doublage de films à grande échelle et déployer des modèles de doublage zero-shot. Ce pipeline de bout en bout gère le traitement vidéo, la séparation de la parole, la diarisation des locuteurs et les corrections multimodales avec des MLLMs. Construisez les datasets CineDub-CN/EN à partir de vidéos brutes et générez des doublages de haute qualité avec synchronisation labiale parfaite et correspondance de timbre. Inclut du code d'inférence, des échantillons de démo, et supporte le chinois et l'anglais. Parfait pour les chercheurs en IA et les créateurs de contenu.
VoiceChanger : Conversion vocale en temps réel open-source
Découvrez comment VoiceChanger vous permet de transformer la parole instantanément grâce à des modèles IA de pointe tels que Beatrice et RVC. Ce projet open-source dispose d’une interface graphique multiplateforme, d’une prise en charge Docker, d’un mode réseau et de tutoriels pour Linux AMD et Google Colab. Que vous soyez développeur de jeux, streamer ou amateur, apprenez à installer, configurer et mettre à jour le logiciel en quelques minutes et explorez le monde passionnant de la manipulation vocale en temps réel.
EasyOCR : une bibliothèque OCR rapide et multilingue pour Python
EasyOCR apporte la prise en charge de plus de 80 langues directement dans vos projets Python. Grâce à une simple installation pip, à des téléchargements de modèles légers et à une API intuitive, vous pouvez extraire du texte d’images en quelques secondes. Ce guide couvre tout, de l’utilisation de base et des ensembles linguistiques personnalisés à l’intégration Docker et au Hugging Face Space. Que vous développiez un outil de gestion de photos ou un pipeline d’entrée de données, EasyOCR vous offre la rapidité et la précision dont vous avez besoin.
VibeVoice : la suite d'IA vocale open-source de Microsoft
Explorez VibeVoice, l'outil open-source de pointe de Microsoft qui apporte la reconnaissance vocale longue (ASR), la synthèse vocale multi-voix (TTS) et le streaming en temps réel aux développeurs et chercheurs. Découvrez comment exploiter son pipeline ASR de 60 minutes, son TTS de 90 minutes, et son modèle en temps réel léger, ainsi que son intégration avec Hugging Face Transformers pour un déploiement sans effort.
RCLI : Assistant vocal IA sur l’appareil pour macOS – Zero‑Cloud, Rapide
RCLI transforme votre Mac en un assistant vocal entièrement local et en explorateur de documents. Propulsé par le moteur GPU MetalRT d’Apple Silicon, il exécute un STT, un LLM et un TTS à la pointe de la technologie en local – sans cloud, sans clés API. Découvrez comment l’installer avec Homebrew, contrôler 38 actions macOS, intégrer des PDF avec un RAG en moins de 4 ms, et tester MetalRT contre llama.cpp. Que vous soyez développeur, utilisateur avancé ou passionné d’IA, RCLI offre l’IA locale la plus avancée sur votre bureau avec un minimum de configuration. Découvrez pourquoi ce dépôt est un incontournable pour toute personne construisant des outils macOS basés sur la voix.
LiveTalking : Humain numérique IA en temps réel avec synchronisation labiale
Découvrez LiveTalking, la puissance open source pour créer des humains numériques interactifs en temps réel. Ce projet Python prend en charge plusieurs modèles (wav2lip, musetalk, ernerf) avec clonage vocal, streaming WebRTC et gestion des interruptions. Déployez via Docker, exécutez sur GPU avec des performances de 60+ FPS, et créez des avatars parlants de qualité commerciale. Parfait pour les streamers, éducateurs et développeurs IA à la recherche de solutions de synchronisation labiale prêtes pour la production.