Catégories
- Toutes les publications 550
- Projets Open Source Pratiques 478
- Articles Tutoriels 22
- Utilitaires en ligne 13
- Actualités IA 7
- Tiny Startups Showcase 7
- Claude Code Skills 6
- Modèles d'Invites 5
- Espaces Hugging Face 3
- OpenClaw Use Cases 3
- LLM Learning Resources 1
- Online AI Image Tools 1
- OpenClaw Master Skills Collection 1
- Rust Training Resources 1
- AI Short Drama Tools 1
- AI Image Generate Maker 1
- Mes favoris 0
Publications marquées avec: OCR
Content related to OCR
EasyOCR : une bibliothèque OCR rapide et multilingue pour Python
EasyOCR apporte la prise en charge de plus de 80 langues directement dans vos projets Python. Grâce à une simple installation pip, à des téléchargements de modèles légers et à une API intuitive, vous pouvez extraire du texte d’images en quelques secondes. Ce guide couvre tout, de l’utilisation de base et des ensembles linguistiques personnalisés à l’intégration Docker et au Hugging Face Space. Que vous développiez un outil de gestion de photos ou un pipeline d’entrée de données, EasyOCR vous offre la rapidité et la précision dont vous avez besoin.
DeepSeek-OCR : un modèle vision-langage avancé pour l'OCR
Découvrez DeepSeek-OCR, un projet open source innovant de DeepSeek AI, conçu pour une reconnaissance optique de caractères (OCR) robuste et une compression visuelle de texte. Ce projet propose un modèle d'IA puissant qui étudie le rôle des encodeurs visuels d'un point de vue centré sur les grands modèles de langage (LLM). Il offre des capacités impressionnantes pour la conversion de documents en Markdown, l'analyse de figures et la description d'images générales. Explorez ses différents modes de résolution, de Tiny à Gundam, et apprenez à l'implémenter en utilisant vLLM ou Transformers pour une inférence haute performance. DeepSeek-OCR vise à repousser les limites de la compréhension visuo-textuelle, rendant l'OCR avancé accessible aux développeurs et aux chercheurs.
Traducteur Dango : Logiciel d'OCR et de traduction de BD en temps réel
Découvrez Dango-Translator, un outil open source basé sur l'OCR, conçu pour briser les barrières linguistiques en temps réel. Que vous jouiez à des jeux étrangers, naviguiez sur des sites web non traduits ou lisiez des bandes dessinées originales, ce puissant logiciel Windows capture et traduit instantanément le texte affiché sur votre écran. Doté d'un traitement d'image avancé pour les bandes dessinées (incluant la reconnaissance, l'effacement et la réintégration du texte), de la prise en charge de 15 sources de traduction différentes, et de paramètres sauvegardés dans le cloud, Dango-Translator offre une solution fluide et efficace pour gérer le contenu «brut». Découvrez comment cette solution pratique peut transformer votre expérience numérique, rendant le contenu inaccessible instantanément compréhensible et enrichissant votre expérience des contenus multilingues.