Articles étiquetés avec: OCR
Content related to OCR
DeepSeek-OCR : un modèle vision-langage avancé pour l'OCR
Découvrez DeepSeek-OCR, un projet open source innovant de DeepSeek AI, conçu pour une reconnaissance optique de caractères (OCR) robuste et une compression visuelle de texte. Ce projet propose un modèle d'IA puissant qui étudie le rôle des encodeurs visuels d'un point de vue centré sur les grands modèles de langage (LLM). Il offre des capacités impressionnantes pour la conversion de documents en Markdown, l'analyse de figures et la description d'images générales. Explorez ses différents modes de résolution, de Tiny à Gundam, et apprenez à l'implémenter en utilisant vLLM ou Transformers pour une inférence haute performance. DeepSeek-OCR vise à repousser les limites de la compréhension visuo-textuelle, rendant l'OCR avancé accessible aux développeurs et aux chercheurs.
Traducteur Dango : Logiciel d'OCR et de traduction de BD en temps réel
Découvrez Dango-Translator, un outil open source basé sur l'OCR, conçu pour briser les barrières linguistiques en temps réel. Que vous jouiez à des jeux étrangers, naviguiez sur des sites web non traduits ou lisiez des bandes dessinées originales, ce puissant logiciel Windows capture et traduit instantanément le texte affiché sur votre écran. Doté d'un traitement d'image avancé pour les bandes dessinées (incluant la reconnaissance, l'effacement et la réintégration du texte), de la prise en charge de 15 sources de traduction différentes, et de paramètres sauvegardés dans le cloud, Dango-Translator offre une solution fluide et efficace pour gérer le contenu «brut». Découvrez comment cette solution pratique peut transformer votre expérience numérique, rendant le contenu inaccessible instantanément compréhensible et enrichissant votre expérience des contenus multilingues.