标记为: OCR
Content related to OCR
DeepSeek-OCR:面向光学字符识别的先进视觉语言模型
October 21, 2025
探索 DeepSeek-OCR,这是 DeepSeek AI 推出的尖端开源项目,专为强大的光学字符识别(OCR)和视觉文本压缩而设计。该项目提供了一个功能强大的 AI 模型,它从以大型语言模型(LLM)为中心的视角,深入探讨了视觉编码器的作用,在将文档转换为 Markdown、解析图表以及生成通用图像描述方面展现了卓越的能力。了解其从 Tiny 到 Gundam 的多种分辨率模式,并学习如何使用 vLLM 或 Transformers 实现高性能推理。DeepSeek-OCR 旨在突破视觉文本理解的界限,让开发者和研究人员都能轻松应用先进的 OCR 技术。
团子翻译器:实时文字识别与漫画翻译软件
June 27, 2025
体验 Dango-Translator,一款开源的OCR工具,助您实时打破语言障碍。无论您是玩海外游戏、浏览生文网页,还是阅读生肉漫画,这款强大的Windows软件都能实时截取并翻译屏幕上的文字。它具备针对漫画的先进图像处理能力(含文字识别、信息抹除及二次嵌入功能),支持多达15个翻译引擎,并提供云端设置同步,为各类原生内容的翻译处理提供了无缝、高效的解决方案。探索这款实用工具如何改变您的数字体验,它能让原本无法理解的内容瞬间变得清晰易懂,并大大提升您与多语言媒体的互动体验。