タグ付きの投稿: OCR

Content related to OCR

DeepSeek-OCR:OCR向け高度Vision-Languageモデル

October 21, 2025

DeepSeek AIが開発した最先端のオープンソースプロジェクト、DeepSeek-OCRをご紹介します。これは、堅牢な光学文字認識(OCR)とビジュアルテキスト圧縮を目的としています。このプロジェクトは、LLM中心の視点からビジョンエンコーダーの役割を探求する強力なAIモデルを提供し、ドキュメントのMarkdownへの変換、図の解析、一般的な画像記述において素晴らしい能力を発揮します。TinyからGundamまで、さまざまな解像度モードを探索し、vLLMやTransformersを使ってこれらを実装し、高性能な推論を実現する方法を学びましょう。DeepSeek-OCRは、ビジュアルテキスト理解の限界を押し広げ、高度なOCRを開発者や研究者が利用できるようにすることを目指しています。

Dango-Translator:リアルタイムOCR・漫画翻訳ソフト

June 27, 2025

リアルタイムで言語の壁を打ち破るオープンソースのOCRツール、「Dango-Translator」をご紹介します。 海外のゲームをプレイしている時も、未翻訳のウェブサイトを閲覧している時も、あるいは生の漫画を読んでいる時でも、この強力なWindowsソフトウェアが画面上のテキストを瞬時に認識し、翻訳します。 漫画向けの高度な画像処理機能(テキスト認識、消去、そして再埋め込み機能を含む)に加え、15種類もの多様な翻訳ソースに対応。さらに設定はクラウドに保存できるため、シームレスな利用が可能です。Dango-Translatorは、「生(なま)」のコンテンツを効率的に扱うための最適なソリューションを提供します。 この実用的なプロジェクトが、あなたのデジタル体験をいかに変革するか、ぜひご自身の目でお確かめください。これまでアクセスが難しかったコンテンツも瞬時に理解できるようになり、多言語メディアとの関わりがより豊かなものとなるでしょう。