最近、LLMへのRAGを用いた文書データの連携等を目的に海外を中心にOCRや文書画像解析技術に関連する新しいサービスが活発にリリースされています。 しかし、その多くは日本語をメインターゲットに開発されているわけではありません。日本語文書は ...
AI開発企業のMistral AIが、スキャンしたドキュメントや手書き文字を認識してテキストデータに変換できるAIモデル「Mistral OCR 3」を発表しました。Mistral OCR ...
英語のゲームをやっているときに翻訳ツールを頼ろうと考えたのですが、テキストのフォントが独特なため既存の翻訳ツールでは上手く翻訳できませんでした。そこでゲーム画面のキャプチャ→文字読み取り→翻訳までをPythonで自動化しました. ゲームの ...
PDFを開いたときに、検索機能が使えず、テキストのハイライトすらできないのは非生産的ですよね。 これはだいたい紙文書をスキャンしてPDFを作成した場合に起こります。テキストを単なるイメージとして認識してしまうのが原因です。 そんなとき ...