スキャナーでPDF化した書類から文字を取り出そうという試みを、時々端折りながら、最初から最後までその経緯をダラダラと書いた記事でございます。 溜め込んだ書類をドキュメントスキャナーでPDF化した。 さて、ファイル名をどうしようか。 書類の内容 ...
「にゃんぽう」という商品のHPに掲載してという依頼 兄が新規事業として猫用の漢方を販売したいと連絡があり その商品の情報をホームページに突貫で掲出してほしいと頼まれた PDFから 8 枚の画像を生成しました。 ページ 1 のOCR処理が完了しました。
AIを用いて写真からテキストデータを抽出できる軽量ツール「NDLOCR-Lite」が2月24日、国会図書館の実験的なサービスを提供する「NDLラボ」の公式「GitHub」サイトで公開された。ライセンスは「CC BY 4.0」で、ソースコードも公開済み。適切なクレジット表示さえあれば商用を含め自由に利用できる。
A ready-to-use workflow for converting documents into structured, machine-readable content. Point it at a PDF or image — either a URL or a local file — and get back the extracted text (as markdown), ...
Focus: Built for tasks like fraud detection where precision matters. We needed a universal tool for both PDF and image processing with best-in-class OCR support through local engines (EasyOCR, ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する