スキャナーでPDF化した書類から文字を取り出そうという試みを、時々端折りながら、最初から最後までその経緯をダラダラと書いた記事でございます。 溜め込んだ書類をドキュメントスキャナーでPDF化した。 さて、ファイル名をどうしようか。 書類の内容 ...
PDFは、もはや「閲覧するだけのファイル」ではありません。契約書の編集、資料作成、PDFからのテキスト抽出、OCRによる文字認識、さらには論文の要約など、ビジネスや学習のさまざまなシーンで活用されています。そのため、PDFをどれだけ効率よく扱えるかが、作業スピードや生産性に大きく影響するようになりました。 私自身、日常的にPDFの編集や形式変換を行う中で、「もっと簡単に、しかも正確に処理できるツー ...
こんにちは。AIで勘違いして何でも作ってみる部です。 これまで「Gemini・Genspark・CanvaPro・Feloを使ってNotebookLMで作成したスライドPDFを編集可能にする方法」や「GeminiとGASを使ってNotebookLMで作成したスライドを編集可能なパワーポイントにする方法」を実際に ...
紙の書類をスキャンして電子化するときに、テキストや数字を読み取ってデータを抽出する技術がOCR(Optical Character Recognition、光学式文字認識)だ。さまざまな種類の書類が電子保存されるようになったことで、その活用範囲は広がっている。特に経理部門 ...
プレゼン資料や見積書、契約書、企画書、役所の申請書類など、ビジネスでは、毎日のようにPDFファイルをやりとりしている。だが多くの人は、PDFを「閲覧するだけのもの」と思い込んでいないだろうか。実はPDFを編集・活用できる環境を整えるだけで、日々の業務効率は大きく変わるのだ。
株式会社Kdan Japan(日本本社:東京都千代田区、代表取締役社長:ケニー・スー、以下 Kdan)が提供する、ドキュメントの編集・管理など生産性を向上させるPDFアプリ「PDF Reader」が、Windows版にOCR機能を追加しました。従来のOCR機能とは異なり、ソフトウェア ...
AILEX合同会社(本社:東京都渋谷区、顧問弁護士事務所:弁護士法人えそら)は、AI法務支援SaaS「AILEX」に搭載するOCRエンジンのAIモデルを、従来のGPT-4からOpenAI社の最新モデルGPT-4.1/GPT5へ全面刷新したことをお知ら ...
スキャンしたPDFをExcel(.xlsx)形式に変換したいと考えたことはありませんか? スキャンPDFは画像として保存されているため、コピー&ペーストでは文字や表データを正確に取得できません。特に請求書や帳票、一覧表などは、手作業での入力が必要になり ...
OCR (Optical Character Recognition:光学文字認識)とは、画像やPDFに含まれる文字を読み取り、そのままテキストデータとして扱えるようにする技術です。これにAI技術を組み合わせることで、より高精度な文字認識が可能となり、様々な書類の自動入力を実現します。