Tesseract OCRの「easyocr」というライブラリを用いて、画像(PNG形式)の文字抽出を今回はやっていく知識のシェアです。 最近MENTAで学んだことをとりまとめました。 今回のテーマ ①コマンドプロンプトやVSCODEでの設定方法 ②画像から文字抽出して、ExcelのCSV ...
Tesseract OCRとは? 手順1: コマンドプロンプトからTesseractを実行する方法 手順2: PythonからTesseract OCRを使う方法 PythonコードをVSCodeで実行する方法 今後の課題 日本語の読み取りとレイアウト保持の精度を上げるためのライブラリ POINTYOMITOKUライブラリは精度が良いらしいです!
サイバーエージェントは4月17日、AI研究者向けの技術研修資料を無料公開した。同社のAI研究機関「AI Lab」の技術研修で使った資料。研究者のためのPythonコーディング上のテクニックや、VSCodeのおすすめプラグイン、英語論文の書き方など15種類の資料を公開 ...
AIを用いて写真からテキストデータを抽出できる軽量ツール「NDLOCR-Lite」が2月24日、国会図書館の実験的なサービスを提供する「NDLラボ」の公式「GitHub」サイトで公開された。ライセンスは「CC BY 4.0」で、ソースコードも公開済み。適切なクレジット表示さえあれば商用を含め自由に利用できる。
Microsoftが開発している高機能なコードエディター「Visual Studio Code(VSCode)」とその拡張機能を活用し、データ分析に欠かせない「データ加工」を効率化するテクニックを紹介します。プログラミング言語はPythonを使います。