【Python編】OCRプログラミング入門講座 – 日本人のための人工知能プログラマー入門講座(機械学習)
OCR(Optical Character Recognition:光学文字認識)プログラミングの入門的な内容のコンテンツを作成しました。
これからOCRプログラミングを始めてみたい方の、何かしらの参考になることがありましたら幸いです。
Tesseractの「ReleaseNotes」
:https://github.com/tesseract-ocr/tesseract/wiki/ReleaseNotes
をみてみるとオープンソース版(Apache License 2.0)が、2006年から現在(2019年時点)まで長期にわたり開発が続けられているようです。
文字認識精度が向上してきたのは2018年に公開されたV4.0.0(LSTM:Long Short-Term Memoryに基づいたニューラルネットワークシステムを使用するOCRエンジンの追加)あたりのようです。OCRプログラミングを学ぶ立場からすると、少しプログラムを変更するだけで文字認識精度が向上するのを体験できてしまう、面白い時代なのではないかと感じます。
【Python:OCRプログラミング入門】
Google ColaboratoryのJupyterノートブックの開発環境で、OCRエンジンの「Tesseract OCR」(テッセラクトOCR)とPython用のOCRツールラッパーの「PyOCR」を使って光学文字認識プログラミングを実施しています。
無料でここまでの精度のプログラミングができてしまうとは…
すごい時代になりましたね。
「Tesseract OCR」の今後の開発の進歩も楽しみです。
・【Python編】OCRプログラミングをはじめてみよう(Tesseract OCR)
・【Python編】OCRプログラミング:日本語縦書き対応版(Tesseract OCR)
・【Python編】OCRプログラミング:特定の領域(画像の一部分)を指定(Tesseract OCR)
・【Python編】OCRプログラミング:日本語の手書き文字認識(Tesseract OCR)