【Python編】OCRプログラミング入門講座 – OCRプログラミングをはじめてみよう
Google ColaboratoryのJupyterノートブックの開発環境で、OCRエンジンの「Tesseract OCR」(テッセラクトOCR)とPython用のOCRツールラッパーの「PyOCR」(パイOCR)を使って光学文字認識プログラミングを実施してみましょう。
【Python】OCRプログラミングをはじめてみよう。
Tesseract OCR・PyOCR・Google Colaboratoryで光学文字認識入門
視聴時間:2分20秒
比較的簡単なOCR(Optical Character Recognition:光学文字認識)プログラミングのチュートリアル動画を作成してみました。
Google ColaboratoryのJupyterノートブックでOCRエンジンの「Tesseract OCR」(テッセラクトOCR)とPython用のOCRツールラッパーの「PyOCR」を使って光学文字認識プログラミングを実施しています。比較的に簡単にOCRが実行出来てしますのですごいですね。Tesseract OCRを使った今回のプログラムでは、日本語の縦書きなどの認識精度は低そうでした。
縦書き対応版のプログラムも公開中です。
:【Python編】OCRプログラミング:日本語縦書き対応版(Tesseract OCR)
Pythonサンプルコード
すぐに使えるサンプルコードリンク:
OCR-basic-sample.ipynb(Google ColaboratoryのJupyterノートブック)
サンプルコードの使い方は動画を参照ください。
***** サンプルコード:はじめ ******
#OCRエンジンの「 Tesseract OCR 」(テッセラクトOCR)をインストールします。
!apt install tesseract-ocr libtesseract-dev tesseract-ocr-jpn
#PyOCRをインストールします。
!pip install pyocr
#OCR実行する画像をアップロードします。(アップロード後、画像を確認します)
#「ocr5.png」のところを変更して使ってみてください。
from IPython.display import Image,display_png
display_png(Image('ocr5.png')) #ここを変更
#OCRに挑戦
#「ocr5.png」のところを変更して使ってみてください。
from PIL import Image
import pyocr
import pyocr.builders
tools = pyocr.get_available_tools()
#OCRが使えるかチェック
if len(tools) == 0:
print('OCRツールが使えません')
sys.exit(1)
tool = tools[0]
print("インストールされているOCRツールは', %s" % (tool.get_name()) ,'です。\n Tesseract(テッセラクト)は光学文字認識のエンジンです。\n\n')
langs = tool.get_available_languages()
print(langs,'などの言語を指定できます。')
# OCRを実行する画像イメージや言語指定、オプション指定
txt = tool.image_to_string(
Image.open('ocr5.png'), #ここを変更
lang='eng+jpn',
builder=pyocr.builders.TextBuilder()
)
print('\n\nOCR(光学文字認識)の実行結果\n\n\n__________________\n\n',txt, '\n\n__________________\n\n')
***** サンプルコード:ここまで ******