【Python編】OCRプログラミングをはじめてみよう（Tesseract OCR）

Contents - 目次（もくじ）

1 【Python編】OCRプログラミング入門講座 – OCRプログラミングをはじめてみよう
- 1.1 【Python】OCRプログラミングをはじめてみよう。 Tesseract OCR・PyOCR・Google Colaboratoryで光学文字認識入門
  - 1.1.1 Pythonサンプルコード

【Python編】OCRプログラミング入門講座 – OCRプログラミングをはじめてみよう

Google ColaboratoryのJupyterノートブックの開発環境で、OCRエンジンの「Tesseract OCR」（テッセラクトOCR）とPython用のOCRツールラッパーの「PyOCR」（パイOCR）を使って光学文字認識プログラミングを実施してみましょう。

【Python】OCRプログラミングをはじめてみよう。
Tesseract OCR・PyOCR・Google Colaboratoryで光学文字認識入門

視聴時間：2分20秒

比較的簡単なOCR（Optical Character Recognition：光学文字認識）プログラミングのチュートリアル動画を作成してみました。

Google ColaboratoryのJupyterノートブックでOCRエンジンの「Tesseract OCR」（テッセラクトOCR）とPython用のOCRツールラッパーの「PyOCR」を使って光学文字認識プログラミングを実施しています。比較的に簡単にOCRが実行出来てしますのですごいですね。Tesseract OCRを使った今回のプログラムでは、日本語の縦書きなどの認識精度は低そうでした。

縦書き対応版のプログラムも公開中です。
：【Python編】OCRプログラミング：日本語縦書き対応版（Tesseract OCR）

Pythonサンプルコード

すぐに使えるサンプルコードリンク：
OCR-basic-sample.ipynb（Google ColaboratoryのJupyterノートブック）

サンプルコードの使い方は動画を参照ください。

＊＊＊＊＊　サンプルコード：はじめ　＊＊＊＊＊＊

#OCRエンジンの「 Tesseract OCR 」（テッセラクトOCR）をインストールします。
!apt install tesseract-ocr libtesseract-dev tesseract-ocr-jpn

#PyOCRをインストールします。
!pip install pyocr

#OCR実行する画像をアップロードします。（アップロード後、画像を確認します）
#「ocr5.png」のところを変更して使ってみてください。
from IPython.display import Image,display_png display_png(Image('ocr5.png')) #ここを変更

#OCRに挑戦
#「ocr5.png」のところを変更して使ってみてください。
from PIL import Image import pyocr import pyocr.builders

tools = pyocr.get_available_tools()

#OCRが使えるかチェック if len(tools) == 0: print('OCRツールが使えません') sys.exit(1)

tool = tools[0] print("インストールされているOCRツールは', %s" % (tool.get_name()) ,'です。\n Tesseract（テッセラクト）は光学文字認識のエンジンです。\n\n')

langs = tool.get_available_languages() print(langs,'などの言語を指定できます。')

# OCRを実行する画像イメージや言語指定、オプション指定 txt = tool.image_to_string( Image.open('ocr5.png'), #ここを変更 lang='eng+jpn', builder=pyocr.builders.TextBuilder() ) print('\n\nOCR（光学文字認識）の実行結果\n\n\n__________________\n\n',txt, '\n\n__________________\n\n')

＊＊＊＊＊　サンプルコード：ここまで　＊＊＊＊＊＊

by 子供プログラマー | プログラミング入門ウェブ教室

【Python編】OCRプログラミング入門講座（Tesseract OCR）| 一覧へ

日本人のための人工知能プログラマー入門講座（機械学習）| 一覧へ

【Python編】OCRプログラミング入門講座 – OCRプログラミングをはじめてみよう

【Python】OCRプログラミングをはじめてみよう。 Tesseract OCR・PyOCR・Google Colaboratoryで光学文字認識入門

Pythonサンプルコード

【Python】OCRプログラミングをはじめてみよう。
Tesseract OCR・PyOCR・Google Colaboratoryで光学文字認識入門