OCRプログラミング入門講座

OCRプログラミング入門講座 – 日本人のための人工知能プログラマー入門講座(機械学習)

 

OCR(Optical Character Recognition:光学文字認識)プログラミングの入門的な内容のコンテンツを公開中です。
Tesserct OCR(テッセラクト オーシーアール)・Tesseract.js(テッセラクト ジェーエス)や、ディープラーニング等を使ってOCRプログラミング・OCRアプリケーション開発に挑戦してみましょう。
これから仕事や日々の生活等で画像認識・文字認識をしたい方の参考になることがありましたら幸いです。

 




 

【Python OCRプログラミング入門:オリジナルOCRを作ろう】

 

 

【機械学習モデル:サポートベクターマシーン SVM編】

【4桁】連続数字画像認識プログラミング入門(Python・OpenCV・SVM)

4桁の数字画像を認識できるプログラムを作成してみました。

 

【機械学習モデル:ディープラーニング CNN編】

 

– 7セグメントのデジタル数字画像認識・OCR –

【4桁 – 7セグメント編】連続デジタル数字画像認識プログラミング入門(Python・OpenCV・Keras・CNN)

【ステップ1】7セグメント認識用オリジナル学習済みモデルの作成
【7セグメント編】オリジナル学習済みモデルの作成方法 

【ステップ2】1文字判定(デジタル数字:0〜9+空白)
【7セグメント編】1文字判定(デジタル数字:0〜9+空白) 

【ステップ3】デジタル数字:4桁連続数字認識 +再学習
【基本 – 手動で文字領域トリミング】
【7セグメント編-手動抽出OCR】連続文字判定(デジタル数字:4桁連続数字)+再学習

【応用 – 自動文字検出・抽出機能付きの自作OCR作成】
【ステップ3−1:7セグメントデジタル数字文字検出】
【7セグメント編】デジタル数字文字検出(物体検出):画像の2値化・膨張処理・輪郭検出枠のカット設定

【ステップ3−2:7セグメントデジタル数字文字検出・抽出オリジナルOCR】
【7セグメント編 – 自動文字検出・抽出OCR】連続文字判定(デジタル数字:1〜4桁以上の連続数字)+再学習

 

– 英語の画像認識・OCR:Programming OCR for English(Basic)-

膨張処理を活用して、英語対応の基本的な仕組みのOCR開発に挑戦。

【ステップ1】英語認識用オリジナル学習済みモデルの作成
-【英語編】オリジナル学習済みモデルの作成方法(アルファベット)

【ステップ2】1文字・単語判定(英語:アルファベット・英単語・,コンマ・.ピリオド・?)
-【日本語編】1文字・単語判定(画像認識:アルファベット・英単語・,コンマ・.ピリオド・?)

【ステップ3】英語認識:アルファベット文字認識+再学習
-【英語編 – 自動文字検出・抽出OCR】連続文字判定(アルファベット・英単語・,コンマ・.ピリオド・?+空白)+再学習

 

– 日本語手書き文字の画像認識・OCR:Programming OCR for Japanese Handwritten Text(Basic) –

膨張処理を活用して、日本語縦書き・横書き対応の基本的な仕組みのOCR開発に挑戦。

【日本語手書きOCR編】連続文字画像認識プログラミング入門(Python・OpenCV・Keras・CNN) New♪

【開発中】
【Python – 自作OCR開発中】日本語手書き文字(横書き・縦書き対応):プログラミング学習用

【ステップ0】
【日本語 – 手書き編】自作OCRプログラムの概略とOCRの難しさについて

【ステップ1】日本語手書き文字画像認識用オリジナル学習済みモデルの作成(ひらがな・カタカナ・漢字・、点・。丸)
【日本語 – 手書き編】OCR用のオリジナル学習済みモデルの作成方法(ひらがな・カタカナ・漢字・ローマ字・、点・。丸)

【ステップ2】1文字判定(日本語手書き:ひらがな・カタカナ・漢字・点、・丸。)
【日本語 – 手書き編】1文字判定(ひらがな・カタカナ・漢字・ローマ字・、点・。丸)

【ステップ3】日本語認識:横書き・縦書き文字検出
-【日本語 – 手書き編】連続文字検出:横書き・縦書き(ひらがな・カタカナ・漢字・、点・。丸)

【ステップ3-1:水平・垂直の文章の日本語検出】
シンプルな横書き・縦書き文章の日本語手書き文字検出(ブロック→行と列→個別文字)

【ステップ3-2:線が入った画像の日本語検出】
直線除去の機能を実装:横書き・縦書き文章の日本語手書き文字検出(ブロック→行と列→個別文字)

【ステップ3-3:点々などのノイズの入った画像の日本語検出】
ノイズ除去の機能を実装:横書き・縦書き文章の日本語手書き文字検出(ブロック→行と列→個別文字)

【ステップ3-4:傾いた画像の日本語検出】
傾き・角度補正の機能を実装:横書き・縦書き文章の日本語手書き文字検出(ブロック→行と列→個別文字)

【ステップ4】日本語手書きOCR:横書き・縦書き文字認識 +再学習
【日本語手書き編 – 自動文字検出・抽出OCR】連続文字判定:横書き・縦書き(ひらがな・カタカナ・漢字・ローマ字・、点・。丸)+再学習

 

 

【Tesseract OCR:OCRプログラミング入門】

 

 

【Python編】OCRプログラミング入門講座(Tesseract OCR)

Google ColaboratoryのJupyterノートブックの開発環境で、OCRエンジンの「Tesseract OCR」(テッセラクトOCR)とPython用のOCRツールラッパーの「PyOCR」を使って光学文字認識プログラミングを実施しています。

無料でここまでの精度のプログラミングができてしまうとは…
すごい時代になりましたね。
「Tesseract OCR」の今後の開発の進歩も楽しみです。

 

 

【Tesseract.js:OCR Webアプリケーション開発入門】
HTML・CSS・JavaScript編

 

 

【JavaScript編】OCRプログラミング入門講座(Tesseract.js)

 




 

by 子供プログラマー | プログラミング入門ウェブ教室