OCRプログラミング入門講座 – 日本人のための人工知能プログラマー入門講座(機械学習)
OCR(Optical Character Recognition:光学文字認識)プログラミングの入門的な内容のコンテンツを公開中です。
Tesserct OCR(テッセラクト オーシーアール)・Tesseract.js(テッセラクト ジェーエス)や、ディープラーニング等を使ってOCRプログラミング・OCRアプリケーション開発に挑戦してみましょう。
これから仕事や日々の生活等で画像認識・文字認識をしたい方の参考になることがありましたら幸いです。
【Python OCRプログラミング入門:オリジナルOCRを作ろう】
【機械学習モデル:サポートベクターマシーン SVM編】
・【4桁】連続数字画像認識プログラミング入門(Python・OpenCV・SVM)
4桁の数字画像を認識できるプログラムを作成してみました。
【機械学習モデル:ディープラーニング CNN編】
– 7セグメントのデジタル数字画像認識・OCR –
・【4桁 – 7セグメント編】連続デジタル数字画像認識プログラミング入門(Python・OpenCV・Keras・CNN)
【ステップ1】7セグメント認識用オリジナル学習済みモデルの作成
– 【7セグメント編】オリジナル学習済みモデルの作成方法
【ステップ2】1文字判定(デジタル数字:0〜9+空白)
– 【7セグメント編】1文字判定(デジタル数字:0〜9+空白)
【ステップ3】デジタル数字:4桁連続数字認識 +再学習
【基本 – 手動で文字領域トリミング】
– 【7セグメント編-手動抽出OCR】連続文字判定(デジタル数字:4桁連続数字)+再学習
【応用 – 自動文字検出・抽出機能付きの自作OCR作成】
【ステップ3−1:7セグメントデジタル数字文字検出】
– 【7セグメント編】デジタル数字文字検出(物体検出):画像の2値化・膨張処理・輪郭検出枠のカット設定
【ステップ3−2:7セグメントデジタル数字文字検出・抽出オリジナルOCR】
– 【7セグメント編 – 自動文字検出・抽出OCR】連続文字判定(デジタル数字:1〜4桁以上の連続数字)+再学習
– 英語の画像認識・OCR:Programming OCR for English(Basic)-
膨張処理を活用して、英語対応の基本的な仕組みのOCR開発に挑戦。
【ステップ1】英語認識用オリジナル学習済みモデルの作成
-【英語編】オリジナル学習済みモデルの作成方法(アルファベット)
【ステップ2】1文字・単語判定(英語:アルファベット・英単語・,コンマ・.ピリオド・?)
-【日本語編】1文字・単語判定(画像認識:アルファベット・英単語・,コンマ・.ピリオド・?)
【ステップ3】英語認識:アルファベット文字認識+再学習
-【英語編 – 自動文字検出・抽出OCR】連続文字判定(アルファベット・英単語・,コンマ・.ピリオド・?+空白)+再学習
– 日本語手書き文字の画像認識・OCR:Programming OCR for Japanese Handwritten Text(Basic) –
膨張処理を活用して、日本語縦書き・横書き対応の基本的な仕組みのOCR開発に挑戦。
・【日本語手書きOCR編】連続文字画像認識プログラミング入門(Python・OpenCV・Keras・CNN) New♪
【開発中】
:【Python – 自作OCR開発中】日本語手書き文字(横書き・縦書き対応):プログラミング学習用
【ステップ0】
– 【日本語 – 手書き編】自作OCRプログラムの概略とOCRの難しさについて
【ステップ1】日本語手書き文字画像認識用オリジナル学習済みモデルの作成(ひらがな・カタカナ・漢字・、点・。丸)
– 【日本語 – 手書き編】OCR用のオリジナル学習済みモデルの作成方法(ひらがな・カタカナ・漢字・ローマ字・、点・。丸)
【ステップ2】1文字判定(日本語手書き:ひらがな・カタカナ・漢字・点、・丸。)
– 【日本語 – 手書き編】1文字判定(ひらがな・カタカナ・漢字・ローマ字・、点・。丸)
【ステップ3】日本語認識:横書き・縦書き文字検出
-【日本語 – 手書き編】連続文字検出:横書き・縦書き(ひらがな・カタカナ・漢字・、点・。丸)
【ステップ3-1:水平・垂直の文章の日本語検出】
– シンプルな横書き・縦書き文章の日本語手書き文字検出(ブロック→行と列→個別文字)
【ステップ3-2:線が入った画像の日本語検出】
– 直線除去の機能を実装:横書き・縦書き文章の日本語手書き文字検出(ブロック→行と列→個別文字)
【ステップ3-3:点々などのノイズの入った画像の日本語検出】
– ノイズ除去の機能を実装:横書き・縦書き文章の日本語手書き文字検出(ブロック→行と列→個別文字)
【ステップ3-4:傾いた画像の日本語検出】
– 傾き・角度補正の機能を実装:横書き・縦書き文章の日本語手書き文字検出(ブロック→行と列→個別文字)
【ステップ4】日本語手書きOCR:横書き・縦書き文字認識 +再学習
– 【日本語手書き編 – 自動文字検出・抽出OCR】連続文字判定:横書き・縦書き(ひらがな・カタカナ・漢字・ローマ字・、点・。丸)+再学習
【Tesseract OCR:OCRプログラミング入門】
・【Python編】OCRプログラミング入門講座(Tesseract OCR)
Google ColaboratoryのJupyterノートブックの開発環境で、OCRエンジンの「Tesseract OCR」(テッセラクトOCR)とPython用のOCRツールラッパーの「PyOCR」を使って光学文字認識プログラミングを実施しています。
無料でここまでの精度のプログラミングができてしまうとは…
すごい時代になりましたね。
「Tesseract OCR」の今後の開発の進歩も楽しみです。
【Tesseract.js:OCR Webアプリケーション開発入門】
HTML・CSS・JavaScript編
・【JavaScript編】OCRプログラミング入門講座(Tesseract.js)