OCRプログラミング入門講座

OCRプログラミング入門講座 – 日本人のための人工知能プログラマー入門講座(機械学習)

 

OCR(Optical Character Recognition:光学文字認識)プログラミングの入門的な内容のコンテンツを公開中です。
Tesserct OCR(テッセラクト オーシーアール)・Tesseract.js(テッセラクト ジェーエス)や、ディープラーニング等を使ってOCRプログラミング・OCRアプリケーション開発に挑戦してみましょう。
これから仕事や日々の生活等で画像認識・文字認識をしたい方の参考になることがありましたら幸いです。

 




 

【Python OCRプログラミング入門:オリジナルOCRを作ろう】

 

 

【機械学習モデル:サポートベクターマシーン SVM編】

【4桁】連続数字画像認識プログラミング入門(Python・OpenCV・SVM)

4桁の数字画像を認識できるプログラムを作成してみました。

 

【機械学習モデル:ディープラーニング CNN編】

 

– 7セグメントのデジタル数字画像認識・OCR –

【4桁 – 7セグメント編】連続デジタル数字画像認識プログラミング入門(Python・OpenCV・Keras・CNN) New♪

【ステップ1】7セグメント認識用オリジナル学習済みモデルの作成
【7セグメント編】オリジナル学習済みモデルの作成方法 New♪

【ステップ2】1文字判定(デジタル数字:0〜9+空白)
【7セグメント編】1文字判定(デジタル数字:0〜9+空白) New♪

【ステップ3】デジタル数字:4桁連続数字認識 +再学習
【基本 – 手動で文字領域トリミング】
【7セグメント編-手動抽出OCR】連続文字判定(デジタル数字:4桁連続数字)+再学習 New♪

【応用 – 自動文字検出・抽出機能付きの自作OCR作成】
【ステップ3−1:7セグメントデジタル数字文字検出】
【7セグメント編】デジタル数字文字検出(物体検出):画像の2値化・膨張処理・輪郭検出枠のカット設定 New♪

【ステップ3−2:7セグメントデジタル数字文字検出・抽出オリジナルOCR】
【7セグメント編 – 自動文字検出・抽出OCR】連続文字判定(デジタル数字:1〜4桁以上の連続数字)+再学習 New♪

 

– 英語の画像認識・OCR –

【ステップ1】英語認識用オリジナル学習済みモデルの作成
-【英語編】オリジナル学習済みモデルの作成方法(アルファベット)

【ステップ2】1文字判定(英語:アルファベット・,コンマ・.ピリオド・?+空白)
-【日本語編】1文字判定(画像認識:アルファベット・,コンマ・.ピリオド・?+空白)

【ステップ3】英語認識:アルファベット文字認識+再学習
-【英語編 – 自動文字検出・抽出OCR】連続文字判定(アルファベット・,コンマ・.ピリオド・?+空白)+再学習

 

– 日本語の画像認識・OCR –

【ステップ1】日本語認識用オリジナル学習済みモデルの作成(ひらがな・カタカナ・漢字・、点・。丸)
-【日本語編】オリジナル学習済みモデルの作成方法

【ステップ2】1文字判定(日本語:ひらがな・カタカナ・漢字・点、・丸。)
-【日本語編】1文字判定(画像認識:ひらがな・カタカナ・漢字・、点・。丸)

【ステップ3】日本語認識:横書き・縦書き文字認識 +再学習
-【日本語編 – 自動文字検出・抽出OCR】連続文字判定:横書き・縦書き(ひらがな・カタカナ・漢字・、点・。丸)+再学習

 

 

【Tesseract OCR:OCRプログラミング入門】

 

 

【Python編】OCRプログラミング入門講座(Tesseract OCR)

Google ColaboratoryのJupyterノートブックの開発環境で、OCRエンジンの「Tesseract OCR」(テッセラクトOCR)とPython用のOCRツールラッパーの「PyOCR」を使って光学文字認識プログラミングを実施しています。

無料でここまでの精度のプログラミングができてしまうとは…
すごい時代になりましたね。
「Tesseract OCR」の今後の開発の進歩も楽しみです。

 

 

【Tesseract.js:OCR Webアプリケーション開発入門】
HTML・CSS・JavaScript編

 

 

【JavaScript編】OCRプログラミング入門講座(Tesseract.js)

 




 

by 子供プログラマー | プログラミング入門ウェブ教室