【日本語手書きOCR編】連続文字画像認識プログラミング入門(Python・OpenCV・Keras・CNN)

【日本語手書きOCR編】連続文字画像認識プログラミング入門(Python・OpenCV・Keras・CNN)

 

動画:Pythonではじめる日本語OCR開発 – 手書き文字認識編

 

 


視聴時間:1時間12分38秒

 




 

【動画の内容】

0:00 はじめに
1:01 ステップ0:概略
6:36 ステップ1:学習済みモデル作成
16:40 ステップ2:1文字判定
24:44 ステップ3-1:文字検出
34:38 ステップ3-2:直線の検出と除去
43:31 ステップ3-3:ノイズ除去
53:03 ステップ3-4:角度補正
59:55 ステッ プ4:OCRに挑戦と再学習
1:11:46 おわりに

 

 

日本語手書き文字の画像認識・OCR:Programming OCR for Japanese Handwritten Text(Basic)

 

 

日本語手書き文字認識AIを作成し、縦書き・横書きの日本語文章のOCR(手書き文書のテキスト化)に挑戦。オリジナルデータセットで学習・再学習させて実用的なOCRを作成してみましょう。

膨張処理を活用して、日本語縦書き・横書き対応の基本的な仕組みのOCR開発に挑戦。(手書きOCR:オープンソース)
利用技術:Python・OpenCV・Keras(CNN)

【開発中】

【Python – 自作OCR開発中】日本語手書き文字(横書き・縦書き対応):プログラミング学習用

【ステップ0】
日本語手書き文字用のOCRの仕組み等
【日本語 – 手書き編】自作OCRプログラムの概略とOCRの難しさについて

【ステップ1】
日本語手書き文字画像認識用オリジナル学習済みモデルの作成(ひらがな・カタカナ・漢字・、点・。丸)
【日本語 – 手書き編】OCR用のオリジナル学習済みモデルの作成方法(ひらがな・カタカナ・漢字・ローマ字・、点・。丸)

【ステップ2】
1文字判定(日本語手書き:ひらがな・カタカナ・漢字・ローマ字・点、・丸。)
【日本語 – 手書き編】1文字判定(ひらがな・カタカナ・漢字・ローマ字・、点・。丸)

【ステップ3】
日本語認識:横書き・縦書き文字検出
【日本語 – 手書き編】連続文字検出:横書き・縦書き(ひらがな・カタカナ・漢字・ローマ字・、点・。丸)

【ステップ3-1:水平・垂直の文章の日本語検出】
シンプルな横書き・縦書き文章の日本語手書き文字検出(ブロック→行と列→個別文字)

【ステップ3-2:線が入った画像の日本語検出】
直線除去の機能を実装:横書き・縦書き文章の日本語手書き文字検出(ブロック→行と列→個別文字)

【ステップ3-3:点々などのノイズの入った画像の日本語検出】
ノイズ除去の機能を実装:横書き・縦書き文章の日本語手書き文字検出(ブロック→行と列→個別文字)

【ステップ3-4:傾いた画像の日本語検出】
傾き・角度補正の機能を実装:横書き・縦書き文章の日本語手書き文字検出(ブロック→行と列→個別文字)

【ステップ4】日本語手書きOCR:横書き・縦書き文字認識 +再学習
【日本語手書き編 – 自動文字検出・抽出OCR】連続文字判定:横書き・縦書き(ひらがな・カタカナ・漢字・ローマ字・、点・。丸)+再学習

 

 

by 子供プログラマー | プログラミング入門ウェブ教室

 

 

日本人のための人工知能プログラマー入門講座(機械学習)| 一覧ページ