Contents - 目次(もくじ)
動画:Pythonではじめる日本語OCR開発 – 手書き文字認識編
視聴時間:1時間12分38秒
【動画の内容】
0:00 はじめに
1:01 ステップ0:概略
6:36 ステップ1:学習済みモデル作成
16:40 ステップ2:1文字判定
24:44 ステップ3-1:文字検出
34:38 ステップ3-2:直線の検出と除去
43:31 ステップ3-3:ノイズ除去
53:03 ステップ3-4:角度補正
59:55 ステッ プ4:OCRに挑戦と再学習
1:11:46 おわりに
日本語手書き文字の画像認識・OCR:Programming OCR for Japanese Handwritten Text(Basic)
日本語手書き文字認識AIを作成し、縦書き・横書きの日本語文章のOCR(手書き文書のテキスト化)に挑戦。オリジナルデータセットで学習・再学習させて実用的なOCRを作成してみましょう。
膨張処理を活用して、日本語縦書き・横書き対応の基本的な仕組みのOCR開発に挑戦。(手書きOCR:オープンソース)
利用技術:Python・OpenCV・Keras(CNN)
【開発中】
:【Python – 自作OCR開発中】日本語手書き文字(横書き・縦書き対応):プログラミング学習用
【ステップ0】
日本語手書き文字用のOCRの仕組み等
– 【日本語 – 手書き編】自作OCRプログラムの概略とOCRの難しさについて
【ステップ1】
日本語手書き文字画像認識用オリジナル学習済みモデルの作成(ひらがな・カタカナ・漢字・、点・。丸)
– 【日本語 – 手書き編】OCR用のオリジナル学習済みモデルの作成方法(ひらがな・カタカナ・漢字・ローマ字・、点・。丸)
【ステップ2】
1文字判定(日本語手書き:ひらがな・カタカナ・漢字・ローマ字・点、・丸。)
– 【日本語 – 手書き編】1文字判定(ひらがな・カタカナ・漢字・ローマ字・、点・。丸)
【ステップ3】
日本語認識:横書き・縦書き文字検出
【日本語 – 手書き編】連続文字検出:横書き・縦書き(ひらがな・カタカナ・漢字・ローマ字・、点・。丸)
【ステップ3-1:水平・垂直の文章の日本語検出】
– シンプルな横書き・縦書き文章の日本語手書き文字検出(ブロック→行と列→個別文字)
【ステップ3-2:線が入った画像の日本語検出】
– 直線除去の機能を実装:横書き・縦書き文章の日本語手書き文字検出(ブロック→行と列→個別文字)
【ステップ3-3:点々などのノイズの入った画像の日本語検出】
– ノイズ除去の機能を実装:横書き・縦書き文章の日本語手書き文字検出(ブロック→行と列→個別文字)
【ステップ3-4:傾いた画像の日本語検出】
– 傾き・角度補正の機能を実装:横書き・縦書き文章の日本語手書き文字検出(ブロック→行と列→個別文字)
【ステップ4】日本語手書きOCR:横書き・縦書き文字認識 +再学習
– 【日本語手書き編 – 自動文字検出・抽出OCR】連続文字判定:横書き・縦書き(ひらがな・カタカナ・漢字・ローマ字・、点・。丸)+再学習
:日本人のための人工知能プログラマー入門講座(機械学習)| 一覧ページ
2件のコメント
現在コメントは受け付けていません。