【動画で解説】現代の魔法:RVC WebUIの使い方
– 学習の保存頻度上限を変更
RVC WebUI – How to change the Save frequency in the RVC WebUI
【知りたい!学習モデルの保存頻度上限「50」の変更方法
視聴時間:4分34秒
注:2023年5月15日確認時点では、プログラムのコードが改変され「save_epoch10 = gr.Slider」が「1302行目」にあるようでした。
RVC WebUIの「Save frequency (save_every_epoch)」(学習モデルの保存頻度)の上限である「50」の数値を変更する方法を動画でまとめておきました。
Google Colaboratoryの無料枠で、数百回〜1000回レベルで学習させたい方が、ディスク容量上限対策の1つとして参考になることがありましたら幸いです。
【RVC WebUIのチュートリアル動画の内容】
0:00 はじめに
0:55 プログラムの使い方について
1:09 学習モデルの保存頻度上限を変更する手順
4:03 おわりに
動画で紹介している各種リンク
RVC WebUI:
RVC-Project(旧liujing04)/Retrieval-based-Voice-Conversion-WebUI(The MIT License)| GitHub
日本人向けのRVC WebUIのチュートリアルコード:
RVC-WebUI-for-Japanese-AI-beginners.ipynb(The MIT License)| Google Colaboratory
動画で紹介しているRVC WebUIのチュートリアル:
【現代の魔法】RVC WebUIの使い方入門:オリジナルAIボイスチェンジャーを作ろう(男性・女性の声)RVC WebUI – AI Voice Changer Tutorial by RehabC – デジタルで、遊ぶ。(YouTube動画)
【RVC WebUIで困った…】
学習中にGoogle Colaboratoryのディスク容量上限MAXになり学習が完了できない・・・
RVC WebUIで使用する中で、遭遇する無料枠の使用容量が一杯(MAX)になることへの対応例を紹介します。
この問題は、学習回数を増やした際に、途中の学習過程が保存されたファイルが一杯になることで、Google Colaboratoryのディスク使用容量を圧迫してしまうことが原因の1つと考えられます。
RVC WebUI上の元々の保存頻度の上限が「50」のため、特に、数百回〜1000回レベルで学習させる場合には、大量のファイルが生成されてしまい、エラーとなるリスクがあるのではないかと思います。
上述の動画で紹介しているRVC WebUIのチュートリアルでは、
・Save frequency (save_every_epoch):5
(学習の状況の保存頻度)
にしていますが、例として300回の学習の際には「60回」分の経過の学習ファイルが保存されてしまいます。
ここの数値を大きくするとGoogle Colaboratoryの無料枠の容量がMAXになるのを回避できるかもしれません。
(定期的に保存するファイルが減るため)
一例:
・Save frequency (save_every_epoch):50
*WebUI上での上限は50のようです。
【Save frequencyの上限を再設定する方法】
Google Colaboratory上のチュートリアルプログラムの「手順3」で「Retrieval-based-Voice-Conversion-WebUI」をGitHubからクローン後に、Google Colaboratoryのファイル機能を起動し、「Retrieval-based-Voice-Conversion-WebUI」フォルダ内(直下)にある
・infer-web.py
のファイルをダブルクリックします。
ファイル内のコードを変更できるようになるので、562行目(Google Colaboratory上でファイルを開いた際の表示:注 – 2023年5月15日確認時点では、プログラムのコードが改変され「save_epoch10 = gr.Slider」が「1302行目」にあるようでした)
注:2023年5月15日確認時点の表示
・save_epoch10 = gr.Slider(minimum=0, maximum=50, step=1, label=i18n(“保存频率save_every_epoch”), value=5,interactive=True)
のコード内の
・maximum=50
の「50」という値をお好みの数字に変更します。
その後、ファイルの変更情報を反映させるために
Windowsの例
・Ctrlキー+Sキー(「Ctrlキー」を押し続けながら「Sキー」を押す)
Macの例
・commandキー + Sキー(「commandキー」を押し続けながら「Sキー」を押す)
でファイルを保存します。自信がなければ、Google Colaboratory上の上部メニュー内の
・ファイル – 保存
をクリックして、現在の状況を反映させます。
その後、一連の手順を実行し、ファイルが最新情報に更新された状態で「手順10」を実行し、RVC WebUIを起動させると、
・Save frequency (save_every_epoch):
の上限を指定した数値に設定することができます。
プログラミングの仕組みについてあまり分からない方の場合、文字情報だけでは理解できないのではないかと思います。
そういった方の場合、必要に応じて、動画を参照していただけますと幸いです。
【音声認識】
:【Python入門】日本語の文字起こしのやり方(音声認識:音声ファイル編)サンプルコード
【音声合成】
RVC WebUIで作成したオリジナル学習モデルを使ってテキスト音声合成に挑戦!
:VG WebUIの使い方:AIボイスチェンジャー(RVC WebUI)の学習モデルでテキスト音声合成(テキストの音声読み上げ:TTS – Text to Speach)入門
:【PyTorch入門】日本語のテキスト音声合成(E2E-TTS)- ESPnet・Tacotron 2版