動画:【近況報告】ChatGPTも気になるが… それよりもAIボイスチェンジャーRVC WebUIでオリジナル音声変換に挑戦中
視聴時間:2分28秒
動画で紹介しているリンク
AIボイスチェンジャー(AIボイチェン)RVC WebUI:
RVC-Project(旧liujing04)/Retrieval-based-Voice-Conversion-WebUI(The MIT License)| GitHub
AIを利用したリアルタイムボイスチェンジャーのクライアントソフトウェアVC Client:
w-okada/voice-changer(The MIT License)| GitHub
音声変換AIでオリジナルボイスチェンジャーを作りたい
2023年に入り、機械学習領域で世間へのインパクトが噂されているChatGPTによる文章生成技術が盛り上がっているようですが、個人的には、会話などの音声情報を基に音声変換(声質変換)ができる
✔︎ AIボイスチェンジャー(AIボイチェン)の「RVC WebUI」
(Retrieval-based-Voice-Conversion-WebUI:An easy-to-use SVC framework based on VITS.)
(使いやすいVITSベースの音声変換・ボイスチェンジャーフレームワーク)
* RVC Voice Changer
に関心があります。
初めてAIボイスチェンジャーの「RVC WebUI」の存在を知った時に、
「 えっ、もうそんなことができてしまう時代になったのか・・・」
と感じ、ワクワクしながら希望を抱きつつプログラムを動かしてみると
「 今の自分の能力では、このプログラムを動かせる自信がない・・・」
といった結論に至り、一時期は絶望感に苛まれていました。
パソコンへの負荷を考慮すると、基本的に機械学習系のプログラムはGoogle Colaboratory上で動かしたい!という思いもあるので、Google Colaboratory上で実行する方法を模索していましたが、失敗が続きGoogle Colaboratoryで実行する方法は半ば諦めていました。
Twitter上では実際に試した方が、音声変換した音声などを投稿されていたので、羨ましいなあ〜と思いながら呆然としていましたが、それでも!と思い、再挑戦すると、とりあえず動かすことができました。
RVC用の学習データの学習方法と、音声変換のチュートリアル作成には、もう少し時間がかかりそうですが、このサイトを訪問してくださる皆さんが、MacやWindowsなどのパソコンの機種やスペックによらず気軽にAIの恩恵を受けられるようにするために、Google Colaboratory上で完結できるような「RVC WebUI」の使い方をまとめていこうと考えています。
今後、しばらく使い方を調査・検証後に、RVC WebUIのチュートリアル動画などを作成予定です。
お楽しみに♪
文章生成AI・AIボイスチェンジャーなどのAI技術が、今後、世の中にどのような影響を与えていくのか・・・?
要注目です。
チュートリアル公開開始:日本人のためのRVC WebUIの使い方
【追記:2023年4月16日】
チュートリアル記事も公開できました。
【追記:2023年4月18日】
解説動画も公開できました。以下の記事に掲載しておきました。
:日本人のためのRVC WebUIの使い方:簡単オリジナルAIボイスチェンジャー作成
【音声認識】
:【Python入門】日本語の文字起こしのやり方(音声認識:音声ファイル編)サンプルコード
【音声合成】