⚠音声の実験です⚠ 説明欄に詳しく書いてあります
sm40731861をもとに音声と映像をすこし変えています
◆技術的詳細◆
so-vits-svc 4.0 (
https://github.com/svc-develop-team/so-vits-svc )で事前に甜花ちゃんの会話・コミュのボイスでベースとなるモデルを構築(
sm41930944)の後、ルカの音源を追加で学習させモデルを構築しました。
人力において、ベース曲を1曲にすることでボイス・発音・テンションが安定しやすいことは経験則として言われています。しかし素材不足または不適正な素材の無理やりな使用に陥ることが、大きな欠点として挙げられます。
音素が不足した際によく行われるのが類似の音素を組み合わせ錬成する方法です。しかしこの方法は不自然になりやすく素材によりうまくいかないことも多々あります。またノイズも発生しやすく発音も不明確になりやすいです。
もしso-vits-svcで音素を補完することができれば、人力のクオリティの向上に期することができるのではないかと思い、その補完のための実験としてこの動画の音声を作成しています。
映像はなんかHDDにあった現時点でも、人力で不足した音素を錬成する用途としてはそれなりに使えるかと思います。
なお、so-vits-svcで出力された音声は-aオプションを入れても
凄まじい音痴音程が狂う傾向にあるため、ほぼ全域にわたって人力で音程を動かしています(VocalShifter)。
普通に人力する際に音程合わせするのと手間が変わらないんですが。 というか-aオプションなんの意味があるのところでso-vits-svcについての解説動画っている?