茂野つみきです。
先日の動画から、2万に増やそ!と思ったらデータミスとかで、追加は7000弱になってしまいました。
が、かなり変化してるので、再度比較をば。
通常学習モデルの方が声もピッチもなめらか。その代わりちょっと音痴。
RMDN学習モデルは声が明瞭、音は比較的正確。でもピッチがちょっと角ばってる。あとリズムが走っちゃったりします。
細かいことはTwitter見てね
(仮)Pさんの透明交差点(
sm16851355)を、初期配布の際と同様に歌ってもらいました。
ENUNU制作を考えられてる方の参考になれば幸いです。
たまにニコ生でラベリングとか関連作業のながら配信してます。
よかったらそちらも見てね。
ラベリングをしながら(コメ0で1時間半以上)雑談を続ける動画→
sm43692282