歌声合成技術に革命!ディープラーニングで人間さながらに歌うAI歌声合成システムを名工大とテクノスピーチが開発
日進月歩の技術の世界ですが、もはや人間とコンピュータによる歌声の違いを識別できないレベルのところまで技術は進化してきたようです。
本日、国立大学法人名古屋工業大学の国際音声言語技術研究所と名古屋の大学発ベンチャー企業である株式会社テクノスピーチが共同で
「超高音質な歌声を再現するAI歌声合成システム」を発表しました。
これまでVOCALOIDを中心とした歌声合成のシステムがDTMの世界に広がり、ひとつの音楽ジャンルというかひとつの文化を作り上げてきた
といっても過言ではありません。しかし、それとは明らかに次元の異なる歌声合成のシステムが登場してきました。ある種コンピュータっぽさ、
無機質さが売りでもあったVOCALOIDに対し、今回発表されたのは人間の声質やクセ、歌い方を再現する、まさに人の歌声と区別のつかない
レベルの歌声合成。現時点では技術発表であって、まだ製品化はされていませんが、歌声合成技術の革命といってもいいと思います。
https://www.dtmstation.com/archives/22902.html
AI歌声合成システム Demo
ボーカロイド始まったな
これはひっくり返るは 深層学習による合成音声絶対いつか流行ると思ってたわ
ただしボカロ止まりなのはあくまで波形操作モデルの構築が目的
次は動画音声から雑音を消して特定の人の声だけ抜き出す技術が出来ると予想してる
それさえ出来れば歌声だけじゃなくただの会話音声も作れるようにもなって
コナンくんの声変えマイクが現実になるだろうな
名古屋大が最近ブレークしてきてるよね
ベンチャー投資額が四年前の14倍、福岡も抜いて国内二位におどりでた
一昔前の深センのようになってきた
やっぱり宮廷唯一の情報系の学部の存在がデカい、ベンチャーに繋がりやすいな
これ既存の歌の波形に合わせてるだけでは?
日常会話でこれぐらいだとすごいけど
AIで声優の声完全再現できるだろといい続けて
やっとかよ!
>>12
>本研究では、約2時間の特定の歌唱者の歌声波形に対してディープラーニング等の統計的機械学習技術を適用することにより、
>当該歌唱者の声質・癖 ・歌い方を学習しました。合成の際は、任意の歌詞付き楽譜を入力するだけで高品質な歌声を合成することができます。
学習さえしてしまえばボカロのように使えるらしい 正面門のメイちゃんに歌わせてオタク学生の心を癒やそう
大沢たかおの声を学習させて文書読ませることも出来るのか?
ここからAIがもっと自分で学習してさらに才能に開花して人間にないレベルの歌声を聞かせてくれるんだろ?最高じゃないか
歌はいいからボイスチェンジャー欲しい
ロリになりたい
へー、音読とかも出来るようになれば面白いだろうな
ボカロと合わせれば夢が広がる
アイドルアニメ声優はわからんが、洋画吹き替えみたいな仕事は消えるかもしれんな
これの半年前のりんな
これは他の歌い方をまねる方法みたいだけど エンジニアの給料も、最近だと東京より名古屋のほうが高いんだよな
ベンチャーもたくさんでてきてるし、いま勢いがある
音痴の奴も音声録ってディープラーニングさせたら音痴が治るな
数時間分の音のサンプルがあれば良いわけだから
適当に配信や番組の音声を入力すれば指定のテキストを喋らすことも可能なわけだよな
音声の癖を意図的に変更すれば音声の権利問題も回避できる
いずれはいろんな声や年代の音声素材がネットに出回るんだろうな
ミクっぽさがまだ残ってるけど進歩してるな
もっと進歩すれば声優が死んでもキャラの声が変わらないようにできるかもしれん
まじで声優はほとんどが廃業しそう
商業作品なら声優使うかもしれないけど
自主制作やら少人数制作だと声優いらなくなるだろ
コミュ障でも自分で会話しなくて済む時代がすぐそこに来てそうだな
おっさんだから萌え声に変換したいわ
>>20
ボイスチェンジャー使ったロリ声のおっさん同士が抜きあうのか >>40
ホモホモホモホモホモホモホモホモホモホモホモホモホモホモホモホモホモホモホモホモ >>6
高音のほうが合成しやすい
低音のほうがあらが目立つ
技術的な理由からなわけだがなんでも萌絡めないと考えられない重度の萌え豚かなんかかお前 歌を集めるのは簡単だけど、その人のインタビューとかの地声を集めたい
ここらへんなんとかならんかな
歌声じゃなくて普通の喋りも出来るようになったらオレオレ詐欺やる奴増えるんじゃね?
定時ニュースのアナウンサーとか実はもう要らないんじゃねーの?
>>20
TC-Helicon VoiceWorks Plus キャラクターと声優をディープラーニングして
キャラクターから声が生成できるようにする
すげー
でもこれそこらへんの素人に歌わせてそうな感じがする
もう生人間のやる事なくなるね
何したらいいんだろう
声優が自分の声学習させて著作権料で生きていける時代が来るの?
すげーな
でもまあ人間にはまだまだ及ばないか
人間は曲の雰囲気や歌詞の意味によって歌い方を変えるしな
歌スレにうpしたら「しゃくりすぎ」って言われるレベルの完成度
なかなかいいな
メリハリ感は弱いけど聞けるレベルになってきた
VRエロゲで「合成音声で自然にしゃべらせることまでは何とかできても自然な喘ぎ声は無理」問題がもし近いうちに解決するとしたらもう革命だぞ(´・ω・`)
おっ、なかなか凄いなこれは。
もうちょっと長いのを聞いてみたい所。
>>40
バーチャルレズだよ
>>55
名前からしてお高そう…
自分で声データ集めて機械学習させたいけどよくわからん これは元の音声があって、その音声に近づけてるだけじゃないの
久しぶりにMicrosoft Harukaで棒読みちゃんにスレ読ませたけど和むわ
宇多田ヒカルとかR&B系が歌えるようになってからが本番だわ
siriやAlexaは音声命令されながらも
膨大な量の会話サンプルを集めてるから
近い将来にディープラーニングで自然な発声を習得するだろうな
賢網民よこれも見てくれ。未来関連で。
Playing Guitar in MIT Autonomous Vehicle (Driver Activity Recognition) - YouTube
AI x Robotics x Cooking - YouTube
ここまでCeVIOなしなのがボカロ界隈のオワコンぶりを物語ってるな
ボカロはVtuber的な方向で進化していくしかないんだろうけど、
喋りやって歌作ってってやるのは結構大変だからな。
1人立ち上げるのに相当金掛かる。
>>1
節ごとのつなぎで若干ながら不自然さが出るな >>29
こっちの方が凄いやん
好みの声と歌い方だわ ボーカロイド的アプローチなんかどうでもいいから
亡くなった声優の声を復活させてみろよ