Web Speech API



ボイスチェンジャーで声を変えると おネエ みたいになってしまうけど、最近の音声認識・音声合成技術を使えは性別も超えられるのでは?ということで、マイクで喋った声を音声認識してテキスト化し、そのテキストを音声合成して出力するとともに、その音声とアバターの口とリップシンクさせてみたテスト



Web Speech APIを叩くスクリプトを書いて、「おっさんの声→[音声認識→テキスト→音声合成]→女性の声→仮想オーディオドライバ→音声出力/リップシンク→録画」してみた。どうしても音声認識でタイムラグが発生するため会話には向かないけど、独白やチャットなら使えそう。音声モデルも2つ目の「Microsoft Nanami」はいい感じだね。

コメント

このブログの人気の投稿

Evernote から Googleドライブに移行

ゆかりねっと VOICEPEAKプラグイン

TDPT(Three D Pose Tracker)

Platearu-Blender-Importer

ARCore Geospatial Creator for Unity