Web Speech API

- 1/24/2021 05:35:00 午後

ボイスチェンジャーで声を変えるとおネエみたいになってしまうけど、最近の音声認識・音声合成技術を使えは性別も超えられるのでは？ということで、マイクで喋った声を音声認識してテキスト化し、そのテキストを音声合成して出力するとともに、その音声とアバターの口とリップシンクさせてみたテスト

Web Speech APIを叩くスクリプトを書いて、「おっさんの声→[音声認識→テキスト→音声合成]→女性の声→仮想オーディオドライバ→音声出力／リップシンク→録画」してみた。どうしても音声認識でタイムラグが発生するため会話には向かないけど、独白やチャットなら使えそう。音声モデルも2つ目の「Microsoft Nanami」はいい感じだね。

このブログを検索

SeaGate Reloaded

Web Speech API

コメント

コメントを投稿

このブログの人気の投稿

Platearu-Blender-Importer

ブログを note に移行

ゆかりねっと VOICEPEAKプラグイン

Stable DiffusionのOutpainting/Inpainting

"現状"の建築設計分野でのAIマップ