2009年10月08日

感情合成

STRAIGHTによる感情合成に適した音素片歌唱合成方法を考えてみてる。
最近移動中の時間がこればっかりというダメ具合、楽しいからいいか。

・基本的にSTRAIGHTの感情合成は複数音声のモーフィングであること。
・感情合成に重要なのは主に母音である『ように思える』こと。
・演劇等の滑舌練習に子音を省いた母音のみの練習法が有効であること。

この三点を考えると、

・指定されたNote情報から母音のSTRAIGHTmorphingを行う。
・子音は合成済み母音パラメタの子音位置に合成する。
・子音位置は該当Noteの直前とする。
・子音合成時には子音の前後で子音方向へ向かうモーフィングを行う。

とすれば既存のUTAUフォーマットの拡張で済む。
といかめしく書いたものの音素片合成の考えとしては非常にシンプル。

課題点は子音の切り張りをどう行えばよい結果がでるか。
つまるところ子音とは何かを考えなければいけない。
ただ、v.Connectが子音に特別な処理を行っていないことから、
手作業の切り出し作業を失敗しなければそこここの結果になりそう。

ちなみにこの方法による利点は以下。

・感情モーフィングの手法に適している。
・細かいリズムの際に生じる『綺麗すぎる』フォルマント変化の軽減。
・1セットの容量の削減にも貢献する。

試す価値がありそうなんですが、今一暇が足りないので誰か試しませんか?←


ちなみにv.Connect自体は既存資源の活用をメインに行くつもりです。
こっちの利点はUTAU資源との互換性と、VSQ編集技術との互換性だし。
BRIとCLEの実装もできそう。OPEは『ん』と合成すればいんじゃね?
ただたまにノイズ乗るのが…騒々しい音なら紛れるんだけど…

この手のツールは適度な自動化が必要だけどどこまでやるべきなんでしょうね。
posted by HAL at 12:19| Comment(0) | 音声合成 | このブログの読者になる | 更新情報をチェックする
×

この広告は1年以上新しい記事の投稿がないブログに表示されております。