HANASU調声法 -単独音編-

まずはHANASUを始める前に、必要なプラグインを入れておきます。
・Mode1用ピッチエディタ
・拡張エンベロープエディタ
 (参考:UTAUユーザ互助会@ウィキ[http://www20.atwiki.jp/utaou/pages/36.html])

Step1 セリフの流し込み

クォンタイズを64分音符(もしくは(なし))、レングスを16分音符、テンポを135に設定。
人が喋るテンポって大体120~140の間らしいですね。
またHANASUはフリーハンドでピッチを書いていくのでMode1にしておきます。

あとは歌詞のところにセリフを打ち込んで、一気に流し込みます。
ここで、「っ」になってるところは先にRを代わりにおいてきます。

ex)「すこってい」と入れたい場合:すこRてい


Step2 喋らせる下準備

次に母音結合をして、音のつながりをよくします。(ショートカット[B])
おまけに右上の「クロスフェードのエンベロープをp2とp3で設定」を押して、音素によって重なりすぎている部分を解消しておきます。
これを行うだけでUTAUの音のつながりが大きく改善します。
ここまでで、調声に入るまでの下ごしらえの完了です。

UTAUはボーカロイドほど、自動で音のつながりを処理してくれないので、手作業で微調整することが少し増えます。
しかし逆に言えば、調整の自由度が高い…と思っています信じています。

Step3 イントネーションを付ける

喋りのイントネーションは「Mode1用ピッチエディタ」という追加のプラグインを使い、ピッチラインで表現していきます。フリーハンドです。(ショートカット[N])
喋らせるのにはいろいろなテクニックがあると思いますが、調声の中では一番ここに時間を注いでいます。とにかく何度も何度も自分で喋りながら、それに近いイントネーションを目指します。
イントネーションを付ける時のコツですが、とにかくピッチラインの幅を大きくことです。推奨音域や、「ここからここの間!」と書く範囲を作ってしまうのでなく、自由に書きます。あと平坦なところを作らない、ってのも意識しながら書いてます。
一番大事なところなのに書くことがない…!?でもこればっかりは自分の耳を頼りにガリガリ書くしかないんです…ッ!

ここからは、発音がおかしいところだったりを微調整していきます。


Step4 発音の編集、タイミングの編集

よく聞くと思う「無声音」ですが、これは人が喋るときに、母音が欠落する音のことを指します。
UTAUでは、音量をエンベロープ(ショートカット[ctrl+Y])で調整し母音をなくこともできますが、後ろの音とのつながりがやや弱くなってしまいます。
そこで原音設定を用いて、子音だけを発声する無声音用の設定を作ります。
※注意:原音設定を弄るときは、必ず[複製]のボタンを押して、別に作っておきましょう。


「し」を例に見ましょう。
左右の青い部分は原音から音を切り落とす部分です。ここはUTAUで処理するときに発音されません。
無声音は子音の部分だけが必要なので、子音の直前までと母音の部分をごっそり切り落とします。
固定範囲は子音の1/4~半分くらい、先行発音とオーバーラップは固定範囲の真ん中あたりに置きます。
次にエイリアスに「sh」と打ち込んでセットボタンを押し、今ある「し」とは別に使えるようにしておきます。
この方法は「し」「す」「ち」「つ」「ひ」「ふ」等に使えるのでとても便利です。

エディタの画面に戻って、無声音にしたい部分のノートを「し」→「sh」に変えて(ノートをダブルクリック)、もう一度ピッチラインを書き直しましょう。
そのままだと目立ちすぎるので、ノートのプロパティ(ショートカット[Ctrl+E])から音量を15~20あたりにします。
またお好みでBRE(ブレス)を少し足してあげます。

無声音や、母音に繋がる音や長音(ex:「ボーカロイド」の「イ」の音、「ボ」は16分音符2つ分の長さ)は、やや他より発音の長さが短くなっている気がするので、ノートの長さを64分音符だけ短くします。
ずっと同じ長さで淡々と喋るよりも、このようにするだけで一気にメリハリが出ます。
ここでの64分音符だけ短くするというのはあくまでも目安で、クォンタイズを「なし」にした場合、64分音符以下で長さを調節できます。


音によっては、前の音の母音が、次の音に食い込むことがあります。「マ行」「ナ行」「ラ行」は特に顕著に表れるので、プロパティの「オーバーラップ」を少し大きめにとります。大体先行発音の値の半分から、それを少し超えるくらいの間で数値を増やします。
逆に、前後の繋がりが必ず切れる音があります。「カ行」「タ行」「パ行」はオーバーラップの値をできるだけ小さく、場合によってはマイナスにします。

あとは間を持たせたり早口にしたりしますが、基本的に喋りの早さ遅さはテンポを変えるのではなく、全てノートの長さを変えて速さを変えています。
自論ですが、人はそれぞれ一定のテンポで喋り続けてて、音素の長さで早口やゆっくりなど使い分けてるのかなーと思っております。

そして完成したものがこちらです。

※Nはプロパティの「No Formant Filter」にチェックを入れている状態。ケロケロの処理を「行わない」ので、音素そのままの音を持ってくることができる。

次は連続音で調声する方法についてです。