« スカイリム(Skyrim)というゲームでMikuMikuDance(MMD)のダンスモーションを取り込んだMODが登場 | トップページ | 1677万7216色の画像をAvisynth 2.6でYV24にしてからRGB24に戻して色を数えてみた »

2012年2月19日 (日)

ゆっくりボイス(Softalkや棒読みちゃん等)をAviUtlで扱う場合は0.99k2以降がオススメ

ニコニコ動画の「ゆっくり実況」などで使われる、いわゆる「ゆっくりボイス」。
これはAQUEST社のAquesTalkライブラリを利用した人工音声です。

ゆっくり音声の生成に使う代表的なソフトには、

  「Softalk

  「棒読みちゃん

などが挙げられます。最近では

  「yukktalk(&nicotalk)」

  「ゆっくりMovieMaker

のように、ゆっくりボイスを生成して、それをAviUtlの拡張編集プラグインのタイムラインに
並べる作業までやってくれるツールもあります。(yukktalkは字幕やキャラ映像なども並べてくれます)

さて、このゆっくりボイスの扱いですが、ちょっと注意が必要な点があります。

Softalkや棒読みちゃんで出力したゆっくりボイスは、

  PCM 16bit 1ch 8000Hz (128kbps)

のwavファイルとなります。一方で、ゆっくりボイスをあわせる対象となる動画(キャプチャしたものなど)の
音声には、44100Hz48000Hzというサンプリング周波数が使われることが多いはずです。
元動画の音声を劣化させたくないでしょうから、編集プロジェクトを作る際にも44100Hzや48000Hzで
作ることが多いでしょうし、最終的にMP4出力する時もそうすることが多いでしょう。
その場合、8000Hzのゆっくりボイスは、44100Hzや48000Hzに変換されて使われることになります。

 ※yukktalkもVer2d時点では、サンプリングレート44100Hzのプロジェクトが生成されるようになっています。
   ゆっくりMovieMaker v1.0.5も、出力するexoファイルではサンプリングレートの指定はしていませんが
   exoから拡張編集プロジェクトを作成するとデフォルト値である44100Hzが使われます。)

さて、ここからがAviUtlでの話となります。
「AviUtl 0.99k」までは、44100Hzや48000Hzの編集プロジェクトにゆっくりボイス(8000Hz)を読み込むと、
元々のゆっくりボイスとは違った、ちょっと甲高い金属質(キンキン響く感じ)な声になってしまっていました。
しかし、2012/1/22にリリースされた「AviUtl 0.99k2」
   サンプリングレート変換処理を少し改良した。
という改良が行われたことで、元の音に近い形で処理ができるようになっています。
作者のKENくん氏のツイートによると、

  2倍以上にサンプリングレートを引き上げる場合に音質がイマイチだったのを少し改善しています

  ゆっくりさん用ですw 補間を変えておきました

とのことです。
そんなわけで、ゆっくりボイスを扱う方はAviUtl本体を 0.99k2 に更新することをお勧めします。

0.99kと0.99k2の比較動画を作ってありますので貼っておきます。聞き比べてみて下さい。

実は最初はユーザー側で何らかの対処をすればいいだろうと思って、ツイッターで呟きながら色々な音声変換ソフトを使って
サンプル動画をアップしていたのですが、KENくん氏がそれを見かねてさくっと本体の改良をして下さったという・・・。
なんというかすいませんというか、本当にありがとうございました。

Audacity、SRCDropといったツールで変換したサンプル動画も上げてありますので、一応そちらの一覧も貼っておきます。

 

|

« スカイリム(Skyrim)というゲームでMikuMikuDance(MMD)のダンスモーションを取り込んだMODが登場 | トップページ | 1677万7216色の画像をAvisynth 2.6でYV24にしてからRGB24に戻して色を数えてみた »

コメント

この記事へのコメントは終了しました。

トラックバック


この記事へのトラックバック一覧です: ゆっくりボイス(Softalkや棒読みちゃん等)をAviUtlで扱う場合は0.99k2以降がオススメ:

« スカイリム(Skyrim)というゲームでMikuMikuDance(MMD)のダンスモーションを取り込んだMODが登場 | トップページ | 1677万7216色の画像をAvisynth 2.6でYV24にしてからRGB24に戻して色を数えてみた »