「初音ミク」が創った新しい音楽の世界 ―― エレキジャック・フォーラム in Akihabara 2012
tag: 組み込み 電子回路 ディジタル・デザイン
レポート 2012年4月17日
●FM音源から音声素片の連結へ
商用の歌声合成システムとしては,ヤマハにおける最初の歌声合成の取り組みであるプラグイン・ボード「PLG-100SG」を紹介した.FM音源をベースとした時間領域フォルマント合成方式の音源である.この音源による歌声も,剣持氏は再生して聞かせてくれた.1997年に開発されたPLG-100SGは,FM音源というハードウェアの制約のため,子音の発生に難点があったという.
ヤマハが新たな歌声合成システムVOCALOIDの開発を始めたのは,2000年3月のことである(写真8).音声素片を連結して歌声を合成する技術を採用した.最初の製品であるバージョン1がリリースされたのが2004年.その3年後にバージョンアップした「VOCALOID2」の開発を完了し,「初音ミク」が発売された(「初音ミク」の発売元はヤマハのパートナ企業であるクリプトン・フューチャー・メディア).
VOCALOIDはエディタと歌声合成エンジン,ライブラリ(歌声ライブラリと感情ライブラリ)で構成される(写真9).ライブラリはヤマハのほか,クリプトン・フューチャー・メディアなどのパートナ企業が作成する.そして各社が歌声合成ソフトウェアを独自のブランドで発売している.
歌声ライブラリは,音声素片のデータベースである(写真10).歌手や声優などの歌声をスタジオで収録し,データベース化する.そのままでは意味不明な歌声を発生してもらうため,歌手や声優などにとっては相当に大変な作業になるようだ.
それからVOCALOIDで使われている,音声素片を利用して歌声を合成する仕組みを,剣持氏は解説してくれた(写真11).音声の素片を集めたライブラリから,素片同士を周波数領域で接続する.例えば「朝(あさ)」という音声を合成する場合は,「#a」,「a-s」,「s-a」,「a」,「a#」の五つの素片(音素)を接続する.音素同士をそのまま接続しただけでは自然な音声にならないので,音色を調整したり,のばし音をさらにのばしたり,といった加工を施す(写真12).これは「ヤスリがけ」のようなイメージだという.
また音声の発生では,子音のタイミングを早め,音符のタイミングと母音のタイミングを一致させている(写真13).このタイミング調整は歌声合成ソフトウェアが自動的に実行するのでソフトウェアのユーザからは見えないものの,非常に重要だとする.子音と音符のタイミングが同じだと,実際には歌声が遅れて聞こえてしまうのだ.
●新しい音楽は新しい楽器が作る
VOCALOIDを採用した歌声合成ソフトウェアは,基本的にはパソコンをプラットフォームとしている.最近ではiPadやiPhoneなどにも対応している(写真14).さらには専用ハードウェア「VOCALOID-board」を開発中である.8cm角のボードを顧客に評価してもらっているほか,外形を縮小した4cm角のボードも開発している.
最後に剣持氏は,大作曲家ベートーベンの作った楽曲の音域が年代とともに拡大していることが,楽器であるピアノの音域の拡大によるものである,という事例を紹介した.つまり,新しい音楽は新しい楽器とともに生まれてくる.VOCALOIDからは,これまでになかったタイプの歌詞を備えた楽曲が作られているとして,「初音ミク」を使用した楽曲「ワールドイズマイン」を例に挙げた.「歌詞が突き抜けている」という.