「初音ミク」が創った新しい音楽の世界 ―― エレキジャック・フォーラム in Akihabara 2012

福田 昭

●FM音源から音声素片の連結へ

 商用の歌声合成システムとしては,ヤマハにおける最初の歌声合成の取り組みであるプラグイン・ボード「PLG-100SG」を紹介した.FM音源をベースとした時間領域フォルマント合成方式の音源である.この音源による歌声も,剣持氏は再生して聞かせてくれた.1997年に開発されたPLG-100SGは,FM音源というハードウェアの制約のため,子音の発生に難点があったという.

 ヤマハが新たな歌声合成システムVOCALOIDの開発を始めたのは,2000年3月のことである(写真8).音声素片を連結して歌声を合成する技術を採用した.最初の製品であるバージョン1がリリースされたのが2004年.その3年後にバージョンアップした「VOCALOID2」の開発を完了し,「初音ミク」が発売された(「初音ミク」の発売元はヤマハのパートナ企業であるクリプトン・フューチャー・メディア).

 

写真8 「VOCALOID(ボーカロイド)」の概要と開発史

 

 

 VOCALOIDはエディタと歌声合成エンジン,ライブラリ(歌声ライブラリと感情ライブラリ)で構成される(写真9).ライブラリはヤマハのほか,クリプトン・フューチャー・メディアなどのパートナ企業が作成する.そして各社が歌声合成ソフトウェアを独自のブランドで発売している.

 

写真9 VOCALOIDシステムの構成

 

 

 歌声ライブラリは,音声素片のデータベースである(写真10).歌手や声優などの歌声をスタジオで収録し,データベース化する.そのままでは意味不明な歌声を発生してもらうため,歌手や声優などにとっては相当に大変な作業になるようだ.

 

写真10 歌声ライブラリの作成

 

 

 それからVOCALOIDで使われている,音声素片を利用して歌声を合成する仕組みを,剣持氏は解説してくれた(写真11).音声の素片を集めたライブラリから,素片同士を周波数領域で接続する.例えば「朝(あさ)」という音声を合成する場合は,「#a」,「a-s」,「s-a」,「a」,「a#」の五つの素片(音素)を接続する.音素同士をそのまま接続しただけでは自然な音声にならないので,音色を調整したり,のばし音をさらにのばしたり,といった加工を施す(写真12).これは「ヤスリがけ」のようなイメージだという.

 

写真11 歌声合成の仕組み

 

写真12 音声素片の接続

 

 

 また音声の発生では,子音のタイミングを早め,音符のタイミングと母音のタイミングを一致させている(写真13).このタイミング調整は歌声合成ソフトウェアが自動的に実行するのでソフトウェアのユーザからは見えないものの,非常に重要だとする.子音と音符のタイミングが同じだと,実際には歌声が遅れて聞こえてしまうのだ.


写真13 発声タイミングの調整


 

●新しい音楽は新しい楽器が作る

 VOCALOIDを採用した歌声合成ソフトウェアは,基本的にはパソコンをプラットフォームとしている.最近ではiPadやiPhoneなどにも対応している(写真14).さらには専用ハードウェア「VOCALOID-board」を開発中である.8cm角のボードを顧客に評価してもらっているほか,外形を縮小した4cm角のボードも開発している.

 

写真14 プラットフォームの拡張と専用ハードウェアの開発

 

 

 最後に剣持氏は,大作曲家ベートーベンの作った楽曲の音域が年代とともに拡大していることが,楽器であるピアノの音域の拡大によるものである,という事例を紹介した.つまり,新しい音楽は新しい楽器とともに生まれてくる.VOCALOIDからは,これまでになかったタイプの歌詞を備えた楽曲が作られているとして,「初音ミク」を使用した楽曲「ワールドイズマイン」を例に挙げた.「歌詞が突き抜けている」という.

 

 

組み込みキャッチアップ

お知らせ 一覧を見る

電子書籍の最新刊! FPGAマガジン No.12『ARMコアFPGA×Linux初体験』好評発売中

FPGAマガジン No.11『性能UP! アルゴリズム×手仕上げHDL』好評発売中! PDF版もあります

PICK UP用語

EV(電気自動車)

関連記事

EnOcean

関連記事

Android

関連記事

ニュース 一覧を見る
Tech Villageブログ

渡辺のぼるのロボコン・プロモータ日記

2年ぶりのブログ更新w

2016年10月 9日

Hamana Project

Hamana-8最終打ち上げ報告(その2)

2012年6月26日