話速変換や音域拡張,バーチャル・サラウンド,自動音場補正など(後編) ―― DSPによる音声信号処理の動向と実現法

米本 明弘,桜井 淳宏,岩田 佳英,伊藤 裕二

5. 2本のスピーカでサラウンドが楽しめるバーチャル・サラウンド

 近年,DVDやマルチメディア・コンテンツの普及に伴い,よりリアルな音声を家庭で楽しめるホーム・シアタ・システムなどが注目を集めています.その迫力は映画館のレベルには達しないものの,物の動きや位置関係などの表現は,従来のステレオ・システムよりも優れています.しかし,視聴エリアを四方から取り囲むようにスピーカを設置することは,専用視聴室のない一般の住宅では困難です.そのため,こういった製品は幅広い消費者層に受け入れられるまでには至っていません.

 バーチャル・サラウンド技術はこのような事情を改善することを目的とします.つまり,従来のステレオ・システムで使われる2本のスピーカだけを用いて,ホーム・シアタと同じサラウンド効果を作り出し,「バーチャル」なホーム・シアタ・システムを実現します.

● 頭部伝達関数を利用し仮想スピーカを設ける

 バーチャル・サラウンド技術は,音源から左右の耳に至るまでの音の伝達特性を示す頭部伝達関数(HRTF:Head Related Transfer Function)を使い,前面の2本のスピーカあるいはヘッドホンといった2チャネルの出力だけで真正面や前面左右,背面左右に仮想的な音源を作り出します.それを実現するため,HRTF係数をディジタル・フィルタに組み込み,信号が実際の空間を伝わって左右の耳に到来するまでの過程をシミュレートします.例えば,背面左45°(135°)の角度に仮想スピーカを設置する場合を考えます(図16).この角度における左右の耳に対応するHRTF係数を利用して原音のフィルタリングを行います.ここで得られる2チャネルの信号(バイノーラル信号)を左右の内耳で再生すれば,仮想音源の効果が得られます.



図16 仮想音源の考え方(135°方向の例)
ある角度に対応する左右のHRTF係数を用いて原音をフィルタリングする.処理された信号は指定角度に位置する音源による音が左右の内耳に到来したときの状態に相当する(バイノーラル信号).HRTF係数は無響室で測定されるため,この信号には反射音が一切含まれていない.

 

● ヘッドホンとスピーカの違い

 内耳における音像定位について述べましたが,スピーカを使用する場合,スピーカから両耳までの特性を考慮しなければなりません.その場合,伝搬による音圧の減衰よりも反対側のスピーカからの音漏れ(クロストーク)の影響の方が大きく,それを除去する必要があります.

 一方,ヘッドホンの場合,反対側からの音漏れが少ないためクロストークを除去する必要はないものの,臨場感を高めるために特殊な処理が必要です.HRTFは無響室で測定されるため,HRTFと畳み込んだ信号には方向に関する情報が含まれていますが,音源からの距離や聴取環境などに関する情報は含まれていません.それらの情報を付加し,臨場感を高めるためには残響を人工的に生成する必要があります.なお,スピーカを使用する場合は実際の環境による自然な残響が存在するため,その必要はありません.

● スピーカではクロストークを除去する処理を行う

 スピーカによる聴取環境を線形システムとみなせば,スピーカから人間の左右の耳までの伝達関数を2次行列(2ポート系)として表現できます(図17).そこで,伝達関数の逆行列を近似的に求め,信号に対しそれを適用すれば,クロストークによる影響を理論上除去できます.

 しかし聴取環境による系の逆行列を求めた結果,ダイナミック・レンジの低下につながる高いピークを有する伝達関数が見られることがあります.そこでクロストーク除去で用いられるディジタル・フィルタを最適なものにし,ピークの影響を軽減する手法などが提案されています.

 クロストーク除去という処理は特定のスピーカの位置に依存するため,実用にあたり,物理的な条件の変化に対する頑健性が問われます.特に,効果の期待できる領域(スイート・スポット)の広さがシステムの重要な特徴となります.図17にクロストーク除去システムの構成を示します.



図17 クロストーク除去
スピーカを駆動する信号(X1,X2)は環境(H)の影響を受けて左右の耳に到来する(Y1,Y2).従って原音Eが直接耳に到達するためには,CHC=H-1(上付き)を満たすような行列を求め,原音Eに対して適用すればよい.

 

● ヘッドホンでは残響を生成する処理を行う

 残響とは聴取環境で発生する無数の反射音による総合的な効果のことです.それを人工的に作り出すためには,コンサート・ホールの特等席などでインパルス応答を測定する方法や反射モデル(8)などを用いた方法,IIRフィルタの特性を利用した方法(9)などがあります.

 ここでは反射モデルまたは実測によって求められたインパルス応答があると仮定し,それから残響を作り出します.残響を含めたインパルス応答は非常に長く,通常のFIRフィルタの実装には適しません.この場合,周波数領域におけるブロック処理(10)が適切ですが,信号だけでなく係数もブロック分割します.その結果,次数の小さいFFTで処理を済ませ,必要なメモリ容量と出力の遅延を抑えることができます.この手法に基づく実装例を図18に示します.



図18 残響生成用FIRフィルタの実装例
係数をブロック分割することにより,点数の少ないFFTで処理でき,必要なメモリ領域が大幅に減少.

 

● バーチャル・サラウンドをDSPに実装するためのヒント

 バーチャル・サラウンド技術のDSPへの実装について説明します(図19).HRTFの実装は通常のFIRフィルタまたはIIRフィルタで実装できます.ここではDSPメーカから提供されるDSP用の最適化されたライブラリを用いることができます.



図19 バーチャル・サラウンド・システムの基本構成
HRTFを用いた仮想音源処理は共通だが,その後の処理はスピーカとヘッドホン・システムで異なる.スピーカでは反対側のスピーカから聞こえる(クロストーク)を除去する必要があるが,ヘッドホンにはそのような問題はない.一方,ヘッドホン・システムではHRTFで処理した信号をほぼそのまま聴取できるため,聴覚的な印象は無響室で聞く音に近く,臨場感を与えるために残響を作りこむ必要がある.スピーカの場合は実環境による残響があるため,その必要はない.

 クロストーク除去処理も同じように通常のFIRフィルタまたはIIRフィルタを用いることができます.参考文献(11)の手法と組み合わせると大幅な演算量の削減が見込めます.また,ヘッドホン用の残響生成処理は,周波数領域での処理が適切ですが,HRTF処理も含めて周波数領域で行う方法も考えられます.周波数領域への変換にもDSPメーカの提供する最適化されたライブラリを使用できます.

 ここで紹介したスピーカやヘッドホン用のバーチャル・サラウンド・アルゴリズムはC67DSPに実装されています.必要とされる演算量は20MHz未満ですが,IIRフィルタで構成される低コスト仕様では10MHz程度です.

組み込みキャッチアップ

お知らせ 一覧を見る

電子書籍の最新刊! FPGAマガジン No.12『ARMコアFPGA×Linux初体験』好評発売中

FPGAマガジン No.11『性能UP! アルゴリズム×手仕上げHDL』好評発売中! PDF版もあります

PICK UP用語

EV(電気自動車)

関連記事

EnOcean

関連記事

Android

関連記事

ニュース 一覧を見る
Tech Villageブログ

渡辺のぼるのロボコン・プロモータ日記

2年ぶりのブログ更新w

2016年10月 9日

Hamana Project

Hamana-8最終打ち上げ報告(その2)

2012年6月26日