ゲームとサラウンドサウンド

追記2: PS2のごく一部のタイトルはDTS Interactiveに対応している。http://av.watch.impress.co.jp/docs/20020111/ces12.htm
追記: 謎惑館のバイノーラルエフェクトはARNIS( http://www.arns.com/ )だった。ref. http://www.inside-games.jp/article/2011/09/28/51804.html
ゲームと立体音響の関わりは古い が、あまり注目されないポイントであるのもまた事実であるように思える。
ドットマトリクスで構成される映像とは異なり、音響は多くても5.1chような制限された数のスピーカーで実現されるため、多くの場合は正確な音場再現ではなく多少のデフォルメを含んでいてもより良い臨場感を提供するための方法論に重きが置かれている。
視覚同様に、聴覚も個人差が有り、特に(立体映像に比べて)立体音響は一般的でありながら、受け取る人間の個人差の影響をより受けやすい傾向にある。

黎明期: 2chステレオ化

ハードウェア制約の少ないアーケードゲームでは、ステレオなゲームはそれなりに早期から開発されていた。また、ナイトストライカー(TAITO、'89)の4ch出力のように、いわゆるサラウンドサウンドを採用したシステムもある。
家庭用ゲーム機のステレオ化は遅く、PCエンジン('87)が最初の採用となる。これ以降の家庭用ゲーム機は事実上全てのハードウェアがステレオ(またはそれ以上の)仕様になっている。
対照的に、携帯ゲーム機ではGameboy('89)の段階でステレオを採用している(ただし本体のスピーカは1ch)。携帯機の音声はイヤホン等で聴取するのが普通なので、これといってモノラルにする動機に乏しかったのだろう。
PCM出力さえ無いことの有る当時のハードウェアに於いて、2ch出力で行える空間表現の選択肢はそれほど無い。PCエンジンやそれ以降のステレオ + PSGまたはFM音源で構成されるシステムでは、オートパンのようなテクニックで左右のmix比率を熱心にコントロールすることにより空間表現を行っている楽曲がそれなりにあった。
いづれにせよ、本格的なサラウンドへの取り組みが見られるのは2000年台以降のハードまで待たされることになる。幾つかのタイトル - たとえばPCエンジンのスーパーダライアス等 - はドルビーサラウンドな3ch出力を実現していたが、ゲーム機のシステムとして標準的に提供されるものではなかった。

現状: 5.1/7.1chサラウンド

驚くべきことに、現行の据置型家庭用ゲーム機は全てサラウンドをサポートしている。HDMIは8chのPCM音声を伝送でき、個々のSDKも8ch(または5.1ch)の出力をサポートし、いわゆる3D Positional audioを何らかの形でサポートしている。
これは簡単にはDVD-Video以降のハードウェアと要約できる。DVD-Videoはサラウンド音声を規格に盛り込んでいたため、DVD-Videoの良い再生環境 = 5.1chサラウンドを再生可能な環境という状況が2000年台初めから実現されている。ゲーム機はこの環境に"乗っかる"形でその再生環境を利用し、インタラクティブ立体音響の実現に邁進することになる。
しかしながら、一般的なTV視聴環境ではなかなか5.1ch/7.1ch環境は整備されていないので、現状サラウンド専用のゲームは殆ど存在しない。
携帯用ゲーム機は、現状においても2ch以上の出力を標準でサポートするものは存在しない。PSPはごく一部のタイトルがドルビープロロジックIIに対応しているが、コレに対応した携帯環境を用意することはなかなか難しいように思える。
see追記↑: 3DSDSPを内蔵しており、このDSPによるエフェクトの一つとして(おそらくHRTFベースの)3Dオーディオエフェクトを実現できると言われている:

使用されているボイスやSEはすべてオトフォニクスという訳ではありません。モノラル、3DS内蔵のリアルタイムバイノーラルなども併用されています。
リアルタイムバイノーラルは頭部伝達関数を用いて任意の場所にモノラル音声を定位できる技術です。

トランスポート: アナログ、S/PDIFHDMI

サラウンドサウンドを実現するためには、多数のスピーカーを接続することになる。重要なポイントは、S/PDIFも多チャンネル音声は圧縮しないと転送できないという点で、多チャンネル音声を無圧縮で伝送したければHDMIを使うか、さもなくば、直接アナログケーブルを複数本使ってスピーカを接続する必要がある。
DVDの視聴者であれば聞き覚えがあるであろう"ドルビーデジタル(= AC-3)"とか"dts"とか"ドルビープロロジックII"のような音声フォーマットは全て圧縮フォーマットであり、多チャンネル音声を2ch音声程度の帯域に圧縮している。

ドルビーのページがこれらのシチュエーションをよく要約している。つまり:

これらのエンコードはゲームに影響しないようにハードウェア(またはシステムが予約しているCPU/DSPリソース)で行われる。
ちなみに、この状況はPCでも大差無いため、MacOSWindowsS/PDIFのパススルーに関してそれなりに熱心に考察している。パススルーを行えなければ完全なDVDプレーヤ(AC-3やdtsのパススルーを要求する)を実装することが出来ない。
PC上のドルビープロロジックIIリアルタイムエンコード(downmix)*1は、例えばffdshow等で行うことが出来る。
これらの手法は音声圧縮の一種なので、それなりに音質に対する犠牲がある。例えば、ドルビープロロジックIIは個々のスピーカ出力を2chにdownmixするため、リアスピーカでしか鳴らない音 を表現することは出来ない。つまり、DVD-videoにはロスレスサラウンドサウンドに対する良いソリューションが無く、この実現にはBlu-rayHD-DVDの再生環境(= HDMI)を待つ必要がある。

"コバンザメ"であること

家庭用ビデオゲーム機の宿命として、既存の幅広く普及しているメディアの制約を常に受けるという点がある。前世代まで人々を悩ませ続けたPAL/NTSCの違いであったり、HD放送の普及に伴うHD化の波など。
同様に、音響に関しても映画音声を可能な限り忠実に届ける方法としての家庭用サラウンドシステムが先にあり、このサラウンドシステムを"転用"する形で発想されているのが、ゲームにおけるインタラクティブサラウンドオーディオということになる。このため、本来の目的であるBlu-rayやDVD-Videoの仕様を知ることが効率的なシステムデザインには要求されている。

*1:この"downmix"はこの界隈で習慣的にそう呼ばれているに過ぎない。一般にはオーディオチャンネルをミキシングによってより少ないオーディオチャンネルにすることがdownmixになる。