空間から鼓膜への自然な音声伝送をシミュレートする数学モデル;ヘッドフォンを通じた正確な3Dオーディオ位置特定を実現する。
技術詳細
HRTFは、各リスナーに対して、角度分解能が通常5〜15度の360度の空間角度位置で測定することにより作成されます。データセットは通常、片耳あたり1,550〜2,500の測定点を含み、50〜200MBのストレージ容量が必要です。CIPIC Databaseのような最新のHRTFデータベースには、45種類のリスナータイプが含まれており、それぞれ1,250以上の方向があります。測定は、無響室で、聴道内に校正されたミニチュアマイクロフォンを使用し、様々な角度からテストトーンまたは広帯域インパルスを再生して行われます。
歴史と発展
体系的なHRTF研究は、1988年にMIT Media LabでDuane Cooperの指導の下で始まりました。1994年、Crystal River Engineeringは、25,000ドルで最初の商用HRTFシステム「Convolvotron」を発売しました。Lake Technologyは、1998年にコンシューマーハードウェア向けの最初のリアルタイムHRTFプロセッサを開発しました。映画産業にとってのブレークスルーは、2016年にDolby Atmos Renderer 3.0が登場したことで、ポストプロダクションにおけるヘッドフォンミックスのためのHRTFベースのバイノーラライゼーションが初めて統合されました。
映画での実用例
「Gravity」(2013)では、サンドラ・ブロックのヘルメット内の呼吸音や無線通信の正確なポジショニングのためにHRTF処理が使用されました。「1917」(2019)では、360度空間における砲弾の着弾音や機関銃掃射音の没入感のある配置のために、パーソナライズされたHRTFが使用されました。Netflixは、2020年以降、ストリーミング配信におけるAtmosコンテンツの自動バイノーラライゼーションのためにHRTFレンダリングを使用しています。このワークフローには、Audiokinetic WwiseやFacebook 360 Spatial Audioのような特別なコンボリューションエンジンが必要であり、20ms未満のレイテンシーでリアルタイムHRTFフィルタリングを可能にします。
比較と代替手段
HRTFは、実際の高さのローカライゼーションを可能にする角度依存の周波数整形という点で、静的なサラウンドパンニングとは異なります。アンビソニックスデコーディングは、個々の伝達特性ではなく、数学的な球面調和関数で動作します。最新の代替手段としては、Steam AudioやGoogle Resonanceのようなオブジェクトベースのオーディオエンジンがあり、これらはHRTFと空間音響シミュレーションを組み合わせています。ヘッドセットVRにはHRTFが不可欠であり続ける一方、スピーカー再生にはAmbiophonicsのようなクロストークキャンセレーション技術が好まれます。