模拟声音从空间到鼓膜自然传输的数学模型;通过耳机实现精准的3D音频定位。
技术细节
HRTF是通过在360个空间角度位置进行测量来为每个听众创建的,角度分辨率通常为5-15度。数据集通常包含每只耳朵1,550-2,500个测量点,需要50-200 MB的存储空间。现代HRTF数据库,如CIPIC数据库,包含45种不同的听众类型,每种类型有超过1,250个方向。测量在消声室中进行,使用校准的微型麦克风插入耳道,同时从不同角度播放测试音或宽带脉冲。
历史与发展
系统性的HRTF研究始于1988年,在MIT媒体实验室由Duane Cooper领导。1994年,Crystal River Engineering公司以25,000美元的价格发布了首个商业HRTF系统“Convolvotron”。Lake Technology公司于1998年开发了首批用于消费级硬件的实时HRTF处理器。对于电影行业来说,突破发生在2016年,当时Dolby Atmos Renderer 3.0首次集成了基于HRTF的双耳化处理,用于后期制作中的耳机混音。
在电影中的实际应用
《地心引力》(2013) 利用HRTF处理来精确地定位桑德拉·布洛克头盔内的呼吸声和无线电通讯。“1917”(2019) 使用个性化HRTF来沉浸式地放置360度空间内的手榴弹爆炸声和机关枪扫射声。Netflix自2020年起在流媒体交付时,利用HRTF渲染对其Atmos内容进行自动双耳化处理。该工作流程需要特殊的卷积引擎,如Audiokinetic Wwise或Facebook 360 Spatial Audio,它们能够实现低于20毫秒延迟的实时HRTF滤波。
比较与替代方案
HRTF与静态环绕声声像的区别在于其角度依赖的频率整形,这使得真实的垂直声像定位成为可能。Ambisonics解码使用数学球谐函数而不是个体传输特性。现代替代方案是基于对象的音频引擎,如Steam Audio或Google Resonance,它们将HRTF与空间声学模拟相结合。对于头戴式VR,HRTF仍然是必不可少的,而对于扬声器播放,则更倾向于使用串扰消除技术,如Ambiophonics。