将声音作为具有空间元数据的可动3D对象而非固定扬声器通道处理的音频技术。Dolby Atmos支持128个对象,自动适应不同的影院配置。
技术细节
杜比全景声支持多达128个同步音频对象,最高采样率为48 kHz/24 Bit。DTS:X 支持无限数量的对象,但实际应用中通常使用32-64个对象。元数据以BWF(广播波格式)或独立的ADM(音频定义模型)文件形式,根据ITU-R BS.2076标准传输。每个对象都包含有关大小、弥散度和优先级的相关信息。空间分辨率通常为方位角和仰角0.1度。在影院播放时,影院处理器(CP850或RMU)会将对象位置重新计算到最多64个扬声器上。
历史与发展
杜比于2012年通过《勇敢传说》首次引入了基于对象的影院音频。DTS于2014年通过《猩红山峰》(2015年)推出了DTS:X。2014年,克里斯托弗·诺兰的《星际穿越》采用了杜比全景声混音,包含128个同步对象,标志着该技术取得了突破性进展。2016年,ITU-R确立了BS.2076标准,用于基于对象的音频元数据。Netflix于2017年开始支持全景声流媒体,亚马逊Prime紧随其后于2018年跟进。自2019年以来,所有主流流媒体平台都支持基于对象的格式。
在电影中的实际应用
《疯狂的麦克斯:狂暴之路》(2015年)在追逐场景中使用了76个音频对象,每个车辆都作为一个独立的对象在影院空间中移动。《银翼杀手2049》(2017年)则将雨滴作为32个独立的音频对象放置在观众上方,以实现基于对象的音频效果。混音过程通常在配备全景声模块的Avid S6或SSL System T等调音台上完成。缺点是混音时间延长30%,CPU负载增加,并且与老式影院的兼容性有限。优点是无需重新混音即可自动适应不同的扬声器配置。
比较与替代方案
基于通道的音频(5.1、7.1)将声音固定分配给特定的扬声器,而基于对象的音频则保持灵活性。Ambisonics(1阶=4通道,3阶=16通道)编码完整的声场,而基于对象的系统则处理单个声源。双耳音频仅适用于耳机,而基于对象的音频可以扩展到任何扬声器布局。MPEG-H Audio(自2020年起)结合了基于通道、基于对象和基于场景的方法。对于艺术电影,5.1声道通常已足够;大片则倾向于使用杜比全景声;电视节目则越来越多地选择基于对象的家庭影院格式。