前言

音频编码格式顾名思义是对音频编码的方式,需要注意的是与音频文件格式进行区分。音频文件格式可以理解成是一种容器用于存储音频数据,例如".wav"音频文件通常使用PCM音频编码格式,而".mp3"文件则是使用mp3音频编码格式。

音频编码格式基本概念

音频编码格式可以分为三类:

  • 未压缩(uncompression)

  • 无损压缩 (lossless compression)

  • 有损压缩 (lossy compression)

未压缩

定义:

​ 未压缩音频表示音频文件的所有数据都是原始录音捕获的数据,没有任何的数据丢失和减少。

特点:

  • 高质量:保持原始音频录制的质量。
  • 大文件大小:由于没有数据被移除或减少,导致文件体积较大。
  • 广泛兼容:通常与各种播放系统更加通用兼容。
  • :如WAV和AIFF格式。

用途

​ 通常用于专业音频设置中,保持最高质量至关重要,例如在音乐制作、声音设计和录音室中。

无损压缩

定义

​ 无损压缩涉及减小音频文件的大小,同时不损失任何质量。可以从压缩数据完美重建原始数据。

特点:

  • 质量保持:与有损压缩不同,保持与原始音频相同的质量。
  • 减小文件大小:与未压缩音频相比,文件大小较小,但不如有损压缩文件小。
  • 需要解压缩:播放前需要解压缩,可能会使用更多的处理资源。
  • :FLAC、ALAC

用途

在需要节约存储空间但又重视音质的情况下使用。适用于高质量音乐流媒体、存档以及重视音频保真度的音频爱好者。

有损压缩

定义

​ 有损压缩通过永久性地消除被认为对人耳感知不太重要的某些数据部分来减小音频文件的大小。这个过程是不可逆的,意味着一旦数据被压缩,被丢弃的信息无法恢复。

特点

  • 显著减小文件大小:与无压缩和无损格式相比,提供了更小的文件大小。
  • 质量损失:压缩涉及音质的权衡。根据压缩级别(比特率),音质损失可以从几乎不可察觉到显著不同。
  • 高效性:需要较少的存储空间和带宽,非常适合流媒体和存储大量音乐或其他音频。
  • 示例:常见格式包括MP3、AAC和OGG Vorbis。

用途

广泛用于消费者音频应用,如流媒体服务、MP3播放器和互联网音频。它是在存储空间和带宽有限、绝对音频保真度不是至关重要的情况下的流行选择。

Wwise引擎中的4种编码格式

在Wwise中间件中,有四种默认的音频格式:

  • PCM (uncompression)
  • Vorbis (lossy compression)
  • Opus (lossy compression)
  • ADPCM (lossy compression)

PCM (Pulse Code Modulation)

定义:PCM 是一种未压缩的格式,直接表示原始音频数据,没有经过任何形式的压缩。

特点:提供最佳的声音质量,但占用较高的存储空间;对 CPU 处理要求较低。

游戏中的应用

  • 短且重复的音频文件:减少对处理能力的压力。
  • 高保真声音:适用于需要高质量音频输出的场景。

备注: 在 Wwise 中导入音频文件时,通常使用 '.WAV' 文件格式,并采用 PCM 音频格式。这确保了高质量的源文件,可以稍后转换为其他格式或保持为 PCM。

Vorbis

定义:Vorbis 是一种开源的有损压缩编解码器,能在低比特率下保持良好的声音质量。

特点:与其他格式相比,在非常低的比特率下保持较好的声音质量。并且在 Wwise 中,这种格式针对交互媒体和游戏平台进行了高度优化。

Vorbis格式在多交互媒体和游戏平台的优势:

  1. 高效的音质保持:Vorbis 在较低比特率下能够保持较好的音质。这对于游戏开发尤为重要,因为游戏通常包含大量的音频内容,需要在保持音质的同时尽量减少文件大小。
  2. 开源和无版税:Vorbis 是一个开源的编解码器,这意味着它可以免费使用,不涉及版权费用,降低了开发成本。
  3. 良好的适应性:Vorbis 格式适用于各种不同的游戏和交互媒体场景,包括复杂的音频环境和动态音频交互。
  4. 平台兼容性:Vorbis 在多种硬件平台上都表现良好,包括PC、主机和移动设备。这使得它成为跨平台游戏开发的理想选择。
  5. 动态流媒体优化:Vorbis 适合动态音频流媒体,这对于需要实时音频处理和动态音效调整的游戏来说非常重要。
  6. 处理效率:虽然 Vorbis 需要一定的处理能力来解压,但它在游戏中的应用通常是可接受的,尤其是在桌面和主机平台上。

游戏中的应用

  • 项目中的大多数声音:适用于大部分情况,但应避免用于需要高重复率的音频文件,因为它需要一些处理能力来解压缩。
  • “嘈杂”的声音:如岩石破坏等,压缩带来的伪影不太可能被用户感知为低质量。

备注: Vorbis 编解码器在音频文件中需要暂停、恢复或循环播放时,需要使用 Seek tables。

Seek Table

关于Seek Table的具体配置,可查看Wwise 251课程。下面是一些关键点:

  1. 定义:Seek tables 是音频文件中的一部分,包含关于文件不同部分的信息。这些信息使得音频播放器可以快速定位(或“跳转”)到音频流中的特定位置,而无需从头开始顺序播放。
  2. 用途:Seek tables 主要用于需要随机访问的情况,比如当用户希望跳转到音频文件的特定部分时。在游戏中,这种功能特别有用,因为它允许快速访问音轨的不同部分,例如循环播放背景音乐的特定段落,或在对话中跳到特定点。
  3. 与有损压缩的关系:在某些有损压缩格式(如Vorbis)中,文件被分割成多个小的数据块进行压缩。没有 Seek tables,音频播放器需要从头开始顺序处理这些数据块,直到达到所需的位置。这在快速访问或循环播放时会变得效率低下。
  4. 性能考虑:使用 Seek tables 可以提高性能,特别是在处理较大的音频文件或在资源受限的设备上。通过减少必须处理的数据量,可以提高应用程序的响应速度和整体性能。
  5. 在游戏音频中的重要性:游戏音频经常需要高度的交互性和动态响应。利用 Seek tables,可以实现更为精准和快速的音频内容访问,从而增强游戏的音频体验,比如快速响应游戏事件触发的音效变化。

Opus

定义:Opus 是 Vorbis 的一个替代品,是一种有损压缩编解码器。

特点:使用更多 CPU,但在类似的质量下允许更大的压缩;不需要 Seek tables 来寻找或循环。

游戏中的应用

  • 非循环的音频源:如对话或长的音频源,如环境声;适用于对文件大小要求特别严格的场景。

ADPCM (Adaptive Differential Pulse-Code Modulation):

定义:ADPCM 提供相对于 PCM 更小的文件大小的音频格式。

特点:提供与 PCM 相比 3:1 的压缩比;与 Vorbis 相比几乎不使用 CPU。

游戏中的应用

  • 环境声或其他音效:适用于想要比 PCM 释放更多内存的场景。
  • 移动设备:作为节省 CPU 和运行时内存的 Vorbis 替代品。

其他音频编码格式

  1. MP3 (MPEG-1 Audio Layer III)
    • 描述:MP3 是最著名的音频编码格式之一,用于有损压缩数字音频。它通过去除人耳难以察觉的音频信息来减小文件大小。
    • 优点:文件大小小,兼容性强,广泛应用于音乐播放器、流媒体服务等。
    • 缺点:音质在高压缩比下会有所下降。
  2. AAC (Advanced Audio Coding)
    • 描述:AAC 是一种比 MP3 更高效的有损压缩格式,提供更好的音质。
    • 优点:在相同比特率下比 MP3 提供更好的音质;广泛用于流媒体服务。
    • 缺点:不像 MP3 那样普遍支持,特别是在一些旧的或限制性的硬件设备上。
  3. FLAC (Free Lossless Audio Codec)
    • 描述:FLAC 是一种无损压缩音频编码格式,完美保留原始音频数据。
    • 优点:提供无损音质,文件大小小于 WAV;支持元数据标签。
    • 缺点:文件大小仍然比有损格式大,不适合流媒体服务。
  4. ALAC (Apple Lossless Audio Codec)
    • 描述:ALAC 是 Apple 开发的无损压缩格式,与 FLAC 类似。
    • 优点:无损音质;与 Apple 生态系统(如 iTunes 和 iPod)兼容性良好。
    • 缺点:文件大小较大,主要在 Apple 设备和软件中使用。
  5. WMA (Windows Media Audio)
    • 描述:WMA 是由微软开发的一系列音频编码格式和其相应的音频编解码器。
    • 优点:提供了有损和无损格式;与 Windows 平台兼容性良好。
    • 缺点:在非 Windows 平台上的支持不如其他更普及的格式。

常见音频文件格式与对应的音频编码格式

  • WAV - PCM (也可以ADPCM)
  • MP3 - MP3 (有损压缩)
  • AAC - AAC (有损压缩)
  • OGG - Vorbis / Opus (有损压缩,开源且无版税)
  • FLAC - FLAC (无损压缩)
  • ALAC - ALAC (无损压缩)
  • WMA - WMA (可以有损也可以无损)