MPEG音频


  MPEG音频属于宽频带压缩处理标准,根据其压缩算法不同,对它确定了I、II、Ⅲ层共3个层次的算法。
  
  VCD、DVD和电视场合,使用它的第Ⅱ层算法。MPEG音频信号是一种对信号压缩处理后形成的数码信号,对原信号的取样多取48k,量化精度取16bit。其主要形式有MPEG-1和MPEG-2两种,可将音频数据量压缩为1/10~1/6,MPEG-2音频比MPEG-1音频的指标更为严格,MPEG-2音频格式的取样频率可取为32kHz、44kHz和48kHz;也可以采用低取样频率,增加了24kHz、22.05kHz、16kHz低取样频率。
  
  下图是MPEG音频编、的简化方框图。首先看压缩器的方框图。该编码器主要由32波段多相组(库)、量化和比特分配器、心理听觉模型和比特流形成电路等组成。其基本思路是:输入16bit的PCM数码流,进行掩蔽效应处理。
  
  输入数据流,首先进入32波段多相组(库),进行由时间域到频率域的变换,将时域输入信号转换为32个子波段基本波形(频域)的叠加。它采用子带编码方式,将宽频带输入信号分割为32个狭窄频段,称为子频段(简称子带)。即将波形群转换为对应于32组频率系数序列(称子带样本)。于是,利用各子带功率不均匀性进行独立编码,以便减小各子带内信号能量的不均匀性,利于减小。此外,对这种系数序列进行逆变换时,完全可以恢复为原来的信号波形,在变换过程中没有数据压缩效果,不引起信号质量的劣化。
  
  多相器组是多相结构的FIR数字滤波器组,它将16bit的PCM数据流信号,在频域范围内分割为带宽为750Hz的32个子频带信号,然后将频率系数序列送到量化和比特分配器。
  
  量化和比特分配器简称为位分配器。各滤波器输出的频率系数还要像视频数据那样进行再量化,以便压缩数据量。位分配器在心理听觉模型电路的控制下,根据心理听觉特性对滤波器组输出的信息进行计算,可依据各子带的能量进行最佳的比特分配,即对各子带的量化步长进行自动分配,通过调整各子带的量化步长,取得合适的量化编码。当位分配器输出一组量化参数和量化数据时,已经舍弃了对听觉效果影响较小的信息,但保留了音频信息的主体部分。
  
  最后是比特流形成电路,又称为位流编组电路、帧打包电路等。该电路可将量化和比特分配器参数、量化数据及其他辅助信息编码,并按照一定的格式对这些信息进行编组,打包成帧排列。经上述格式编组后,音频压缩数据经过多重化处理后,组成统一的码流,存入媒体中。