常用音频格式基础知识


对于很多音频爱好者、普通消费者甚至一部分发烧友来说,都有这样的一个疑问:目前常见的音频格式种类之多,能挑花眼也一点都不夸张,在这些名字各不相同的格式背后,都有什么区别?为了体积便携我们应该选择那些格式,为了更好的声音我们应该选择那些格式,如果想两者并存我们又应该选择那些格式?


对于不同的音频格式来说,可以说主流的音频格式都使用过也并不深入的研究过,虽然对于及其深度的技术方面来说也许并不甚了解,但是对于它们之间的区别还是可以做一个简单的分享的。

随着近几年HiFi圈中DSD音频流的崛起,近几年已经不再是PCM编码垄断音频文件行业,DSD码流也成为了非常主流的一种格式,而在这篇文章中笔者也将会简单的介绍DSD音频文件格式以及个人对于DSD音频格式的一些看法,网友朋友们也不妨在留言区域留下自己对于DSD和PCM两种格式的看法。


什么是PCM编码格式?


PCM中文称脉冲编码调制(Pulse Code Modulation),是70年代末发展起来的,记录媒体之一的CD,在80年代初由飞利浦和索尼公司共同推出。脉码调制的音频格式也被DVD-A所采用,它支持立体声和5.1环绕声,1999年由DVD讨论会发布和推出的。脉冲编码调制的比特率,从14-bit发展到16-bit、18-bit、20-bit直到24-bit;采样频率从44.1kHz发展到192kHz。PCM脉码调制这项技术可以改善和提高的方面则越来越来小。只是简单的增加PCM脉码调制比特率和采样率,不能根本的改善它的根本问题。其原因是PCM的主要问题在于:


(1)任何脉冲编码调制数字音频系统需要在其输入端设置急剧升降的滤波器,仅让20Hz-22.05kHz的频率通过(高端22.05kHz是由于CD44.1kHz的一半频率而确定)。


(2)在录音时采用多级或者串联抽选的数字滤波器(减低采样频率),在重放时采用多级的内插的数字滤波器(提高采样频率),为了控制小信号在编码时的失真,两者又都需要加入重复定量噪声。这样就限制了PCM技术在音频还原时的保真度。


2.jpg

码率越高的PCM录音就越接近模拟信号的圆滑正弦波


对于我们最常说的“无损音频”来说,一般都是指传统CD格式中的16bit/44.1kHz采样率的文件格式,而知所以称为无损压缩,也是因为其包含了20Hz-22.05kHz这个完全覆盖人耳可闻范围的频响频率而得名,当然现在的各种PCM格式编码高码率文件已经层出不穷非常常见,但是就像上文中所说的,高码率并不能有效地提升PCM编码采样率的频响范围,而只能增加其采样点来得到更加类似模拟录音的平滑波形。


也正因为几乎所有的有损压缩格式都是从WAV格式压缩、转换而来,其实内部的编码依然是PCM,所以曾经很多MP3设备并不支持FLAC、APE、AAC等等格式,是因为它们不支持这些文件的解压缩,但是从没有一款播放器不支持WAV格式,因为WAV格式本身,就等于PCM码流。


WAV、APE、FLAC那个才是更好的选择?


对于目前常见的PCM码率文件来说,最常见的三种文件格式也就是WAV、APE、FLAC了,而这三种格式之间又有怎么样的差别呢?


WAV波形文件是音响设备和很多软件可以直接读取的波形文件,基本上不存在编解码问题。flac和ape都对WAV进行了编码,故能换取较小的体积,但同时造成解码播放时,因播放器材解析力很敏感(或者说技术所限),会因出现一定的jitter抖动(解析复杂编码所致)而导致播放效果不够饱满和流畅。这点你可以通过统一转换为WAV格式来试听解决。


对于WAV格式来说,是目前的常规无损压缩格式中体积最大的文件格式,由于FLAC和APE都对WAV进行了更高技术的编码,所以换取了较小的体积,这也是这两种格式之所以出现的根本原因。而对于FLAC和APE两种格式来说,虽然体积大小差不多,但是采用了不同的压缩格式,所以对于设别来说在播放时候需要占用的资源多少也并不相同,简单地说占用资源多少的比例为:APE最大、FLAC中、WAV占用最小。最简单的例子就是如果你用一款配置并不算很高的随身播放设备,比如刷了rockbox的iPod Classic或者一些目前主流的便携播放器,使用APE会有明显的卡顿以及续航的减少,而FLAC和WAV则没有什么明显的区别。


并且除了压缩比例和占用资源的不同,APE、FLAC和WAV在纠错方面也有不同。首先最为传统的WAV格式其实并没有纠错的处理,所以即使在播放的码率中有错误,WAV也会照常播放下去,在错误的地方可能会发生爆音等问题。而APE对于错误则是直接停止播放,而这点也是被很多人所诟病的,如果你的APE文件中存在错误,那么整个音轨几乎都报废了。而FLAC使用的则是静音的策略,如果播放中出现错误,则将错误的地方静音处理。


送葬CD的MP3、AAC格式的优劣


对于这两个目前全世界用户最多的音频格式来说,它们有两个共同点:1.它们都不是无损压缩格式音频。2.它们联手终结了CD在音乐行业的老大地位。

也许对于中国的用户来说,对于MP3格式更加熟悉,用户也基本都是从MP3格式开始使用直到现在为止,但是AAC确实是一个不能不提的音频格式,它因苹果发扬光大,并且在iPod的垄断之路上立下了汗马功劳,甚至可以说,AAC不仅仅目送CD走下历史舞台,传统消费级MP3产品也是被它赶下神坛的。至今在iTunes Store的专辑音乐销售中,音乐的格式依然是AAC而不是MP3。


首先,MP3是一种国内用户最为耳熟能详的有损压缩格式,而隶属世界上的有损压缩格式其实数不胜数,而MP3成功的原因究竟是什么?首先是它的压缩比,传统的音频压缩文件只能达到8:1左右的压缩比。而MP3格式则是将这个压缩比提升到了10:1甚至12:1的高比例压缩,也因为MP3音频编码具有10:1~12:1的高压缩率,同时基本保持低音频部分不失真,但是牺牲了声音文件中12KHz到16KHz高音频这部分的质量来换取文件的尺寸,并且完全砍掉20KHz以上的部分,相同长度的音乐文件,用.mp3格式来储存,一般只有.wav文件的1/10,因而音质要次于CD格式或WAV格式的声音文件。但由于其文件尺寸小,音质好;所以在它问世之初还没有什么别的音频格式可以与之匹敌,因而为.mp3格式的发展提供了良好的条件。直到现在,这种格式还是很流行,作为主流音频格式的地位难以被撼动。但是树大招风,MP3音乐的版权问题也一直找不到办法解决,因为MP3没有版权保护技术,说白了也就是谁都可以用。


AAC实际上是高级音频编码的缩写。AAC是由Fraunhofer IIS-A、杜比和AT&T共同开发的一种音频格式,它是MPEG-2规范的一部分。AAC所采用的运算法则与MP3的运算法则有所不同,AAC通过结合其他的功能 来提高编码效率。AAC的音频算法在压缩能力上远远超过了以前的一些压缩算法(比如MP3等)。它还同时支持多达48个音轨、15个低频音轨、更多种采样率和比特率、多种语言的兼容能力、更高的解码效率。总之,AAC可以在比MP3文件缩小30%的前提下提供更好的音质。AAC也是目前最好的有损格式之一。有多种编码,faac,nero为常见,比特率最高为448kbps,并且在448kbps的比特率下已经几乎很难分辨和无损压缩的区别。


3.jpg

人气正旺的DSD格式有多强大?


最近的HiFi圈里可以说刮起了一阵DSD的台风,所有设备一夜之间都开始支持DSD格式,甚至这个传统的行业里的顶级大牌们也都开始争先恐后的更新自己的解码设备来支持DSD格式的码流文件,而对于这个体积巨大,曾经SACD独用的编码格式究竟有着何等的魅力?


DSD究竟有多强大?


DSD(Direct Stream Digital)直接比特流数字,它是Sony与Philips在1996年宣布共同发展的高解析数字音响规格,DSD新技术与DVD的音响技术指针竞争,用1bit比特流的方式取样,采样率2.4MHz(CD 44.1kHz取样的64倍)的高取样方式,直接把模拟音乐讯号波形以脉冲方式转变为数字讯号,以将近四倍于CD的空间,储存音乐,因此可以提供更为优秀的声音效果,由于取样次数高,所以取样过的波形很圆顺,比较接近原来的模拟波形。再者由于不采用多位,省却位转换程序,降低了因为数字滤波而可能产生的失真与噪声。还有,由于不像多位系统般容易(位越高就越容易)受到电源或外部干扰的影响,因此理论上质量会比较稳定。当前的SACD player,兼容性,无论是DSD支持者或是传统CD的拥护者,都将是双赢的局面。SACD(Super Audio CD)是新一代数码音响规格,以超高速取样(2.8224MHz,为CD的64倍)声音以0和1连续的量子化,可听频域的动态范围约为120dB,可能收录频域约1000kHz,结和了传统模拟的温暖及超高的分辨率,SACD多声道的音质包含了6个独立的音轨,每一个音轨都可以读到没有经过任何压缩而完整的DSD规格(Full DSD Bit Rate)。


但是其实DSD的问题很严重并且显而易见,与之前的格式问题相比,DSD的问题并不在它的声音素质上,可以说DSD的声音素质是毋庸置疑的优秀的。但是其实这种技术诞生已经将近20年的时间,而在近两年才火起来,那么前面的十多年它去哪了?一些录音业内人士曾经告诉我,其实在推广DSD录音的时候索尼和飞利浦将DSD录音设备的价格定价非常昂贵,几乎没有录音棚愿意购买,于是DSD格式也就逐渐的胎死腹中,而时隔这么多年再次出现,现在的扬声器和解码、放大的技术发展都能更好的展现出DSD的高水平,但是问题一样明显:没得听。


真正喜欢音乐的朋友会发现DSD的音频基本分为两种:PCM码流转录和DSD直接录制。而后者很少有值得聆听的专辑,除了部分流行音乐之外,古典音乐几乎没有很好的演绎。而对于PCM转录来说,在录音的源头就并不能达到DSD的水平,也就变得毫无意义。