HiFi网络化时代全面到来,你做好准备了吗?(1)
原作者: 姚子颖

数播技术和产品,历经20多年的发展,目前已日臻成熟,大有与黑胶和CD平分秋色,成为家庭主力HiFi播放设备的趋势,而5G高速网络和云存储技术的普及,使得网络成为传播和推广高清无损数字音乐的主要媒介,因此HiFi网络化时代可谓已然全面来临,但国内广大烧友们是否都做好准备了呢?据笔者了解,目前烧友对HiFi网络化的态度可分为四类:第一类为坚拒型,这类烧友对黑胶、CD、磁带等传统音乐载体抱有极深的情怀,始终认为网络数播系统的音质远不如前者,对数播产品拒不接受;第二类为初尝型,此类烧友同样爱好黑胶或CD,但出于好奇心或者被网络数播的便利性所吸引,愿意学习了解数播产品知识或者刚开始尝试使用;第三类为兼修型,这类烧友既玩黑胶或CD,同时家里也有一套不错的数播设备,平时黑胶、CD和数播轮流使用,乐在其中;第四类为拥抱型,此类烧友是HiFi网络化的坚定支持者,平时聆听音乐基本以数播系统为主,家里虽有黑胶或CD,仅偶尔用于对比听音甚至已闲置或转让。笔者目前属于第三类,但已很少购买CD和黑胶唱片,可能不久就会转变为第四类烧友了。根据本人亲身体会和所见所闻,笔者认为,对于从上世纪八九十年代开始玩音响,经历了磁带和CD的全盛期,以及近十多年来黑胶复苏的烧友来说,能够全面接受和认可数播产品,乐意迎接乃至主动拥抱HiFi网络化时代,并非一朝一夕之事,需要经历一个不断学习和实践的蜕变过程。一年前笔者曾撰文《浅谈数播系统的选购与搭配》,主要聚焦于硬件方面,希望能给到初识数播产品的烧友一点参考和建议。今时一年已过,笔者对数字音乐文件及其来源的网络化、操作或播放软件、无损流媒体音乐平台等有了更深的认识,因此,希望更多从软件方面,针对上述的第一和第二类烧友,分享一些拙见。
1 / 重新认识无损音乐文件

首先说一下音源,也就是无损数字音乐文件。这个话题可谓老生常谈了,但音源问题既基础又重要,几乎每个烧友都希望获得高清无损的音源,从而欣赏到高保真原汁原味的录音,因此还是有必要说道一下。
基于PCM的无损音频格式

常见的无损数字音频格式,主要分为两大类:一类是基于PCM的无损音频格式,包括未压缩的CD-DA、WAV和AIFF等格式,以及无损压缩的APE、FLAC和ALAC等格式。

PCM是出现最早并得到广泛应用的数字音频编码技术,主要用于将模拟信号转换为数字信号。CD-DA格式诞生于1979年,是首先应用PCM的无损音频格式,采样频率为44.1kHz,量化深度为16bit,虽然出现时间早,但已经能够提供高质量的接近原始音频的音质体验了。随着技术不断进步,PCM格式的量化深度从16bit发展到32bit,采样频率也从44.1kHz发展到384kHz,从而支持Hi-Res高解析度无损音频文件的制作,如24bit/96kHz或24bit/192kHz高清无损音频文件,当然文件的数据量也会大大增加。


WAV是由微软和IBM于1991年共同开发的一种无损数字音频格式,具有广泛的兼容性,几乎所有的音频软件和设备都支持它。WAV格式可以存储不同采样率、量化深度和声道数的音频数据,最高可支持192kHz采样率和32bit量化深度。 由于不对音频数据进行压缩,WAV格式不会损失任何音频信息,因此音质非常高,成为专业音乐制作和后期处理的首选格式,缺点就是文件体积比较大,在存储和传输过程中需要更多的空间和时间。但随着存储技术的发展,大容量硬盘和高速互联网的普及,WAV文件的大体积已经不再是一个大问题。由于CD-DA文件只是一个索引信息,并不包含真正的音频信息,因此不能简单地通过拷贝来获取CD上的音乐内容,但可以借助特定软件(如EAC)抓取CD上的音轨并转换为WAV文件,因此WAV提供了一个高品质地分享CD唱片上珍贵音乐内容的途径。

与WAV类似,AIFF是苹果公司于1988年为Mac系统开发的无损音频格式,同样可支持高达192kHz采样率和32bit量化深度,其开发时间早于WAV,但因其主要应用于苹果电脑上,在一般民用PC系统上的流行程度不如WAV。


WAV和AIFF文件通常都比较大,一首三分多钟的歌曲就有近50M,在4G时代以前,不太适合通过网络传播,因此支持无损压缩的APE和FLAC等音频格式就应运而生了。当用户将音频数据文件压缩成这两种格式后,通过解码可以还原为与压缩前一模一样的音乐文件,没有任何数据信息的丢失或音质的损失。APE格式的压缩率较FLAC高,文件相对较小,但解码速度上FLAC要快于APE。由于大大节省存储空间,音质又不受损,APE和FLAC音频格式被广大音乐爱好者和HiFi发烧友所喜爱,也是各流媒体音乐平台的热门选择。不过,也有观点认为,APE和FLAC文件解码还原为WAV源码流的过程,更耗电,会带来额外电磁干扰,占用更多MCU运算时间,导致时钟抖动更严重,这些情况在中低端数播设备上尤为明显,因此它们的音质相比WAV还是有一定差距。
3~4分钟歌曲在PCM和DSD不同规格下的文件大小(仅供参考):

苹果公司于2004年也推出了自家的无损压缩音频编码格式ALAC,但仅在iTune和iOS系统上得到支持和应用,其他非苹果的设备和操作系统并不支持ALAC格式,目前Apple Music提供的无损音乐采用的都是ALAC格式。

小结一下,WAV、APE和FLAC是目前最主流的基于PCM编码技术的无损音频格式,其中WAV在质量和兼容性方面都是最好的,如果硬盘空间足够,建议首选WAV格式;而APE和FLAC,文件小而音质好,也是网上非常流行的音频格式。AIFF和ALAC都只在苹果生态系统上得到支持和应用,不过它们都能提供高品质的无损音乐内容,因此是果粉们首选的音频格式。
基于DSD的无损音频格式

另一类就是基于DSD编码技术的无损音频格式,主要包括DSF、DFF、DXD和DST等四种。说到这,有人可能会问,ISO不也是吗?严格意义上,ISO其实是一种光盘镜像文件格式,而非专门的音频文件格式,后面会单独说明。


DSD是索尼和飞利浦专门为SACD标准开发的高解析度数字音频规格,采用1bit量化深度和2.8MHz采样率(为CD采样率44.1kHz的64倍,因此被称为DSD 64),这种前所未有的高采样率,使得DSD的量化误差更小,能获得更准确的声音信息,取样后的波形也更加圆顺平滑,非常接近原始的模拟波形,能够提供细腻和自然的声音。DSD在理论上能够记录比CD的22kHz高得多的频率范围,达到1.4MHz,而在0~20kHz频率范围内,DSD的动态范围可达150dB,优于CD的96dB,使得DSD能够捕捉到更多音频细节,呈现出更为丰富和真实的音乐表达。DSD规格并非只有DSD 64一种,其只是最低规格,还有2倍取样率的DSD 128(5.6MHz)、4倍的DSD 256(11.3MHz)、8倍的DSD 512(22.6MHz)、以及目前最高规格16倍的DSD 1024(45.2MHz)。虽然理论上,更高的DSD采样率可以大幅拓展极高频的延伸和降低高频噪声,但是这也对硬件设备质量提出了极高的要求,电子元件尤其是时钟线路的噪声和失真会有损声音质量,因此有观点认为DSD 128是最理想的DSD规格。实际上,目前原生的DSD录音仍以DSD 64格式为主,DSD 128和256的录音极少,更别说其他更高规格了。

DFF是飞利浦公司于2000年开发的DSD文件格式,是主要运用于SACD制作的专业音乐录制格式,内容以单纯的音乐数据为主,不含附加信息(Meta Data)。
DSF是索尼于2005年推出的DSD文件格式,与DFF非常相似,主要差别是DSF可以携带Meta Data曲目信息,方便在计算机上播放和使用。DSF是索尼原本计划推出的DSD Disc所使用的文件格式,后来DSD Disc因故并未正式发行,但是DSF却因为可以添加Meta Data,无意中成为DSD规格的主流文件格式。

DXD是瑞士Merging Technologies公司针对DSD格式无法直接进行编辑的先天缺限,于2004年推出的专门用于混音制作的音频文件格式,是为实现DSD最优转换而开发的一种PCM格式。由于DXD格式的分辨率足够高,可以完整保留DSD的全部信息,不少录音师都选择以DXD格式录音,以便直接进行混音制作工作,最后再输出为DSD格式。目前不少音乐下载平台也直接提供DXD格式下载,作为高解析音乐文件的选择之一。
DST与以上三种文件格式不同,是DSD的无损压缩格式,类似于PCM的FLAC和ALAC文件格式,可以用比较小的文件进行储存高质量的音频数据。但DST主要用于SACD的多声道版本,目前大多数播放机都不支持这种文件格式。
PCM和DSD,究竟孰优孰劣?
很多烧友都会问,PCM和DSD这两种数字音乐格式,究竟谁更优异?这个问题在学术界和产业界其实早有定论:从技术原理和工作流程上看,这两种格式各有优缺点(太过专业和复杂,这里不作讨论);虽然在还音保真度上,DSD更有优势,但是在一般平价音响系统上,却很难听出两者的差别;另外在制作阶段,DSD必须先转换为DXD类的PCM格式,才能编辑处理,然后再输出为DSD格式,而在大多数情况下,PCM格式在基于Δ-Σ编码的DAC芯片里也都经过了DSD转换,因而也携带了DSD的高频噪声(采用基于R2R编码DAC芯片的无此情况),因此这两种格式,不但互有优劣势,而且是互相影响和依存的。

但是在HiFi圈内,这个话题一直争论不休,特别是一些刚开始玩数播的烧友,对各种音乐文件格式的特点了解不多,容易偏信DSD的优势,而贬低和抵触PCM格式,因而出现了一些忽略设备档次、听音环境和个人听音水平等重要因素,而只追求更高规格DSD文件的比较盲目的发烧行为,比如有的人非DSD 256以上规格不听,有的人把PCM文件转换为DSD文件,还要升频到256甚至512规格才听,结果一顿忙碌下来,发现DSD格式音乐重放的效果不如预期,和CD或其他PCM格式音乐没啥区别。其实早有行业专家指出,PCM和DSD之间的转换会破坏音质,只有在专业录音室用非常昂贵的设备来操作,才能将负面影响降至最低,因此不推荐一般发烧友或爱好者,简单地在电脑上用Foobar2000等软件做个转换,这样得到的音频文件,必定是音质受损的,而追求原生的PCM或DSD才是发烧的正道。
近来流行的Hi-Res音乐与升频玩法

近些年来,越来越多的音乐作品采用24bit/96kHz或24bit/192kHz高规格PCM格式录制,并在网上发行和传播,音质接近DSD格式,动态范围更大,高频得到延展,更加顺滑柔暖,声音的模拟味更浓,这种Hi-Res音乐的出现在一定程度上治愈了一些发烧友对DSD的偏好。但是也有一些比较谨慎理智的发烧友认为,传统CD音质已经足够好,Hi-Res音乐就是个噱头,延伸的高频人耳根本听不到,而144db大动态人耳也根本受不了,因此用高规格PCM格式来录音,主要是在制作端给了录音师更大的自由调节和处理的空间,使A/D转换的效果更好,但在消费端的重放领域并无多大意义。而另一些烧友则正相反,热衷于玩升频,就是为了体验更大的动态和更柔顺的高频,还形成了PCM升频和DSD升频两大流派,前者一般升频到24bit/192kHz或者32bit/384kHz,后者则升频为DSD256或者DSD512。不过这种玩法,对重播设备和听音环境要求苛刻,否则不太容易分辨出升频前后的声音差异,因此仅在小部分烧友中流行。
光盘镜像文件

光盘镜像文件一般是由WinISO或CloneCD等光盘工具软件抓取CD或DVD整张光盘上的数据光轨,然后复制到硬盘上,所有的数据都保存在一个文件中,能够保证光盘数据内容的结构及完整性。光盘镜像通常是以ISO 9660格式存储的,其扩展名为.iso,ISO文件由此而得名。2010年,索尼的PS3系统被美国著名黑客乔治•霍兹破解后,导致SACD被连带盗版,复制出来的音乐数据文件,就是以ISO文件保存的。目前ISO文件已经成为SACD和DVD-Audio主要的镜像文件存储格式。很多烧友刚接触ISO文件时,感觉比较陌生,以为需要解压或加载虚拟光驱后才能播放,其实只需要在电脑上给Foobar软件添加相应的插件,即可直接用Foobar播放了。目前市面上的数播设备大都能直接播放SACD ISO,但多声道的DVD-Audio ISO文件,大多数数播系统不能直接支持,需要外接具备多声道解码功能的DAC或AV功放,才能正常播放。

近两年,另一种常见的镜像文件格式NRG,也被利用来存储DVD-Audio或DTS-CD等多声道格式的音乐数据,并开始在网络上传播,但由于NRG格式比较新,不但市面上大多数数播系统都不支持,就连Foobar软件也必须先加载虚拟光驱后,才能播放。
(待续)