光盘见证数码多媒体的30年 影响后世的CD
张伟周 于 2009.05.08 01:39:43 | 源自:www.soomal.com | 版权:原创 | 平均/总评分:09.67/87

我们今天介绍的主要是Audio CD,CD的分支--数据CD在这一篇中不是我们的重点。需要说明的是:要想详细的阐述介绍什么是CD不是只言片语能够解决的事情,从CD诞生至今,前前后后至少发布了不下6部标准,其中包括1980年的第一本红皮书,83年的黄皮书,86年的绿皮书等等,篇幅所限我们在这里不可能介绍的面面俱到。我们从CD的物理特征、容量、速度,到编码、采样角度介绍,说说当年CD的标准给我们的生活带来了什么样的影响。

  • 什么是CD?CD是Compact Disk的缩写,从硬件角度来说是一种直径为120mm(还有一种非主流的80mm规格),厚度为1.2mm的塑料圆盘,中间有一15mm直径的孔洞。 CD盘片多由聚碳酸酯组成,是一片透明的衬底,在数据面覆盖了一张金属(多为铝质)膜,在这张膜上,从圆心到边缘是一圈圈的肉眼无法分辨的数据轨道,数字0和1就在这一圈圈的轨道里以凹坑或非凹坑存储,最后在金属膜上覆盖一层极薄的保护层。从数据角度说,CD是一个存储声音信号轨道的光盘,在这张光盘上,声音以数字化的编码,以数字的形式记录在物理层上,播放时激光头将CD表面扫描轨道上的记录并还原为数字信号,经过解码,还原出声音。

    由于CD的巨大成功,它的物理特性也深刻的影响后世。它的120mm的直径,直接的影响了光驱的大小,光驱的大小为5.25寸,进而影响了主流电脑机箱的大小。巨大的销量,让人们对CD有了一个定性的印象,CD成为了很多产品摄影中的重要参照物。不管数字技术如何进步,新一代的主流光盘尺寸始终都是120mm的。

    容量

    一张CD需要容纳多长的声音?这里还有个小典故。1979至1980年期间,在世界上第一张CD发布前夕,索尼和飞利浦为CD唱片行业设立统一标准进行商谈,CD时长的标准便是围绕着如何或者是否应该坚持单碟CD录下整首“贝九”来讨论。这是因为贝多芬的《第九交响乐》完整的演出往往要超过一个小时,当时的普遍时长为72-74分钟。于是在商谈的最后,索尼公司创始人盛田昭夫坚持认为一张CD应能容下一场完整的“贝九”演出,最终CD的最大时长标准被定在了74分钟之上,这样得出的光盘容量为650M。

  • 在CD刚刚诞生的那段日子,这样的规格并不显得落后,所有的唱片公司都按照这一规格制作唱片,所有的Audio CD最高容量都是74分钟和650M,但650M其实是一个保守的容量,是对当时的技术的一种更保险的妥协。近年来,随着光盘、光头制造工艺的改进,以前为了保险起见而放弃的空间被利用上了,CD容量实现了700M的安全容量,并成为主流,现在市场上购买到得CDR刻录盘大部分都是700M规格的。这个容量上限,也对我们一些熟知的事物产生了重要影响。比如我们常常接触的Divx格式电影,大都都限制在700M以内,这是为了下载后能用一张光盘保存。

    速度

    提到CD的读取,人们常常看到的是nnX倍,这是什么意思呢?最初的CD规范要求:CD读取设备的读取速度为150KB/s,这就是标准的单倍速读取速度,也就是1X的标准。随着技术的发展,这个速度被以几何倍数提升,1X到8X,16X再到24X,最后发展到52X。这里的X很好理解:多少X就是多少倍的150KB/s,例如52X,就是52x150KB/s=7800KB/s。在音乐器材制造领域,CD的读取速度并不是一个被人关心的数据。但在IT领域,CD的读取速度则是非常重要的。

    说到这里有必要多一句:DVD规格里同样有倍速的概念,但是DVD的1X 可就不是150KB/s,而是1380KB/s,远大于CD的150KB/s。

    编码

    声音到底是如何“放置”到CD上去的?这里需要介绍的是另外一个名词:PCM编码。PCM是PULSE CODE MODULATION的缩写,直译为脉冲编码调制。在CD的制作环节中,母带的声音信号经过取样、量化、编码三个环节,完成PCM调制,实现A/D转化,形成数字信号,再经过进一步的纠错和调制,记录到光盘上。播放时,数字信号经过解调和纠错等处理后,得到PCM数字信号,在经过D/A转换还原为模拟的音频信号得到声音。

    在这里我们不用去关心PCM编码到底是什么样的算法,就说说它造成的影响力。由于音乐CD采用了PCM编码,这对后来的音频编解码技术产生了长远的影响,大家熟知的WAV文件,大部分都是采用的PCM编码。在当年,由于技术的落后,PCM的编解码被设计得很简单,它完全没有考虑数据压缩,PCM也因此显得“体态臃肿”,PCM的这个缺点是明显的,受此刺激,出现了大量的压缩音频编解码方案,无损的例如APE、有损的例如MP3。

    说到这里我们引出了另外一个话题:声音的有损和无损,无损和有损都是相对概念。我们常说的无损编码也并不是绝对无损。将原始母带的模拟信号转变为数字的过程,任何编码都不可能绝对的无损转换,只能是尽可能接近原始信号。相对原始母带来说,CD的PCM始终是有损的,相对CD的PCM来说,APE、FLAC等则是无损的,而MP3、MPC等,不管对应什么原始信息,都是有损的。

    采样速率

  • 音频编码离不开采样速率。什么叫采样速率?我们来看上图。采样率就是每秒中的采样次数。采样速率越高,我们得到的波形的轮廓就越接近原始波形,反之,采样速率低的话,我们得到的数字信号就会失真明显。采样速率高了虽然更有利于还原声音,但带来的弊病就是数据文件的庞大。所以,CD采用何种采样速率,也是在音质和文件体积之间寻求一个平衡。在CD里,采样标准是 44.1KHz,也就是每秒钟采样44100个点。那么为什么不是44KHz?也不是44.2KHz呢?这里又有两个小典故:典故之一:在CD发布之前,人们记录高保真的数字信号采用的是录像带,用黑与白代替0和1的方式记录数字信息。而当时的录像带格式是每秒30帧,而每帧又可以分为490线,每一条线又可以储存3个取样信号,因此每秒有30x490x3=44100个取样点,这就是44.1kHz的由来。典故之二:科学界有一个“乃奎斯特抽样定理”是这样说的:“要从抽样信号中无失真地恢复原信号,抽样频率应大于2倍信号最高频率。”而我们都知道音频的最高频率为20kHz,所以取样率至少应该大于40kHz,为了留一点安全系数,再考虑到工程上的习惯,CD标准最终选择了44.1kHz这个数值。两个典故对于44.1KHz的由来都做了貌似真实的阐述,到底哪个是准确的?很遗憾我们也没法告诉你。

    采样大小

    沿时间轴采样,只能记录频率信息,但无法记住频率的信号强度。这就还需要有个“采样大小”。这样才能记录数字信号的轮廓,这个采样大小就就是我们常说的bit,中文叫“位”,比如8bit、16bit,所谓bit(位),就是2的几次方,8bit就是2的8次方,即256。采样大小为8位时, 就是把电平量化为256级,这样声音的强度能出现256级变化。同理16bit可以把电平分成65,536级。位数越高,声音的保真度越高,层次也跟丰富。CD的采样大小最终被确定为16bit,是因为采样大小和声音的动态范围有着最直接的关系,采样大小越高,声音大小的变化也就越大,动态范围也就越高。在当初制定规范时,飞利浦和索尼的工程师针对是采用14bit还是16bit展开过激烈的讨论,飞利浦工程师认为14bit就已经足够用,而崇尚数据的索尼工程师坚持更高规格的 16bit。 最终还是索尼取得了胜利,CD的采样规格定格于16bit。

    还记得1996年起开始兴起的多媒体电脑,一定要配一款“真16位”声卡才算有面子。到此时,音乐CD所确定的16位采样大小的规范,已经有14年了。

    回首

    直径120mm、容量650-700M、两声道,44.1KHz和16bit,这就是音乐CD的典型特征。CD的每一个参数,几乎都对后世产生了重大的影响,无时无刻都在影响着我们生活中方方面面,除了上文中说的那些。你能说说,CD还在那些方面改变了我们的生活吗?