声卡技术
要用计算机处理声音信号,让计算机发出各种声音,用计算机播放有声的视频节目(VCD)、电子图书、教学光盘等都离不开声卡。进入1998年,家用电脑上没有一块声卡,那将是一件颇为不可思议的事情,甚至相当一部分商用电脑也将声音子系统作为标准或可选设备。因为现在的PC音频已经逐渐从单纯的娱乐用途向多功能发展,它使人们与电脑之间的交流更加方便。而对于语音识别和视频会议等新的应用,声卡更是不可缺少。与此同时,MPC—多媒体电脑这一名词却出现得越来越少,因为在人们的概念里电脑几乎与多媒体电脑划上了等号。
PC音频技术的概念
为了叙述方便,我们首先应该了解一些有关声卡和声音的知识。例如,什么是声音、计算机怎样度量声音、计算机是怎样存储声音、怎样播放声音等问题。按照多媒体计算机MPC的规定,声卡应该支持两种声音:波形声音和MIDI声音(合成声音)。MIDI(Music Instrument Digital Interface,即乐器数字化接口)声音是一种由电子器件和设备合成的声音,按照其原理不同,又可以分为FM合成法和乐音样本合成法(通常也称为波表合成法)。下面先介绍这几种声音的特点及其产生的原理。
波形声音与WAV文件
从本质上讲,声音是一种连续的波,称为声波。要把声音信号存储到计算机之中去,必须把连续变化的波形信号(称为模拟信号)转换成为数字信号,因为计算机中只能存储数字信号。把模拟信号转换为数字信号(DAC)一般由对声音信号的采样和转换两步来完成。所谓采样就是采集声音模拟信号的样本,然后再转换成数字信号。计算机对声音采样能力的大小也用两个参数来衡量:采样频率和声音采样信号的位数(bit)。理解这两个参数十分重要,它们是声卡的主要指标,它们不仅影响到声音的播放质量,还与存储声音信号所需要的存储空间有直接的关系。声音信号的采样过程可以用下图说明。
采样频率
是指计算机每秒钟采集多少个声音样本,是描述声音文件的音质、音调,衡量声卡、声音文件的质量标准。采样频率越高,即采样的间隔时间越短,则在单位时间内计算机得到的声音样本数据就越多,对声音波形的表示也越精确。采样频率与声音频率之间有一定的关系,根据奎斯特理论,只有采样频率高于声音信号最高频率的两倍时,才能把数字信号表示的声音还原成为原来的声音。这就是说采样频率是衡量声卡采集、记录和还原声音文件的质量标准。
当前声卡常用的采样频率一般为11KHz(每秒采集声音样本11千次)、22KHz、44.1KHz和48KHz。11KHz的采样率获得的声音称为电话音质,基本上能让你分辨出通话人的声音;22KHz称为广播音质;44.1KHz称为CD音质。采样频率越高,获得的声音文件质量越好,占用磁(光)盘的空间也就越大。一首CD音质的歌曲会占去40M左右的盘空间。 声音样本的位数(bit)
也称为采样值的编码位数,这个参数表示了计算机度量声音波形幅度(音量)的精度,就是通常所说的声卡的位数。早期的声音卡是8位声卡,目前多为16位声卡,专业级的高档声卡有32位的。位数越多,度量的单位越小,计算机对声音波形描述的精度越高,声音的质量越高。
当前声卡以16位声卡为主,8位声卡已趋于淘汰。8位声卡对语言的解释能满足需要,可达到电台中波广播的音质,而播放音乐效果就不是很好。16位声卡可以达到CD音响水平,真正的32位声卡还比较少。
采样到计算机内的声音信号经过模数转换后生成数字信号就可以保存在计算机的存储介质中,这样的文件一般称为波形声音文件(简称声音文件)。在Windows中,声音文件的扩展名一般是.WAV。.WAV文件的制作和播放过程与普通录音机录放声音磁带的过程很相似。WAV文件的最大缺点是要占用相当大的存储空间,例如采样频率为44.1KHz、16位样本的单道声音每分钟需要的存储空间为5.28MB,而如果是双声道立体声则存储空间还要增加一倍。而MIDI文件需要的存储空间则很小。
FM合成声音
产生MIDI乐音的方法很多,最主要的是FM合成法和波表合成法。FM合成法是八十年代初由美国斯坦福大学的John Chowning发明的,称为“数字式频率调制合成法”,简称FM合成法。FM合成法生成乐音的基本原理是,用数字信号来表示不同乐音的波形,然后把它们组合起来,再通过数模转换器(DAC)生成乐音播放。
FM合成器由五个基本模块组成:
(1)数字载波器 数字载波器有3个参数:音调、音量和各种波形。 (2)调制器 调制器用了6个参数:频率、调制深度、波形的类型、反馈量、颤音。 (3)声音包络发生器 乐器声音除了有它自己的波形参数外,还有它自己的比较典型的声音包络线,声音包络发生器用来调制声音的电平,这个过程也称为幅度调制,并且作为数字式音量控制旋钮,它的4个参数写成ADSR,这条包络线也称为ADSR包络线。 (4)数字运算器 (5)数模转换器 在低档声卡中,一般乐器的声音由两种、三种或四种不同的频率的波形叠加合成,MIDI音乐都不够逼真。 波表合成声音
使用FM合成法来产生各种逼真的乐音是相当困难的,有些乐音几乎不能产生。目前只有低档次的声卡采用。中高档的声音卡一般采用乐音样本合成法,即波表合成(WaveTable)法。波表合成采用一种称之为“波表查找”技术来产生MIDI音乐,这种技术采用真实乐器的数字录制技术,并将录制的大提琴、小提琴、钢琴、鼓等各种实际乐器的数字化声音存储在只读存储器中,在产生MIDI音乐时再从存储的波表中找出进行合成,这样还原的声音质量非常高,所产生的音响效果自然比FM合成器合成的MIDI音乐质量高,音质丰富。采用波表合成技术的声音卡一般为优秀的声音卡采用,在MPC3标准中规定应采用波表合成技术。产生的声音质量比FM合成方法产生的声音质量要高。
MIDI文件
MIDI音乐文件就是用来播放MIDI音乐的数据文件,它的扩展名通常是.MIDI、MID。与WAV文件不同,MIDI文件中储存的不是声音信号,而是发给MIDI设备或其它装置(如声卡的合成器)的一组命令。MIDI设备接收到这些命令后,会自动识别出这些命令的含义,准确地发出各种乐器的声音。
当前市售的声卡均支持MIDI。但不同声卡播放MIDI的效果不同。低档声卡合成音源的方法(FM合成)不太精确,播放的MIDI音乐很单调,无法与真实的乐器声相比。高档的波表合成声卡(如创新公司的AWE32)能提供较真实的音源,播放MIDI效果几乎可以乱真。“乱真”的程度取决于声卡所能提供的复音数。
当前一些声卡型号中“32”、“64”的含义,指的是声卡的复音数(Polyphon,即声卡包装上常见的是Voice),而不是声卡上的DAC(数模转换)和ADC(模数转换)的转换位数(bit)。复音就是同时发音的个数。如果在一台电子琴上同时按下一排琴键,那么是否所有被按下琴键所发出的音符都能被听到了呢?这就与这台电子琴所能发出的最大复音数有关。32复音声卡在播放MIDI音乐时,只要乐曲中复音数小于或等于32,则可听到乐曲中的所有声部。当然,拥有64复音的声卡就可以欣赏更丰满一些的音乐。相反,如果一首MIDI乐曲中的复音数超过了声卡的复音数,则将丢失某些声部,但一般不会丢掉主旋律。声卡AWE32的32复音是通过硬件实现的,到目前为止,网上和游戏中的MIDI音乐还没有超过32复音的。
MIDI文件与WAV文件相比具有以下优点:
(1)生成的文件比较小。由于WAV文件记录的是声音数字信号,MIDI文件记录的是发出声音的命令,所以将能播放相同时间的WAV和MIDI文件相比,MIDI文件小很多很多。 (2)容易编辑,因为编辑命令比编辑声音波形要简单得多。 (3)可以作为背景音乐,MIDI音乐可以和其它媒体,如数字电视、图形、动画、话音等一起播放。
波表子卡
市场上的声卡大部分是采用FM合成技术,而要使用波表声卡,只有几种价格较高的品种供选择。现在,在市场上可见波表合成器子卡。对于已有声卡的计算机用户,采用波表子卡对原声卡进行升级,就显得比较合算了。波表合成器子卡主要有Blue Point(兰点)和Sound Image等公司的产品,由于各子卡品牌和波形容量的不同,其价格也不等。有了这种子卡,就可以把原来的FM合成声卡升级为波表声卡了。
给声卡升级,首先要看一看你的声卡有没有升级能力。这可以阅读声卡的说明书或直接检查声卡本身。具有升级能力的声卡,上面有两排插针,每排13根,并通常注有WAVE TABLE的字样。你可以去购买一块WAVE TABLE扩充子卡,只要把扩充子卡插到WAVE TABLE升级插针上,升级即告完成,一般也不需跳线(阅读说明书便可知道)。
有的声卡不但可升级为一般的WAVE TABLE,还可以升级YAMAHA OPL波表扩充子卡。
在硬件升级工作结束后,你还要将Windows中的MIDI Mapper设置进行改动,使波表生效。同时,将你使用的MIDI软件中的输出端口也要做一些必要的改动。
虽然说WAVE TABLE比FM技术要高一档次,音色好,真实感强。在给声卡升级后,有可能发现音色虽有一定改进,但并不像期望的那样理想,这主要是波表容量和合成算法造成的。在专业级的MIDI设备中,波表容量可以达到6MB、12MB,甚至更多。专业级的声卡或升级子卡也有4MB波表容量的,但一般的波表子卡只有512KB或1MB。由于容量小,效果当然不可能象专业级的那样完美了。
新的音效标准
早在七年以前,Creative Lab的Sound Blaser已界定了PC的Audio系统。Sound Blaster对PC来说可说是一种贡献。不过,Sound Blaster的标准亦有不少限制,所以,近年有很多音效卡、多媒体套装、扬声器都能提供3D模拟音响。这不但增加了音效的层次深度,也不需要特别购置中置、后置扬声器。
以上只是音效突破的第一步,如果能加上最新的API软件和硬件,便能同时播出多种不同的声音,提供更真实的音效。为了配合Windows 95的Direct 3D API,不少的生产商已经开发这类第二代3D音效芯片。
DirectSound是 Windows 95的 Audio API,它是PC硬件和游戏之间的主要元素,而其最重要的使命是打破Sound Blaster作为游戏音效的标准。DirectSound对音效方面力图作以下的改良: (1)利用比FM Synthesis更高级的技术合成声音; (2)增加同时播放的音源(Audio Stream)数目; (3)改良整体的音效品质; (4)改良3D音效。
说起DirectSound,最值得称道的是其能同时支援多个音源,Stream(流)的意思是形容音响数据或任何Real-Time数据的传送。至于DirectSound同时能支援多少个 Streams就决定于电脑硬件了,例如一个硬件数码混音器 (Digital Mixer)和取样速率转换器(Sample-Rate Converter)能增加系统处理Stream的数目。 DirectSound更会取用部分系统内存作为Sound Buffer,以确保音效的质量。
总括来说,配合下一代音效芯片的音效卡和Windows 95的API音效标准,音效便会有突破性的改进,大部分的电脑游戏将会使用Windows 95作基础,亦不再需要FM Synthesis。DOS游戏仍会继续使用Sound Blaster标准的硬件,当然,你的电脑亦要有一定的Power,才能真正把高品质的音效发挥出来。
声卡的基本功能
声卡是多媒体技术中最基本的组成部分,是实现声波/数字信号相互转换的硬件电路。声卡的基本功能是把来自话筒、磁带、光盘的原始声音信号加以转换,输出到耳机、扬声器、扩音机、录音机等声响设备,或通过音乐设备数字接口(MIDI)使乐器发出美妙的声音。声卡在多媒体系统中的主要作用可具体归纳为如下八点:
(1)录制(采集)数字声音文件。通过声卡及相应驱动程序的控制,采集来自话筒(麦克风)、收录机等音源的信号,压缩后存放于微机系统的内存或硬盘中。 (2)将硬盘或激光盘片压缩的数字化声音文件还原,重建高质量的声音信号,放大后,通过扬声器输出。 (3)对数字化的声音文件进行编辑加工,以达到某一特殊的效果。 (4)控制音源的音量,对各种音源进行混合,即声卡具有混响器的功能。 (5)压缩和解压缩采集数据时,对数字化声音信号进行压缩,以便存储。播放时,对压缩的数字化声音文件进行解压。 (6)利用语音合成技术,通过声卡朗读文本信息,如读英语单词读句子、说英语、奏音乐。 (7)具有初步的语音识别功能,让用户用口令指挥计算机工作。 (8)提供MIDI(乐器数字接口)功能,使计算机可以控制多台具有MIDI接口的电子乐器。同时,在驱动程序的控制下,声卡将以MIDI格式存放的文件输出到相应的电子乐器中,发出相应的声音。
|