声学基础与常识王传芳/gaizi23@163.com声音三要素声学三要素:音调或者叫音高(对应频率)、音色(对应频谱)、响度(对应振幅)。任何复杂的声音都可以用此三个属性来描述音调:人耳对于声音高低的感觉,称为音调。音调主要与声音的频率有关,同时也与声压级和声音的持续时间有关。音调会随着频率的增大而提高,但不是与频率成完全的线性关系。音调的单位为“美”(Mel),定义40dB@1KHz纯音的音调为1000美。需要注意的是,影响音调的因素还有声音的声压级,以及声音的持续时间。低频的纯音,声压级高的时候,要比声压级低的时候搞到音调变低;频率在1KHz~5KHz之间的纯音,音调几乎与声压级无关;频率再高的纯音,声压级升高时,会感到音调变高。复音(是指由许多纯音组成的声音)的音调由复音中频率最低的声音决定,即由基音决定。复音的声压级高低对于音调的影响要比纯音小很多。当声音持续时间在0.5s以下的时候,要比1s以上感到音调比较低。持续时间再短,为10ms左右的时候,会使得听音人感觉不出它的音调,只能听到“咔咔”的声音。要想使人耳能够明确感觉出音调所必须的声音持续时间,随声音的频率不同而不同。频率低的声音要比频率高的声音需要更长的时间。纯音的音调和频率的关系曲线音色:音色是指人们区别具有相同响度和音调的两个声音的主管感觉。每个人都有自己的独有音色,不同的乐器进行演奏的时候,人们也能区分出它们各自的音色。人在讲话的时候,乐器在演奏的时候,都是复音,是由基频与谐频组成的声音。两个音调相同的声音,它们的基频是相同的,但是谐频的成分与大小可能不同,从而使人们感到其音色不同。所以,音色主要是由声音的频谱决定的。但是需要特别注意的是,音色还与声音的强度、持续时间以及时间过程有关。西洋乐器声源频率范围(包括谐频)小提琴196Hz~16KHz大提琴65Hz~16KHz低音提琴41Hz~10KHz小号180Hz~10KHz圆号90Hz~8KHz长号80Hz~7KHz高音萨克斯200Hz~17KHz低音萨克斯58Hz~14KHz钢琴27Hz~12KHz民乐声源频率范围(基频)粤胡390Hz~2.6KHz琵琶108Hz~1KHz三弦87Hz~1.1KHz扬琴146Hz~1.1KHz笙217Hz~587Hz笛子217Hz~978Hz唢呐195Hz~522Hz声音三要素响度:人耳对于声音强弱的感觉,称为响度。声音的响度主要与声压有关,声压越大,响度也就越大。但是,响度与声压并不是成线性比例关系,而是大致与声压的指数成比例关系。响度的这一听觉特性被称为“史蒂文指数定律”。响度是个主观量,是声压的主观量,1kHz时的声压级定义为响度级,单位是“方”。人耳对声音强弱的感觉不是一根线的,当响度级每增加10方时,我们人耳听到的响度加倍。人耳听觉特性的研究表明,刺激量(声压)增加为指数方式,感觉量(响度级)增加为差数方式。这是耳膜的自动保护机制。声压级是一个物理量,并不完全能反映人对声音强弱的感受,而响度则是心理学中用于衡量衡量这种感受的心理量。具体的定义可以参考维基百科:Loudness。响度级与声压级并非线性关系。响度级的计算模型请参考:ISO/WD532-1。在ISO-532中描述了两种响度计算方法,两种方法都需要分带计算(将声音的不同频率成分分别考虑),第一种方法是Steven在1956年的论文TheMesurementofLoudness中提出的,是一种并不复杂的计算模型;第二种是Zwicker提出的,大概方法是分频带的查表计算。除此之外,响度还与频率、波形、声音的持续时间相关。响度的频率特性:人耳对于不同频率声音的响度感觉是不同的。也就是说,对于频率不同,而强度相同的声音,人耳会感觉到不同的响度。为了说明人耳的响度感觉,定义了响度级。响度级用来表示响度的大小,其单位为“方”(phon),符号为LN。定义一个声音的响度级在数值上等于和它同样响的1KHz纯音的声压级。由此,人们通常通过等响曲线来表示具有相同响度级的纯音声压级随频率变化的特性。可以看到,在不同的频率条件下,响度相同的时候,需要的声压级是不一样的。等响曲线中每条曲线显示不同频率的声压级不相同,但人耳感觉的响度相同。由此可见(我的理解),响度级考虑的是折算人耳的频率特性后的声压级。可以认为“方”与dB的物理意义类似。声音三要素响度与持续时间的关系:响度除了与声压级、频率等相关因素有关以外,还与声音的持续时间有关。大量的测试结果表明:在100ms~200模式的持续时间以内,声音的响度随持续时间的增大而增大。所以,从某种程度上说,听觉是由记忆功能的。以一个57dB、2KHz的纯音测试响度级随着持续时间的变化特性,可以得到响度级和持续时间的关系,如右图所示。当持续时间大于100ms的时候,响度级基本保持在60方;当持续时间小于100ms时,响度级随着持续时间以大约每10倍时间10方的斜率下降:当持续时间从100ms下降到10ms的时候,响度级大约从56方下降到46方。其他频率信号测试结果也类似。所以,当人耳听到一个短促的脉冲声时,如果强度不变,长度由1ms变为2ms,则听起来不是声音的长度变了,而是更响了。因此,当人耳倾听频度超过一定值的一系列脉冲声时,并不能感觉到响度的不连续。这一现象类似于视觉的停留现象。响度与声压级的关系:响度级的单位为“方”(phon),符号为LN。定义一个声音的响度级在数值上等于和它同样响的1KHz纯音的声压级。响度与强度的对数(响度级)成正比。现代心理物理学进行了响度的定量判断实验,并建立了响度表。由于响度级“方”值并不是与人耳的感觉到的响度成正比例关系,为了计算方便,人们又定义了与人耳感觉成正比的量,响度。响度的单位为“宋”(son),符号为N。1宋的定义为40dB,1KHz纯音所引起的响度,大致相当于耳语的声级。响度与响度级的关系:N=2(𝐿𝑁−40)/10或者𝐿𝑁=40+10𝑙𝑜𝑔2N,𝐿𝑁=40+33lgN(N为响度,𝐿𝑁为响度级)响度级的合成不能直接相加,而响度可以相加。例如:两个不同频率而都具有60方的声音,合成后的响度级是70方。声压级(SPL)声波通过空气传播时,由于振动会导致压强的改变,压强改变量是随时间变化的,实测声压就是压强该变量的有效值,单位是Pa或MPa。声压就是大气压受到扰动后产生的变化,相当于在大气压强上的叠加一个扰动引起的压强变化。由于声压的测量比较容易实现,通过声压的测量也可以间接求得质点速度等其它物理量,所以声学中常用这个物理量来描述声波。表示声压大小的指标称为声压级(SPL,soundpressurelevel),用某声音的声压(p)与基本声压值(p0)之比的常用对数的20倍来表示,即20lgP/P0,单位为dB。标准大气压(Standardatmosphericpressure):1标准大气压=760mm汞柱=76cm汞柱=1.01325×10^5Pa=1.01×10^5N/㎡P0(Pa)P(Pa)比值(P/P0)SPLP(ref)P(e)P(e)/P(ref)20*lg[P(e)/P(ref)]0.000020.00002100.000020.000210200.000020.002100400.000020.021000600.000020.210000800.0000221000001000.000022010000001200.00002200100000001400.0000220001000000001600.000022000010000000001800.0000220000010000000000200如下是声压与声压级之间的换算表格,右边是声压与声压级之间的曲线关系。051015202520406080100120P(Pa)VS.SPL050100150-50510152025SPLVS.P(Pa)声压·声压级·响度级·响度为分析声压,响度级以及响度之间的关系,我们通过右上角表格数据绘制了如下曲线。从分析的曲线可以看出,人耳所感受到的响度与物理意义的声压(帕)直接虽然是对数关系,但是其底a没有达到10。050100150200250300-50510152025Loudness(sone)VS.Pa05101520-0.0500.050.10.150.20.25Loudness(sone)VS.Pa020406080100120140-50510152025LoudnessLevel(SPL)VS.Pa020406080100-0.0500.050.10.150.20.25LoudnessLevel(SPL)VS.Pa050100150050100150200250300LoudnessLevel(SPL)VS.Loudnedd(sone)02040608010005101520LoudnessLevel(SPL)VS.Loudnedd(sone)声压(帕)loudnesslevel(phon)响度级(方)Loudness(sone)响度(宋)P(Pa)LNN=2^[(LN−40)/10]0.0000200.06250.0002200.250.0024010.026040.2801621006420120256说明响度(宋)与声压(帕)之间的关系是对数关系N=𝑙𝑜𝑔𝑎𝑃𝑎说明响度级(SPL)与声压(帕)之间的关系是对数关系LN=𝑙𝑜𝑔𝑎𝑃𝑎说明响度级(SPL)与响度(宋)之间的关系是对数关系LN=𝑙𝑜𝑔𝑎𝑁听觉的分辨力听觉对于不同频率、不同声压级的信号,其分辨能力是不同的。当这些信号连续或者不连续变化的时候,分辨阈又有所不同。声压级变化存在两种形式,连续变化(信号连续,声压级连续变化,即幅度连续变化),非连续变化(两个不同声压级测试信号之间有短暂的时间间隔,我的理解应该是指声压级的变化不是连续的)。声压级连续变化时的声压级变化分辨阈:对于声压级连续变化的信号,声压级变化的分辨阈与声压级大小有关。当声压级较小的时候,分辨阈较大;当声压级逐渐增大的时候,分辨阈会逐渐减小。而且不同的声压级的声音,其声压级变化的分辨阈随频率的变化也会不同。右图可以看到,当声压级在50dB以上的时候,人耳能够分辨的最小声压级变化大约为1dB;当声压级小于40dB的时候,声压级变化需要达到1dB~3dB才能察觉出来。对于纯音信号,声压级较小的时候,分辨阈比较大,可以达到3dB~7dB;当声压级较大的时候,分辨阈可以达到0.5dB。(我的理解:声压级是物理量声压的对数函数,当声压级小时,增加1dB所导致实际物理量声压的增幅当然小于声压级大是所导致的绝对增量。)由此可见,人们对于声音强弱变化的察觉能力是有限的,相当多的人对同一个声音信号在其声音强弱变化的察觉能力是有限的。相当多的人对同一个声音信号在其声压级突然变大或者变小量小于3dB时是察觉不出来的,只有那些经过专门训练的音乐工作者和录音师才能察觉出1dB~2dB的声压级突变。所以,在声频工程中常以3dB这个数值作为某些特性指标,比如频率特性不均匀度的上限。而高质量的声频设备,则常用1dB~2dB这个数值来衡量其质量。听觉的分辨力频率连续变化:频率变化也有连续和非连续两种方式。在进行非连续频率分辨阈的测量时,选用听觉较敏感的4Hz调制频率。下图显示的是响度级为60方,调制频率为4Hz时,频率分辨阈随频率变化的特性。在频率低于500Hz的时候,分辨阈基本保持在3.6Hz。当频率高于500Hz时,频率分辨阈几乎随着频率成正比例增大,比例系数为0.007。频率非连续变化:频率非连续变化的时候,分辨阈分布曲线与频率连续变化的曲线类似。只是频率非连续变化的分辨阈小,约是连续分辨阈的0.33倍。即频率小于500Hz时,分辨阈为1Hz左右;频率大于500Hz时,分辨阈随频率正比例增大,比例系数约0.002。声压级不连续变化:声压级不连续变化的时候,听觉对于两个不同的声压级声音的分辨阈要小于声压级连续变化的情况。下图反映的是1KHz纯音在连续和非连续