新人课堂:关于语音清晰度,你需要知道的一切(二)DPA大学堂
在录音中保持语音清晰度
上篇文章中介绍了声调语言和非声调语言的区别以及辅音的重要性,点击链接回顾:关于语音清晰度,你需要知道的一切(一)|(三)|(四)不仅从语义上影响词语的含义,从声学角度看,辅音集中所在的频率范围,是影响语音清晰度的重要因素之一。
这篇文章中,将继续介绍其它影响语音清晰度的因素。
声压级和动态范围
介绍其它影响语音清晰度的因素之前,首先需要考虑的人声的声压级范围,这点在挑选麦克风时也很有帮助。
请看下面这个视频:
视频内容虽然很简单,但很有必要再次强调,因为是基础性的问题。
要确保麦克风的动态范围始终超过声音的动态范围,才能让你不必时时担心麦克风本身的噪音和失真,从而把更多精力放在如何提高语音清晰度和其它声音问题上。
重要频率
非声调语言(英语等)的重要频率如下图所示。这里,2kHz左右的频带是关于语音清晰度最重要的频率范围,而大多数辅音都集中在这个频带。
请看下图。语音频谱是高通滤波或低通滤波的。使用20Hz的高通滤波器(左上角)可以使语音100%可以被理解,这是因为完整的语音频谱被保留了。
一个高通滤波器将500Hz以下的频率全部去除,仍然可以让语音信号很容易被理解。即使大部分语音的声音能量被去除了,语音的可理解程度也只降低了5%。不过,如果应用更高的截止频率,会使清晰度下降。
与之相反的是,使用低通滤波器会使语音清晰度下降得非常快。将1kHz作为截止频率时,语音清晰度已经低于40%。由此可以看出,1khz到4khz之间的频率范围对于语音清晰度是至关重要的。
背景噪音
不难想到,背景噪音对语音清晰度肯定有影响。这种情况下,可以将除了语音本身以外的所有声音信号都当作是背景噪音。因此,像空调声、其他嘈杂的设备声、其他人的在场发声这些都属于背景噪音。在电视或电影声音中,对白层次和背景音乐/氛围声音层次之间的关系平衡,常常是一个备受关注的问题。
在上面这张图中,语音清晰度与信噪比(S/N)成反比。较低的曲线表明,即使信噪比为负,语音仍然可以在一定程度上被理解,这意味着噪声比语音电平大10dB。但在任何情况下,最佳的感知语音水平约为60 dB re 20μPa。
专家们在这方面进行了大量的研究,总体而言,结果表明:
● 1. 当背景噪音电平低于40dB(A)时,最佳语音电平是恒定的
● 2. 最佳语音电平似乎是当背景噪音电平大于40 dB(A)时,保持约15 dB(A)信噪比的电平
● 3. 在信噪比几乎完好保持语音可理解度的条件下,随着语音电平的增加,听力难度增加
1kHz—4 kHz的频率范围内应尤其“保持清晰”。举个具体应用的例子:当添加音乐作为叙述的背景声时,应使用参数均衡器将1kHz—4kHz频率范围内的音乐减5-10 dB来提高语音的清晰度。
此外,在讨论语音清晰度时,一些混响也被认为是噪音。轻微的混响可以支持语音,但是混响一旦掩盖关键字节,就会使语音清晰度大大下降。
下篇文章中会介绍另一个影响语音清晰度的因素:声场及声音特性原理。相关知识能帮助你理解什么样的麦克风位置,最有利于语音清晰度的保留。
– 未 完 待 续 –