新人课堂:关于语音清晰度,你需要知道的一切(一)DPA大学堂
在录音中保持语音清晰度
在录音时,应该始终考虑到语音的清晰度问题,也就是说,在我们录下的说话声中,每个词应该都是清晰可辨的。然而,在录制或放大声音时,要保持语音的清晰度在技术上是很有挑战性的。
从今天起,同期录音网将通过几篇文章来给大家介绍关于语音清晰度的一些知识,还有最重要的——教你该如何在录音中保持语音的清晰度。
更多内容:关于语音清晰度,你需要知道的一切(二)|(三)|(四)
发声原理
相信大家对发声的原理并不陌生(不清楚的举手让我康康),简单来说,空气通过声带振动从而产生声音。控制声带可以让声音的音量和音调发生变化,然后声音通过声带上方的腔(咽、口、鼻)过滤后发出。
发声力度的不同会相应改变声音的电平、音调、频谱。很明显的例子就是,喊叫的声音和随便说话的声音完全不同。当录音时,你可能会发现声音信号的峰值远高于RMS值或平均电平,而你需要确保所有峰值都能在录音通路里保留。
什么音最需要被保留
从音位学(phonologie)上来说,汉语是一种声调语言,也就是:元音、辅音和声调共同承担表意功能。在语音不变的情况下,我们还能通过4个声调的变化来改变语义,不同的声调能表达出不同的意思。
但是世界上更多的,包括英语在内的语言,是非声调语言,即:无论声调怎么变化,都不会改变词的意思。而在一切非声调语言中,辅音就显得更为重要。
为什么说辅音更重要?它和语音清晰度有什么关系?
请看下面这个视频:
从视频中,我们得知:辅音之所以重要,是因为元音本身是没有任何含义的,是通过元音前后的辅音,来给词赋予意义。
因此,当语音中的辅音被其它声音掩盖,比如在一些混响多的地方和背景噪音很大的地方,人们就会听不清对方说了什么。
(元音的发音示意图)
辅音和元音的发声过程不太一样:元音是由声带产生、声腔过滤后直接发出;辅音则是空气通过喉咙和口腔(特别是舌头和嘴唇)时,受到阻碍而形成的。
通过简单的发声实验就会发现,无论多努力地去大喊一个辅音,都不会很大声。在正常的声音强度下,元音的能量通常在大约1k Hz以上迅速减少。当声音升高时,对语音频谱的强调会向更高的频率移动一到两个八度。
这也意味着,当你大声喊话时,辅音会被元音所掩盖——大喊并不会让对方更容易理解你的语音。
从声学上来看,辅音(k、p、s、t等)主要出现在500Hz以上的频率范围内,更具体一点说,是在2 kHz-4 kHz频率范围内。因此,这部分频率范围就是为了保持语音清晰度而需要保留的最重要区域之一。
(辅音集中所在的区域)
不过,形成不同元音的空腔也影响着空气流通。这就是为什么元音的特征也出现在耳语中。一般来说,男性的复音基频(也称为基音或f0)在100-120Hz的范围内,但在这个范围之外可能会发生变化。女性的f0大约高出一个八度。对于儿童来说,f0大约是300Hz。
如何更好地保留辅音
既然辅音如此重要,如何更好地保留它们呢?视频中给出了3个简单的建议:
● 1.选择频率范围较广的麦克风
● 2.将其放置在靠近声源的位置
● 3.尽可能避免出现太多声音反射和背景噪音
(将麦克风靠近声源)
接下来的文章中,我们将细致地介绍其它影响语音清晰度的因素和原理,包括声源、麦克风的位置和选择等,并教你如何保持语音清晰度。
– 未 完 待 续 –