什么是De-hum降噪?以及在什么情况下使用De-hum? iZotope RX10
从电气噪音到空调噪音,去除音频中的hum嗡嗡声一直是降噪和音频清理工具主要功能,也是iZotope RX的主打功能之一。RX De-hum是自RX1以来少数几个“常驻”模块之一,已经走过了15年。
想了解更多关于RX的介绍及使用小技巧,请点击链接:RX10——高清晰音频的智能解决方案、iZotope RX 10 官方介绍视频(中文字幕)、RX如何消除音频中的咔哒声和爆裂声、如何用RX删除对白录音中的背景噪音。

在这篇文章中,我们将深入了解清理噪音的一些最新发展,并学习静态、动态和自适应操作模式的区别。
看往期对他的专访:音频修复行业标准iZotope RX10开发工程师Alexey Lukin专访
什么是Hum?
当涉及到噪声的分类时,我们通常认为一类噪音是瞬时的或短暂的,而另一部分是稳定的和持续的。第一种包括各种clicks 咔哒声和bumps怦怦声,而第二种包括hiss 嘶嘶声、buzz 嗡嗡声、rumble 隆隆声。说到这第二类,我们可以把这些静态噪音分成两种:一种是宽带噪声和随机的,如Hiss 嘶嘶声,而另一种是音调的,如Hum 哼声(或叫嗯声、低频嗡嗡声)和Buzz 嗡嗡声。
最初,RX De-hum模块被设计用来处理低频噪音,如50/60Hz的电源嗡嗡声。从RX9开始,De-hum也能够处理高频的嗡嗡声。现在,该模块适用于消除整个频谱中的稳定噪声。
不同类型的噪音
下面是RX频谱图中不同类型的稳态噪声的样子。
RX频谱图中的宽带噪声

RX频谱图中的哼声

RX谱图中的嗡嗡声
用陷波滤波器去掉嗡嗡声
消除不需要噪音的最简单方法是什么?每个工程师都会建议你使用陷波滤波器。因此,传统的除哼声模块的设计是基于一组调谐到基音的谐波的陷波滤波器,如60Hz。听着还不错?那么,现在是时候了解一下这种方法的局限性了。
一个最明显的限制是一次可以衰减的谐波的数量。在RX中,有一段时间它的上限是8次,直到RX9将其扩展到16次。对于典型的50或60赫兹的基本频率,这涵盖了大约1kHz的范围。其实许多现实生活中的嗡嗡声主要集中在较低的频率上。然而,有些哼声的变种是更加宽频的;它们听起来更像嗡嗡声。它可以延伸到1千赫兹甚至1万赫兹以上,并包含数百个谐波。
另一个问题,即使使用数以百计的陷波滤波器是否实用?有可能,但是必须考虑到其副作用。每个陷波滤波器都有一个频率、衰减深度和Q值(又称量系数,定义了陷波的狭窄程度)。当陷波滤波器堆叠在一起时,它们的频率响应也会相加,就一定衰减更多的有用信号,就像下面的图片一样。如果我们通过提高Q值使凹口更窄呢?这也有一个重要的副作用,我们称之为Ring“铃声”,它有可能比原来的哼声对信号的损害更大。

Ringing铃声
每一个陷波滤波器(以及一般的均衡器)都可以通过其频率响应和脉冲响应来描述。频率响应决定了滤波器是如何改变信号中不同频率成分的振幅的(如上面的图)。脉冲响应决定了滤波器对信号波形的作用,以及它如何处理瞬态。
频率响应和脉冲响应是相关的。更详细和参差不齐的频率响应不可避免地需要在时域上扩大脉冲响应的范围。
例如,增加陷波滤波器的Q值会使其变窄,但会给滤波器的脉冲响应增加更多 “尾巴”。这些尾巴被称为“Ringing铃声”,因为它们在脉冲的完美点击中增加了混响、Ringing声的特性。这种“Ringing铃声”在频率上与滤波器频率响应的弯度相匹配。
听一听Q值增加时脉冲的咔嗒声,建议使用耳机。

更高的Q值在陷波滤波器的脉冲响应中产生更多的铃声
“Ringing铃声”是坏事吗?当一个信号的瞬态通过滤波器时,滤波器的脉冲响应的“铃声”会通过一个叫做卷积的数学运算传给信号。实际上,信号本身就开始响了。槽口越窄,铃声效果就越长。
“铃声”总是发生在陷波滤波器上吗?必须满足一个条件才会发生:瞬时信号能量必须发生在与缺口相同的频率上。换句话说,滤波器必须 “切断信号”。如果有用的信号不与凹槽共享频率,那么“铃声”就不会发生。例如,如果讲话都在150赫兹以上,那么剔除60和120赫兹的嗡嗡声就不会使讲话Ringing响起来。然而,剔除两个以上的谐波将不可避免地与语音发生交叉频率。语音是瞬时性的,足以使“Ringing铃声”可听见。
有两种流行的数字均衡器设计,它们对铃声的处理方式略有不同。一种被称为线性相位,它在信号瞬态之前和之后将铃声平均分布。当铃声强到可以听到时,它会在信号前面产生一个不自然的预回声。
另一种EQ类型被称为最小相位,它接近于模拟EQ的行为和声音。这种类型将所有的振铃放在信号瞬态的后面(之后),在那里它有更大的机会被信号本身的心理声学所掩盖。由于De-hum中的狭窄缺口可能会产生明显的铃声,所以最小相位滤波器通常是首选类型。

线性相位的哼声去除会产生不自然的预响声
下面的一个例子显示了哼声与歌唱的频率不重叠的情况。然而,我们仍然应用了所有16个接口,以显示铃声的效果,如果我们只应用两个接口,就不会发生这种情况。经过陷波滤波后,原本的录音开始出现混响,而声音谐波的振幅在越过陷波的频率时急剧下降。

线性和最小相位的De-Hum都会增加铃声和降低语音谐波的水平
动态De-hum
基于陷波滤波器的传统方法有一些严重的局限性:越来越多的陷波产生越来越多的破坏性铃声。有没有解决Ringing的办法呢?
答案就是在RX9中引入的RX动态De-hum!它与传统方法有两个根本性的区别,即与RX9中的De-hum有两个根本不同之处。首先,它支持多达1024个陷波滤波器,可以覆盖整个频谱。这使得它适用于衰减传统方法无法达到的嗡嗡声。最重要的是:凹槽的频率不需要一定是谐波相关的。该算法可以处理包括几个不相关的基本频率的复杂噪声并且这些都是零延迟的。
第二个根本性的变化使动态De-hum在很大程度上避免了铃声。怎么说呢?它是否打破了物理学定律?正如刚才提到的,Ringing铃声是在凹槽切割信号的瞬态能量时产生的。有了动态De-hum,这种情况是不会发生的。该算法会去监测每个频率上的信号能量,并实时控制缺口的数量。当信号看起来像哼声时,它就被过滤掉。当信号能量超过预期的哼声能量时,缺口就会停止衰减,不会切断信号。我们把这称为门控缺口,因为现在每个缺口都作为一个动态处理器!
比较一下传统的 “静态 “消声和新的动态模式在下面的样本上的作用。你可以看到 “静态 “咝咝声是如何切断语音的谐波,并在300至700赫兹之间产生明显的频谱孔,这也导致了波形中可见的信号电平的损失。另一方面,动态消音不会破坏信号的谐波,这导致了处理后的信号振幅更高。除此之外,动态De-hum还能减弱8kHz左右发生的哼声。

动态De-hum更好地保留了原始信号,并优化了高频的嗡嗡声
自适应 De-hum
由于动态消音的槽口很窄,该算法对哼唱中的小频率变化也非常敏感。这种变化并不罕见,特别是当录音是由几个片段拼接而成的。哼声的振幅变化也可能影响模块的性能,因为门控切口是基于学习的振幅阈值。
在RX10中,iZotope开发了动态去噪的自适应模式。在这种模式下,不需要学习哼声曲线。AI算法会自动分析信号,以确定哪些看起来像哼声,哪些看起来像语音或音乐。然后,不断更新的哼声配置文件被用来驱动动态去哼声算法。这种自适应变体能够检测到哼声的频率和振幅的缓慢变化。然而,它需要大量的提前量来对这些变化作出反应,所以在这种模式下,De-hum插件的延迟增加到大约2000ms。
那么,你应该选择哪种模式。动态还是自适应?如果你知道哼声在振幅和频率上是稳定的,那就选择动态模式,尤其是当你有几秒钟的纯哼声需要捕捉时。通过准确地捕捉哼声的轮廓,你就为更准确的过滤设定了算法。
另一方面,如果你看到动态模式在整个文件中没有很好地减弱哼声,那么你就有理由怀疑哼声可能在变化。这就需要使用 “自适应 “模式。
但是。如果在音乐上使用自适应模式时要小心,因为持续的音符可能会触发算法,把它们当作不需要的哼唱。自适应模式主要是为语音制定的,在这种情况下,稳态的音调是很少见的。
替代De-hum的方法
De-hum的动态模式是一个强大的工具,可以在其他针对噪声随机成分的去噪算法之前削弱声调噪声。语音去噪或光频谱去噪。然而,在有些情况下,其他模块可以成功地取代或完善De-hum。
当没有运行De-hum,然后用RX Spectral De-noise(针对嘶嘶声)跟进时,仅仅使用RX光谱修复也能相当有效地处理嗡嗡声。光谱修复有单独的控制,用于减少噪声的音调和宽带成分。手动绘制的降低曲线提供了额外的方法来微调衰减量。
有时在单频或多频(周期性咔嗒声)模式下使用RX De-click可以处理构成嗡嗡声的咔嗒声。
最后,RX光谱修复提供了一个快速解决偶尔出现的单音嗡嗡声的方法:只需在频谱图上选择出问题的频率,并应用垂直衰减模式,使用合理的高波段数(1024-4096)。
好了,今天对于hum及处理hum的详解收益一定很多吧,喜欢别忘了转发。
我们将于12月左右推出第二期RX音频修复大师课,小伙伴们可以通过首期课程链接了解:RX10音频修复认证课程有哪些特点?、首期iZotope RX10大师课正式结业,学员收获满满。
iZotope RX10及相关产品在黑五还有优惠,抓紧入手吧!黑五特惠,iZotope RX10,accentize全系列超低折扣
Audio groupon
来团-点击图片扫码进入




同期录音网
公众号|locationsound_cn
服务微信|locationsound