音频修复行业标准iZotope RX10开发工程师Alexey Lukin专访
iZotope RX 10 是iZotope有史以来最直观、最智能的音频清理和降噪软件版本。在这次采访中,邀请到了Alexey Lukin,以了解更多关于RX音频修复软件背后的故事。我们往期也制作了许多关于RX的内容,:iZotope RX10 现已正式发布|RX如何消除音频中的咔哒声和爆裂声|如何用RX删除对白录音中的背景噪音。更多内容请到同期录音网locationsound.cn网站查看。
双十一期间我们也推出了iZotope等软件、硬件的优惠活动,请扫描二维码参与!


还有抽奖,试试手气!
Q:在 iZotope做什么工作?
AL:我在iZotope的工作始于一个叫Spectron的效果处理器,于2003年发布。大约在同一时间,我开始了降噪算法的早期设计,四年后它成为了iZotope RX。我的专业主修的是音频处理和图像处理,所以我的博士论文探索了这些领域。 Spectron 虽然RX现在是我最喜欢的“孩子”,但作为iZotope的DSP工程师,我也为其他产品设计了算法。如iZotope Ozone IRC maximizers、Radius time/pitch modification、dither、SRC、EQs,以及其他许多产品。
Ozone IRC maximizers Radius time/pitch modification iZotope的研究团队也在不断壮大,我学习了(ML)、嵌入式DSP、空间音频、硬核数学和C++编程等领域,并与拓展我技能的人一起工作。而现在,iZotope已经与Native Instruments公司和Brainworx公司展开合作,这也使得我有更多的机会去学习。
NATIVE INSTRUMENTS
公司

BRAINWORX
公司
Q:在过去的几年里,音频清理、修复和恢复的情况发生了怎样的变化,RX 10是如何应对这些变化的?
AL:在疫情期间,大量的音频制作已经转移到个人或家庭工作室,这给音频修复带来了新的挑战。像嗡嗡声、底噪、频率损失或早期反射等;很多在录音棚中几乎不存在的问题又回来了。
现在可用于音频处理的软件呈爆炸性增长。比如,在十年前几乎无法想象的,对白增强或音源分离这样的事情,现在已经成为了常规化处理的一环。
RX10提供了几种新的工具来解决困难样本的清理问题。RX Dynamic De-hum动态消音的自适应模式能够在不事先“学习”的情况下减弱嗡嗡声(稳态音调噪音,如嗡嗡声或干扰),即使频率在缓慢漂移中。由于陷波滤波器的门控作用,与旧的静态消声相比,振铃的数量可以降到最低。
RX Spectral Recovery光谱恢复中更新的ML算法(由我的同事Shahan Nercessian开发)能够比RX 9更真实地恢复语音中缺失的高频。而且它还能合成较低的频率,如缺失的基音,这对修复zoom等会议软件录音或手机录音很有帮助。
对于新手或时间紧迫的用户,重新设计的RX Repair Assistant修复助手能够解决比以前更多的问题。它可以建立自定义的信号链来修复不同类别的音频源,如语音、音乐或鼓声。除了RX应用中的模块外,修复助手现在还可以作为插件使用。
Repair Assistant
我最喜欢的RX10功能之一是新的 Selection Feathering羽化功能。它可以将修复模块应用于 “较软 “的频段,从而使处理过的和未处理过的素材更好地融合在一起。

Selection Feathering
RX Text Navigation分析对话,并在频谱图上方显示可搜索的转录,支持基于文本的编辑。自动多人检测功能可以找到并标记与每个说话人相关的语音部分。
Q:在创造这项新技术的过程中,你们面临的挑战有哪些?
AL:一个挑战是如何将一些复杂的新算法融入到产品中,使它们能够在本地运行,而不需要接入云端(这在许多后期制作室是无法实现的)。在开发自适应De-hum的时候算法延迟是很难处理的,因为它需要几秒钟的提前量,以便能够可靠地区分嗡嗡声和语音。所以在某些DAW中运行该插件时,可能会产生问题。
我们还没有解决的另一个难题是消除早期反射。我们的RX Dialogue、De-reverb算法在处理较长的混响上是有效的,但在非录音棚内经常遇到的短混响来说是个挑战。这种混响不仅在频谱图中产生衰减的尾音,而且还会引入梳状滤波并改变信号的相位。我们希望在未来能更好地解决这个问题。
Q:你能介绍一些RX中小众却又好用的模式吗?
AL:View ► Show Channels Separately模式 [Ctrl + Shift + C]
允许你将立体声文件视为单声道,并在频谱图中获得两倍的分辨率。同样的,你也可以使用通道选择按钮选择个别通道进行编辑。
RX Deconstruct模块对于半手动清理残留的失真、噼啪声或蝉鸣声很有帮助。在RX10中,它可以和频率羽化一起使用,对修复目标进行温和的修复。
在处理立体声文件时,我经常使用RX Mixing模块的 “M/S encoder-decoder“预设。它可以测试L和R通道的相似程度,以及它们之间是否有偏移,并可以用RX Azimuth模块进行补偿。当录音接近单声道时,我经常会用Center Extract中心的提取模块来进行额外的降噪。
当涉及到导出时,只选择一个立体声通道并应用文件►Export Selection导出选择[Ctrl + Shift + E]将导出一个只有这个通道的单声道文件。如果你以有损格式导出,如MP3或OGG,RX在导出窗口有一个独特的防止削波功能,以确保你导出的文件在解码和播放时不会出现削波。它不仅是一个峰值限制器,也可以消除即使是限制在0dBTP的文件,也可能发生的编解码器削波。

Prevent clipping功能
还有一个导出方法我经常使用,File ► Export Screenshot,它会自动捕捉频谱图的窗口,也可以保存为GIF格式,非常便于在线演示和教学。
Q:在你看来,未来的音频修复会是怎样的?
AL:我肯定在未来,AI人工智能机器可以修复目前为止不可能修复的问题。通过让机器学习,它能理解更多的音频信号。例如,人声、音乐、对话内容、和声、乐器等。有了这些知识后,修复质量将会越来越好。在某些情况下,修复将会被接近于音频源的重新合成所取代。随着对音频源信号的更好理解,机器将为音频修复提供更多更完美的修复方法和处理结果。
而且我还看到了另一个趋势;音频修复的普惠化。将来会出现比以往更便宜的工具,控制也更简单,能供更多人使用。在以前运行它需要专门的硬件,现在可以在电脑端运行,那在未来呢?它很有可能在你的浏览器、手机、耳机等设备上运行。想象一下,那时的录音棚、工作室将会使用什么样的处理方式呢?
以上就是采访的所有内容了,想了解更多关于RX的功能及使用、修复的小技巧请关注我们的公众号及刚刚重装上线的同期录音网!
12月,RX10音频修复大师认证课第2期正在预热中,欢迎咨询!我们首期课的介绍如下:RX10音频修复认证课程有哪些特点?、首期iZotope RX10大师课正式结业,学员收获满满。