腾讯会议又一黑科技，屏蔽超过 200 种会议噪声是如何做到的？

AI科技大本营 | 2021-07-16 12:40:22 阅读：1414

远程会议已成为我们常规的工作沟通方式，在线交流打破时间、空间的限制，给予我们便利之际，也屡遭尴尬：

忘记静音，一边听会一边敲键盘，被对方提醒：“XX，麻烦静下音”；

自己正在讲话呢，身旁人走来走去有噪音，影响会议收听效果，你恨不得马上转移开会阵地……

后疫情时代，远程会议有以下发展趋势：远程协作占员工的工作时间50-80%，线上线下混合会议将超过90%，视频会议功能将成为大部分会议的标配。因此提高远程会议的交互体验已成为厂商迫在眉睫的事。

为了应对以上会议室各种复杂声学场景下的开会难题，腾讯会议旗下天籁实验室推出天籁语音模组方案，由腾讯AILab 技术加持，实现12米超长距离拾音，消除超过200种会议噪声，在双讲、回声消除等方面实现突破性升级。

天籁语音模组加持，立即开启自动“屏蔽杂音”模式

天籁语音模组能消除超过 200 种会议噪声是怎样的概念？

腾讯天籁实验室资深研究员刘成做了以下演示：在顶端装有天籁模组的屏幕那头用力敲打键盘、做桌椅碰撞，笔者与之实时连线，并没有听到键盘噪音，宛如开启了“噪声静音”模式。

刘成表示，还有空调噪声、翻纸张、塑料瓶、水杯、雨打在窗户上、外面马路施工、脚步等 200 多种声音，可通过 AI 算法降噪处理。同时天籁语音模组基于深度学习模型，也能将空调声、风扇声等平稳噪声消除。

刘成尝试在距离屏幕 2 米和 8 米的位置讲话，收听效果变化不大。这是因为天籁模组是全面 180 度拾音，不管讲话人从左边、右边、前面、后面走动变化，声音变化不大。在双讲测试里，刘成和另一人同时发声，两者声音均能清晰听到，并无剪切感或回声泄露情况。

据刘成介绍，天籁语音模组结合房间声场感知、采集和空间声场重建技术，远场多人音频通信、多讲话人实时追踪、多人自动取景等实时音视频技术难题，帮助企业和用户实现在远场复杂物理空间下通信体验的突破性提升。

例如针对讲话者离屏幕较远时，可能存在听不清、声音小的情况，天籁语音模组方案将多个 MEMS 麦克风板嵌入到会议大屏中，结合音频处理器，能够实现 180 度广角、12 米超长距离拾音，让参会者可以像面对面交流般清晰、自然，并给与参会者更灵活的活动空间。

基于 20 多年音视频技术经验，打造“软硬一体”的云视频会议生态

去年 9 月，腾讯会议发布企业版、会议室连接器以及新一代云视频会议室解决方案“腾讯会议Rooms”，据了解，天籁语音模组将应用于腾讯会议 Rooms 专款机型上，还开放给腾讯会议Rooms专款硬件合作伙伴，助力打造会议室场景高清、纯净、流畅的开会体验。

与此同时，不做硬件的腾讯会议，还通过开放音视频认证标准，联合硬件设备厂商，共同为企业量身打造“软硬一体”的云视频会议解决方案。

腾讯会议天籁实验室技术研发专家余涛介绍“软硬一体”方案背后的几点思考：

一是从商业上，为硬件厂商集成一体化方案提供便利，可快速形成产品能力。

二是从技术上，由于远程语音、噪音等语音的复杂性，仅靠几个算法，即使在深度学习模组加持下，想要较好地解决远场语音问题还是较难的。

自 QQ 推出语音通话开始，腾讯已有 20 年音视频技术的积累。去年成立专注于新一代实时音频技术的天籁实验室，并结合腾讯AI Lab 技术的加持，天籁模组从多维度、多角度、多模态出发，在提升远场拾音能力上拥有天时地利的技术优势。

目前天籁模组将首先服务于腾讯会议 Rooms，相信未来天籁模组可应用在小型会议室、中型会议室、大型会议室、超大型会议室、开放空间等。最后，据余涛透露，与硬件厂商合作的具备天籁音频模组的产品，正在量产中。

*博客内容为网友个人发布，仅代表博主个人观点，如有侵权请联系工作人员删除。