3kbps也能清晰通话的神器Lyra,开源了!
Lyra是谷歌公司推出的一款不惧低带宽的音频编解码器,用来实现随时随地高质量通话。
3kbps是什么概念?
换算成生活中常见的单位,等于0.375KB/s。
对比来看更加直观,Skype官网给出的通话最低速度是30kbps,带宽要求整整高出了10倍。
Lyra利用机器学习模型,将原始音频压缩到3kbps,即使没有高速网络,也能得到自然清晰的语音。
它的架构与传统的编解码器类似,分为编码器和解码器两部分:
编码器以40毫秒为单位,从语音中提取特征,进行压缩后通过网络传输。
解码器利用机器学习模型,能使用最少的数据量重建语音,将特征转换成完整的音频波形,以进行播放。
在Lyra之前,音频编解码器的比特率越低,语音的清晰度就越差,并且机械感越重。
传统的音频编解码器使用的是数字信号处理技术,而Lyra则依赖其强大的信号重建能力。
由于Lyra无需逐个处理信号,因此无需高带宽,而且在保持低比特率的同时,还能提供高质量的音频输出。
谷歌还使用Lyra与Opus、Speex,在6kbps和3kbps的情况下,对同一音频的压缩质量进行对比测试。
http://www.qbitai.com/wp-content/uploads/2021/04/Lyra与现有编解码器的比较.mp4