作为AI的重要一环,智能语音已经成了新一代人机交互入口的必争之地。大象声科作为机器听觉方案提供商,为通讯以及人机交互提供智能语音增强和语音交互解决方案,打造更清晰的机器听觉体验。
据悉,大象声科是一家致力于机器听觉的人工智能公司,2017年成立于深圳。公司云集了一批全球顶尖机器听觉科学家和来自世界知名企业的产品研发团队,依托算法、软件、硬件三个维度的技术纵深,提供尖端的智能语音增强和语音交互解决方案。
大象声科副总裁金辉
在“软硬兼‘摄’,听·见AI”2018重庆国际AI Phone产业技术峰会上,大象声科副总裁金辉重点介绍了大象声科AI智能通话降噪的两大理论基础——计算听觉场景分析理论(CASA)和深度学习技术,CASA主要关注的领域是声源分离。这里的声源不单是指人的声音,也可能是其它各种声音。声源分离的目标就是将这些声音分离开。针对这一问题的早期解决方式是通过统计的方法把声音里面的统计特性提取出来;计算听觉场景分析则在很大程度上是对人的听觉特性的模拟。
大象声科创造性地将CASA与深度学习技术相结合,成功实现了世界上第一个利用深度学习和传统信号处理相结合的单通道智能通话降噪方案,能够有效地分离人声和背景噪声,在性能上不仅突破了传统信号处理方案的瓶颈,在机器个性化拾音与智能化降噪的应用上,更是开创先河。
这项智能降噪技术技术目前是软件方案,不用重新设计或额外增加硬件,也不用改动结构,原有的麦克风都可以继续用,这不仅可以大大降低对硬件的要求,同时可以提高工程效率。目前市面上锤子坚果3和pro 2s已经率先搭载了这项技术,能够帮用户过滤掉周围嘈杂的背景音,加强通话者本身的声音,同时,努比亚即将发布的一款红魔Mars电竞手机将采用这项技术来消除游戏场景通话中的啸叫,背景噪音等问题。
金辉表示,这项技术除了手机领域,还有非常广泛的应用场景,包括VoIP云通讯、耳机、对讲机等。此外,大象声科针对IoT领域所推出的智能语音交互解决方案,通过将智能降噪和麦克风阵列,语音唤醒,声纹以及语音识别等多项技术相结合,将大幅度提升语音交互的体验。
据了解,今年7月,大象声科获得了小米和高通创投的数千万人民币的Pre-A轮战略投资。大象声科表示,下一步公司将依托自身行业领先的技术优势,整合小米和高通创投的战略资源,联合通讯、智能硬件等领域的优质客户,共同将高品质和便利的人工智能服务带进千家万户。