语音语言处理实验室

部门介绍

语音语言实验室成立于2018年,旨在突破特定/开放环境声纹识别、脑信号分析、多模态数据分析、逻辑学习等领域关键技术,构建面向企业/个人的声纹识别、语义搜索、多模态数据检索解决方案。

研究方向

(1)声纹识别研究,主要探索基于深度学习的声纹识别技术,并结合语音识别、音频检索等技术,解决特定环境下声纹识别的实际应用问题;

(2)语言分析研究:主要探索基于深度学习、知识图谱的自然语言技术,解决面向大数据舆情分析、面向特定领域的语义搜索,人机对话等问题;

(3)情感脑电信号识别研究,主要探索基于信号处理和认知心理学的脑电信号分析及识别技术,解决情感脑电信号的有效识别问题;

(4)多模态机器学习研究,包括表示(representation)、转换(translation)、对齐(alignment)、融合(fusion)和互相学习(co-learning) 5个基本任务,旨在创建可以处理和关联来自多个模态信息的模型;

(5)逻辑学习,主要探索基于数据驱动的逻辑学习技术,解决逻辑可学习问题。

未来预期

(1)推进声纹识别、脑电信号分析、大数据舆情分析、识别等产品落地;

(2)解决多模态数据融合中语义不一致等核心问题;

(3)奠定逻辑学习基本的理论基础。