OA系统图书馆网站地图所长信箱English中国科学院
 
首页机构概况科研成果研究队伍国际交流科技合作研究生教育创新文化党群园地科学传播信息公开
  综合新闻  
  图片新闻  
  科研动态  
  学术活动  
  媒体报道  
您现在的位置:首页 > 新闻动态 > 科研动态
研究人员提出一体化降噪与混响消除算法
2020/11/20 | 作者:中国科学院语言声学与内容理解重点实验室 程龙彪 | 【 【打印】【关闭】

  当环境中存在噪声或混响干扰时,传统的降噪算法或解混响算法能够有效抑制相应的干扰,但当这两种干扰同时存在时,这些算法的性能明显下降,从而导致语音通信的质量与自动语音识别系统的准确率大大降低。

  为了同时抑制环境中存在的噪声与混响,中科院语言声学与内容理解重点实验室的硕士生宋思远与其导师李军锋研究员等人提出了一种融合了多通道加权预测误差与多通道维纳滤波的一体化降噪与解混响算法。

  相关研究成果20208月在线发表于学术期刊 Applied Acoustics

  研究人员用加入单通道维纳后滤波的最小方差无失真响应(Minimum Variance Distortionless Response, MVDR)波束形成器实现了多通道维纳滤波器,其输入为加权预测误差(Weighted Predict Error, WPE)预处理器的输出信号。他们采用相对早期传递函数,而非整个相对传递函数或直达声信号,来实现MVDR波束形成器,并使用WPE的预测对干扰信号的协方差矩阵进行近似计算;随后根据整个系统的输出信号,来更新WPE中的目标信号方差。

  模拟和真实条件下的实验结果表明,在噪声与混响同时存在的环境下,该方法可以对语音进行有效地增强处理。当麦克风与声源距离为3米时,算法处理后的语音识别词错率降低了38.50%。研究人员将该方法与五种最近被提出的相关算法进行对比,结果表明,新算法在语音质量、语音清晰度和语音识别性能等方面均优于其他算法。

  当环境中存在噪声与混响时,本项研究成果很大程度上提升了语音通信系统与自动语音识别系统的用户体验。

  此研究获得国家重点研发计划(No.2017YFB1002803)和国家自然科学基金(No.1172243711674352)资助。

  

  本研究所提算法的系统结构(图/中科院声学所)

  关键词:

  语音增强;降噪;解混响

  参考文献:

  SONG Siyuan, CHENG Longbiao, LUAN Shuming, YAO Dingding, LI Junfeng, YAN Yonghong. An integrated multi-channel approach for joint noise reduction and dereverberation. Applied Acoustics, 171: 107526. DOI: 10.1016/j.apacoust.2020.107526.

  论文链接:

  https://doi.org/10.1016/j.apacoust.2020.107526

 
  相关新闻
Copyright 1996 - 中国科学院声学所 版权所有 备案序号:京ICP备16057196号 京公网安备110402500001号
地址:北京市海淀区北四环西路21号中国科学院声学研究所  邮编:100190
E-mail:ioa@mail.ioa.ac.cn