Microphone Array Post-Filter for Separation of Simultaneous Non- - - PowerPoint PPT Presentation

▶

Nov 13, 2023 124 likes •285 views

Microphone Array Post-Filter for Separation of Simultaneous Non- Stationary Sources Jean-Marc Valin , Jean Rouat, Franois Michaud Department of Electrical Engineering and Computer Engineering Universit de Sherbrooke, Qubec, Canada

SLIDE 1

Microphone Array Post-Filter for Separation of Simultaneous Non- Stationary Sources

Jean-Marc Valin, Jean Rouat, François Michaud Department of Electrical Engineering and Computer Engineering Université de Sherbrooke, Québec, Canada Jean-Marc.Valin@USherbrooke.ca

SLIDE 2

Motivations

The context: sound source separation The problem: beamforming and similar techniques provide limited noise reduction The solution: use a post-fjlter to further reduce noise and interference

Microphones Source separation Post-fjlter

SLIDE 3

Approach

Linear source separation

Geometric Source Separation (Parra) is used Works for any linear separation algorithm

Post-fjlter

Frequency-domain processing Based on the optimal Ephraim and Malah estimator Gain modifjcation according to probability of speech presence (Cohen)

SLIDE 4

Contribution

Multiple sources of interest

Generalize post-fjlters to separation of multiple sources

Non-stationary noise

Decouple background noise (stationary) and directional interference (transient) Fast estimation of interference

Direct estimation from initial separation

SLIDE 5

Post-Filter Overview

Noise estimate as the sum of two components (stationary + transient)

SLIDE 6

Background Noise Estimation

Minima-Controlled Recursive Average (Cohen)

Applied for each source of interest

Initial estimate provided directly from the microphones

SLIDE 7

Interference Estimation

Source separation leaks

Incomplete adaptation Inaccuracy in localization Reverberation Imperfect microphones

Estimation from other separated sources

SLIDE 8

Suppression Rule

Loudness-domain optimal estimator Assuming speech is present:

SLIDE 9

Speech Presence Uncertainty

Optimal gain modifjcation for loudness- domain Setting Gmin = 0 leads to Unlike log-domain estimator, no arbitrary limit on attenuation

SLIDE 10

Experimental Setup

Array of 8 inexpensive microphones on a mobile robot Automatic localization Noisy conditions Moderate reverberation

SLIDE 11

Results (Signal-to-Noise Ratio)

Three voices recorded separately so clean signal is available

SLIDE 12

Results (Log-Spectral Distortion)

SLIDE 13

Results (spectrograms)

Input GSS Post-fjlter output Reference

SLIDE 14

Conclusion

Source separation post-fjlter

Based on optimal loudness-domain estimator Interference estimated using other sources

Future work

Robustness to reverberation Integration with speech recognition

riginal

processed

SLIDE 15