Perzeptive Eigenschaften der datenbasierten Wellenfeldsynthese - - PowerPoint PPT Presentation

perzeptive eigenschaften der datenbasierten
SMART_READER_LITE
LIVE PREVIEW

Perzeptive Eigenschaften der datenbasierten Wellenfeldsynthese - - PowerPoint PPT Presentation

Perzeptive Eigenschaften der datenbasierten Wellenfeldsynthese Sascha Spors 1 and Hagen Wierstorf 2 1 Universitt Rostock, Institut fr Nachrichtentechnik 2 Technische Universitt Berlin, Assessment of IP-based Applications 12.Mrz 2014


slide-1
SLIDE 1

Perzeptive Eigenschaften der datenbasierten Wellenfeldsynthese

Sascha Spors 1 and Hagen Wierstorf 2

1Universität Rostock, Institut für Nachrichtentechnik 2Technische Universität Berlin, Assessment of IP-based Applications

12.März 2014

slide-2
SLIDE 2

Datenbasierte Wellenfeldsynthese

[Hulsebos et al. 2001]

Aufnahme natürlicher Schallfelder mittels Mikrofonarray und Synthese des Schallfeldes durch die Wellenfeldsynthese Plane Wave Decomposition Driving Signals /

M

/

Npw

/

L

Hier: Untersuchung der perzeptiven Eigenschaften datenbasierter Wellenfeldsynthese

Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Einleitung 1

slide-3
SLIDE 3

Intrinsische Dimensionalität von Schallfeldern

[Kennedy et al. 2007]

Die Darstellung eines Schallfeldes mit beschränkten Fehler in einem beschränkten quellenfreien Bereich benötigt nur eine endliche Anzahl von Expansionskoeffizienten. Sphärischer/kreisförmiger Bereich Sphärische Harmonische als Expansionsbasis Fehler sinkt exponentiell mit steigender Ordnung Nsph Ordnung Nsph steigt linear mit Frequenz und Radius Darstellung als Superposition von ebene Wellen Spektrum der ebenen Wellen aus Darstellung in sphärischen Harmonischen Endliche Anzahl Npw von (unabhängigen) ebenen Wellen

Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Datenbasierte Synthese 2

slide-4
SLIDE 4

Modales Beamforming mit sphärischen Mikrofonarrays

Expansion des aufgenommen Schallfeldes in sphärische Harmonische endlicher Ordnung Spherical Harmonics Decomposition Plane Wave Expansion Modal Beamforming /

M

/

Nsph

/

Npw

Realisierung des modalen Beamformings

  • 1. Räumliche Abtastung

Wiederholung des räumlichen Spektrums [Ahrens et al. 2012] Typischerweise Begrenzung der Ordnung Nsph

  • 2. Eigenrauschen des Equipments
  • 3. Mikrofonabweichungen- und Positionsungenauigkeiten

Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Datenbasierte Synthese 3

slide-5
SLIDE 5

Ansteuerungsfunktionen für die Wellenfeldsynthese

Gerichtete Ableitung des aufgenommenen Schallfeldes an der Lautsprecherposition Vorfilterung der Signals der virtuellen Quelle Translation der ebene Wellen zur Lautsprecherposition und Summation Illustration

¯ P(φ, θ, ω) ∂V n x0

Alternativ: Synthese von ebenen Wellen mit Spektrum der jeweiligen ebene Welle

Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Datenbasierte Synthese 4

slide-6
SLIDE 6

Versuchsdesign

Eine monofrequente/breitbandige ebenen Welle als virtuelle Quelle Kontinuierliches modales Beamforming [Rafaely 2005] 2.5-dimensionale Wellenfeldsynthese mit zirkulären Lautsprecherarray Continuous Modal Beamforming Driving Signals /

Npw

/

L Nsph

Einfluss der Ordnung auf synthetisiertes Schallfeld Lokalisation und Klangfarbe Simulationsparameter

Nsph

750 28 10 5 1 28

Npw 2 · Nsph + 1

1501

L

56

Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 5

slide-7
SLIDE 7

Synthetisiertes Schallfeld - Monofrequent

Nsph = 750, f = 1000 Hz (Volle Ordnung)

x / m y / m −2 −1 1 2 −2 −1.5 −1 −0.5 0.5 1 1.5 2 −1 −0.8 −0.6 −0.4 −0.2 0.2 0.4 0.6 0.8 1

(2.5D, L = 56, R = 1.5 m, φpw = 270o) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 6

slide-8
SLIDE 8

Synthetisiertes Schallfeld - Monofrequent

Nsph = 28, f = 1000 Hz (Beschränkte Ordnung)

x / m y / m −2 −1 1 2 −2 −1.5 −1 −0.5 0.5 1 1.5 2 −1 −0.8 −0.6 −0.4 −0.2 0.2 0.4 0.6 0.8 1

(2.5D, L = 56, R = 1.5 m, φpw = 270o) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 6

slide-9
SLIDE 9

Synthetisiertes Schallfeld - Monofrequent

Nsph = 28, f = 2000 Hz (Beschränkte Ordnung)

x / m y / m −2 −1 1 2 −2 −1.5 −1 −0.5 0.5 1 1.5 2 −1 −0.8 −0.6 −0.4 −0.2 0.2 0.4 0.6 0.8 1

(2.5D, L = 56, R = 1.5 m, φpw = 270o) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 6

slide-10
SLIDE 10

Synthetisiertes Schallfeld - Monofrequent

Nsph = 10, f = 2000 Hz (Beschränkte Ordnung)

x / m y / m −2 −1 1 2 −2 −1.5 −1 −0.5 0.5 1 1.5 2 −1 −0.8 −0.6 −0.4 −0.2 0.2 0.4 0.6 0.8 1

(2.5D, L = 56, R = 1.5 m, φpw = 270o) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 6

slide-11
SLIDE 11

Synthetisiertes Schallfeld - Monofrequent

Nsph = 5, f = 2000 Hz (Beschränkte Ordnung)

x / m y / m −2 −1 1 2 −2 −1.5 −1 −0.5 0.5 1 1.5 2 −1 −0.8 −0.6 −0.4 −0.2 0.2 0.4 0.6 0.8 1

(2.5D, L = 56, R = 1.5 m, φpw = 270o) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 6

slide-12
SLIDE 12

Synthetisiertes Schallfeld - Monofrequent

Nsph = 1, f = 2000 Hz (Beschränkte Ordnung)

x / m y / m −2 −1 1 2 −2 −1.5 −1 −0.5 0.5 1 1.5 2 −1 −0.8 −0.6 −0.4 −0.2 0.2 0.4 0.6 0.8 1

(2.5D, L = 56, R = 1.5 m, φpw = 270o) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 6

slide-13
SLIDE 13

Synthetisiertes Schallfeld - Monofrequent

Nsph = 28, Npw = 1501, f = 2000 Hz (Interpolation)

x / m y / m −2 −1 1 2 −2 −1.5 −1 −0.5 0.5 1 1.5 2 −1 −0.8 −0.6 −0.4 −0.2 0.2 0.4 0.6 0.8 1

(2.5D, L = 56, R = 1.5 m, φpw = 270o) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 6

slide-14
SLIDE 14

Synthetisiertes Schallfeld - Breitbandig

Nsph = 750 (Volle Ordnung)

x / m y / m −2 −1 1 2 −2 −1.5 −1 −0.5 0.5 1 1.5 2 −1 −0.8 −0.6 −0.4 −0.2 0.2 0.4 0.6 0.8 1

(2.5D, L = 56, R = 1.5 m, φpw = 270o, fs = 44.1 kHz) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 7

slide-15
SLIDE 15

Synthetisiertes Schallfeld - Breitbandig

Nsph = 28 (Beschränkte Ordnung)

x / m y / m −2 −1 1 2 −2 −1.5 −1 −0.5 0.5 1 1.5 2 −1 −0.8 −0.6 −0.4 −0.2 0.2 0.4 0.6 0.8 1

(2.5D, L = 56, R = 1.5 m, φpw = 270o, fs = 44.1 kHz) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 7

slide-16
SLIDE 16

Synthetisiertes Schallfeld - Breitbandig

Nsph = 10 (Beschränkte Ordnung)

x / m y / m −2 −1 1 2 −2 −1.5 −1 −0.5 0.5 1 1.5 2 −1 −0.8 −0.6 −0.4 −0.2 0.2 0.4 0.6 0.8 1

(2.5D, L = 56, R = 1.5 m, φpw = 270o, fs = 44.1 kHz) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 7

slide-17
SLIDE 17

Synthetisiertes Schallfeld - Breitbandig

Nsph = 5 (Beschränkte Ordnung)

x / m y / m −2 −1 1 2 −2 −1.5 −1 −0.5 0.5 1 1.5 2 −1 −0.8 −0.6 −0.4 −0.2 0.2 0.4 0.6 0.8 1

(2.5D, L = 56, R = 1.5 m, φpw = 270o, fs = 44.1 kHz) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 7

slide-18
SLIDE 18

Synthetisiertes Schallfeld - Breitbandig

Nsph = 1 (Beschränkte Ordnung)

x / m y / m −2 −1 1 2 −2 −1.5 −1 −0.5 0.5 1 1.5 2 −1 −0.8 −0.6 −0.4 −0.2 0.2 0.4 0.6 0.8 1

(2.5D, L = 56, R = 1.5 m, φpw = 270o, fs = 44.1 kHz) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 7

slide-19
SLIDE 19

Synthetisiertes Schallfeld - Breitbandig

Nsph = 28, Npw = 1501 (Interpolation)

x / m y / m −2 −1 1 2 −2 −1.5 −1 −0.5 0.5 1 1.5 2 −1 −0.8 −0.6 −0.4 −0.2 0.2 0.4 0.6 0.8 1

(2.5D, L = 56, R = 1.5 m, φpw = 270o, fs = 44.1 kHz) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 7

slide-20
SLIDE 20

Frequenzgang

Mittig x = (0, 0, 0) m

10

2

10

3

10

4

−140 −120 −100 −80 −60 −40 −20 frequency (Hz) level (dB)

Nsph=750 (Volle Ordnung) Nsph=28 (Beschränkte Ordnung) Nsph=10 Nsph=5 Nsph=1 Nsph=28, Npw=1501 (Interpolation)

Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 8

slide-21
SLIDE 21

Frequenzgang

Außermittig x = (1, 0, 0) m

10

2

10

3

10

4

−140 −120 −100 −80 −60 −40 −20 frequency (Hz) level (dB)

Nsph=750 (Volle Ordnung) Nsph=28 (Beschränkte Ordnung) Nsph=10 Nsph=5 Nsph=1 Nsph=28, Npw=1501 (Interpolation)

Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 8

slide-22
SLIDE 22

Eigenschaften des synthetisierten Schallfeldes

Überlagerung einer endlichen Anzahl von ebene Wellen Volle Ordnung: Synthese einer ebenen Welle Beschränkte Ordnung: amplitude-panning higher-order Ambisonics (APA) Interpolation: near-field compensated higher-order Ambisonics (NFC-HOA) Lokalisation der virtuellen Schallquelle Volle Ordnung ⇒ Wellenfeldsynthese [Wierstorf et al. 2013] Beschränkte Ordnung:

Mittig ⇒ datenbasierte binauraler Synthese [Spors et al. 2012] Außermittig ⇒ Abschätzung durch binaurales Modell

Interpolation ⇒ NFC-HOA [Wierstorf et al. 2013] Klangfarbe Beschränkte Ordnung/Interpolation ⇒ Klangverfärbungen für außermittige Positionen

Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 9

slide-23
SLIDE 23

Vorhersage der Lokalisation durch binaurales Modell

Nsph = 28 (Beschränkte Ordnung)

(2.5D, L = 56, R = 1.5 m, φpw = 270o, fs = 44.1 kHz, binaurales Modell nach [Dietz et al. 2011], [Wierstorf et al. 2013]) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 10

slide-24
SLIDE 24

Vorhersage der Lokalisation durch binaurales Modell

Nsph = 10 (Beschränkte Ordnung)

(2.5D, L = 56, R = 1.5 m, φpw = 270o, fs = 44.1 kHz, binaurales Modell nach [Dietz et al. 2011], [Wierstorf et al. 2013]) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 10

slide-25
SLIDE 25

Vorhersage der Lokalisation durch binaurales Modell

Nsph = 5 (Beschränkte Ordnung)

(2.5D, L = 56, R = 1.5 m, φpw = 270o, fs = 44.1 kHz, binaurales Modell nach [Dietz et al. 2011], [Wierstorf et al. 2013]) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 10

slide-26
SLIDE 26

Vorhersage der Lokalisation durch binaurales Modell

Nsph = 1 (Beschränkte Ordnung)

(2.5D, L = 56, R = 1.5 m, φpw = 270o, fs = 44.1 kHz, binaurales Modell nach [Dietz et al. 2011], [Wierstorf et al. 2013]) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 10

slide-27
SLIDE 27

Vorhersage der Lokalisation durch binaurales Modell

Nsph = 28, Npw = 1500 (Interpolation)

(2.5D, L = 56, R = 1.5 m, φpw = 270o, fs = 44.1 kHz, binaurales Modell nach [Dietz et al. 2011], [Wierstorf et al. 2013]) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 10

slide-28
SLIDE 28

Zusammenfassung und Ausblick

Für eine typische Ordnung von Nsph ≥ 5 ergeben sich Gute Ergebnisse für mittige Zuhörerposition Gute Lokalisation aber Klangverfärbungen für außermittige Positionen Ausblick Einfluss des Amplitudenfehlers bei 2.5-dimensionaler Synthese Einfluss von Abtastung und Eigenrauschen

Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ausblick 11

slide-29
SLIDE 29

Ausblick – Amplitudenabweichungen

2.5-dimensionale Synthese einer ebene Welle f = 1000 Hz

x / m y / m −2 −1 1 2 −2 −1.5 −1 −0.5 0.5 1 1.5 2

level (dB)

−15 −10 −5 5 10

(2.5D, L = 56, R = 1.5 m, φpw = 270o) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ausblick 12

slide-30
SLIDE 30

Sphärisches Mikrofonarray ohne Eigenrauschen

Synthetisiertes Schallfeld für Nsph = 23

x / m y / m −2 −1 1 2 −2 −1.5 −1 −0.5 0.5 1 1.5 2 −1 −0.8 −0.6 −0.4 −0.2 0.2 0.4 0.6 0.8 1

(2.5D, M = 770 Lebedev, L = 56, R = 1.5 m, φpw = 270o, fs = 44.1 kHz) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ausblick 13

slide-31
SLIDE 31

Vielen Dank!

http://spatialaudio.net

Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ausblick 13