Digital Audio Graduate School of Culture Technology (GSCT) Juhan - - PowerPoint PPT Presentation

digital audio
SMART_READER_LITE
LIVE PREVIEW

Digital Audio Graduate School of Culture Technology (GSCT) Juhan - - PowerPoint PPT Presentation

CTP 431 Music and Audio Computing Digital Audio Graduate School of Culture Technology (GSCT) Juhan Nam 1 Outlines Introduction Digital audio chain Transducers Sampling Sampling theorem Aliasing and reconstruction


slide-1
SLIDE 1

1

Digital Audio

CTP 431 Music and Audio Computing

Graduate School of Culture Technology (GSCT) Juhan Nam

slide-2
SLIDE 2

Outlines

§ Introduction

– Digital audio chain – Transducers

§ Sampling

– Sampling theorem – Aliasing and reconstruction

§ Quantization

– Quantization error: SNR – Dynamic range

2

slide-3
SLIDE 3

Digital Audio Chain

3

…0 ¡0 ¡1 ¡0 ¡1 ¡0 ¡… ¡

slide-4
SLIDE 4

Why Digital?

4

Helmholtz ¡Resonators ¡ Op-­‑amp ¡and ¡amplifier ¡ On ¡computer ¡

y[n] ¡= ¡g ¡* ¡x[n] ¡

slide-5
SLIDE 5

Transducers

§ Convert one form of energy to another form

– The forms are different but the information remains (almost) the same

§ Microphones

– Sound wave to electrical signal – Dynamic / condenser microphones

§ Speakers

– Electrical signal to sound wave – Generate distortion (by diaphragm) – Crossover networks: woofer / tweeter

5

slide-6
SLIDE 6

Analog to Digital

6

…0 ¡0 ¡1 ¡0 ¡1 ¡0 ¡… ¡

slide-7
SLIDE 7

Sampling

  • Convert continuous-time signal to discrete-time signal by

periodically picking up the instantaneous values

– Represented as a sequence of numbers; pulse code modulation (PCM) – Sampling period (Ts): the amount of time between samples – Sampling rate ( fs =1/Ts )

7

Ts ¡

x(t) → x(nTs)

Signal ¡notaBon ¡

slide-8
SLIDE 8

Sampling Theorem

§ What is an appropriate sampling rate?

– Too high: increase data rate – Too low: become hard to reconstruct the original signal

§ Sampling Theorem

– In order for a band-limited signal to be reconstructed fully, the sampling rate must be greater than twice the maximum frequency in the signal – Half the sampling rate is called Nyquist frequency ( )

8

fs 2

fs > 2⋅ fm

slide-9
SLIDE 9

Aliasing

§ If the sampling rate is less than twice the maximum frequency, the high-frequency content is folded over to lower frequency range

9

0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 x 10

4

−0.8 −0.6 −0.4 −0.2 0.2 0.4 0.6 0.8 1

slide-10
SLIDE 10

Sampling in Frequency Domain

§ Sampling in time corresponds to replicating the original signal at every fs frequency § Why ?

10

x1(t) = Asin(ω1t) = Asin(2π f1n / fs)

x2(t) = Asin(ω2t) = Asin(2π f2n / fs) = Asin(2π( f1 ± mfs)n / fs) = Asin(2π f1n / fs ± 2πmn) = Asin(2π f1n / fs) = x1(t) f2 = f1 ± mfs

fm ¡

  • fm ¡

fm ¡

  • fm ¡

fs+fm ¡ fs-fm ¡ fs ¡

  • fs ¡

fm < fs − fm

slide-11
SLIDE 11

Aliasing in Frequency Domain

§ The high-frequency content is folded over to lower frequency range from the replicated images § A low-pass filter is applied before sampling to avoid the aliasing noise

11

fm ¡

  • fm ¡

fs+fm ¡ fs-fm ¡ fs ¡

  • fs ¡

fs/2 ¡ fs ¡

  • fs ¡
  • fs/2 ¡
slide-12
SLIDE 12

Example of Aliasing

12

Frequency ¡sweep ¡of ¡the ¡trivial ¡sawtooth ¡wave ¡

Time (s) Frequency (Hz) 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 x 10

4

Bandlimited ¡sawtooth ¡wave ¡spectrum ¡

5 10 15 20 −60 −40 −20 Frequency (kHz) Magnitude (dB) 5 10 15 20 −60 −40 −20 Frequency (kHz) Magnitude (dB)

Trivial ¡sawtooth ¡wave ¡spectrum ¡

slide-13
SLIDE 13

Example of Aliasing

§ Aliasing in Video

– https://www.youtube.com/watch?v=QOqtdl2sJk0 – https://www.youtube.com/watch?v=jHS9JGkEOmA

13

( ¡Note ¡that ¡video ¡frame ¡rate ¡corresponds ¡to ¡the ¡sampling ¡rate ¡) ¡

slide-14
SLIDE 14

Sampling Rates

§ Determined by the bandwidth of signals or hearing limits

– Consumer audio product: 44.1 kHz (CD) – Professional audio gears: 48/96/192 kHz – Speech communication: 8/16 kHz

14

slide-15
SLIDE 15

Digital to Analog

15

…0 ¡0 ¡1 ¡0 ¡1 ¡0 ¡… ¡

slide-16
SLIDE 16

Reconstruction in Frequency Domain

§ In the view of frequency domain, the signal before sampling (continuous-time) signals can be reconstructed by applying a low-pass filter § Conceptually, this is the operation in digital-to-analog converters.

– In practice, DACs are composed of sample-and-hold and low- pass filtering circuitry

16

fm ¡

  • fm ¡

fm ¡

  • fm ¡

fs ¡

  • fs ¡

fs/2 ¡

slide-17
SLIDE 17

Reconstruction in Time Domain

§ In time domain, the reconstruction corresponds to interpolation with the sinc function

– The ideal low-pass corresponds to sinc function – The interpolation is actually convolution with the sinc function

17

sinc ¡funcBons! ¡ ¡

sinc(x) = sin(π x) π x

Before ¡sampling ¡ AOer ¡sampling ¡ ReconstrucBon ¡ Time ¡domain ¡ Frequency ¡domain ¡

slide-18
SLIDE 18

Quantization

§ Discretizing the amplitude of real-valued signals

– Round the amplitude to the nearest discrete steps – The discrete steps are determined by the number of bit bits

  • Audio CD: 16 bits (-215 ~ 215-1)

18

slide-19
SLIDE 19

Quantization Error

§ Quantization causes noise

– Average power of quantization noise: obtained from the probability density function (PDF) of the error

§ Signal to Noise Ratio (SNR)

– Based on average power – Based on the max levels

19

20log10 Srms Nrms = 20log10 2B−1 / 2 112 = 6.02B+1.76 dB

1/2 ¡

  • 1/2 ¡

P(e)

1 ¡

x2p(e)dx

−1/2 1/2

= 112

Root ¡mean ¡square ¡(RMS) ¡of ¡noise ¡ ¡

(With ¡16bits, ¡SNR ¡= ¡98.08dB) ¡

20log10 Smax Nmax = 20log10 2B−1 12 = 6.02B dB

(With ¡16bits, ¡SNR ¡= ¡96.32 ¡dB) ¡

RMS ¡of ¡full-­‑scale ¡sine ¡wave ¡

slide-20
SLIDE 20
  • Dynamic ¡range ¡ ¡

– The ¡raBo ¡between ¡the ¡loudest ¡and ¡soOest ¡levels ¡

  • Clipping ¡

– Non-­‑linear ¡distorBon ¡that ¡occurs ¡when ¡a ¡signal ¡is ¡above ¡the ¡max ¡level ¡

  • Headroom ¡

– Different ¡between ¡the ¡signal ¡level ¡and ¡the ¡max ¡level ¡

Dynamic Range, Clipping and Headroom

20

0 ¡dB ¡

  • ­‑98.08 ¡dB ¡

Noise ¡floor ¡ (By ¡quanBzaBon) ¡ Max ¡level ¡ Head ¡room ¡ Clipping ¡ Min ¡level ¡

  • ­‑90.31 ¡dB ¡

B ¡= ¡16 ¡bits ¡

20log10 Srms,max Srms,min = 20log10 2B−1 / 2 1/ 2 = 6.02B − 6 (With ¡16bits, ¡DR ¡= ¡90.31 ¡dB) ¡

In ¡digital ¡audio, ¡0dB ¡is ¡regarded ¡ as ¡the ¡maximum ¡level ¡ ¡(dBFS) ¡ Again, ¡RMS ¡of ¡full-­‑scale ¡sine ¡wave ¡ for ¡ ¡both ¡loudest ¡and ¡soOest ¡