FOTOGRAFIA DIGITAL FOTOGRAFIA DIGITAL Fernando Pereira Fernando - - PowerPoint PPT Presentation

fotografia digital fotografia digital
SMART_READER_LITE
LIVE PREVIEW

FOTOGRAFIA DIGITAL FOTOGRAFIA DIGITAL Fernando Pereira Fernando - - PowerPoint PPT Presentation

FOTOGRAFIA DIGITAL FOTOGRAFIA DIGITAL Fernando Pereira Fernando Pereira Instituto Superior Tcnico Instituto Superior Tcnico Comunicao de udio e Vdeo, Fernando Pereira Imagem Fotogr fica fica Multin Multin vel vel


slide-1
SLIDE 1

Comunicação de Áudio e Vídeo, Fernando Pereira

FOTOGRAFIA DIGITAL FOTOGRAFIA DIGITAL

Fernando Pereira Fernando Pereira Instituto Superior Técnico Instituto Superior Técnico

slide-2
SLIDE 2

Comunicação de Áudio e Vídeo, Fernando Pereira

Imagem Fotográfica Multinível

(tons de cinzento ou cores)

Imagem Fotogr Imagem Fotográ áfica fica Multin Multiní ível vel

(tons de cinzento ou cores) (tons de cinzento ou cores)

OBJECTIVO OBJECTIVO Transmissão e armazenamento eficiente de imagem Transmissão e armazenamento eficiente de imagem fotográfica fotográfica multinível multinível

slide-3
SLIDE 3

Comunicação de Áudio e Vídeo, Fernando Pereira

Sonho ou Pesadelo ? Sonho ou Pesadelo ? Sonho ou Pesadelo ?

“Uma imagem vale mais que 1000 palavras” - a informação visual é um meio extremamente eficiente de expressar uma mensagem ou visualizar qualquer tipo de dados. Os sistemas de imagem digital geram enormes quantidades de dados, p.e. muitos Megabytes para uma única imagem.

slide-4
SLIDE 4

Comunicação de Áudio e Vídeo, Fernando Pereira

Aplicações Aplicações Aplicações

Fotografia e bases de dados pessoais Bases de dados profissionais: museus, mapas, esquemas, etc. Videotexto fotográfico Desktop publishing Artes gráficas Telecópia a cores Imagem médica

slide-5
SLIDE 5

Comunicação de Áudio e Vídeo, Fernando Pereira

Principal Problema Principal Principal Problema Problema

Uma imagem é gerada e consumida como um conjunto de M× × × ×N amostras de luminância e crominância, com um certo número de bits por amostra o que faz com que

  • número de bits
  • e logo a banda e memória - necessário para

representar digitalmente uma imagem seja ENORME !!!

slide-6
SLIDE 6

Comunicação de Áudio e Vídeo, Fernando Pereira

Codificação/Compressão de Imagem Codificação/Compressão Codificação/Compressão de Imagem de Imagem

Trata da representação o mais eficiente possível de uma imagem, satisfazendo o conjunto de requisitos relevantes. E os requisitos variam segundo as aplicações e as respectivas funcionalidades ...

slide-7
SLIDE 7

Comunicação de Áudio e Vídeo, Fernando Pereira

Donde vem a Compressão ? Donde vem a Compressão ? Donde vem a Compressão ?

  • REDUNDÂNCIA

REDUNDÂNCIA - tem a ver com as semelhanças, correlação e preditabilidade entre as amostras da imagem.

  • > a redução de redundância não envolve a perda de informação ou

seja a imagem é comprimida sem perdas.

  • IRRELEVÂNCIA

IRRELEVÂNCIA - tem a ver com a informação imperceptível ao olho ou insignificante ao cérebro humanos.

  • > a redução de irrelevância é um processo irreversível, involvendo

perda de informação.

slide-8
SLIDE 8

Comunicação de Áudio e Vídeo, Fernando Pereira

A Norma JPEG

( (Joint Photographic Experts Group Joint Photographic Experts Group-

  • ISO & ITU

ISO & ITU

  • T

) T )

slide-9
SLIDE 9

Comunicação de Áudio e Vídeo, Fernando Pereira

OBJECTIVO OBJECTIVO OBJECTIVO

Definição de uma norma genérica de compressão que considere os requisitos da maior parte das aplicações usando imagem fotográfica multinível.

slide-10
SLIDE 10

Comunicação de Áudio e Vídeo, Fernando Pereira

Interoperabilidade, logo Normas ! Interoperabilidade, logo Normas ! Interoperabilidade, logo Normas !

A codificação de imagem é usada em muitas aplicações

audiovisuais para as quais a interoperabilidade é um requisito essencial.

O requisito de interoperabilidade é satisfeito através da

especificação de normas de codificação.

De forma a incentivar a evolução e a competição, as normas

devem oferecer interoperabilidade através da especificação do menor conjunto possível de ferramentas.

slide-11
SLIDE 11

Comunicação de Áudio e Vídeo, Fernando Pereira

Principais Requisitos do JPEG Principais Requisitos do JPEG Principais Requisitos do JPEG

  • Eficiência

Eficiência - Basear-se nas mais eficientes técnicas de compressão, nomeadamente para qualidades classificadas como 'muito boas'; possibilidade de parametrização da qualidade/compressão.

  • Flexibilidade

Flexibilidade - Aplicabilidade a qualquer tipo de imagem fotográfica multinível (não binível) sem restricções de resolução, factor de forma, espaço de cores, conteúdo, etc.

  • Baixa complexidade

Baixa complexidade - Complexidade aceitável de forma a permitir a implementação em software numa gama variada de CPU's.

  • Generalidade

Generalidade - Considerar vários modos de operação, nomeadamente os modos sequencial, progressivo, sem perdas e hierárquico.

slide-12
SLIDE 12

Comunicação de Áudio e Vídeo, Fernando Pereira

Elementos Normativos Elementos Normativos Elementos Normativos

  • CODIFICADOR

CODIFICADOR - A partir das imagens digitais à entrada e das tabelas de especificação gera, através dum conjunto de técnicas, o fluxo de dados comprimidos de saída.

  • FORMATO DE INTERCÂMBIO

FORMATO DE INTERCÂMBIO - Representação comprimida dos dados correspondentes à imagem, incluindo as tabelas de especificação.

  • DESCODIFICADOR

DESCODIFICADOR - Através de um conjunto de técnicas, gera as imagens reconstruídas na saída, a partir do fluxo de dados comprimidos à entrada e das tabelas de especificação.

slide-13
SLIDE 13

Comunicação de Áudio e Vídeo, Fernando Pereira

Elementos Normativos Elementos Normativos Elementos Normativos

v Codificador Fluxo binário codificado Tabelas Informação original Fluxo binário codificado Descodificador Tabelas v Informação descodificada

slide-14
SLIDE 14

Comunicação de Áudio e Vídeo, Fernando Pereira

Norma ITU-R 601 Norma ITU Norma ITU-

  • R 601

R 601

Inclui os sistemas de 625 e 525 linhas (25 e 30 Hz) e os

formatos 4:3 e 16:9

Ritmos base de amostragem: 13.5 MHz para a luminância

e 6.75 MHz para as crominâncias

Quantificação das amostras: 8 bits

Formato Resolução Y Resolução U e V Horizontal Vertical 4:4:4 720 x 576 720 x 576 1:1 1:1 4:2:2 720 x 576 360 x 576 2:1 1:1 4:2:0 720 x 576 360 x 288 2:1 2:1 4:1:1 720 x 576 180 x 576 4:1 1:1 4:1:0 720 x 576 180 x 144 4:1 4:1

slide-15
SLIDE 15

Comunicação de Áudio e Vídeo, Fernando Pereira

Multiplexagem Multiplexagem Multiplexagem

Uma vez que inúmeras aplicações devem proceder à descodificação e visualização ou impressão sem grande capacidade de memorização, é necessário que as imagens com várias componentes considerem a necessidade de multiplexar a respectiva informação. Caso Caso 1: 1: Todas Todas as as componentes componentes com a com a mesma mesma resolução resolução

Sem multiplexagem (ordem): A1,A2,A3,…,An B1,B2,B3,…,Bn C1,C2,C3,…,Cn Com multiplexagem fina (ordem): A1, B1, C1, A2, B2, C2, A3 … An, Bn, Cn

slide-16
SLIDE 16

Comunicação de Áudio e Vídeo, Fernando Pereira

Multiplexagem Multiplexagem Multiplexagem

Caso Caso 2: 2: Componentes Componentes com com diferente diferente resolu resoluç ção ão

Sem multiplexagem (ordem): A1,A2,A3,…,An B1,B2,B3,…,Bn/2 C1,C2,C3,…,Cn/2 Com multiplexagem fina (ordem): A1, A2, B1, C1, A3, A4, B2, C2, … An-1, An, Bn/2, Cn/2

slide-17
SLIDE 17

Comunicação de Áudio e Vídeo, Fernando Pereira

Tipos de Codificação Tipos de Codificação Tipos de Codificação

  • SEM PERDAS (

SEM PERDAS (lossless lossless) ) - A imagem é reconstruída sem qualquer perda (original e descodificado são matematicamente iguais); factores de compressão mais reduzidos são atingidos (aproximadamente 2:1)

  • COM PERDAS (

COM PERDAS (lossy lossy) ) - A imagem é reconstruída com elevada fidelidade em relação ao original (mas não idêntica), atingindo-se factores de compressão elevados; este tipo de codificação recorre à Transformada de Coseno Discreta (Discrete Cosine Transform - DCT) O processo de codificação mais simples baseado na DCT é designado por PROCESSO SEQUENCIAL BASELINE PROCESSO SEQUENCIAL BASELINE e é suficiente para inúmeras aplicações. Este processo é obrigatório em todos os sistemas JPEG.

slide-18
SLIDE 18

Comunicação de Áudio e Vídeo, Fernando Pereira

Modos de Operação Modos de Operação Modos de Operação

Os vários modos de operação resultam da exigência de universalidade desta norma e da variedade de aplicações consideradas.

  • SEQUENCIAL

SEQUENCIAL - Cada componente da imagem é codificada num único varrimento (de cima para baixo e da esquerda para a direita);

  • PROGRESSIVO

PROGRESSIVO - A imagem é codificada usando vários varrimentos que oferecem uma imagem sucessivamente de melhor qualidade;

  • SEM PERDAS

SEM PERDAS - A codificação garante a reconstrução exacta de cada amostra da imagem original;

  • HIERÁRQUICO

HIERÁRQUICO - A imagem é codificada em várias resoluções de modo a que resoluções mais baixas possam estar acessíveis sem descodificar a resolução mais elevada. Para cada modo de operação são especificados um ou mais codecs que se distinguem pela precisão das amostras da imagem ou pelo método de codificação entrópica usado.

slide-19
SLIDE 19

Comunicação de Áudio e Vídeo, Fernando Pereira

Modo Progressivo versus Modo Sequencial Modo Progressivo Modo Progressivo versus versus Modo Modo Sequencial Sequencial

slide-20
SLIDE 20

Comunicação de Áudio e Vídeo, Fernando Pereira

Codificação Baseada na DCT Codificação Codificação Baseada Baseada na DCT na DCT

Imagem

  • riginal

DCT Quantificação Codific. entrópica Transmissão

  • u

armazenam. Imagem descodificada IDCT Inversão da quantificação Descodif. entrópica Tabela de des- quantificação Tabela de descodificação Tabela de quantificação Tabela de codificação

slide-21
SLIDE 21

Comunicação de Áudio e Vídeo, Fernando Pereira

Codificação Baseada na DCT Codificação Codificação Baseada Baseada na DCT na DCT

A acção conjunta dos vários blocos do codificador baseline visa reduzir a redundância e irrelevância contidas na imagem. Enquanto os primeiros blocos visam a geração de uma sinal sem memória (eliminação da redundância espacial) e sem irrelevância, a codificação entrópica final visa a geração de símbolos equiprováveis como modo de minimizar os dados a transmitir (eliminação da redundância estatística).

slide-22
SLIDE 22

Comunicação de Áudio e Vídeo, Fernando Pereira

Codificação por Transformada Codificação por Transformada Codificação por Transformada

A codificação por transformada envolve a divisão da imagem em blocos de N× × × ×N pixels aos quais é aplicada a transformada, produzindo blocos de N× × × ×N coeficientes.

Uma transformada define-se formalmente pelas equações de transformação

directa e inversa:

F(u,v) = F(u,v) = Σ Σ Σ Σ Σ Σ Σ Σi=0

i=0 N N-

  • 1

1 Σ

Σ Σ Σ Σ Σ Σ Σ j=0

j=0 N N-

  • 1

1 f(i,j) A(i,j,u,v)

f(i,j) A(i,j,u,v) f(i,j) = f(i,j) = Σ Σ Σ Σ Σ Σ Σ Σu=0

u=0 N N-

  • 1

1 Σ

Σ Σ Σ Σ Σ Σ Σ v=0

v=0 N N-

  • 1

1 F(u,v) B(i,j,u,v)

F(u,v) B(i,j,u,v)

  • nde

f(i,j) - sinal de entrada (no espaço) A (i,j,u,v) - núcleo da transformada directa F(u,v) - coeficientes da transformada B (i,j,u,v) - núcleo da transformada inversa

slide-23
SLIDE 23

Comunicação de Áudio e Vídeo, Fernando Pereira

Características das Transformadas Relevantes Características das Transformadas Características das Transformadas Relevantes Relevantes

Usam-se transformadas unitárias que apresentam as seguintes características:

Reversibilidade Ortogonalidade dos vectores do núcleo da transformada Conservação da energia ou seja a energia no domínio espacial é igual

à energia no domínio da transformada

Nota 1: Para as transformadas unitárias A*A=AA*=In onde In é a matriz identidade e * representa a operação conjugada transposta. Nota 2: A matriz transposta é conseguida quando se permutam as linhas por colunas e vice- versa ou seja se a matriz original é n×m, a matriz transposta é m×n. Nota 3: A matriz conjugada obtem-se substituindo cada elemento pelo seu complexo conjugado (parte imaginária com sinal trocado).

slide-24
SLIDE 24

Comunicação de Áudio e Vídeo, Fernando Pereira

O que se Espera da Transformada ? O que se O que se Espera Espera da Transformada ? da Transformada ?

  • Incorrelação da Informação

Incorrelação da Informação - A transformada ideal deve gerar coeficientes completamente incorrelacionados.

  • Compactação da Energia

Compactação da Energia - A maior parte da energia do sinal deve ser compactada num número reduzido de coeficientes.

  • Funções de Base do Núcleo da Transformada Independentes da Image

Funções de Base do Núcleo da Transformada Independentes da Imagem m - Uma vez que as imagens apresentam variações estatísticas acentuadas, a transformada óptima depende normalmente da imagem; devido ao peso computacional que representa a procura da transformada óptima para cada imagem, é desejável que cujas funções de base da transformada sejam independentes da imagem, ainda que isso possa ser pago em desempenho.

  • Rapidez da Implementação

Rapidez da Implementação - O elevado número de operações envolvidas justifica a necessidade de encontrar transformadas com implementações rápidas.

slide-25
SLIDE 25

Comunicação de Áudio e Vídeo, Fernando Pereira

Como Interpretar a Transformada ? Como Como Interpretar Interpretar a a Transformada ? Transformada ?

A expressão da transformada inversa

f(i,j) = f(i,j) = Σ Σ Σ Σ Σ Σ Σ Σu=0

u=0 N N-

  • 1

1 Σ

Σ Σ Σ Σ Σ Σ Σ v=0

v=0 N N-

  • 1

1 F(u,v) B(i,j,u,v)

F(u,v) B(i,j,u,v)

indica que a transformada pode ser interpretada como a decomposição da imagem no espaço num conjunto de componentes básicas - as funções de base da transformada - adequadamente pesadas através dos respectivos coeficientes. A Interpretação Espectral A Interpretação Espectral - Como a maior parte das transformadas usa funções de base com diferentes frequências (em sentido lato), a decomposição do sinal através dos coeficientes e das funções de base assume um caracter espectral onde cada coeficiente representa à fracção de energia na imagem original correspondente à respectiva função de base/frequência.

slide-26
SLIDE 26

Comunicação de Áudio e Vídeo, Fernando Pereira

Os Coeficientes: Como são ? Os Os Coeficientes Coeficientes: Como : Como são são ? ?

slide-27
SLIDE 27

Comunicação de Áudio e Vídeo, Fernando Pereira

Vantagens da Interpretação Espectral Vantagens da Interpretação Espectral Vantagens da Interpretação Espectral

A interpretação espectral permite introduzir facilmente na codificação as características do sistema visual humano que são imprescindíveis para uma codificação eficiente.

O sistema visual humano é menos sensível às altas

frequências espaciais

  • >> codificação mais grosseira dos coeficientes correspondentes

O sistema visual humano é menos sensível para luminâncias muito

baixas ou muito elevadas

  • >> codificação mais grosseira do coeficiente DC da luminância nessas

condições

slide-28
SLIDE 28

Comunicação de Áudio e Vídeo, Fernando Pereira

Porque se Transformam Blocos ? Porque se Transformam Blocos ? Porque se Transformam Blocos ?

Basicamente a transformada representa o sinal original num outro

domínio onde pode ser mais eficientemente codificado através da exploração da redundância espacial.

A exploração mais completa da redundância espacial contida na

imagem conduz à aplicação da transformada em blocos N× × × ×N tão grandes quanto possível, idealmente toda a imagem.

O esforço computacional associado à transformada aumenta

rapidamente com a dimensão do bloco onde esta é aplicada. A aplicação da transformada a blocos, normalmente com 8× × × ×8 pixels, resulta do compromisso entre a exploração da redundância espacial e o esforço computacional associado.

slide-29
SLIDE 29

Comunicação de Áudio e Vídeo, Fernando Pereira

O que se Transforma … O O que que se se Transforma Transforma … …

  • 144

130 112 104 107 98 95 89 145 135 118 107 106 98 99 92 141 133 119 113 97 98 95 88 139 130 122 113 98 94 94 88 147 135 129 116 101 102 88 92 144 131 128 112 105 96 92 86 149 135 129 116 105 101 91 85 155 142 130 118 106 101 89 87

Y =

slide-30
SLIDE 30

Comunicação de Áudio e Vídeo, Fernando Pereira

O Efeito de Bloco O O Efeito Efeito de de Bloco Bloco

slide-31
SLIDE 31

Comunicação de Áudio e Vídeo, Fernando Pereira

Transformada de Karhunen-Loéve (KLT) Transformada de Transformada de Karhunen Karhunen-

  • Loéve

Loéve (KLT) (KLT)

A transformada de Karhunen-Loéve é muitas vezes considerada a transformada ideal por conseguir a

MÁXIMA COMPACTAÇÃO DA ENERGIA DO SINAL MÁXIMA COMPACTAÇÃO DA ENERGIA DO SINAL

  • u seja se apenas um número limitado de coeficientes for transmitido, os

coeficientes da KLT serão aqueles que conterão a fracção mais elevada da energia do sinal em comparação com qualquer outra transformada.

As funções de base da KLT baseiam As funções de base da KLT baseiam-

  • se nos vectores próprios da

se nos vectores próprios da matriz de matriz de covariância covariância de blocos da imagem. de blocos da imagem.

slide-32
SLIDE 32

Comunicação de Áudio e Vídeo, Fernando Pereira

Porque não se usa a KLT ? Porque não se usa a KLT ? Porque não se usa a KLT ?

A utilização da KLT em sistemas de compressão de imagem é praticamente nula porque:

As suas funções de base dependem da imagem a codificar requerendo

  • cálculo da matriz de covariância.

Não existem algoritmos bastante rápidos para o seu cálculo. Existem outras transformadas sem as desvantagens acima apontadas e

com uma eficiência em termos de compactação de energia apenas ligeiramente inferior.

slide-33
SLIDE 33

Comunicação de Áudio e Vídeo, Fernando Pereira

Transformada de Fourier Discreta (DFT) Transformada de Transformada de Fourier Fourier Discreta (DFT) Discreta (DFT)

A DFT decompõe o sinal do bloco de imagem nas suas componentes espectrais, sendo u e v as frequências espaciais horizontal e vertical

F(u,v) = 1/N F(u,v) = 1/N Σ Σ Σ Σ Σ Σ Σ Σj=0

j=0 N N-

  • 1

1 Σ

Σ Σ Σ Σ Σ Σ Σ k=0

k=0 N N-

  • 1

1 f(j,k)

f(j,k) exp exp [ [-

  • 2

2 π π π π π π π π i ( i (uj uj + +vk vk) / N] ) / N] f(j,k) = 1/N f(j,k) = 1/N Σ Σ Σ Σ Σ Σ Σ Σu=0

u=0 N N-

  • 1

1 Σ

Σ Σ Σ Σ Σ Σ Σ v=0

v=0 N N-

  • 1

1 F(u,v)

F(u,v) exp exp [2 [2 π π π π π π π π i ( i (uj uj + + vk vk) / N] ) / N]

com i = √ √ √ √ -1

É uma transformada separável já que se pode calcular em dois passos: primeiro

aplica-se a transformação unidimensional às colunas e depois às linhas do bloco NxN de dados.

Produz coeficientes complexos o que é uma desvantagem em termos de

memorização e manipulação.

Gera componentes espectrais espúrias devido à periodicidade implícita dos

blocos de imagem.

slide-34
SLIDE 34

Comunicação de Áudio e Vídeo, Fernando Pereira

Transformada de Coseno Discreta (DCT) Transformada de Coseno Discreta (DCT) Transformada de Coseno Discreta (DCT)

A DCT é uma das várias transformadas sinusoidais existentes, sendo os seus vectores de base constituídos por amostras de funções (co)sinusoidais. A DCT é, sem dúvida, a transformada mais usada em codificação de imagem por o seu desempenho se aproximar do da KLT para sinais com elevada correlação e por existirem algoritmos rápidos para a sua implementação.

= − =

  • +
  • +

=

1 1

2 1 2 2 1 2 2

N j N k

N k v N j u k j f v C u C N v u F ) ( cos ) ( cos ) , ( ) ( ) ( ) , ( π π

= − =

  • +
  • +

=

1 1

2 1 2 2 1 2 2 N

u N v

N k v N j u v u F v C u C N k j f π π ) ( cos ) ( cos ) , ( ) ( ) ( ) , (

slide-35
SLIDE 35

Comunicação de Áudio e Vídeo, Fernando Pereira

Funções de Base da DCT Unidimensional (N=8) Funções de Base da DCT Unidimensional Funções de Base da DCT Unidimensional (N=8) (N=8)

slide-36
SLIDE 36

Comunicação de Áudio e Vídeo, Fernando Pereira

Funções de Base da DCT Bidimensional (N=8) Funções de Base da DCT Bidimensional Funções de Base da DCT Bidimensional (N=8) (N=8)

slide-37
SLIDE 37

Comunicação de Áudio e Vídeo, Fernando Pereira

DCT KLT

slide-38
SLIDE 38

Comunicação de Áudio e Vídeo, Fernando Pereira

  • 144

130 112 104 107 98 95 89 145 135 118 107 106 98 99 92 141 133 119 113 97 98 95 88 139 130 122 113 98 94 94 88 147 135 129 116 101 102 88 92 144 131 128 112 105 96 92 86 149 135 129 116 105 101 91 85 155 142 130 118 106 101 89 87

DCT

  • 5.6187
  • 3.9974
  • 0.5240
  • 0.1142

0.8696 0.1559 2.3804 3.4688

  • 0.3496

0.8410

  • 0.7874
  • 0.0628

0.0601 0.6945

  • 0.1650
  • 4.1042
  • 0.3942

1.7394 3.3000 0.4772 0.4010 2.6308 2.6624

  • 7.9536

2.4750 2.0787 1.8446 2.5000 0.2085 0.8610 2.0745

  • 0.7500

5.4051 2.7510

  • 2.7203
  • 2.1336
  • 2.8421

1.5106 2.7271

  • 1.9463

3.1640

  • 3.1945
  • 4.4558

2.4614 9.9277

  • 2.3410

2.6557

  • 5.3355

1.2591 8.4265 1.9909

  • 0.2867
  • 5.2187

7.6122

  • 16.5235
  • 12.1982

0.0330 3.5750 5.7540

  • 0.7500

14.0897

  • 26.6464

149.5418

  • 898.0000

Y =

  • Coef. DCT =
slide-39
SLIDE 39

Comunicação de Áudio e Vídeo, Fernando Pereira

Transformada de Walsh-Hadamard (WHT) Transformada de Transformada de Walsh Walsh-

  • Hadamard

Hadamard (WHT) (WHT)

A WHT tem um conjunto de funções de base constituídas apenas por + 1 e -1 o que facilita a sua implementação por não necessitar de multiplicações. Ainda que possa ter uma interpretação espectral semelhante às outras transformadas (as suas funções de base têm um número crescente de mudanças de sinal), a sua capacidade de compactação da energia do sinal de imagem é menor.

slide-40
SLIDE 40

Comunicação de Áudio e Vídeo, Fernando Pereira

Funções de Base da WHT Unidimensional (N=8) Funções de Base da WHT Unidimensional Funções de Base da WHT Unidimensional (N=8) (N=8)

slide-41
SLIDE 41

Comunicação de Áudio e Vídeo, Fernando Pereira

Funções de Base da WHT Bidimensional (N=8) Funções de Base da WHT Bidimensional Funções de Base da WHT Bidimensional (N=8) (N=8)

slide-42
SLIDE 42

Comunicação de Áudio e Vídeo, Fernando Pereira

A DCT no JPEG A DCT no JPEG A DCT no JPEG

Uma vez que a DCT usa funções transcendentes é impossível o seu cálculo com total precisão o que dá origem a diferenças nos resultados de implementações diferindo ainda que muito ligeiramente (e.g. precisão dos cálculos intermédios, etc).

Com vista a possibilitar futuros desenvolvimentos, a norma JPEG não

especifica nenhuma implementação particular da DCT ou IDCT.

A norma JPEG especifica um teste de fiabilidade com vista a limitar as

diferenças provocadas pela liberdade na implementação da DCT e IDCT. Nota: A DCT é aplicada às amostras do sinal com P bits, com valores entre

  • 2P-1 e 2P-1-1 de modo a que o coeficiente DC fique distribuído em torno

de zero.

slide-43
SLIDE 43

Comunicação de Áudio e Vídeo, Fernando Pereira

Codificação Baseada na DCT Codificação Codificação Baseada Baseada na DCT na DCT

Imagem

  • riginal

DCT Quantificação Codific. entrópica Transmissão

  • u

armazenam. Imagem descodificada IDCT Inversão da quantificação Descodif. entrópica Tabela de des- quantificação Tabela de descodificação Tabela de quantificação Tabela de codificação

slide-44
SLIDE 44

Comunicação de Áudio e Vídeo, Fernando Pereira

Como Trabalha a DCT ? Como Trabalha a DCT ? Como Trabalha a DCT ?

X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X

DCT DCT

Domínio Espacial Domínio Espacial Domínio Domínio Frequencial Frequencial

slide-45
SLIDE 45

Comunicação de Áudio e Vídeo, Fernando Pereira

Codificação Baseada na DCT Codificação Codificação Baseada Baseada na DCT na DCT

Imagem

  • riginal

DCT Quantificação Codific. entrópica Transmissão

  • u

armazenam. Imagem descodificada IDCT Inversão da quantificação Descodif. entrópica Tabela de des- quantificação Tabela de descodificação Tabela de quantificação Tabela de codificação

slide-46
SLIDE 46

Comunicação de Áudio e Vídeo, Fernando Pereira

DCT: um Exemplo DCT: um DCT: um Exemplo Exemplo

slide-47
SLIDE 47

Comunicação de Áudio e Vídeo, Fernando Pereira

A Sequência da Codificação A A Sequência Sequência da da Codificação Codificação

slide-48
SLIDE 48

Comunicação de Áudio e Vídeo, Fernando Pereira

A Quantificação A Quantificação A Quantificação

É o modo através do qual a irrelevância ou redundância perceptual é reduzida, sendo o principal responsável pelas perdas inerentes à codificação baseada na DCT. Cada passo de quantificação deverá ser escolhido tendo em conta a 'diferença mínima perceptível' no coeficiente que lhe está associado. As matrizes de quantificação não estão normalizadas ainda que exista uma sugestão para imagens com resolução ITU-R 601.

slide-49
SLIDE 49

Comunicação de Áudio e Vídeo, Fernando Pereira

Como Funciona a Quantificação ? Como Funciona a Quantificação ? Como Funciona a Quantificação ?

Espaço (amostras) sij DCT Coeficientes DCT

Sij

Coeficientes quantificados

Sqij

Tabela Quantificação

Qij

Quantificação Round (S/Q) IDCT Espaço (amostras descodificadas) rij Coeficientes quantificados

Sqij

Coeficientes DCT reconst.

Rij

Quantificação Inversa R = Sq*Q Transmissão

  • u

armazenamento

slide-50
SLIDE 50

Comunicação de Áudio e Vídeo, Fernando Pereira

A norma JPEG sugere a quantificação dos coeficientes DCT através das matrizes com

  • s valores da sensibilidade visual para cada coeficiente (informativo; matrizes têm

de ser sempre transmitidas): Situação: Luminância e crominância com sub-amostragem horizontal 2:1 (formato 4:2:2); amostras com 8 bits (Lohscheller) Nota: O uso destes passos de quantificação divididos por 2 fornece imagens codificadas indistinguíveis das originais.

Tabelas de Quantificação Tabelas de Quantificação Tabelas de Quantificação

16 11 10 16 24 40 51 61 12 12 14 19 26 58 60 55 14 13 16 24 40 57 69 56 14 17 22 29 51 87 80 62 18 22 37 56 68 109 103 77 24 35 55 64 81 104 113 92 49 64 78 87 103 121 120 101 72 92 95 98 112 100 103 99 17 18 24 47 99 99 99 99 18 21 26 66 99 99 99 99 24 26 56 99 99 99 99 99 47 66 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99

slide-51
SLIDE 51

Comunicação de Áudio e Vídeo, Fernando Pereira

Tabelas de Quantificação Tabelas de Quantificação Tabelas de Quantificação

A análise das matrizes de quantificação sugeridas permite

  • bservar que:
  • s coeficientes têm uma contribuição diferente para a qualidade

subjectiva

a visão humana é anisotrópica pois os limiares são diferentes

para as mesmas frequências espaciais, horizontais ou verticais

slide-52
SLIDE 52

Comunicação de Áudio e Vídeo, Fernando Pereira

  • 1
  • 1
  • 1

1

  • 3

14

  • 56
  • 5.6187
  • 3.9974
  • 0.5240
  • 0.1142

0.8696 0.1559 2.3804 3.4688

  • 0.3496

0.8410

  • 0.7874
  • 0.0628

0.0601 0.6945

  • 0.1650
  • 4.1042
  • 0.3942

1.7394 3.3000 0.4772 0.4010 2.6308 2.6624

  • 7.9536

2.4750 2.0787 1.8446 2.5000 0.2085 0.8610 2.0745

  • 0.7500

5.4051 2.7510

  • 2.7203
  • 2.1336
  • 2.8421

1.5106 2.7271

  • 1.9463

3.1640

  • 3.1945
  • 4.4558

2.4614 9.9277

  • 2.3410

2.6557

  • 5.3355

1.2591 8.4265 1.9909

  • 0.2867
  • 5.2187

7.6122

  • 16.5235
  • 12.1982

0.0330 3.5750 5.7540

  • 0.7500

14.0897

  • 26.6464

149.5418

  • 898.0000

Quantificando

slide-53
SLIDE 53

Comunicação de Áudio e Vídeo, Fernando Pereira

Codificação Baseada na DCT Codificação Codificação Baseada Baseada na DCT na DCT

Imagem

  • riginal

DCT Quantificação Codific. entrópica Transmissão

  • u

armazenam. Imagem descodificada IDCT Inversão da quantificação Descodif. entrópica Tabela de des- quantificação Tabela de descodificação Tabela de quantificação Tabela de codificação

slide-54
SLIDE 54

Comunicação de Áudio e Vídeo, Fernando Pereira

Zig-Zagueando ... Zig Zig-

  • Zagueando

Zagueando ... ...

1 2 3 10 11 12 13 4 6 20 22 36 38 52 1 5 6 14 15 27 28 4 5 8 9 17 16 15 14 1 5 7 21 23 37 39 53 2 4 7 13 16 26 29 42 6 7 19 18 26 27 28 29 2 8 19 24 34 40 50 54 3 8 12 17 25 30 41 43 20 21 24 25 30 31 32 33 3 9 18 25 35 41 51 55 9 11 18 24 31 40 44 53 22 23 34 35 42 43 44 45 10 17 26 30 42 46 56 60 10 19 23 32 39 45 52 54 36 37 40 41 46 47 48 49 11 16 27 31 43 47 57 61 20 22 33 38 46 51 55 60 38 39 50 51 56 57 58 59 12 15 28 32 44 48 58 62 21 34 37 47 50 56 59 61 52 53 54 55 60 61 62 63 13 14 29 33 45 49 59 63 35 36 48 49 57 58 62 63

Horizontal alternado Vertical alternado Zig-zag

slide-55
SLIDE 55

Comunicação de Áudio e Vídeo, Fernando Pereira

Serialização dos Coeficientes Quantificados Serialização Serialização dos dos Coeficientes Coeficientes Quantificados Quantificados

Para que o descodificador possa

reconstruir a matriz de coeficientes quantificados para cada bloco, é preciso enviar-lhe a posição e o valor de cada coeficiente não nulo de forma sequencial (em série).

A posição de cada coeficiente

quantificado pode ser enviada de forma absoluta ou relativa.

A solução adoptada é enviar o posição

dos coeficientes quantificados não nulos indicando quantos coeficientes nulos existem na ordem zig-zag entre cada 2 coeficientes não nulos.

Cada bloco de coeficientes DCT é representado como uma sequência de pares (run, level), e.g. (0,124), (0, 25), (0,147), (0, 126), (3,13), (0, 147), (1,40) ...

slide-56
SLIDE 56

Comunicação de Áudio e Vídeo, Fernando Pereira

A Geração dos Símbolos A Geração dos Símbolos A Geração dos Símbolos

É essencial definir quais são

  • s símbolos que o codificador

de entropia codifica.

O coeficiente DC é tratado de modo diferente dos restantes 63, dada a elevada

correlação entre os coeficientes DC de blocos 8× × × ×8 adjacentes.

Os restantes coeficientes, já quantificados, são ordenados em zig-zag de modo a

facilitar a codificação entrópica, colocando os coeficientes de mais baixa frequência antes dos de mais alta frequência. A definição mais precisa dos símbolos a codificar depende do modo de operação DCT e do método de codificação entrópica.

slide-57
SLIDE 57

Comunicação de Áudio e Vídeo, Fernando Pereira

O Modelo Simbólico JPEG O O Modelo Modelo Simbólico Simbólico JPEG JPEG

Uma imagem é representada como uma sequência de blocos 8× × × ×8 independentes, sendo cada bloco representado como uma sucessão de coeficientes DCT quantificados através de pares (run,level), terminados por um End of Block. Gerador de Símbolos (Modelo) Codificador Entrópico

Imagem Original Símbolos Bits

slide-58
SLIDE 58

Comunicação de Áudio e Vídeo, Fernando Pereira

Codificação Entrópica JPEG Codificação Codificação Entrópica JPEG Entrópica JPEG

Usa a estatística dos símbolos a transmitir para alcançar compressão adicional (sem perdas).

A codificação entrópica compreende dois passos:

Conversão da sequência de pares (run, level ) correspondentes aos

coeficientes da transformada ordenados em zig-zag numa sequência intermédia de símbolos (símbolo 1 e símbolo 2 a seguir)

Conversão dos símbolos intermédios num fluxo de bits sem fronteiras

entre símbolos externamente identificáveis

slide-59
SLIDE 59

Comunicação de Áudio e Vídeo, Fernando Pereira

A Norma JPEG considera dois tipos de codificação entrópica:

  • CODIFICAÇÃO DE HUFFMAN

CODIFICAÇÃO DE HUFFMAN - É usada no processo baseline (obrigatório); podem ser usadas tabelas pré-definidas ou optimizadas para a imagem a transmitir.

  • CODIFICAÇÃO ARITMÉTICA

CODIFICAÇÃO ARITMÉTICA - Baseia-se no princípio de que qualquer acontecimento pode ser codificado como uma sucessão de decisões binárias. A codificação aritmética produz factores de compressão 5-10 % superiores para as imagens de teste do JPEG ainda que possa ser mais complexa para certos tipos de implementação.

Codificação Entrópica no JPEG Codificação Entrópica no JPEG Codificação Entrópica no JPEG

slide-60
SLIDE 60

Comunicação de Áudio e Vídeo, Fernando Pereira

Cada coeficiente AC não nulo é representado em combinação com o número de coeficientes nulos que o antecede no varrimento zig-zag (runlength - 0...15) Cada um destes pares (run, level) para coeficientes AC é representado por um par de símbolos:

Size - número de bits usados para codificar a Amplitude (ou seja o Level, símbolo 2) Level - amplitude (quantificada) do coeficiente AC a ser codificado

Cada coeficiente DC é representado da mesma forma mas tendo o símbolo 1 apenas a parte correspondente ao 'Size'.

Codificação Entrópica: Representação Intermédia dos Símbolos Codificação Entrópica: Representação Codificação Entrópica: Representação Intermédia dos Símbolos Intermédia dos Símbolos

Size Size Level Level Run Run Símbolo 1 Símbolo 1 -

  • Huffman

Huffman (bidimensional) (bidimensional) Símbolo 2 Símbolo 2 -

  • VLI

VLI

slide-61
SLIDE 61

Comunicação de Áudio e Vídeo, Fernando Pereira

Codificação Entrópica: Atribuição das Palavras de Código Codificação Entrópica: Atribuição das Codificação Entrópica: Atribuição das Palavras de Código Palavras de Código

Os símbolos 1 dos coeficientes DC e AC são codificados com o código de

Huffman (VLC) correspondente à componente em codificação.

Os símbolos 2 são codificados com um código VLI - Variable Length

Integer - cujo comprimento depende da amplitude em causa.

Os códigos VLI são códigos VLC onde o comprimento da palavra é

indicado precedentemente e baseiam-se na representação de inteiros na notação complemento para 2 (quando o valor é positivo, transmite-se o valor em binário; quando é negativo, transmite-se o valor em complemento para 2 menos 1 o que corresponde ao mesmo valor em complemento para 1).

Os códigos VLI podem ser calculados em vez de armazenados (grande

vantagem para códigos extensos) e não se demonstraram muito ineficientes em comparação com códigos de Huffman.

slide-62
SLIDE 62

Comunicação de Áudio e Vídeo, Fernando Pereira

Tabelas de Codificação (Símbolos 1 e 2) Tabelas de Tabelas de Codificação (Símbolos 1 e 2) Codificação (Símbolos 1 e 2)

1 2 Size 9 10 EOB . X . X . X Runlength 15 ZRL Run-size values

Size Amplitude 1

  • 1, 1

2

  • 3, -2, 2, 3

3

  • 7 …-4, 4 … 7

4

  • 15 …-8, 8 … 15

5

  • 31 … -16, 16 … 31

6

  • 63 … -32, 32 … 63

7

  • 127 … -64, 64 … 127

8

  • 255 … -128, 128 … 255

9

  • 511 … -256, 256 … 511

10

  • 1023 … -512, 512 … 1023

Codificação Codificação ( (run run, , size size) ) bidimensional bidimensional Codificação do Codificação do level level (amplitude) (amplitude) VLI VLI

slide-63
SLIDE 63

Comunicação de Áudio e Vídeo, Fernando Pereira

Exemplo de Codificação VLI: +12 e -12 Exemplo de Codificação VLI: +12 e Exemplo de Codificação VLI: +12 e -

  • 12

12

0000

  • 15

0001

  • 14

0010

  • 13

0011

  • 12

0100

  • 11

0101

  • 10

0110

  • 9

0111

  • 8

1000 8 1001 9 1010 10 1011 11 1100 12 1101 13 1110 14 1111 15

1100 0011

+12 em binário depois de complementado +12 em binário

O código dos valores negativos é simplesmente o complementar do código para os mesmos valores, se positivos (complemento para 1).

slide-64
SLIDE 64

Comunicação de Áudio e Vídeo, Fernando Pereira

Afinal Como Comprime o JPEG ? Afinal Como Comprime o JPEG ? Afinal Como Comprime o JPEG ?

Redundância espacial - DCT

  • Elementos da imagem estatisticamente dependentes são

convertidos em coeficientes incorrelacionados, sendo a energia da imagem concentrada no menor número possível de coeficientes.

Irrelevância

  • Coeficientes DCT são quantificados usando critérios

psicovisuais.

Redundância estatística

  • Estatística dos símbolos é explorada usando codificação run-

lenght e codificação entrópica de Huffman (ou aritmética).

slide-65
SLIDE 65

Comunicação de Áudio e Vídeo, Fernando Pereira

O Modo Sem Perdas O Modo Sem Perdas O Modo Sem Perdas

O modo sem perdas JPEG baseia-se num esquema preditivo. A predição combina os valores de, no máximo, três pixels adjacentes codificando- se o erro de predição. A definição de um modo sem perdas baseado na DCT levaria à especificação mais rigorosa dos codecs. Dois codecs diferentes são especificados para o modo sem perdas - um com codificação de Huffman e outro com codificação aritmética.

Os codecs podem usar qualquer precisão entre 2 e 16 bits/amostra. O modo sem perdas JPEG oferece uma compressão de ≈

≈ ≈ ≈ 2:1 para imagens a cores de média complexidade.

slide-66
SLIDE 66

Comunicação de Áudio e Vídeo, Fernando Pereira

Codificação Sem Perdas Codificação Sem Perdas Codificação Sem Perdas

Imagem

  • riginal

Predição espacial Codificação entrópica Transmissão

  • u

armazename nto Tabela de Codificação

Modo de predição Predição Sem predição 1 A 2 B 3 C 4 A + B – C 5 A + ((B - C)/2) 6 B + ((A – C)/2) 7 (A + B)/2

C C X - amostra a codificar A A X X B B

slide-67
SLIDE 67

Comunicação de Áudio e Vídeo, Fernando Pereira

O Modo Progressivo O Modo Progressivo O Modo Progressivo

A imagem é codificada em sucessivos varrimentos. O primeiro varrimento dá muito rapidamente uma ideia da imagem que é sucessivamente melhorada nos varrimentos posteriores. A implementação do modo progressivo requer uma memória da dimensão da imagem, capaz de armazenar os coeficientes DCT quantificados (11 bits para o processo baseline) que serão parcialmente codificados em cada varrimento. Existem dois métodos para a implementação do modo progressivo:

  • SELECÇÃO ESPECTRAL

SELECÇÃO ESPECTRAL - Apenas uma 'zona' especificada dos coeficientes é codificada em cada varrimento (baixas ->> altas frequências)

  • APROXIMAÇÕES SUCESSIVAS

APROXIMAÇÕES SUCESSIVAS - Os coeficientes são codificados com precisão sucessivamente maior Os métodos de selecção espectral e aproximações sucessivas podem ser aplicados individualmente ou em combinação.

slide-68
SLIDE 68

Comunicação de Áudio e Vídeo, Fernando Pereira

Progressivamente mais Qualidade: Escalabilidade de Qualidade ou SNR Progressivamente Progressivamente mais mais Qualidade Qualidade: : Escalabilidade de Escalabilidade de Qualidade Qualidade ou

  • u SNR

SNR

Fluxo binário

5 kbits 8 kbits 30 kbits

slide-69
SLIDE 69

Comunicação de Áudio e Vídeo, Fernando Pereira

Modo Sequencial ou Sem Escalabilidade ... Modo Modo Sequencial Sequencial ou

  • u Sem

Sem Escalabilidade ... Escalabilidade ...

Fluxo NÃO escalável

  • Descod. 1
  • Descod. 2
  • Descod. 3
slide-70
SLIDE 70

Comunicação de Áudio e Vídeo, Fernando Pereira

Modo Progressivo ou com Escalabilidade de Qualidade ou SNR Modo Modo Progressivo Progressivo ou

  • u com

com Escalabilidade Escalabilidade de de Qualidade Qualidade ou

  • u SNR

SNR

Fluxo escalável

  • Descod. 1
  • Descod. 2
  • Descod. 3
slide-71
SLIDE 71

Comunicação de Áudio e Vídeo, Fernando Pereira

Modo Progressivos: Selecção espectral e Aproximações sucessivas Modo Modo Progressivos: Progressivos: Selecção Selecção espectral espectral e e Aproximações Aproximações sucessivas sucessivas

Cada vez mais coeficientes Cada vez mais bits para cada coeficiente

slide-72
SLIDE 72

Comunicação de Áudio e Vídeo, Fernando Pereira

O Modo Hierárquico O Modo Hierárquico O Modo Hierárquico

O modo hierárquico

implementa uma codificação piramidal da imagem com várias resoluções, em que cada imagem difere da precedente dum factor 2 nas resoluções vertical e horizontal.

A codificação hierárquica

pode integrar nos seus vários passos codificação sem perdas ou codificação baseada na DCT.

slide-73
SLIDE 73

Comunicação de Áudio e Vídeo, Fernando Pereira

Nível 1 Nível 4 Nível 3 Nível 2 Imagem original Redução Redução Redução Subamostrag.

  • F. P. B.
slide-74
SLIDE 74

Comunicação de Áudio e Vídeo, Fernando Pereira

Progressivamente mais Resolução ... Progressivamente Progressivamente mais mais Resolução Resolução ... ...

Fluxo binário

14 kbits 34 kbits 47 kbits

slide-75
SLIDE 75

Comunicação de Áudio e Vídeo, Fernando Pereira

Modo Hierárquico ou Escalabilidade Espacial Modo Modo Hierárquico Hierárquico ou

  • u Escalabilidade

Escalabilidade Espacial Espacial

Fluxo escalável

  • Descod. 1
  • Descod. 4
  • Descod. 3
  • Descod. 2
slide-76
SLIDE 76

Comunicação de Áudio e Vídeo, Fernando Pereira

Imagem original

Redução Redução Expansão Expansão

+

Redução Expansão

+

  • +
  • +

+

  • +
slide-77
SLIDE 77

Comunicação de Áudio e Vídeo, Fernando Pereira

Codificador Hierárquico Codificador Hierárquico Codificador Hierárquico

1000× × × ×1000 250× × × ×250 500× × × ×500 250× × × ×250 1000× × × ×1000 500× × × ×500 1000× × × ×1000 1000× × × ×1000

slide-78
SLIDE 78

Comunicação de Áudio e Vídeo, Fernando Pereira

Compressão versus Qualidade Compressão Compressão versus versus Qualidade Qualidade

A Norma JPEG oferece os seguintes níveis de compressão/qualidade para todos os modos de operação, considerando imagens a cores com complexidade média:

  • 0.25

0.25 -

  • 0.5 bits/pixel

0.5 bits/pixel - qualidade moderada a boa, suficiente para certas aplicações

  • 0.5

0.5 -

  • 0.75 bits/pixel

0.75 bits/pixel - qualidade boa a muito boa; suficiente para muitas aplicações

  • 0.75

0.75 -

  • 1.5 bits/pixel

1.5 bits/pixel - qualidade excelente, suficiente para a maior parte das aplicações

  • 1.5

1.5 -

  • 2.0 bits/pixel

2.0 bits/pixel - qualidade indistinguível do original; suficiente para as aplicações mais exigentes Estes níveis são apenas indicativos já que a compressão/qualidade atingida depende de cada imagem em particular. O nível de qualidade escolhido é controlada através da matriz de quantificação.

slide-79
SLIDE 79

Comunicação de Áudio e Vídeo, Fernando Pereira

Imagens de Teste JPEG Imagens de Teste Imagens de Teste JPEG JPEG

slide-80
SLIDE 80

Comunicação de Áudio e Vídeo, Fernando Pereira

Imagens de Teste JPEG Imagens de Teste Imagens de Teste JPEG JPEG

slide-81
SLIDE 81

Comunicação de Áudio e Vídeo, Fernando Pereira

Imagens de Teste JPEG Imagens de Teste Imagens de Teste JPEG JPEG

slide-82
SLIDE 82

Comunicação de Áudio e Vídeo, Fernando Pereira

Imagens de Teste JPEG Imagens de Teste Imagens de Teste JPEG JPEG

slide-83
SLIDE 83

Comunicação de Áudio e Vídeo, Fernando Pereira

Algumas Medidas (1) Algumas Medidas (1) Algumas Medidas (1)

Condições - Processo baseline baseado na DCT, com as matrizes de quantificação indicadas na norma e codificação Huffman/VLI com tabelas optimizadas; resolução ITU-R 601.

A maior parte da energia do sinal está concentrada na componente

de luminância.

A maior parte da informação é usada para codificar os coeficientes

AC.

As imagens Barb1 e Barb2, mais ricas em altas frequências, possuem

  • s piores resultados de compressão, estando contudo dentro dos
  • bjectivos propostos pelo JPEG.
slide-84
SLIDE 84

Comunicação de Áudio e Vídeo, Fernando Pereira

Algumas Medidas (2) Algumas Algumas Medidas Medidas (2) (2)

Imagem Coef. DC Lum (byte) Coef DC crom (byte) Coef AC Lum (byte) Coef AC Crom (byte) Global (byte) Factor Comp. Ritmo (bit/pel) SNR Y (dB) SNR U (dB) SNR V (dB) Zelda 4208 2722 19394 3293 29617 28.00 0.571 38.09 42.01 40.98 Barb1 4520 2926 40995 4878 53319 15.56 1.028 33.39 38.38 39.01 Boats 3833 2255 29302 3755 39145 21.19 0.755 35.95 41.13 40.13 Black 3497 2581 21260 6015 33353 24.87 0.643 37.75 40.09 38.23 Barb2 4223 2933 41613 7246 56014 14.81 1.080 32.37 37.05 36.09 Hill 4007 2206 34890 3727 44830 18.50 0.865 34.31 39.83 38.09 Hotel 4239 2708 35520 6658 49125 16.88 0.948 34.55 37.95 36.99

slide-85
SLIDE 85

Comunicação de Áudio e Vídeo, Fernando Pereira

Resumo dos Processos de Codificação: Processo Baseline Resumo dos Processos de Codificação: Resumo dos Processos de Codificação: Processo Processo Baseline Baseline

Obrigatório em todos os codecs JPEG

Baseado na DCT Imagem original: amostras com 8 bits para cada componente Modo Sequencial Codificação de Huffman: 2 tabelas AC e 2 tabelas DC Descodificadores devem aceitar imagens com 1, 2, 3 ou 4 componentes Varrimentos com interleaving ou não

slide-86
SLIDE 86

Comunicação de Áudio e Vídeo, Fernando Pereira

Resumo dos Processos de Codificação: Processo Extensão baseado na DCT Resumo dos Processos de Codificação: Resumo dos Processos de Codificação: Processo Extensão baseado na DCT Processo Extensão baseado na DCT

Baseado na DCT Imagem original: amostras com 8 ou 12 bits para cada componente Modo Sequencial ou Progressivo Codificação de Huffman ou aritmética: 4 tabelas AC e 4 tabelas DC Descodificadores devem aceitar imagens com 1, 2, 3 ou 4 componentes Varrimentos com interleaving ou não

slide-87
SLIDE 87

Comunicação de Áudio e Vídeo, Fernando Pereira

Resumo dos Processos de Codificação: Processo Sem Perdas Resumo dos Processos de Codificação: Resumo dos Processos de Codificação: Processo Sem Perdas Processo Sem Perdas

Codificação (espacial) preditiva (não baseada na DCT) Imagem original: amostras com 2... 16 bits para cada componente Modo Sequencial (sem perdas) Codificação de Huffman: 4 tabelas DC Descodificadores devem aceitar imagens com 1, 2, 3 ou 4 componentes Varrimentos com interleaving ou não

slide-88
SLIDE 88

Comunicação de Áudio e Vídeo, Fernando Pereira

Resumo dos Processos de Codificação: Processo Hierárquico Resumo dos Processos de Codificação: Resumo dos Processos de Codificação: Processo Hierárquico Processo Hierárquico

Modo hierárquico Múltiplas tramas (diferenciais ou não) Usa processos extensão baseados na DC[ ou processo sem perdas Descodificadores devem admitir imagens com 1, 2, 3 ou 4 componentes Varrimentos com interleaving ou não

slide-89
SLIDE 89

Comunicação de Áudio e Vídeo, Fernando Pereira

Outros Formatos: Bitmap (BMP) Outros Outros Formatos Formatos: : Bitmap Bitmap (BMP) (BMP)

Formato BMP inclui normalmente um cabeçalho, os dados de imagem

e informação adicional, p.e. palette de cores.

A informação de imagem pode corresponder a amostras PCM ou a

índices de uma palette de cores.

A informação de imagem pode estar estruturada de vários modos, p.e.

por amostras, por componentes, etc.

Vantagens: fácil de criar,

de aceder a uma dada posição, de alterar um pixel ou mais

Desvantagens: Pouco

eficiente (não tem compressão)

slide-90
SLIDE 90

Comunicação de Áudio e Vídeo, Fernando Pereira

Outros Formatos: Graphics Interchange Format (GIF) Outros Outros Formatos Formatos: : Graphics Interchange Graphics Interchange Format Format (GIF) (GIF)

Permite armazenar várias imagens do tipo BMP num mesmo ficheiro

mas sempre do tipo RGB

Informação de imagem sempre codificada com algoritmo Lempel-Ziv-

Welch (LZW); compressões de 40% ou mais para imagens com 8 bit/amostra

Informação estruturada como sequência de pacotes Máximo dimensão da imagem: 64 K ×

× × × 64 K

Número de bit/amostra: 1 a 8

slide-91
SLIDE 91

Comunicação de Áudio e Vídeo, Fernando Pereira

Outros Formatos: Tag Image File Format (TIFF) Outros Outros Formatos Formatos: : Tag Image File Format Tag Image File Format (TIFF) (TIFF)

Permite armazenar várias imagens do tipo BMP num mesmo

ficheiro

Informação de imagem pode não ser codificada ou ser codificada

com os algoritmos LZW, RLE, Fax grupo 3, Fax grupo 4, JPEG

Máximo dimensão da imagem: 232 - 1 pixels Número de bit/amostra: 1 a 24 Vantagens: Muito flexível e variado

slide-92
SLIDE 92

Comunicação de Áudio e Vídeo, Fernando Pereira

Bibliografia Bibliografia Bibliografia

JPEG: Still Image Data Compression Standard, William

Pennebaker, Joan Mitchell, Kluwer Academic Publishers, 1993

Image and Video Compression Standards: Algorithms and

Architectures, Vasudev Bhaskaran and Konstantinos Konstantinides, Kluwer Academic Publishers, 1995

Digital Image Compression Techniques, Majid Rabbani, Paul W.

Jones, SPIE Press, Tutorial texts on Optical Engineering, 1991