Comunicação de Áudio e Vídeo, Fernando Pereira
FOTOGRAFIA DIGITAL FOTOGRAFIA DIGITAL Fernando Pereira Fernando - - PowerPoint PPT Presentation
FOTOGRAFIA DIGITAL FOTOGRAFIA DIGITAL Fernando Pereira Fernando - - PowerPoint PPT Presentation
FOTOGRAFIA DIGITAL FOTOGRAFIA DIGITAL Fernando Pereira Fernando Pereira Instituto Superior Tcnico Instituto Superior Tcnico Comunicao de udio e Vdeo, Fernando Pereira Imagem Fotogr fica fica Multin Multin vel vel
Comunicação de Áudio e Vídeo, Fernando Pereira
Imagem Fotográfica Multinível
(tons de cinzento ou cores)
Imagem Fotogr Imagem Fotográ áfica fica Multin Multiní ível vel
(tons de cinzento ou cores) (tons de cinzento ou cores)
OBJECTIVO OBJECTIVO Transmissão e armazenamento eficiente de imagem Transmissão e armazenamento eficiente de imagem fotográfica fotográfica multinível multinível
Comunicação de Áudio e Vídeo, Fernando Pereira
Sonho ou Pesadelo ? Sonho ou Pesadelo ? Sonho ou Pesadelo ?
“Uma imagem vale mais que 1000 palavras” - a informação visual é um meio extremamente eficiente de expressar uma mensagem ou visualizar qualquer tipo de dados. Os sistemas de imagem digital geram enormes quantidades de dados, p.e. muitos Megabytes para uma única imagem.
Comunicação de Áudio e Vídeo, Fernando Pereira
Aplicações Aplicações Aplicações
Fotografia e bases de dados pessoais Bases de dados profissionais: museus, mapas, esquemas, etc. Videotexto fotográfico Desktop publishing Artes gráficas Telecópia a cores Imagem médica
Comunicação de Áudio e Vídeo, Fernando Pereira
Principal Problema Principal Principal Problema Problema
Uma imagem é gerada e consumida como um conjunto de M× × × ×N amostras de luminância e crominância, com um certo número de bits por amostra o que faz com que
- número de bits
- e logo a banda e memória - necessário para
representar digitalmente uma imagem seja ENORME !!!
Comunicação de Áudio e Vídeo, Fernando Pereira
Codificação/Compressão de Imagem Codificação/Compressão Codificação/Compressão de Imagem de Imagem
Trata da representação o mais eficiente possível de uma imagem, satisfazendo o conjunto de requisitos relevantes. E os requisitos variam segundo as aplicações e as respectivas funcionalidades ...
Comunicação de Áudio e Vídeo, Fernando Pereira
Donde vem a Compressão ? Donde vem a Compressão ? Donde vem a Compressão ?
- REDUNDÂNCIA
REDUNDÂNCIA - tem a ver com as semelhanças, correlação e preditabilidade entre as amostras da imagem.
- > a redução de redundância não envolve a perda de informação ou
seja a imagem é comprimida sem perdas.
- IRRELEVÂNCIA
IRRELEVÂNCIA - tem a ver com a informação imperceptível ao olho ou insignificante ao cérebro humanos.
- > a redução de irrelevância é um processo irreversível, involvendo
perda de informação.
Comunicação de Áudio e Vídeo, Fernando Pereira
A Norma JPEG
( (Joint Photographic Experts Group Joint Photographic Experts Group-
- ISO & ITU
ISO & ITU
- T
) T )
Comunicação de Áudio e Vídeo, Fernando Pereira
OBJECTIVO OBJECTIVO OBJECTIVO
Definição de uma norma genérica de compressão que considere os requisitos da maior parte das aplicações usando imagem fotográfica multinível.
Comunicação de Áudio e Vídeo, Fernando Pereira
Interoperabilidade, logo Normas ! Interoperabilidade, logo Normas ! Interoperabilidade, logo Normas !
A codificação de imagem é usada em muitas aplicações
audiovisuais para as quais a interoperabilidade é um requisito essencial.
O requisito de interoperabilidade é satisfeito através da
especificação de normas de codificação.
De forma a incentivar a evolução e a competição, as normas
devem oferecer interoperabilidade através da especificação do menor conjunto possível de ferramentas.
Comunicação de Áudio e Vídeo, Fernando Pereira
Principais Requisitos do JPEG Principais Requisitos do JPEG Principais Requisitos do JPEG
- Eficiência
Eficiência - Basear-se nas mais eficientes técnicas de compressão, nomeadamente para qualidades classificadas como 'muito boas'; possibilidade de parametrização da qualidade/compressão.
- Flexibilidade
Flexibilidade - Aplicabilidade a qualquer tipo de imagem fotográfica multinível (não binível) sem restricções de resolução, factor de forma, espaço de cores, conteúdo, etc.
- Baixa complexidade
Baixa complexidade - Complexidade aceitável de forma a permitir a implementação em software numa gama variada de CPU's.
- Generalidade
Generalidade - Considerar vários modos de operação, nomeadamente os modos sequencial, progressivo, sem perdas e hierárquico.
Comunicação de Áudio e Vídeo, Fernando Pereira
Elementos Normativos Elementos Normativos Elementos Normativos
- CODIFICADOR
CODIFICADOR - A partir das imagens digitais à entrada e das tabelas de especificação gera, através dum conjunto de técnicas, o fluxo de dados comprimidos de saída.
- FORMATO DE INTERCÂMBIO
FORMATO DE INTERCÂMBIO - Representação comprimida dos dados correspondentes à imagem, incluindo as tabelas de especificação.
- DESCODIFICADOR
DESCODIFICADOR - Através de um conjunto de técnicas, gera as imagens reconstruídas na saída, a partir do fluxo de dados comprimidos à entrada e das tabelas de especificação.
Comunicação de Áudio e Vídeo, Fernando Pereira
Elementos Normativos Elementos Normativos Elementos Normativos
v Codificador Fluxo binário codificado Tabelas Informação original Fluxo binário codificado Descodificador Tabelas v Informação descodificada
Comunicação de Áudio e Vídeo, Fernando Pereira
Norma ITU-R 601 Norma ITU Norma ITU-
- R 601
R 601
Inclui os sistemas de 625 e 525 linhas (25 e 30 Hz) e os
formatos 4:3 e 16:9
Ritmos base de amostragem: 13.5 MHz para a luminância
e 6.75 MHz para as crominâncias
Quantificação das amostras: 8 bits
Formato Resolução Y Resolução U e V Horizontal Vertical 4:4:4 720 x 576 720 x 576 1:1 1:1 4:2:2 720 x 576 360 x 576 2:1 1:1 4:2:0 720 x 576 360 x 288 2:1 2:1 4:1:1 720 x 576 180 x 576 4:1 1:1 4:1:0 720 x 576 180 x 144 4:1 4:1
Comunicação de Áudio e Vídeo, Fernando Pereira
Multiplexagem Multiplexagem Multiplexagem
Uma vez que inúmeras aplicações devem proceder à descodificação e visualização ou impressão sem grande capacidade de memorização, é necessário que as imagens com várias componentes considerem a necessidade de multiplexar a respectiva informação. Caso Caso 1: 1: Todas Todas as as componentes componentes com a com a mesma mesma resolução resolução
Sem multiplexagem (ordem): A1,A2,A3,…,An B1,B2,B3,…,Bn C1,C2,C3,…,Cn Com multiplexagem fina (ordem): A1, B1, C1, A2, B2, C2, A3 … An, Bn, Cn
Comunicação de Áudio e Vídeo, Fernando Pereira
Multiplexagem Multiplexagem Multiplexagem
Caso Caso 2: 2: Componentes Componentes com com diferente diferente resolu resoluç ção ão
Sem multiplexagem (ordem): A1,A2,A3,…,An B1,B2,B3,…,Bn/2 C1,C2,C3,…,Cn/2 Com multiplexagem fina (ordem): A1, A2, B1, C1, A3, A4, B2, C2, … An-1, An, Bn/2, Cn/2
Comunicação de Áudio e Vídeo, Fernando Pereira
Tipos de Codificação Tipos de Codificação Tipos de Codificação
- SEM PERDAS (
SEM PERDAS (lossless lossless) ) - A imagem é reconstruída sem qualquer perda (original e descodificado são matematicamente iguais); factores de compressão mais reduzidos são atingidos (aproximadamente 2:1)
- COM PERDAS (
COM PERDAS (lossy lossy) ) - A imagem é reconstruída com elevada fidelidade em relação ao original (mas não idêntica), atingindo-se factores de compressão elevados; este tipo de codificação recorre à Transformada de Coseno Discreta (Discrete Cosine Transform - DCT) O processo de codificação mais simples baseado na DCT é designado por PROCESSO SEQUENCIAL BASELINE PROCESSO SEQUENCIAL BASELINE e é suficiente para inúmeras aplicações. Este processo é obrigatório em todos os sistemas JPEG.
Comunicação de Áudio e Vídeo, Fernando Pereira
Modos de Operação Modos de Operação Modos de Operação
Os vários modos de operação resultam da exigência de universalidade desta norma e da variedade de aplicações consideradas.
- SEQUENCIAL
SEQUENCIAL - Cada componente da imagem é codificada num único varrimento (de cima para baixo e da esquerda para a direita);
- PROGRESSIVO
PROGRESSIVO - A imagem é codificada usando vários varrimentos que oferecem uma imagem sucessivamente de melhor qualidade;
- SEM PERDAS
SEM PERDAS - A codificação garante a reconstrução exacta de cada amostra da imagem original;
- HIERÁRQUICO
HIERÁRQUICO - A imagem é codificada em várias resoluções de modo a que resoluções mais baixas possam estar acessíveis sem descodificar a resolução mais elevada. Para cada modo de operação são especificados um ou mais codecs que se distinguem pela precisão das amostras da imagem ou pelo método de codificação entrópica usado.
Comunicação de Áudio e Vídeo, Fernando Pereira
Modo Progressivo versus Modo Sequencial Modo Progressivo Modo Progressivo versus versus Modo Modo Sequencial Sequencial
Comunicação de Áudio e Vídeo, Fernando Pereira
Codificação Baseada na DCT Codificação Codificação Baseada Baseada na DCT na DCT
Imagem
- riginal
DCT Quantificação Codific. entrópica Transmissão
- u
armazenam. Imagem descodificada IDCT Inversão da quantificação Descodif. entrópica Tabela de des- quantificação Tabela de descodificação Tabela de quantificação Tabela de codificação
Comunicação de Áudio e Vídeo, Fernando Pereira
Codificação Baseada na DCT Codificação Codificação Baseada Baseada na DCT na DCT
A acção conjunta dos vários blocos do codificador baseline visa reduzir a redundância e irrelevância contidas na imagem. Enquanto os primeiros blocos visam a geração de uma sinal sem memória (eliminação da redundância espacial) e sem irrelevância, a codificação entrópica final visa a geração de símbolos equiprováveis como modo de minimizar os dados a transmitir (eliminação da redundância estatística).
Comunicação de Áudio e Vídeo, Fernando Pereira
Codificação por Transformada Codificação por Transformada Codificação por Transformada
A codificação por transformada envolve a divisão da imagem em blocos de N× × × ×N pixels aos quais é aplicada a transformada, produzindo blocos de N× × × ×N coeficientes.
Uma transformada define-se formalmente pelas equações de transformação
directa e inversa:
F(u,v) = F(u,v) = Σ Σ Σ Σ Σ Σ Σ Σi=0
i=0 N N-
- 1
1 Σ
Σ Σ Σ Σ Σ Σ Σ j=0
j=0 N N-
- 1
1 f(i,j) A(i,j,u,v)
f(i,j) A(i,j,u,v) f(i,j) = f(i,j) = Σ Σ Σ Σ Σ Σ Σ Σu=0
u=0 N N-
- 1
1 Σ
Σ Σ Σ Σ Σ Σ Σ v=0
v=0 N N-
- 1
1 F(u,v) B(i,j,u,v)
F(u,v) B(i,j,u,v)
- nde
f(i,j) - sinal de entrada (no espaço) A (i,j,u,v) - núcleo da transformada directa F(u,v) - coeficientes da transformada B (i,j,u,v) - núcleo da transformada inversa
Comunicação de Áudio e Vídeo, Fernando Pereira
Características das Transformadas Relevantes Características das Transformadas Características das Transformadas Relevantes Relevantes
Usam-se transformadas unitárias que apresentam as seguintes características:
Reversibilidade Ortogonalidade dos vectores do núcleo da transformada Conservação da energia ou seja a energia no domínio espacial é igual
à energia no domínio da transformada
Nota 1: Para as transformadas unitárias A*A=AA*=In onde In é a matriz identidade e * representa a operação conjugada transposta. Nota 2: A matriz transposta é conseguida quando se permutam as linhas por colunas e vice- versa ou seja se a matriz original é n×m, a matriz transposta é m×n. Nota 3: A matriz conjugada obtem-se substituindo cada elemento pelo seu complexo conjugado (parte imaginária com sinal trocado).
Comunicação de Áudio e Vídeo, Fernando Pereira
O que se Espera da Transformada ? O que se O que se Espera Espera da Transformada ? da Transformada ?
- Incorrelação da Informação
Incorrelação da Informação - A transformada ideal deve gerar coeficientes completamente incorrelacionados.
- Compactação da Energia
Compactação da Energia - A maior parte da energia do sinal deve ser compactada num número reduzido de coeficientes.
- Funções de Base do Núcleo da Transformada Independentes da Image
Funções de Base do Núcleo da Transformada Independentes da Imagem m - Uma vez que as imagens apresentam variações estatísticas acentuadas, a transformada óptima depende normalmente da imagem; devido ao peso computacional que representa a procura da transformada óptima para cada imagem, é desejável que cujas funções de base da transformada sejam independentes da imagem, ainda que isso possa ser pago em desempenho.
- Rapidez da Implementação
Rapidez da Implementação - O elevado número de operações envolvidas justifica a necessidade de encontrar transformadas com implementações rápidas.
Comunicação de Áudio e Vídeo, Fernando Pereira
Como Interpretar a Transformada ? Como Como Interpretar Interpretar a a Transformada ? Transformada ?
A expressão da transformada inversa
f(i,j) = f(i,j) = Σ Σ Σ Σ Σ Σ Σ Σu=0
u=0 N N-
- 1
1 Σ
Σ Σ Σ Σ Σ Σ Σ v=0
v=0 N N-
- 1
1 F(u,v) B(i,j,u,v)
F(u,v) B(i,j,u,v)
indica que a transformada pode ser interpretada como a decomposição da imagem no espaço num conjunto de componentes básicas - as funções de base da transformada - adequadamente pesadas através dos respectivos coeficientes. A Interpretação Espectral A Interpretação Espectral - Como a maior parte das transformadas usa funções de base com diferentes frequências (em sentido lato), a decomposição do sinal através dos coeficientes e das funções de base assume um caracter espectral onde cada coeficiente representa à fracção de energia na imagem original correspondente à respectiva função de base/frequência.
Comunicação de Áudio e Vídeo, Fernando Pereira
Os Coeficientes: Como são ? Os Os Coeficientes Coeficientes: Como : Como são são ? ?
Comunicação de Áudio e Vídeo, Fernando Pereira
Vantagens da Interpretação Espectral Vantagens da Interpretação Espectral Vantagens da Interpretação Espectral
A interpretação espectral permite introduzir facilmente na codificação as características do sistema visual humano que são imprescindíveis para uma codificação eficiente.
O sistema visual humano é menos sensível às altas
frequências espaciais
- >> codificação mais grosseira dos coeficientes correspondentes
O sistema visual humano é menos sensível para luminâncias muito
baixas ou muito elevadas
- >> codificação mais grosseira do coeficiente DC da luminância nessas
condições
Comunicação de Áudio e Vídeo, Fernando Pereira
Porque se Transformam Blocos ? Porque se Transformam Blocos ? Porque se Transformam Blocos ?
Basicamente a transformada representa o sinal original num outro
domínio onde pode ser mais eficientemente codificado através da exploração da redundância espacial.
A exploração mais completa da redundância espacial contida na
imagem conduz à aplicação da transformada em blocos N× × × ×N tão grandes quanto possível, idealmente toda a imagem.
O esforço computacional associado à transformada aumenta
rapidamente com a dimensão do bloco onde esta é aplicada. A aplicação da transformada a blocos, normalmente com 8× × × ×8 pixels, resulta do compromisso entre a exploração da redundância espacial e o esforço computacional associado.
Comunicação de Áudio e Vídeo, Fernando Pereira
O que se Transforma … O O que que se se Transforma Transforma … …
- 144
130 112 104 107 98 95 89 145 135 118 107 106 98 99 92 141 133 119 113 97 98 95 88 139 130 122 113 98 94 94 88 147 135 129 116 101 102 88 92 144 131 128 112 105 96 92 86 149 135 129 116 105 101 91 85 155 142 130 118 106 101 89 87
Y =
Comunicação de Áudio e Vídeo, Fernando Pereira
O Efeito de Bloco O O Efeito Efeito de de Bloco Bloco
Comunicação de Áudio e Vídeo, Fernando Pereira
Transformada de Karhunen-Loéve (KLT) Transformada de Transformada de Karhunen Karhunen-
- Loéve
Loéve (KLT) (KLT)
A transformada de Karhunen-Loéve é muitas vezes considerada a transformada ideal por conseguir a
MÁXIMA COMPACTAÇÃO DA ENERGIA DO SINAL MÁXIMA COMPACTAÇÃO DA ENERGIA DO SINAL
- u seja se apenas um número limitado de coeficientes for transmitido, os
coeficientes da KLT serão aqueles que conterão a fracção mais elevada da energia do sinal em comparação com qualquer outra transformada.
As funções de base da KLT baseiam As funções de base da KLT baseiam-
- se nos vectores próprios da
se nos vectores próprios da matriz de matriz de covariância covariância de blocos da imagem. de blocos da imagem.
Comunicação de Áudio e Vídeo, Fernando Pereira
Porque não se usa a KLT ? Porque não se usa a KLT ? Porque não se usa a KLT ?
A utilização da KLT em sistemas de compressão de imagem é praticamente nula porque:
As suas funções de base dependem da imagem a codificar requerendo
- cálculo da matriz de covariância.
Não existem algoritmos bastante rápidos para o seu cálculo. Existem outras transformadas sem as desvantagens acima apontadas e
com uma eficiência em termos de compactação de energia apenas ligeiramente inferior.
Comunicação de Áudio e Vídeo, Fernando Pereira
Transformada de Fourier Discreta (DFT) Transformada de Transformada de Fourier Fourier Discreta (DFT) Discreta (DFT)
A DFT decompõe o sinal do bloco de imagem nas suas componentes espectrais, sendo u e v as frequências espaciais horizontal e vertical
F(u,v) = 1/N F(u,v) = 1/N Σ Σ Σ Σ Σ Σ Σ Σj=0
j=0 N N-
- 1
1 Σ
Σ Σ Σ Σ Σ Σ Σ k=0
k=0 N N-
- 1
1 f(j,k)
f(j,k) exp exp [ [-
- 2
2 π π π π π π π π i ( i (uj uj + +vk vk) / N] ) / N] f(j,k) = 1/N f(j,k) = 1/N Σ Σ Σ Σ Σ Σ Σ Σu=0
u=0 N N-
- 1
1 Σ
Σ Σ Σ Σ Σ Σ Σ v=0
v=0 N N-
- 1
1 F(u,v)
F(u,v) exp exp [2 [2 π π π π π π π π i ( i (uj uj + + vk vk) / N] ) / N]
com i = √ √ √ √ -1
É uma transformada separável já que se pode calcular em dois passos: primeiro
aplica-se a transformação unidimensional às colunas e depois às linhas do bloco NxN de dados.
Produz coeficientes complexos o que é uma desvantagem em termos de
memorização e manipulação.
Gera componentes espectrais espúrias devido à periodicidade implícita dos
blocos de imagem.
Comunicação de Áudio e Vídeo, Fernando Pereira
Transformada de Coseno Discreta (DCT) Transformada de Coseno Discreta (DCT) Transformada de Coseno Discreta (DCT)
A DCT é uma das várias transformadas sinusoidais existentes, sendo os seus vectores de base constituídos por amostras de funções (co)sinusoidais. A DCT é, sem dúvida, a transformada mais usada em codificação de imagem por o seu desempenho se aproximar do da KLT para sinais com elevada correlação e por existirem algoritmos rápidos para a sua implementação.
- −
= − =
- +
- +
=
1 1
2 1 2 2 1 2 2
N j N k
N k v N j u k j f v C u C N v u F ) ( cos ) ( cos ) , ( ) ( ) ( ) , ( π π
- −
= − =
- +
- +
=
1 1
2 1 2 2 1 2 2 N
u N v
N k v N j u v u F v C u C N k j f π π ) ( cos ) ( cos ) , ( ) ( ) ( ) , (
Comunicação de Áudio e Vídeo, Fernando Pereira
Funções de Base da DCT Unidimensional (N=8) Funções de Base da DCT Unidimensional Funções de Base da DCT Unidimensional (N=8) (N=8)
Comunicação de Áudio e Vídeo, Fernando Pereira
Funções de Base da DCT Bidimensional (N=8) Funções de Base da DCT Bidimensional Funções de Base da DCT Bidimensional (N=8) (N=8)
Comunicação de Áudio e Vídeo, Fernando Pereira
DCT KLT
Comunicação de Áudio e Vídeo, Fernando Pereira
- 144
130 112 104 107 98 95 89 145 135 118 107 106 98 99 92 141 133 119 113 97 98 95 88 139 130 122 113 98 94 94 88 147 135 129 116 101 102 88 92 144 131 128 112 105 96 92 86 149 135 129 116 105 101 91 85 155 142 130 118 106 101 89 87
DCT
- 5.6187
- 3.9974
- 0.5240
- 0.1142
0.8696 0.1559 2.3804 3.4688
- 0.3496
0.8410
- 0.7874
- 0.0628
0.0601 0.6945
- 0.1650
- 4.1042
- 0.3942
1.7394 3.3000 0.4772 0.4010 2.6308 2.6624
- 7.9536
2.4750 2.0787 1.8446 2.5000 0.2085 0.8610 2.0745
- 0.7500
5.4051 2.7510
- 2.7203
- 2.1336
- 2.8421
1.5106 2.7271
- 1.9463
3.1640
- 3.1945
- 4.4558
2.4614 9.9277
- 2.3410
2.6557
- 5.3355
1.2591 8.4265 1.9909
- 0.2867
- 5.2187
7.6122
- 16.5235
- 12.1982
0.0330 3.5750 5.7540
- 0.7500
14.0897
- 26.6464
149.5418
- 898.0000
Y =
- Coef. DCT =
Comunicação de Áudio e Vídeo, Fernando Pereira
Transformada de Walsh-Hadamard (WHT) Transformada de Transformada de Walsh Walsh-
- Hadamard
Hadamard (WHT) (WHT)
A WHT tem um conjunto de funções de base constituídas apenas por + 1 e -1 o que facilita a sua implementação por não necessitar de multiplicações. Ainda que possa ter uma interpretação espectral semelhante às outras transformadas (as suas funções de base têm um número crescente de mudanças de sinal), a sua capacidade de compactação da energia do sinal de imagem é menor.
Comunicação de Áudio e Vídeo, Fernando Pereira
Funções de Base da WHT Unidimensional (N=8) Funções de Base da WHT Unidimensional Funções de Base da WHT Unidimensional (N=8) (N=8)
Comunicação de Áudio e Vídeo, Fernando Pereira
Funções de Base da WHT Bidimensional (N=8) Funções de Base da WHT Bidimensional Funções de Base da WHT Bidimensional (N=8) (N=8)
Comunicação de Áudio e Vídeo, Fernando Pereira
A DCT no JPEG A DCT no JPEG A DCT no JPEG
Uma vez que a DCT usa funções transcendentes é impossível o seu cálculo com total precisão o que dá origem a diferenças nos resultados de implementações diferindo ainda que muito ligeiramente (e.g. precisão dos cálculos intermédios, etc).
Com vista a possibilitar futuros desenvolvimentos, a norma JPEG não
especifica nenhuma implementação particular da DCT ou IDCT.
A norma JPEG especifica um teste de fiabilidade com vista a limitar as
diferenças provocadas pela liberdade na implementação da DCT e IDCT. Nota: A DCT é aplicada às amostras do sinal com P bits, com valores entre
- 2P-1 e 2P-1-1 de modo a que o coeficiente DC fique distribuído em torno
de zero.
Comunicação de Áudio e Vídeo, Fernando Pereira
Codificação Baseada na DCT Codificação Codificação Baseada Baseada na DCT na DCT
Imagem
- riginal
DCT Quantificação Codific. entrópica Transmissão
- u
armazenam. Imagem descodificada IDCT Inversão da quantificação Descodif. entrópica Tabela de des- quantificação Tabela de descodificação Tabela de quantificação Tabela de codificação
Comunicação de Áudio e Vídeo, Fernando Pereira
Como Trabalha a DCT ? Como Trabalha a DCT ? Como Trabalha a DCT ?
X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
DCT DCT
Domínio Espacial Domínio Espacial Domínio Domínio Frequencial Frequencial
Comunicação de Áudio e Vídeo, Fernando Pereira
Codificação Baseada na DCT Codificação Codificação Baseada Baseada na DCT na DCT
Imagem
- riginal
DCT Quantificação Codific. entrópica Transmissão
- u
armazenam. Imagem descodificada IDCT Inversão da quantificação Descodif. entrópica Tabela de des- quantificação Tabela de descodificação Tabela de quantificação Tabela de codificação
Comunicação de Áudio e Vídeo, Fernando Pereira
DCT: um Exemplo DCT: um DCT: um Exemplo Exemplo
Comunicação de Áudio e Vídeo, Fernando Pereira
A Sequência da Codificação A A Sequência Sequência da da Codificação Codificação
Comunicação de Áudio e Vídeo, Fernando Pereira
A Quantificação A Quantificação A Quantificação
É o modo através do qual a irrelevância ou redundância perceptual é reduzida, sendo o principal responsável pelas perdas inerentes à codificação baseada na DCT. Cada passo de quantificação deverá ser escolhido tendo em conta a 'diferença mínima perceptível' no coeficiente que lhe está associado. As matrizes de quantificação não estão normalizadas ainda que exista uma sugestão para imagens com resolução ITU-R 601.
Comunicação de Áudio e Vídeo, Fernando Pereira
Como Funciona a Quantificação ? Como Funciona a Quantificação ? Como Funciona a Quantificação ?
Espaço (amostras) sij DCT Coeficientes DCT
Sij
Coeficientes quantificados
Sqij
Tabela Quantificação
Qij
Quantificação Round (S/Q) IDCT Espaço (amostras descodificadas) rij Coeficientes quantificados
Sqij
Coeficientes DCT reconst.
Rij
Quantificação Inversa R = Sq*Q Transmissão
- u
armazenamento
Comunicação de Áudio e Vídeo, Fernando Pereira
A norma JPEG sugere a quantificação dos coeficientes DCT através das matrizes com
- s valores da sensibilidade visual para cada coeficiente (informativo; matrizes têm
de ser sempre transmitidas): Situação: Luminância e crominância com sub-amostragem horizontal 2:1 (formato 4:2:2); amostras com 8 bits (Lohscheller) Nota: O uso destes passos de quantificação divididos por 2 fornece imagens codificadas indistinguíveis das originais.
Tabelas de Quantificação Tabelas de Quantificação Tabelas de Quantificação
16 11 10 16 24 40 51 61 12 12 14 19 26 58 60 55 14 13 16 24 40 57 69 56 14 17 22 29 51 87 80 62 18 22 37 56 68 109 103 77 24 35 55 64 81 104 113 92 49 64 78 87 103 121 120 101 72 92 95 98 112 100 103 99 17 18 24 47 99 99 99 99 18 21 26 66 99 99 99 99 24 26 56 99 99 99 99 99 47 66 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99
Comunicação de Áudio e Vídeo, Fernando Pereira
Tabelas de Quantificação Tabelas de Quantificação Tabelas de Quantificação
A análise das matrizes de quantificação sugeridas permite
- bservar que:
- s coeficientes têm uma contribuição diferente para a qualidade
subjectiva
a visão humana é anisotrópica pois os limiares são diferentes
para as mesmas frequências espaciais, horizontais ou verticais
Comunicação de Áudio e Vídeo, Fernando Pereira
- 1
- 1
- 1
1
- 3
14
- 56
- 5.6187
- 3.9974
- 0.5240
- 0.1142
0.8696 0.1559 2.3804 3.4688
- 0.3496
0.8410
- 0.7874
- 0.0628
0.0601 0.6945
- 0.1650
- 4.1042
- 0.3942
1.7394 3.3000 0.4772 0.4010 2.6308 2.6624
- 7.9536
2.4750 2.0787 1.8446 2.5000 0.2085 0.8610 2.0745
- 0.7500
5.4051 2.7510
- 2.7203
- 2.1336
- 2.8421
1.5106 2.7271
- 1.9463
3.1640
- 3.1945
- 4.4558
2.4614 9.9277
- 2.3410
2.6557
- 5.3355
1.2591 8.4265 1.9909
- 0.2867
- 5.2187
7.6122
- 16.5235
- 12.1982
0.0330 3.5750 5.7540
- 0.7500
14.0897
- 26.6464
149.5418
- 898.0000
Quantificando
Comunicação de Áudio e Vídeo, Fernando Pereira
Codificação Baseada na DCT Codificação Codificação Baseada Baseada na DCT na DCT
Imagem
- riginal
DCT Quantificação Codific. entrópica Transmissão
- u
armazenam. Imagem descodificada IDCT Inversão da quantificação Descodif. entrópica Tabela de des- quantificação Tabela de descodificação Tabela de quantificação Tabela de codificação
Comunicação de Áudio e Vídeo, Fernando Pereira
Zig-Zagueando ... Zig Zig-
- Zagueando
Zagueando ... ...
1 2 3 10 11 12 13 4 6 20 22 36 38 52 1 5 6 14 15 27 28 4 5 8 9 17 16 15 14 1 5 7 21 23 37 39 53 2 4 7 13 16 26 29 42 6 7 19 18 26 27 28 29 2 8 19 24 34 40 50 54 3 8 12 17 25 30 41 43 20 21 24 25 30 31 32 33 3 9 18 25 35 41 51 55 9 11 18 24 31 40 44 53 22 23 34 35 42 43 44 45 10 17 26 30 42 46 56 60 10 19 23 32 39 45 52 54 36 37 40 41 46 47 48 49 11 16 27 31 43 47 57 61 20 22 33 38 46 51 55 60 38 39 50 51 56 57 58 59 12 15 28 32 44 48 58 62 21 34 37 47 50 56 59 61 52 53 54 55 60 61 62 63 13 14 29 33 45 49 59 63 35 36 48 49 57 58 62 63
Horizontal alternado Vertical alternado Zig-zag
Comunicação de Áudio e Vídeo, Fernando Pereira
Serialização dos Coeficientes Quantificados Serialização Serialização dos dos Coeficientes Coeficientes Quantificados Quantificados
Para que o descodificador possa
reconstruir a matriz de coeficientes quantificados para cada bloco, é preciso enviar-lhe a posição e o valor de cada coeficiente não nulo de forma sequencial (em série).
A posição de cada coeficiente
quantificado pode ser enviada de forma absoluta ou relativa.
A solução adoptada é enviar o posição
dos coeficientes quantificados não nulos indicando quantos coeficientes nulos existem na ordem zig-zag entre cada 2 coeficientes não nulos.
Cada bloco de coeficientes DCT é representado como uma sequência de pares (run, level), e.g. (0,124), (0, 25), (0,147), (0, 126), (3,13), (0, 147), (1,40) ...
Comunicação de Áudio e Vídeo, Fernando Pereira
A Geração dos Símbolos A Geração dos Símbolos A Geração dos Símbolos
É essencial definir quais são
- s símbolos que o codificador
de entropia codifica.
O coeficiente DC é tratado de modo diferente dos restantes 63, dada a elevada
correlação entre os coeficientes DC de blocos 8× × × ×8 adjacentes.
Os restantes coeficientes, já quantificados, são ordenados em zig-zag de modo a
facilitar a codificação entrópica, colocando os coeficientes de mais baixa frequência antes dos de mais alta frequência. A definição mais precisa dos símbolos a codificar depende do modo de operação DCT e do método de codificação entrópica.
Comunicação de Áudio e Vídeo, Fernando Pereira
O Modelo Simbólico JPEG O O Modelo Modelo Simbólico Simbólico JPEG JPEG
Uma imagem é representada como uma sequência de blocos 8× × × ×8 independentes, sendo cada bloco representado como uma sucessão de coeficientes DCT quantificados através de pares (run,level), terminados por um End of Block. Gerador de Símbolos (Modelo) Codificador Entrópico
Imagem Original Símbolos Bits
Comunicação de Áudio e Vídeo, Fernando Pereira
Codificação Entrópica JPEG Codificação Codificação Entrópica JPEG Entrópica JPEG
Usa a estatística dos símbolos a transmitir para alcançar compressão adicional (sem perdas).
A codificação entrópica compreende dois passos:
Conversão da sequência de pares (run, level ) correspondentes aos
coeficientes da transformada ordenados em zig-zag numa sequência intermédia de símbolos (símbolo 1 e símbolo 2 a seguir)
Conversão dos símbolos intermédios num fluxo de bits sem fronteiras
entre símbolos externamente identificáveis
Comunicação de Áudio e Vídeo, Fernando Pereira
A Norma JPEG considera dois tipos de codificação entrópica:
- CODIFICAÇÃO DE HUFFMAN
CODIFICAÇÃO DE HUFFMAN - É usada no processo baseline (obrigatório); podem ser usadas tabelas pré-definidas ou optimizadas para a imagem a transmitir.
- CODIFICAÇÃO ARITMÉTICA
CODIFICAÇÃO ARITMÉTICA - Baseia-se no princípio de que qualquer acontecimento pode ser codificado como uma sucessão de decisões binárias. A codificação aritmética produz factores de compressão 5-10 % superiores para as imagens de teste do JPEG ainda que possa ser mais complexa para certos tipos de implementação.
Codificação Entrópica no JPEG Codificação Entrópica no JPEG Codificação Entrópica no JPEG
Comunicação de Áudio e Vídeo, Fernando Pereira
Cada coeficiente AC não nulo é representado em combinação com o número de coeficientes nulos que o antecede no varrimento zig-zag (runlength - 0...15) Cada um destes pares (run, level) para coeficientes AC é representado por um par de símbolos:
Size - número de bits usados para codificar a Amplitude (ou seja o Level, símbolo 2) Level - amplitude (quantificada) do coeficiente AC a ser codificado
Cada coeficiente DC é representado da mesma forma mas tendo o símbolo 1 apenas a parte correspondente ao 'Size'.
Codificação Entrópica: Representação Intermédia dos Símbolos Codificação Entrópica: Representação Codificação Entrópica: Representação Intermédia dos Símbolos Intermédia dos Símbolos
Size Size Level Level Run Run Símbolo 1 Símbolo 1 -
- Huffman
Huffman (bidimensional) (bidimensional) Símbolo 2 Símbolo 2 -
- VLI
VLI
Comunicação de Áudio e Vídeo, Fernando Pereira
Codificação Entrópica: Atribuição das Palavras de Código Codificação Entrópica: Atribuição das Codificação Entrópica: Atribuição das Palavras de Código Palavras de Código
Os símbolos 1 dos coeficientes DC e AC são codificados com o código de
Huffman (VLC) correspondente à componente em codificação.
Os símbolos 2 são codificados com um código VLI - Variable Length
Integer - cujo comprimento depende da amplitude em causa.
Os códigos VLI são códigos VLC onde o comprimento da palavra é
indicado precedentemente e baseiam-se na representação de inteiros na notação complemento para 2 (quando o valor é positivo, transmite-se o valor em binário; quando é negativo, transmite-se o valor em complemento para 2 menos 1 o que corresponde ao mesmo valor em complemento para 1).
Os códigos VLI podem ser calculados em vez de armazenados (grande
vantagem para códigos extensos) e não se demonstraram muito ineficientes em comparação com códigos de Huffman.
Comunicação de Áudio e Vídeo, Fernando Pereira
Tabelas de Codificação (Símbolos 1 e 2) Tabelas de Tabelas de Codificação (Símbolos 1 e 2) Codificação (Símbolos 1 e 2)
1 2 Size 9 10 EOB . X . X . X Runlength 15 ZRL Run-size values
Size Amplitude 1
- 1, 1
2
- 3, -2, 2, 3
3
- 7 …-4, 4 … 7
4
- 15 …-8, 8 … 15
5
- 31 … -16, 16 … 31
6
- 63 … -32, 32 … 63
7
- 127 … -64, 64 … 127
8
- 255 … -128, 128 … 255
9
- 511 … -256, 256 … 511
10
- 1023 … -512, 512 … 1023
Codificação Codificação ( (run run, , size size) ) bidimensional bidimensional Codificação do Codificação do level level (amplitude) (amplitude) VLI VLI
Comunicação de Áudio e Vídeo, Fernando Pereira
Exemplo de Codificação VLI: +12 e -12 Exemplo de Codificação VLI: +12 e Exemplo de Codificação VLI: +12 e -
- 12
12
0000
- 15
0001
- 14
0010
- 13
0011
- 12
0100
- 11
0101
- 10
0110
- 9
0111
- 8
1000 8 1001 9 1010 10 1011 11 1100 12 1101 13 1110 14 1111 15
1100 0011
+12 em binário depois de complementado +12 em binário
O código dos valores negativos é simplesmente o complementar do código para os mesmos valores, se positivos (complemento para 1).
Comunicação de Áudio e Vídeo, Fernando Pereira
Afinal Como Comprime o JPEG ? Afinal Como Comprime o JPEG ? Afinal Como Comprime o JPEG ?
Redundância espacial - DCT
- Elementos da imagem estatisticamente dependentes são
convertidos em coeficientes incorrelacionados, sendo a energia da imagem concentrada no menor número possível de coeficientes.
Irrelevância
- Coeficientes DCT são quantificados usando critérios
psicovisuais.
Redundância estatística
- Estatística dos símbolos é explorada usando codificação run-
lenght e codificação entrópica de Huffman (ou aritmética).
Comunicação de Áudio e Vídeo, Fernando Pereira
O Modo Sem Perdas O Modo Sem Perdas O Modo Sem Perdas
O modo sem perdas JPEG baseia-se num esquema preditivo. A predição combina os valores de, no máximo, três pixels adjacentes codificando- se o erro de predição. A definição de um modo sem perdas baseado na DCT levaria à especificação mais rigorosa dos codecs. Dois codecs diferentes são especificados para o modo sem perdas - um com codificação de Huffman e outro com codificação aritmética.
Os codecs podem usar qualquer precisão entre 2 e 16 bits/amostra. O modo sem perdas JPEG oferece uma compressão de ≈
≈ ≈ ≈ 2:1 para imagens a cores de média complexidade.
Comunicação de Áudio e Vídeo, Fernando Pereira
Codificação Sem Perdas Codificação Sem Perdas Codificação Sem Perdas
Imagem
- riginal
Predição espacial Codificação entrópica Transmissão
- u
armazename nto Tabela de Codificação
Modo de predição Predição Sem predição 1 A 2 B 3 C 4 A + B – C 5 A + ((B - C)/2) 6 B + ((A – C)/2) 7 (A + B)/2
C C X - amostra a codificar A A X X B B
Comunicação de Áudio e Vídeo, Fernando Pereira
O Modo Progressivo O Modo Progressivo O Modo Progressivo
A imagem é codificada em sucessivos varrimentos. O primeiro varrimento dá muito rapidamente uma ideia da imagem que é sucessivamente melhorada nos varrimentos posteriores. A implementação do modo progressivo requer uma memória da dimensão da imagem, capaz de armazenar os coeficientes DCT quantificados (11 bits para o processo baseline) que serão parcialmente codificados em cada varrimento. Existem dois métodos para a implementação do modo progressivo:
- SELECÇÃO ESPECTRAL
SELECÇÃO ESPECTRAL - Apenas uma 'zona' especificada dos coeficientes é codificada em cada varrimento (baixas ->> altas frequências)
- APROXIMAÇÕES SUCESSIVAS
APROXIMAÇÕES SUCESSIVAS - Os coeficientes são codificados com precisão sucessivamente maior Os métodos de selecção espectral e aproximações sucessivas podem ser aplicados individualmente ou em combinação.
Comunicação de Áudio e Vídeo, Fernando Pereira
Progressivamente mais Qualidade: Escalabilidade de Qualidade ou SNR Progressivamente Progressivamente mais mais Qualidade Qualidade: : Escalabilidade de Escalabilidade de Qualidade Qualidade ou
- u SNR
SNR
Fluxo binário
5 kbits 8 kbits 30 kbits
Comunicação de Áudio e Vídeo, Fernando Pereira
Modo Sequencial ou Sem Escalabilidade ... Modo Modo Sequencial Sequencial ou
- u Sem
Sem Escalabilidade ... Escalabilidade ...
Fluxo NÃO escalável
- Descod. 1
- Descod. 2
- Descod. 3
Comunicação de Áudio e Vídeo, Fernando Pereira
Modo Progressivo ou com Escalabilidade de Qualidade ou SNR Modo Modo Progressivo Progressivo ou
- u com
com Escalabilidade Escalabilidade de de Qualidade Qualidade ou
- u SNR
SNR
Fluxo escalável
- Descod. 1
- Descod. 2
- Descod. 3
Comunicação de Áudio e Vídeo, Fernando Pereira
Modo Progressivos: Selecção espectral e Aproximações sucessivas Modo Modo Progressivos: Progressivos: Selecção Selecção espectral espectral e e Aproximações Aproximações sucessivas sucessivas
Cada vez mais coeficientes Cada vez mais bits para cada coeficiente
Comunicação de Áudio e Vídeo, Fernando Pereira
O Modo Hierárquico O Modo Hierárquico O Modo Hierárquico
O modo hierárquico
implementa uma codificação piramidal da imagem com várias resoluções, em que cada imagem difere da precedente dum factor 2 nas resoluções vertical e horizontal.
A codificação hierárquica
pode integrar nos seus vários passos codificação sem perdas ou codificação baseada na DCT.
Comunicação de Áudio e Vídeo, Fernando Pereira
Nível 1 Nível 4 Nível 3 Nível 2 Imagem original Redução Redução Redução Subamostrag.
- F. P. B.
Comunicação de Áudio e Vídeo, Fernando Pereira
Progressivamente mais Resolução ... Progressivamente Progressivamente mais mais Resolução Resolução ... ...
Fluxo binário
14 kbits 34 kbits 47 kbits
Comunicação de Áudio e Vídeo, Fernando Pereira
Modo Hierárquico ou Escalabilidade Espacial Modo Modo Hierárquico Hierárquico ou
- u Escalabilidade
Escalabilidade Espacial Espacial
Fluxo escalável
- Descod. 1
- Descod. 4
- Descod. 3
- Descod. 2
Comunicação de Áudio e Vídeo, Fernando Pereira
Imagem original
Redução Redução Expansão Expansão
+
Redução Expansão
+
- +
- +
+
- +
Comunicação de Áudio e Vídeo, Fernando Pereira
Codificador Hierárquico Codificador Hierárquico Codificador Hierárquico
1000× × × ×1000 250× × × ×250 500× × × ×500 250× × × ×250 1000× × × ×1000 500× × × ×500 1000× × × ×1000 1000× × × ×1000
Comunicação de Áudio e Vídeo, Fernando Pereira
Compressão versus Qualidade Compressão Compressão versus versus Qualidade Qualidade
A Norma JPEG oferece os seguintes níveis de compressão/qualidade para todos os modos de operação, considerando imagens a cores com complexidade média:
- 0.25
0.25 -
- 0.5 bits/pixel
0.5 bits/pixel - qualidade moderada a boa, suficiente para certas aplicações
- 0.5
0.5 -
- 0.75 bits/pixel
0.75 bits/pixel - qualidade boa a muito boa; suficiente para muitas aplicações
- 0.75
0.75 -
- 1.5 bits/pixel
1.5 bits/pixel - qualidade excelente, suficiente para a maior parte das aplicações
- 1.5
1.5 -
- 2.0 bits/pixel
2.0 bits/pixel - qualidade indistinguível do original; suficiente para as aplicações mais exigentes Estes níveis são apenas indicativos já que a compressão/qualidade atingida depende de cada imagem em particular. O nível de qualidade escolhido é controlada através da matriz de quantificação.
Comunicação de Áudio e Vídeo, Fernando Pereira
Imagens de Teste JPEG Imagens de Teste Imagens de Teste JPEG JPEG
Comunicação de Áudio e Vídeo, Fernando Pereira
Imagens de Teste JPEG Imagens de Teste Imagens de Teste JPEG JPEG
Comunicação de Áudio e Vídeo, Fernando Pereira
Imagens de Teste JPEG Imagens de Teste Imagens de Teste JPEG JPEG
Comunicação de Áudio e Vídeo, Fernando Pereira
Imagens de Teste JPEG Imagens de Teste Imagens de Teste JPEG JPEG
Comunicação de Áudio e Vídeo, Fernando Pereira
Algumas Medidas (1) Algumas Medidas (1) Algumas Medidas (1)
Condições - Processo baseline baseado na DCT, com as matrizes de quantificação indicadas na norma e codificação Huffman/VLI com tabelas optimizadas; resolução ITU-R 601.
A maior parte da energia do sinal está concentrada na componente
de luminância.
A maior parte da informação é usada para codificar os coeficientes
AC.
As imagens Barb1 e Barb2, mais ricas em altas frequências, possuem
- s piores resultados de compressão, estando contudo dentro dos
- bjectivos propostos pelo JPEG.
Comunicação de Áudio e Vídeo, Fernando Pereira
Algumas Medidas (2) Algumas Algumas Medidas Medidas (2) (2)
Imagem Coef. DC Lum (byte) Coef DC crom (byte) Coef AC Lum (byte) Coef AC Crom (byte) Global (byte) Factor Comp. Ritmo (bit/pel) SNR Y (dB) SNR U (dB) SNR V (dB) Zelda 4208 2722 19394 3293 29617 28.00 0.571 38.09 42.01 40.98 Barb1 4520 2926 40995 4878 53319 15.56 1.028 33.39 38.38 39.01 Boats 3833 2255 29302 3755 39145 21.19 0.755 35.95 41.13 40.13 Black 3497 2581 21260 6015 33353 24.87 0.643 37.75 40.09 38.23 Barb2 4223 2933 41613 7246 56014 14.81 1.080 32.37 37.05 36.09 Hill 4007 2206 34890 3727 44830 18.50 0.865 34.31 39.83 38.09 Hotel 4239 2708 35520 6658 49125 16.88 0.948 34.55 37.95 36.99
Comunicação de Áudio e Vídeo, Fernando Pereira
Resumo dos Processos de Codificação: Processo Baseline Resumo dos Processos de Codificação: Resumo dos Processos de Codificação: Processo Processo Baseline Baseline
Obrigatório em todos os codecs JPEG
Baseado na DCT Imagem original: amostras com 8 bits para cada componente Modo Sequencial Codificação de Huffman: 2 tabelas AC e 2 tabelas DC Descodificadores devem aceitar imagens com 1, 2, 3 ou 4 componentes Varrimentos com interleaving ou não
Comunicação de Áudio e Vídeo, Fernando Pereira
Resumo dos Processos de Codificação: Processo Extensão baseado na DCT Resumo dos Processos de Codificação: Resumo dos Processos de Codificação: Processo Extensão baseado na DCT Processo Extensão baseado na DCT
Baseado na DCT Imagem original: amostras com 8 ou 12 bits para cada componente Modo Sequencial ou Progressivo Codificação de Huffman ou aritmética: 4 tabelas AC e 4 tabelas DC Descodificadores devem aceitar imagens com 1, 2, 3 ou 4 componentes Varrimentos com interleaving ou não
Comunicação de Áudio e Vídeo, Fernando Pereira
Resumo dos Processos de Codificação: Processo Sem Perdas Resumo dos Processos de Codificação: Resumo dos Processos de Codificação: Processo Sem Perdas Processo Sem Perdas
Codificação (espacial) preditiva (não baseada na DCT) Imagem original: amostras com 2... 16 bits para cada componente Modo Sequencial (sem perdas) Codificação de Huffman: 4 tabelas DC Descodificadores devem aceitar imagens com 1, 2, 3 ou 4 componentes Varrimentos com interleaving ou não
Comunicação de Áudio e Vídeo, Fernando Pereira
Resumo dos Processos de Codificação: Processo Hierárquico Resumo dos Processos de Codificação: Resumo dos Processos de Codificação: Processo Hierárquico Processo Hierárquico
Modo hierárquico Múltiplas tramas (diferenciais ou não) Usa processos extensão baseados na DC[ ou processo sem perdas Descodificadores devem admitir imagens com 1, 2, 3 ou 4 componentes Varrimentos com interleaving ou não
Comunicação de Áudio e Vídeo, Fernando Pereira
Outros Formatos: Bitmap (BMP) Outros Outros Formatos Formatos: : Bitmap Bitmap (BMP) (BMP)
Formato BMP inclui normalmente um cabeçalho, os dados de imagem
e informação adicional, p.e. palette de cores.
A informação de imagem pode corresponder a amostras PCM ou a
índices de uma palette de cores.
A informação de imagem pode estar estruturada de vários modos, p.e.
por amostras, por componentes, etc.
Vantagens: fácil de criar,
de aceder a uma dada posição, de alterar um pixel ou mais
Desvantagens: Pouco
eficiente (não tem compressão)
Comunicação de Áudio e Vídeo, Fernando Pereira
Outros Formatos: Graphics Interchange Format (GIF) Outros Outros Formatos Formatos: : Graphics Interchange Graphics Interchange Format Format (GIF) (GIF)
Permite armazenar várias imagens do tipo BMP num mesmo ficheiro
mas sempre do tipo RGB
Informação de imagem sempre codificada com algoritmo Lempel-Ziv-
Welch (LZW); compressões de 40% ou mais para imagens com 8 bit/amostra
Informação estruturada como sequência de pacotes Máximo dimensão da imagem: 64 K ×
× × × 64 K
Número de bit/amostra: 1 a 8
Comunicação de Áudio e Vídeo, Fernando Pereira
Outros Formatos: Tag Image File Format (TIFF) Outros Outros Formatos Formatos: : Tag Image File Format Tag Image File Format (TIFF) (TIFF)
Permite armazenar várias imagens do tipo BMP num mesmo
ficheiro
Informação de imagem pode não ser codificada ou ser codificada
com os algoritmos LZW, RLE, Fax grupo 3, Fax grupo 4, JPEG
Máximo dimensão da imagem: 232 - 1 pixels Número de bit/amostra: 1 a 24 Vantagens: Muito flexível e variado
Comunicação de Áudio e Vídeo, Fernando Pereira
Bibliografia Bibliografia Bibliografia
JPEG: Still Image Data Compression Standard, William
Pennebaker, Joan Mitchell, Kluwer Academic Publishers, 1993
Image and Video Compression Standards: Algorithms and
Architectures, Vasudev Bhaskaran and Konstantinos Konstantinides, Kluwer Academic Publishers, 1995
Digital Image Compression Techniques, Majid Rabbani, Paul W.
Jones, SPIE Press, Tutorial texts on Optical Engineering, 1991