Video Group CS MSU Graphics & Media Lab - - PowerPoint PPT Presentation

video group cs msu graphics media lab
SMART_READER_LITE
LIVE PREVIEW

Video Group CS MSU Graphics & Media Lab - - PowerPoint PPT Presentation

Video Group CS MSU Graphics & Media Lab Only for Maxus


slide-1
SLIDE 1

Способы построения и оценки карт салиентности

Максим Харенко

Video Group CS MSU Graphics & Media Lab

slide-2
SLIDE 2

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

Содержание

 Введение  Реализованные модели  A Novel Multiresolution Spatiotemporal

Saliency Detection Model

 Nonparametric Bottom-Up Saliency Detection

by Self-Resemblance

 Сравнение и оценка качества  Заключение

2

slide-3
SLIDE 3

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

Введение

 Салиентность – это термин обозначающий

свойство объекта, человека, пикселя и т.д. выделяться на фоне группы других, соседних объектов того же типа

 Карты салиентности – вероятность того,

что при первом взгляде человек обратит внимание на конкретные пиксели

3

slide-4
SLIDE 4

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus  Введение

Применение карт салиентности

Сегментация (im, v)

Распознавание объектов (im, v)

Удаление объектов из видео (v)

Зрение роботов (v)

Сжатие (im, v)

Auto Focus (im, v)

Image & video description (im, v)

  • S. Goferman, L. Zelnik-Manor, and A. Tal, “Context-aware

saliency detection,” CVPR, 2010

4

Создание коллажей (im)

Image thumbnailing (im)

Image and video retargeting (im, v)

Art effects (im, v)

Content-aware resize (im)

Web design (im)

slide-5
SLIDE 5

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

Содержание

 Введение  Реализованные модели  A Novel Multiresolution Spatiotemporal

Saliency Detection Model

 Nonparametric Bottom-Up Saliency Detection

by Self-Resemblance

 Сравнение и оценка качества  Заключение

6

slide-6
SLIDE 6

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus  Реализованные модели

Contex-aware saliency

 Рассмотривается окрестность некоторого пикселя

(квадратный патч вокруг него)

 В изображении ищется k (64 в статье) наиболее

похожих патчей

 Оценивается уникальность этого пикселя

7

Результаты нашей реализации

  • S. Goferman, L. Zelnik-Manor, and A. Tal, “Context-aware

saliency detection,” CVPR, 2010

slide-7
SLIDE 7

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus  Реализованные модели

Saliency from face detection

8

Результаты нашей реализации

 Лица ищутся с помощью Viola/Jones Face Detector  На их месте создаются салиентные области

slide-8
SLIDE 8

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus  Реализованные модели

Saliency from motion

 Оценивается global motion  Оценивается loсal motion  Салиентность в каждой точке считается как

разность loсal и global motion

9

Результаты нашей реализации

slide-9
SLIDE 9

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus  Реализованные модели

Saliency from spectral residual

  • X. Hou and L. Zhang, “Saliency detection: A spectral residual

Approach,” CVPR, 2007

10

Saliency map Input image

slide-10
SLIDE 10

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

Содержание

 Введение  Реализованные модели  A Novel Multiresolution Spatiotemporal

Saliency Detection Model

 Nonparametric Bottom-Up Saliency Detection

by Self-Resemblance

 Сравнение и оценка качества  Заключение

11

slide-11
SLIDE 11

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

Особенности модели

 Phase Quaternion Fourier Transform  Hierarchical selectivity  Multiresolution approach  Wavelet domain foveation model

Chenlei Guo and Liming Zhang, “A novel multiresolution spatiotemporal saliency detection model and its applications in image and video compression,” Trans. Img. Proc., 2010

12

slide-12
SLIDE 12

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus  Novel Quaternion

Representation of an Image

Для входного кадра F(t) рассчитываются функции:

Chenlei Guo and Liming Zhang, “A novel multiresolution spatiotemporal saliency detection model and its applications in image and video compression,” Trans. Img. Proc., 2010

13

slide-13
SLIDE 13

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus  Novel Quaternion

Representation of an Image

 Цветовые каналы представляются в виде:  Каналы яркости и движения рассчитываются:

t – пользовательский параметр задержки

Chenlei Guo and Liming Zhang, “A novel multiresolution spatiotemporal saliency detection model and its applications in image and video compression,” Trans. Img. Proc., 2010

14

slide-14
SLIDE 14

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus  Novel Quaternion

Representation of an Image

 Кадр F(t) переводится в квантернионное

изображение q(t): где mi, ш = 1, 2, такое, что:

 и представляется в форме:

Chenlei Guo and Liming Zhang, “A novel multiresolution spatiotemporal saliency detection model and its applications in image and video compression,” Trans. Img. Proc., 2010

15

slide-15
SLIDE 15

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

Quaternion Fourier Transform

QFT можно посчитать, используя два стандартных

FFT: (n,m) и (u,v) – положение пикселя в пространственных и частотных координатах

Chenlei Guo and Liming Zhang, “A novel multiresolution spatiotemporal saliency detection model and its applications in image and video compression,” Trans. Img. Proc., 2010

16

slide-16
SLIDE 16

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

Phase QFT

Обратная преобразование рассчитывается при помощи замены знака у экспоненты и индексов суммирования: Таким образом, построено представление частотного домена Q(t) для q(t): где Ф(t) – спектр фаз; м – элементарный кватернион Если установить ||Q(t)|| =1, то останется только интересующая фазовая составляющая

Chenlei Guo and Liming Zhang, “A novel multiresolution spatiotemporal saliency detection model and its applications in image and video compression,” Trans. Img. Proc., 2010

17

slide-17
SLIDE 17

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

PQFT(1)

Используя обратное преобразование, считается реконструкция Q(t) обозначаемая q’(t), которая может быть представлена в виде: Тогда пространственно-временная карта салиентности где g –2-D фильтр гаусса с дисперсией с

Chenlei Guo and Liming Zhang, “A novel multiresolution spatiotemporal saliency detection model and its applications in image and video compression,” Trans. Img. Proc., 2010

18

slide-18
SLIDE 18

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

PQFT(2)

Пусть , тогда

Chenlei Guo and Liming Zhang, “A novel multiresolution spatiotemporal saliency detection model and its applications in image and video compression,” Trans. Img. Proc., 2010

19

slide-19
SLIDE 19

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

Поиск focus of attention (FoA)

Есть построенная sM(t) для кадра F(t) в момент времени t

smi(t) = sM(t) , smi(t) – i-я карта салиентности

Oma – наибольшая салиентная область в sdfsdf c координатами

i-тый object candidate area (OCA) вычисляется:

Найденная область обнуляется

Поиск не заканчивается пока для текущего i:

Chenlei Guo and Liming Zhang, “A novel multiresolution spatiotemporal saliency detection model and its applications in image and video compression,” Trans. Img. Proc., 2010

20

slide-20
SLIDE 20

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus  Поиск focus of attention

Варьирование переменных

Chenlei Guo and Liming Zhang, “A novel multiresolution spatiotemporal saliency detection model and its applications in image and video compression,” Trans. Img. Proc., 2010

21

slide-21
SLIDE 21

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus  Hierarchical Selectivity PQFT

Алгоритм

Предположение: “there may be a hierarchy of units of attention, ranging from intraobject surfaces and parts to multiobject surfaces and perceptual groups”

Количество уровней иерархии Y задается как параметр (в статье y = 3 )

Рассчитываются карты салиентности размером 64x64, 128x128 и 256x256

Chenlei Guo and Liming Zhang, “A novel multiresolution spatiotemporal saliency detection model and its applications in image and video compression,” Trans. Img. Proc., 2010

22

Древовидное представление изображения «sheeps»

slide-22
SLIDE 22

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus  Hierarchical Selectivity PQFT

“coarse to fine” подход

Chenlei Guo and Liming Zhang, “A novel multiresolution spatiotemporal saliency detection model and its applications in image and video compression,” Trans. Img. Proc., 2010

23

slide-23
SLIDE 23

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus  Hierarchical Selectivity PQFT

Уровни на изображении

Chenlei Guo and Liming Zhang, “A novel multiresolution spatiotemporal saliency detection model and its applications in image and video compression,” Trans. Img. Proc., 2010

24

slide-24
SLIDE 24

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus  Multiresolution Wavelet

Domain Foveation Model

Chenlei Guo and Liming Zhang, “A novel multiresolution spatiotemporal saliency detection model and its applications in image and video compression,” Trans. Img. Proc., 2010

25

slide-25
SLIDE 25

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

Сжатие с WDFW

Chenlei Guo and Liming Zhang, “A novel multiresolution spatiotemporal saliency detection model and its applications in image and video compression,” Trans. Img. Proc., 2010

26

Compressed size = 328 Kb Original size = 628 Kb

slide-26
SLIDE 26

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

Сжатие с HS-MWDF

Chenlei Guo and Liming Zhang, “A novel multiresolution spatiotemporal saliency detection model and its applications in image and video compression,” Trans. Img. Proc., 2010

27

Compressed size = 261 Kb Original size = 628 Kb

slide-27
SLIDE 27

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

Сжатие видео

Chenlei Guo and Liming Zhang, “A novel multiresolution spatiotemporal saliency detection model and its applications in image and video compression,” Trans. Img. Proc., 2010

28

slide-28
SLIDE 28

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus  Сравнение с картами

фиксаций изображений

Chenlei Guo and Liming Zhang, “A novel multiresolution spatiotemporal saliency detection model and its applications in image and video compression,” Trans. Img. Proc., 2010

29

slide-29
SLIDE 29

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

Выводы

 Достоинства:

 Real-time  Временные и цветовые каналы  Устойчивость к высокотекстурированному фону

 Недостатоки:

 Сравнение только со схожими или слабыми моделями  Высокая чувствительность к разрешению

30

slide-30
SLIDE 30

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

Содержание

 Введение  Реализованные модели  A Novel Multiresolution Spatiotemporal

Saliency Detection Model

 Nonparametric Bottom-Up Saliency

Detection by Self-Resemblance

 Сравнение и оценка качества  Заключение

31

slide-31
SLIDE 31

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus  Saliency Detection

by Self-Resemblance

1.

Расчет local steering kernels

2.

Для каждого пикселя строится матрица F center+surrounding region

3.

Салиентность пикселя определяется с помощью алгоритма self-resemblance

Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009

32 Graphical overview of saliency detection system

slide-32
SLIDE 32

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

2-D Local Steering Kernel

Анализируя расстояния, основанные на посчитанных градиентах, получают локальную структуру изображения Эта информация и определяет форму и размер ядра Для каждого пикселя xi моделируется Local Steering Kernel: P – матрица ковариации P – количество пикселей в локальном окне h – сглаживающий параметр

Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009

33

slide-33
SLIDE 33

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

3-D Local Steering Kernel

Local Steering Kernel для центра xi = asdasddz1z2z3z3z – первые производные по соответствующим осям

Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009

34

slide-34
SLIDE 34

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

LSK-weights

K(xl-xi) )) рассчитывается для каждого x и нормализуется весами:

Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009

35

Устойчивость и надежность LSK-весов

slide-35
SLIDE 35

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

Вероятностная модель(1)

– center feature matrix для – center + surrounding region feature matrix L – количество feature vectors в N – количество feature matrix в

Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009

36

slide-36
SLIDE 36

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

Вероятностная модель(2)

 Введем случайную величину  Салиентность х определяется как вероятность:

Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009

37

slide-37
SLIDE 37

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

Вероятностная модель(3)

 По теореме Байеса:  Требуется оценить условную вероятность

p(F|y= 1)

 Для этого используется nonparametric kernel

density estimation

Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009

38

slide-38
SLIDE 38

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

Когда оценивается плотность вероятности в конкретной feature point, ядро, с центром в этой точке, распространяет плотность масс поровну во всех пространственных направлениях, уделяя много внимания незначимым областям и мало внимания важным Поэтому строится нормализованная функция:

||.||F – Frobenious norm б – параметр, контролирующий стабильность весов

Self-resemblanse

Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009

39

slide-39
SLIDE 39

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus  Self-resemblanse

Матрица похожести LSK-векторов

Функция G(. переписывается в виде: где p( Fi, Fj ) – матрица похожести между Fi и Fj, определяемая как “Frobenius inner product”: Эта матрица представляется в виде взвешенной суммы похожестей p(fi,fj) между каждой парой LSK-векторов:

Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009

40

slide-40
SLIDE 40

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

Self-resemblanse

Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009

41

Пример на психологическом шаблоне

slide-41
SLIDE 41

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

Self-resemblanse

Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009

42

Пример на изображении

slide-42
SLIDE 42

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus  Self-resemblanse

Салиентность

Салиентность в пикселе x (S = (sdfsdfsdfdfsdfsfs)) это центральное значение нормализованной весовой функции G()

Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009

43

slide-43
SLIDE 43

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus  Self-resemblanse

Обработка цветовых каналов

44

Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009

slide-44
SLIDE 44

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

Сравнение методов(1)

Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009

45

slide-45
SLIDE 45

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

Сравнение методов(2)

Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009

46

slide-46
SLIDE 46

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus  Схема построения

space-time saliency map

Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009

47

slide-47
SLIDE 47

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

Примеры на видео

Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009

48

slide-48
SLIDE 48

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

Выводы

 Достоинства:

 Оригинальная вероятностная модель  Альтернатива ME и OF при построении SM во времени  Использование цветов

 Предположительный недостаток:

 Низкая скорость на HD при большом размере окна

окрестностей

Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009

49

slide-49
SLIDE 49

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

Содержание

 Введение  Реализованные модели  A Novel Multiresolution Spatiotemporal

Saliency Detection Model

 Nonparametric Bottom-Up Saliency Detection

by Self-Resemblance

 Сравнение и оценка качества  Заключение

50

slide-50
SLIDE 50

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

Оценка качества saliency map

 В задачах обнаружения объектов – количество

правильно распознанных объектов

 В задачах сегментации – сравнение точности

границ сегментов

 Визуальное сравнение: группу людей просят

показать «важные» регионы изображения

 Бинарная ручная разметка изображений

и подсчет площади под ROC-кривой

 Объективное и субъективное сравнение с

результатами eye-tracking

51

slide-51
SLIDE 51

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

Оценка качества saliency map

Eye tracking(1)

В ходе эксперимента испытуемый смотрит в экран

Плавное последовательное движение глаза, когда наблюдатель следит за происходящим на экране, регистрируется аппаратом как фиксация

Фиксации всех зрителей объединяются в карты фиксаций

Hani Alersa, Judith A. Redia, and Ingrid Heynderickxa, “Examining the effect of task on viewing behavior in videos using saliency maps,” Human Vision and Electronic Imaging XVII, 2012

52

Система слежения за глазами

slide-52
SLIDE 52

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

Оценка качества saliency map

Eye tracking(2)

Карты фиксаций нормализуют [0,1] с помощью весов Гаусса

Получается представление вероятности, пиксель в пиксель, что среднестатистический зритель зафиксирует конкретный пиксель

Henderson, J.M.: Diem video and eye tracking database. (http://thediemproject.wordpress.com/)

53

slide-53
SLIDE 53

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

Базы eye-tracking видео

 TUD

 Eye-tracking видео от 24 человек  Разрешение 1280x720  Сцены из фильмов

 DIEM

 Eye-tracking видео от 30 до 100 человек  Разрешение SD,HD  Фильмы, трейлеры, новости, спорт, реклама,

анимация, документалистика

54

slide-54
SLIDE 54

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

Оценка качества saliency map

Как же автоматически сравнивать с GT?

Hani Alersa, Judith A. Redia, and Ingrid Heynderickxa, “Examining the effect of task on viewing behavior in videos using saliency maps,” Human Vision and Electronic Imaging XVII, 2012

55

motion frequency contrast

slide-55
SLIDE 55

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus  Сравнение метрикой

SAD

56

10 20 30 40 50 60 70 80 90 100 Мotion Frequency Contrast 10 20 30 40 50 60 70 80 90 100

DIEM TUD SAD

slide-56
SLIDE 56

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus  Сравнение метрикой

NCC

57

DIEM TUD

0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 Мotion Frequency Contrast

NCC =

slide-57
SLIDE 57

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus  Сравнение метрикой

PSNR

58

DIEM TUD

2 4 6 8 10 12 14 16 18 20 5 10 15 20 25 30 Мotion Frequency Contrast

slide-58
SLIDE 58

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus  Сравнение метрикой

Моя метрика

59

Ground truth Saliency map Gt(i) Sm(i) LMM = Med((Abs(Gt(i)-Sm(i))) LMA = Sum((Abs(Gt(i)-Sm(i)))/N Gt – вектор значений локальных максимумов на Ground truth Sm – вектор значений соответствующих координат на Saliency map N – количество найденных максимумов

slide-59
SLIDE 59

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus  Сравнение метрикой

LMM

60

DIEM TUD

50 100 150 200 250 300 50 100 150 200 250 Мotion Frequency Contrast

slide-60
SLIDE 60

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus  Сравнение метрикой

LMA

61

DIEM TUD

50 100 150 200 250 Мotion Frequency Contrast 20 40 60 80 100 120 140 160 180 200

slide-61
SLIDE 61

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus  Сравнение метрикой

Similarity

62

DIEM TUD

0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45 0,5 0,1 0,2 0,3 0,4 0,5 0,6 0,7 Мotion Frequency Contrast

Tilke Judd, Fredo Durand and Antonio Torralba, "A Benchmark of Computational Models of Saliency to Predict Human Fixations,” PAMI ,2012

slide-62
SLIDE 62

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

Субъективное тестирование

63

DIEM TUD

2 4 6 8 10 12 14 16 18 20 2 4 6 8 10 12 14 16 18 20 Мotion Frequency Contrast

Суммарные результаты шести человек

slide-63
SLIDE 63

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

Оценка метрик для DIEM

64

10 20 30 40 50 60 70 SAD NCC PSNR LMM LMA Similarity 20 40 60 80 100 120 140 160

Баллы: ABC=3 ACB=2 BAC=2 CAB=1 BCA=1 CBA =0 Баллы: ABC=9 ACB=4 BAC=4 CAB=1 BCA=1 CBA =0 Max = 30*3=90 Max = 30*9=270

slide-64
SLIDE 64

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

Оценка метрик для TUD

65

Баллы: ABC=3 ACB=2 BAC=2 CAB=1 BCA=1 CBA =0 Баллы: ABC=9 ACB=4 BAC=4 CAB=1 BCA=1 CBA =0 Max = 20*3=60 Max = 20*9=180

10 20 30 40 50 60 SAD NCC PSNR LMM LMA Similarity 20 40 60 80 100 120 140 160

slide-65
SLIDE 65

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

Содержание

 Введение  Реализованные модели  A Novel Multiresolution Spatiotemporal

Saliency Detection Model

 Nonparametric Bottom-Up Saliency Detection

by Self-Resemblance

 Сравнение и оценка качества  Заключение

66

slide-66
SLIDE 66

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

Заключение

 Улучшить SR до PQFT  Saliency Detection by Self-Resemblance хорошая

модель, идеи можно использовать как улучшение модели Context-aware

 Для обучения классификатора на результатах eye-

tracking стоит использовать метрику similarity или комбинацию similarity+LMA

67

slide-67
SLIDE 67

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

Литература

1.

  • S. Goferman, L. Zelnik-Manor, and A. Tal, “Context-aware saliency

detection,” CVPR, 2010.

2.

  • X. Hou and L. Zhang, “Saliency detection: A spectral residual

Approach”, CVPR, 2007.

3.

Hani Alersa, Judith A. Redia, and Ingrid Heynderickxa, “Examining the effect of task on viewing behavior in videos using saliency maps,” Human Vision and Electronic Imaging XVII, 2012.

4.

Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009.

5.

Henderson, J.M.: Diem video and eye tracking database. (http://thediemproject.wordpress.com/)

6.

Tilke Judd, Fredo Durand and Antonio Torralba, “A Benchmark of Computational Models of Saliency to Predict Human Fixations,” PAMI, 2012.

68

slide-68
SLIDE 68

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus 

Вопросы?

69

slide-69
SLIDE 69

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus  Лаборатория компьютерной

графики и мультимедиа

Видеогруппа — это:

 Выпускники в аспирантурах

Англии, Франции, Швейцарии (в России в МГУ и ИПМ им. Келдыша)

 Выпускниками защищены 5 диссертаций  Наиболее популярные в мире сравнения

видеокодеков

 Более 3 миллионов скачанных фильтров

обработки видео

70