OVERVIEW ¡OF ¡DATA ¡ EXPLORATION ¡TECHNIQUES ¡
Stratos ¡Idreos, ¡Olga ¡Papaemmanouil, ¡Surajit ¡Chaudhuri ¡ SIGMOD ¡2015, ¡Melbourne ¡
OVERVIEW OF DATA EXPLORATION TECHNIQUES Stratos Idreos, - - PowerPoint PPT Presentation
OVERVIEW OF DATA EXPLORATION TECHNIQUES Stratos Idreos, Olga Papaemmanouil, Surajit Chaudhuri SIGMOD 2015, Melbourne USER INTERACTION express collaborate
Stratos ¡Idreos, ¡Olga ¡Papaemmanouil, ¡Surajit ¡Chaudhuri ¡ SIGMOD ¡2015, ¡Melbourne ¡
User ¡Interface ¡Layer ¡
User ¡Interface ¡Layer ¡
User ¡Interface ¡Layer ¡ Data ¡ Visualiza=on ¡
User ¡Interface ¡Layer ¡ Data ¡ Visualiza=on ¡ Explora=on ¡ ¡ Interface ¡
User ¡Interface ¡Layer ¡ Data ¡ Visualiza=on ¡ Explora=on ¡ ¡ Interface ¡
User ¡Interface ¡Layer ¡ Data ¡ Visualiza=on ¡ Explora=on ¡ ¡ Interface ¡
TIMBER ¡
(1,1) ¡ (M,1) ¡ (1,i) ¡
TIMBER, ¡VLDB’82 ¡ ¡
data ¡ ¡ cubes ¡ Polaris ¡
back-‑end ¡ ¡ queries ¡
Polaris, ¡INFOVIS ¡‘02 ¡ ¡
data ¡ ¡ cubes ¡ Polaris ¡ back-‑end ¡queries: ¡data ¡selecSon, ¡parSSon ¡into ¡panes ¡
back-‑end ¡ ¡ queries ¡ specificaSons ¡ (abributes) ¡
Polaris, ¡INFOVIS ¡2002 ¡ ¡
data ¡ ¡ cubes ¡ Polaris ¡ back-‑end ¡queries: ¡data ¡transformaSons ¡ ¡ (group, ¡sort, ¡aggregate ¡within ¡each ¡pane) ¡ ¡
back-‑end ¡ ¡ queries ¡ transformaSons ¡ (group ¡by, ¡sort) ¡
Polaris, ¡INFOVIS ¡2002 ¡ ¡
data ¡ ¡ cubes ¡ Polaris ¡
back-‑end ¡ ¡ queries ¡ mappings ¡ (shape, ¡size, ¡color) ¡ back-‑end ¡queries: ¡graphical ¡transformaSons ¡(renter ¡and ¡visualize) ¡
Polaris, ¡INFOVIS ¡2002 ¡ ¡
Sky ¡View ¡ ¡
AstroShelf, ¡SIGMOD ¡‘12 ¡
Sky ¡View ¡ ¡ Live ¡Annota=ons ¡
AstroShelf, ¡SIGMOD ¡‘12 ¡
Sky ¡View ¡ ¡ Live ¡Annota=ons ¡
AstroShelf, ¡SIGMOD ¡‘12 ¡
User ¡Interface ¡Layer ¡ Data ¡ Visualiza=on ¡ Explora=on ¡ ¡ Interface ¡
User ¡Interface ¡Layer ¡ Data ¡ Visualiza=on ¡
VizDeck ¡
VizDeck, ¡SIGMOD ¡‘12 ¡
sales ¡over ¡Sme ¡ % ¡sales/ ¡region ¡ ¡ user ¡ ¡ query ¡ Q1 ¡
¡
Q2 ¡ … ¡ Qn ¡
informa=ve ¡ queries ¡
SeeDB, ¡ ¡PVLDB‘13 ¡
User ¡Interface ¡Layer ¡ Data ¡ Visualiza=on ¡ Explora=on ¡ ¡ Interface ¡
user ¡ ¡ query ¡ query ¡ ¡ results ¡ ¡
Visualiza=on ¡ Scalar, ¡ ¡Big ¡Data ¡Vis ¡‘13 ¡
user ¡ ¡ query ¡ query ¡ ¡ results ¡ ¡ Visualiza=on ¡ user ¡ ¡ query ¡ reduced ¡ results ¡ ¡
Visualiza=on ¡ Data ¡ ¡ Reduc=on ¡
Scalar, ¡ ¡Big ¡Data ¡Vis ¡‘13 ¡
Visualiza=on ¡ SELECT ¡X, ¡AVG(Y) ¡ FROM ¡R(X,Y) ¡ GROUP ¡BY ¡X ¡ ¡ reduced ¡ results ¡ ¡
chart ¡ approximate ¡ ¡ chart ¡
user ¡ ¡ query ¡ Sampling ¡ Blais ¡et ¡al, ¡PVLDB ¡‘15 ¡
Visualiza=on ¡ SELECT ¡X, ¡AVG(Y) ¡ FROM ¡R(X,Y) ¡ GROUP ¡BY ¡X ¡ ¡ reduced ¡ results ¡ ¡ approximate ¡ ¡ chart ¡ user ¡ ¡ query ¡ Sampling ¡
Blais ¡et ¡al, ¡PVLDB ¡‘15 ¡
Visualiza=on ¡ SELECT ¡X, ¡AVG(Y) ¡ FROM ¡R(X,Y) ¡ GROUP ¡BY ¡X ¡ ¡ reduced ¡ results ¡ ¡ approximate ¡ ¡ chart ¡ user ¡ ¡ query ¡ Sampling ¡
min ¡# ¡samples ¡ ¡ for ¡correct ¡order? ¡ Blais ¡et ¡al, ¡PVLDB ¡‘15 ¡
Visualiza=on ¡ SELECT ¡X, ¡AVG(Y) ¡ FROM ¡R(X,Y) ¡ GROUP ¡BY ¡X ¡ ¡ reduced ¡ results ¡ ¡ approximate ¡ ¡ chart ¡ user ¡ ¡ query ¡
#samples ¡ Group ¡1 ¡ Group ¡2 ¡ Group ¡3 ¡ Group ¡4 ¡ 1 ¡ [60,90] ¡ [20,50] ¡ [10,40] ¡ [40,70] ¡ 20 ¡ [64,84] ¡ [30,48] ¡ [15,35] ¡ [45,65] ¡ 21 ¡ [66,84], ¡I ¡ [30,48] ¡ [17,35] ¡ [46,64] ¡ 70 ¡ [66,84], ¡I ¡ [40,47] ¡ [17,32], ¡I ¡ [46,53] ¡
sampling ¡ ¡phases/ ¡ ¡confidence ¡intervals ¡ Sampling ¡ Blais ¡et ¡al, ¡PVLDB ¡‘15 ¡
user ¡ ¡ query ¡ query ¡ ¡ results ¡ ¡ Visualiza=on ¡
user ¡queries ¡ replicated ¡ db ¡opera=ons ¡ memory ¡opera=ons ¡
Ermac, ¡PVLDB ¡‘14 ¡
user ¡ ¡ query ¡ query ¡ ¡ results ¡ ¡ Visualiza=on ¡
visual ¡ ¡ specifica=ons ¡ ¡
transforma=ons ¡to ¡pixel ¡space ¡ visual ¡op=miza=ons ¡ reduced ¡ ¡ rendering ¡=me ¡
Ermac, ¡PVLDB ¡‘14 ¡
User ¡Interface ¡Layer ¡ Data ¡ Visualiza=on ¡ Explora=on ¡ ¡ Interface ¡
User ¡Interface ¡Layer ¡ Data ¡ Visualiza=on ¡ Explora=on ¡ ¡ Interface ¡
SQL ¡query ¡ ¡ formulaSon ¡ result ¡ ¡ review ¡ predicate ¡ adjustment ¡ query ¡ ¡ execuSon ¡
long, ¡imprecise, ¡ ¡labor-‑intensive ¡process ¡
manual ¡
SQL ¡query ¡ ¡ formulaSon ¡ result ¡ ¡ review ¡ predicate ¡ adjustment ¡ query ¡ ¡ execuSon ¡
long, ¡imprecise, ¡ ¡labor-‑intensive ¡process ¡
capture ¡ user ¡interests ¡
query ¡execu=on ¡ reduce ¡ ¡ user ¡effort ¡ recommend ¡ data/queries ¡ manual ¡ auto ¡
SQL ¡query ¡ ¡ formulaSon ¡ result ¡ ¡ review ¡ predicate ¡ adjustment ¡ query ¡ ¡ execuSon ¡
long, ¡imprecise, ¡ ¡labor-‑intensive ¡process ¡
capture ¡ user ¡interests ¡
query ¡execu=on ¡ reduce ¡ ¡ user ¡effort ¡ recommend ¡ data/queries ¡ manual ¡ auto ¡
User ¡ Model ¡ Samples ¡ Space ¡ ¡ Explora=on ¡ decision ¡ ¡ tree ¡classifier ¡
relevant ¡ irrelevant ¡
sample ¡ extrac=on ¡ AIDE, ¡SIGMOD’14/ ¡VLDB’15 ¡
AIDE, ¡SIGMOD’14/ ¡VLDB’15 ¡
x ¡ x ¡ x ¡ x ¡ x ¡ x ¡ x ¡ x ¡ x ¡ √ ¡ √ ¡
√ ¡
AIDE, ¡SIGMOD’14/ ¡VLDB’15 ¡
√ ¡ √ ¡
√ ¡ √ ¡ x ¡ √ ¡
√ ¡
AIDE, ¡SIGMOD’14/ ¡VLDB’15 ¡
√ ¡ √ ¡ √ ¡ x ¡ √ ¡
√ ¡ √ ¡
AIDE, ¡SIGMOD’14/ ¡VLDB’15 ¡
query ¡
addi=onal ¡ ¡ results ¡ interes=ng ¡ queries ¡
results ¡
YMALDB ¡ YMALDB, ¡VLDBJ ¡’13 ¡
query ¡
addi=onal ¡ ¡ results ¡ interes=ng ¡ queries ¡
results ¡
YMALDB ¡ rank ¡ faSets ¡ freq(result)/ ¡ freq(DB) ¡
query ¡
extract ¡ ¡ query ¡faSets ¡ selecSon ¡predicates ¡ based ¡on ¡original ¡query ¡ expand ¡ ¡ adributes ¡ add ¡abributes ¡ from ¡table ¡schema ¡
top-‑k ¡ queries ¡
YMALDB, ¡VLDBJ ¡’13 ¡
query ¡
addi=onal ¡ ¡ results ¡ interes=ng ¡ queries ¡
results ¡
rank ¡ faSets ¡ freq(result)/ ¡ freq(DB) ¡ YMALDB ¡
query ¡
extract ¡ ¡ query ¡faSets ¡ selecSon ¡predicates ¡ based ¡on ¡original ¡query ¡ expand ¡ ¡ adributes ¡ add ¡abributes ¡ from ¡table ¡schema ¡
top-‑k ¡ queries ¡
!tle, ¡year, ¡genre ¡of ¡ Scorsese ¡movies ¡ !tle, ¡year, ¡genre, ¡country ¡ ¡of ¡Scorsese ¡movies ¡ many ¡Scorsese ¡movies ¡ are ¡related ¡to ¡Italy ¡
YMALDB, ¡VLDBJ ¡’13 ¡
User ¡Interface ¡Layer ¡ Data ¡ Visualiza=on ¡ Explora=on ¡ ¡ Interface ¡
SQL ¡query ¡(tedious) ¡ ¡ keywords ¡(intuiSve) ¡
relevant ¡& ¡irrelevant ¡data ¡ relevant ¡data ¡ keyword ¡search ¡
relevant ¡data ¡
SQLSUGG, ¡ICDE’11 ¡
Template ¡ ¡Repository ¡ “database ¡gray” ¡ template ¡on ¡Stle/authors? ¡ template ¡on ¡Stle? ¡
suggested ¡ ¡ ¡queries ¡ Template ¡ Matcher ¡ SQL ¡ ¡ Query ¡ Generator ¡ keywords ¡ Sample ¡ Results/ ¡ Visualiza=on ¡ ranked ¡ templates ¡
SQLSUGG, ¡ICDE’11 ¡
suggested ¡ ¡ ¡queries ¡ Template ¡ Matcher ¡ SQL ¡ ¡ Query ¡ Generator ¡ keywords ¡ Sample ¡ Results/ ¡ Visualiza=on ¡ ranked ¡ templates ¡
=tle ¡ year ¡
=tle ¡ year ¡ id=p_id ¡
Template ¡1 ¡ Template ¡2 ¡
Template ¡ ¡Repository ¡
template ¡generaSon ¡
SQLSUGG, ¡ICDE’11 ¡
¡template ¡relevance ¡= ¡f ¡(en=ty ¡relevance ¡& ¡importance) ¡ suggested ¡ ¡ ¡queries ¡ Template ¡ Matcher ¡ SQL ¡ ¡ Query ¡ Generator ¡ keywords ¡ Sample ¡ Results/ ¡ Visualiza=on ¡ ranked ¡ templates ¡
Template ¡ ¡Repository ¡
enSty ¡relevance ¡ ¡ ¡èkeyword ¡frequency ¡in ¡enSty ¡ ¡ enSty ¡importanceè ¡importance ¡of ¡ ¡data ¡nodes ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ relevant ¡ ¡template? ¡ ¡
SQLSUGG, ¡ICDE’11 ¡
inference ¡ algorithm ¡ informa=ve ¡ tuple ¡ Cartesian ¡ product ¡ goal ¡ join ¡ predicate ¡
table ¡A ¡
A1 ¡ A2 ¡ B1 ¡ B2 ¡
table ¡B ¡ sample ¡ BonifaS ¡et ¡al, ¡EDBT’14 ¡
inference ¡ algorithm ¡ informa=ve ¡ tuple ¡ Cartesian ¡ product ¡ table ¡A ¡ table ¡B ¡ goal ¡ join ¡ predicate ¡
A1 ¡ A2 ¡ B1 ¡ B2 ¡
(A1, ¡B1) ¡ (A1, ¡B2) ¡ (A2, ¡B1) ¡ (A1, ¡B1) ¡ (A1, ¡B2) ¡ (A1, ¡B1) ¡ (A2, ¡B1) ¡ (A1, ¡B1) ¡ (A2, ¡B2) ¡
sample ¡ candidate ¡predicates ¡ BonifaS ¡et ¡al, ¡EDBT’14 ¡
DataPlay, ¡PVLDB ¡’13 ¡
pivot ¡ ¡ relaSon ¡ query ¡/visualizaSon ¡ recommendaSons ¡ add, ¡remove ¡ query ¡constraints ¡
DataPlay, ¡PVLDB ¡’13 ¡
pivot ¡ ¡ relaSon ¡ query ¡ ¡ correcSons ¡ add, ¡remove ¡ results ¡
DataPlay, ¡PVLDB ¡’13 ¡
query ¡
Charles ¡
results ¡ queries ¡ ¡ selected ¡ query ¡
Charles, ¡CIDR ¡’13 ¡
query ¡
Charles ¡
results ¡ queries ¡ ¡ selected ¡ query ¡ <5 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡>5 ¡ ¡ <5 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡>5 ¡ <20 ¡ ¡ ¡ ¡<30 ¡ <5 ¡ ¡ ¡ ¡ ¡ ¡ ¡>5 ¡ >20 ¡ ¡ ¡ ¡>30 ¡ ¡ weight ¡ weight, ¡height ¡
Charles, ¡CIDR ¡’13 ¡
Merlin ¡
condi=onal ¡ ¡ query ¡ select ¡species ¡from ¡birds ¡ where ¡color= ¡{red: ¡80%, ¡blue: ¡20%} ¡
ranked ¡results ¡by ¡ ¡ match ¡probability ¡ sensi=vity ¡of ¡user ¡predicates ¡ query ¡refinements ¡w/ ¡ ¡ quality ¡improvement ¡
rank ¡ species ¡ 1 ¡ Bluebird ¡ 2 ¡ Blue ¡Jay ¡ adr ¡ sensi=vity ¡ color ¡ 18.6 ¡ adr ¡ quality ¡score ¡ size ¡ 83.3 ¡ legcolor ¡ 57.1 ¡ remaining ¡ ¡adributes ¡ result ¡quality ¡if ¡ ¡ added ¡in ¡the ¡query ¡ impact ¡on ¡ranking ¡
Merlin, ¡ICDE ¡’14 ¡
User ¡Interface ¡Layer ¡ Data ¡ Visualiza=on ¡ Explora=on ¡ ¡ Interface ¡
GestureDB, ¡CIDR ¡’13 ¡
touch ¡input ¡ quick ¡response ¡ dbTouch, ¡CIDR ¡’13 ¡
InteracSve ¡ExploraSon ¡through ¡ ¡ Data ¡Prefetching ¡& ¡Query ¡ApproximaSon ¡ ¡
SQL ¡query ¡ ¡ formulaSon ¡ result ¡ ¡ review ¡ predicate ¡ adjustment ¡ query ¡ ¡ execuSon ¡
approximate ¡ ¡ results ¡ ¡ query ¡ ¡ sampling ¡
Samples ¡
approximate ¡results ¡+ ¡confidence ¡bounds ¡ ¡ ¡ query ¡ Synopses ¡
Aqua ¡ ¡ transformed ¡ ¡ query ¡
samples ¡ histograms ¡ Aqua, ¡SIGMOD ¡’99 ¡
sampling ¡ ¡
columns ¡sets ¡
disk ¡ in-‑memory ¡ samples ¡across ¡ ¡ 1000s ¡machines ¡ select ¡avg(sessionTime) ¡ FROM ¡table ¡ WHERE ¡city=“SF” ¡ WITHIN ¡1 ¡SEC ¡
sample ¡selecSon ¡ Results ¡ 190+/-‑ ¡5.89 ¡ (95% ¡confidence) ¡
parallel ¡query ¡ ¡execu=on ¡on ¡ mul=ple ¡samples ¡across ¡ ¡ mul=ple ¡machines ¡ BlinkDB, ¡EuroSys ¡’13 ¡
approximate ¡ ¡ results ¡
Level ¡1 ¡
query ¡& ¡=me/error ¡ ¡ ¡ bounds ¡ ¡
Level ¡2 ¡ Level ¡3 ¡
SciBORG, ¡CIDR ¡’11 ¡
1. predict ¡follow-‑up ¡queries ¡ 2. execute ¡queries ¡ 3. cache ¡results ¡
DB ¡ Query ¡Formula=on ¡ user ¡wait ¡=me ¡ Query ¡Execu=on ¡ Result ¡Review ¡
=me ¡
1. predict ¡follow-‑up ¡queries ¡ 2. execute ¡queries ¡ 3. cache ¡results ¡
DB ¡ Query ¡Formula=on ¡ user ¡wait ¡=me ¡ Query ¡Execu=on ¡ Result ¡Review ¡
=me ¡
1. predict ¡follow-‑up ¡queries ¡ 2. execute ¡queries ¡ 3. cache ¡results ¡
DB ¡ Query ¡Formula=on ¡ user ¡wait ¡=me ¡ Query ¡Execu=on ¡ Result ¡Review ¡
=me ¡
explora=on ¡ space ¡reduc=on ¡ query ¡ enumera=on ¡ query ¡ ¡ ranking ¡
SELECT ¡AVG ¡(iops) ¡FROM ¡events ¡ WHERE ¡month=“m1” ¡AND ¡week=“w1” ¡ ¡ ¡ GROUP ¡BY ¡zone ¡ location itme month zone center rack week hour
user ¡query ¡
explora=on ¡ space ¡reduc=on ¡
DICE, ¡ICDE ¡’14 ¡
SELECT ¡AVG ¡(iops) ¡FROM ¡events ¡ WHERE ¡month=“m1” ¡AND ¡week=“w1” ¡ ¡ ¡ GROUP ¡BY ¡zone ¡ WHERE ¡month=“m1” ¡ ¡ ¡ ¡ WHERE ¡month=“m1” ¡ AND ¡week=“w1 ¡ ¡ AND ¡hour=“h1” ¡ ¡ ¡ ¡ WHERE ¡month=“m1” ¡ ¡ AND ¡week=“w2” ¡ ¡
parent ¡ child ¡ sibling ¡ user ¡query ¡
explora=on ¡ space ¡reduc=on ¡
¡cube ¡explora=on ¡operators ¡
location itme month zone center rack week hour
DICE, ¡ICDE ¡’14 ¡
Q(month=“m1”) ¡ Q(month ¡= ¡“m12”) ¡ Q(hour ¡=“h1”) ¡ Q(hour ¡=“ ¡h24”) ¡ Q(week=“w2”) ¡ Q(week=“w3”) ¡ specula=ve ¡queries ¡ ¡ … ¡ … ¡ … ¡
explora=on ¡ space ¡reduc=on ¡ query ¡ enumera=on ¡ SELECT ¡AVG ¡(iops) ¡FROM ¡events ¡ WHERE ¡month=“m1” ¡AND ¡week=“w1” ¡ ¡ ¡ GROUP ¡BY ¡zone ¡
user ¡query ¡
location itme month zone center rack week hour
DICE, ¡ICDE ¡’14 ¡
Q(month=“m1”) ¡ Q(month ¡= ¡“m12”) ¡ Q(hour ¡=“h1”) ¡ Q(hour ¡=“ ¡h24”) ¡ Q(week=“w2”) ¡ Q(week=“w3”) ¡ specula=ve ¡queries ¡ ¡ … ¡ … ¡ … ¡
explora=on ¡ space ¡reduc=on ¡ query ¡ enumera=on ¡ SELECT ¡AVG ¡(iops) ¡FROM ¡events ¡ WHERE ¡month=“m1” ¡AND ¡week=“w1” ¡ ¡ ¡ GROUP ¡BY ¡zone ¡
user ¡query ¡
query ¡ ¡ ranking ¡ location itme month zone center rack week hour
DICE, ¡ICDE ¡’14 ¡
Query ¡Formula=on ¡ user ¡wait ¡=me, ¡t ¡ Result ¡Review ¡ DB ¡
Specula=ve ¡ Execu=on ¡ Query ¡Execu=on ¡
74 ¡
=me ¡
DICE, ¡ICDE ¡’14 ¡
Query ¡Formula=on ¡ user ¡wait ¡=me, ¡t ¡ Result ¡Review ¡ DB ¡
Specula=ve ¡ Execu=on ¡ Query ¡Execu=on ¡
75 ¡
QUERY ¡ Probability ¡ Exec ¡Time ¡
Q1 ¡ 0.3 ¡ 22 ¡ Q2 ¡ 0.25 ¡ 20 ¡ Q3 ¡ 0.25 ¡ 35 ¡ Q4 ¡ 0.15 ¡ 70 ¡ Q5 ¡ 0.05 ¡ 35 ¡
=me ¡
DICE, ¡ICDE ¡’14 ¡
DB ¡ Query ¡1 ¡ Execu=on ¡ Query ¡2 ¡
Query ¡3 ¡ Execu=on ¡ prefetching ¡ ¡window ¡ prefetching ¡ ¡window ¡
=me ¡
Execu=on ¡
Kalinin ¡et ¡al, ¡SIGMOD ¡’14 ¡
Kalinin ¡et ¡al, ¡SIGMOD ¡’14 ¡
Kalinin ¡et ¡al, ¡SIGMOD ¡’14 ¡
query ¡
diversified ¡ results ¡ ¡ k ¡representa=ve ¡tuples ¡with ¡ max ¡total ¡ ¡pairwise ¡distance ¡
d(T1, ¡T3) ¡
random ¡ ¡ tuple ¡ d ¡(T2, ¡T3) ¡ d(T4, ¡T3) ¡ d(T5, ¡T3) ¡
query ¡
diversified ¡ results ¡ ¡ k ¡representa=ve ¡tuples ¡with ¡ max ¡total ¡ ¡pairwise ¡distance ¡
d(T1, ¡T3) ¡
random ¡ ¡ tuple ¡ d ¡(T2, ¡T3) ¡ d(T4, ¡T3) ¡ d(T5, ¡T3) ¡
d ¡(T2, ¡T1)+ ¡d(T2,T3) ¡ d ¡(T4, ¡T1)+d(T4, ¡T3) ¡ d ¡(T5, ¡T1)+d(T5, ¡T3) ¡
query ¡
diversified ¡ results ¡ ¡ k ¡representa=ve ¡tuples ¡with ¡ max ¡total ¡ ¡pairwise ¡distance ¡
d(T1, ¡T3) ¡
random ¡ ¡ tuple ¡ d ¡(T2, ¡T3) ¡ d(T4, ¡T3) ¡ d(T5, ¡T3) ¡
d ¡(T2, ¡T1)+ ¡d(T2,T1) ¡ d ¡(T4, ¡T1)+d(T4, ¡T3) ¡ d ¡(T5, ¡T1)+d(T5, ¡T3) ¡
query ¡
diversified ¡ results ¡ ¡ k ¡representa=ve ¡tuples ¡with ¡ max ¡total ¡ ¡pairwise ¡distance ¡
¢ ¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢ ¡
¢ ¡
¢ ¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢ ¡
DivIDE, ¡SSDBM’14 ¡
query ¡ ¡ Cached ¡ Diversified ¡ Results ¡ reusable ¡results ¡ query ¡results ¡ divide ¡ ¡ search ¡ space ¡ reusable ¡ ¡ diversified ¡ ¡ results ¡ new ¡ ¡ query ¡ ¡ results ¡ model ¡ ¡ based ¡
selec=on ¡ diversified ¡results ¡ ¡
DivIDE, ¡SSDBM’14 ¡
SCOUT, ¡VLDB’12 ¡