Cross-Domain Recommendations via Segmented Models Shaghayegh - - PowerPoint PPT Presentation

cross domain recommendations via segmented models
SMART_READER_LITE
LIVE PREVIEW

Cross-Domain Recommendations via Segmented Models Shaghayegh - - PowerPoint PPT Presentation

Cross-Domain Recommendations via Segmented Models Shaghayegh Sahebi (Sherry) *, Trevor Walker + * Intelligent Systems Program, University of Pi>sburgh + Linkedin


slide-1
SLIDE 1

Cross-Domain Recommendations via Segmented Models

Shaghayegh ¡Sahebi ¡(Sherry)*, ¡Trevor ¡Walker+ ¡ ¡

* ¡Intelligent ¡Systems ¡Program, ¡University ¡of ¡Pi>sburgh ¡

+ ¡Linkedin ¡

¡

slide-2
SLIDE 2

Cross-­‑Domain ¡Recommenda0on ¡

  • Recommenda0on ¡in ¡mul0-­‑domain ¡environment ¡
  • Domain ¡

– Type ¡of ¡item ¡ – Systems ¡ – Temporal ¡ – Different ¡data ¡distribu0on ¡in ¡domains ¡

  • Mostly ¡in ¡collabora0ve ¡filtering ¡
  • Ignoring ¡user-­‑side ¡domains ¡

Sherry ¡Sahebi ¡ 2 ¡

slide-3
SLIDE 3

Our ¡Contribu0ons ¡

  • A ¡generic ¡framework ¡for ¡content-­‑based ¡cross-­‑domain ¡

recommenda0ons ¡

– can ¡be ¡used ¡with ¡various ¡classifiers ¡

  • An ¡efficient ¡method ¡of ¡feature ¡augmenta0on ¡
  • Defining ¡user-­‑based ¡domains ¡

– Meta-­‑data ¡features ¡ – Indicator ¡features ¡

  • Implementa0on ¡using ¡logis0c ¡regression ¡

Sherry ¡Sahebi ¡ 3 ¡

slide-4
SLIDE 4

Domains ¡in ¡Job ¡Recommenda0on ¡

  • Different ¡popula0ons, ¡different ¡expecta0ons ¡ ¡
  • Meta-­‑data ¡features ¡

– User’s ¡job ¡func0on ¡

  • E.g. ¡Arts ¡vs. ¡Legal ¡

– User’s ¡job ¡industry ¡

Sherry ¡Sahebi ¡ 4 ¡

Skills ¡ Degrees ¡

slide-5
SLIDE 5

Ways ¡to ¡model ¡cross-­‑domain ¡ recommenders ¡

  • One ¡shared ¡model ¡for ¡all ¡domains ¡

– Missing ¡the ¡details ¡

  • Separate ¡models ¡for ¡each ¡domain ¡

– Loose ¡common ¡cross-­‑domain ¡informa0on ¡

  • Both ¡shared ¡and ¡domain ¡specific ¡models ¡

– Shared ¡informa0on ¡between ¡the ¡domains ¡ ¡ – Domain-­‑specific ¡behavior ¡

Sherry ¡Sahebi ¡ 5 ¡

slide-6
SLIDE 6

Our ¡Framework: ¡ ¡ Segmented ¡Model ¡

  • A ¡trade ¡off ¡between ¡bias ¡and ¡variance ¡

Sherry ¡Sahebi ¡ 6 ¡

slide-7
SLIDE 7

Defined ¡Features ¡

  • Base ¡features ¡

– User-­‑related, ¡item-­‑related, ¡or ¡represent ¡ similari0es ¡between ¡users ¡and ¡items ¡ – Used ¡within ¡each ¡model ¡

  • Meta-­‑Data ¡features ¡

– Features ¡we ¡want ¡to ¡choose ¡the ¡domains ¡from ¡ – Subset ¡of ¡base ¡features ¡

  • Indicator ¡features ¡

– Used ¡for ¡segmenta0on ¡

Sherry ¡Sahebi ¡ 7 ¡

slide-8
SLIDE 8

Indicator ¡and ¡Meta-­‑Data ¡Features ¡ ¡

Sherry ¡Sahebi ¡ 8 ¡

User ¡Features ¡ User ¡Industry ¡ User ¡Func0on ¡ Seniority ¡ Etc… ¡ Ar0st ¡ Lawyer ¡ Engineer ¡ Etc ¡… ¡ Meta_Data ¡Features ¡ Indicator ¡Features ¡

slide-9
SLIDE 9

Augmenta0on: ¡How ¡to ¡handle ¡so ¡many ¡ models? ¡ ¡

  • Augment ¡the ¡feature ¡space ¡based ¡on ¡the ¡domain ¡

defini0ons ¡ ¡

– copy ¡each ¡datapoint ¡into ¡the ¡related ¡domain's ¡sub-­‑space ¡ – main ¡space ¡for ¡the ¡main-­‑effect ¡model ¡

  • Looking ¡at ¡combina0ons ¡of ¡the ¡domains ¡and ¡their ¡

interac0ons ¡

  • Problem ¡ ¡

– Exponen0al ¡growth ¡of ¡subspaces ¡ – Subspace ¡sparsity ¡

Sherry ¡Sahebi ¡ 9 ¡

slide-10
SLIDE 10

Solu0on: ¡Segmenta0on ¡by ¡Indicator ¡ Features ¡

  • Expand ¡the ¡idea ¡of ¡segmented ¡regression ¡

model ¡

Sherry ¡Sahebi ¡ 10 ¡

slide-11
SLIDE 11

Segmented/Piece-­‑Wise ¡Regression ¡

  • Data ¡features ¡par00oned ¡into ¡intervals ¡(by ¡breakpoints) ¡

Sherry ¡Sahebi ¡ 11 ¡

breakpoint ¡1 ¡ breakpoint ¡2 ¡ x ¡ y ¡

slide-12
SLIDE 12

Solu0on: ¡Segmenta0on ¡by ¡Indicator ¡ Features ¡

  • Suppose ¡the ¡meta-­‑data ¡feature ¡to ¡separate ¡the ¡

domain ¡has ¡k ¡values ¡

– E.g. ¡job ¡func0on ¡

  • Binary ¡indicator ¡features ¡

– Meta-­‑data ¡feature ¡value/interval ¡indicators ¡to ¡segment ¡on ¡ ¡ – represen0ng ¡if ¡a ¡data ¡point ¡falls ¡into ¡a ¡specific ¡domain ¡or ¡ not ¡ – E.g. ¡I1 ¡= ¡(job ¡func0on ¡== ¡Art), ¡I2 ¡= ¡(job ¡func0on ¡== ¡ Engineering), ¡…, ¡Ik ¡= ¡(job ¡func0on ¡== ¡Human ¡Resources) ¡

Sherry ¡Sahebi ¡ 12 ¡

slide-13
SLIDE 13

Solu0on: ¡Segmenta0on ¡by ¡Indicator ¡ Features ¡

  • Copying ¡feature ¡space ¡k ¡0mes ¡for ¡each ¡of ¡the ¡meta-­‑

data ¡feature ¡values ¡

  • Linear ¡feature ¡space ¡augmenta0on ¡ ¡

– For ¡one ¡meta-­‑data ¡feature: ¡(k+1)-­‑dimensional ¡space ¡ – For ¡d ¡meta-­‑data ¡features: ¡(dk+1)-­‑dimensional ¡space ¡

Sherry ¡Sahebi ¡ 13 ¡

slide-14
SLIDE 14

What ¡if ¡we ¡want ¡domain ¡interac0ons? ¡

  • An ¡indicator ¡feature, ¡represen0ng ¡cross-­‑

products ¡of ¡feature ¡values ¡in ¡the ¡domains ¡

– I12 ¡= ¡(job ¡func0on ¡== ¡Art) ¡AND ¡(job ¡func0on ¡== ¡ Engineering) ¡

  • E.g. ¡combina0on ¡of ¡every ¡two ¡feature ¡values ¡

within ¡each ¡of ¡the ¡domains ¡

– O(c+f(dk+1)+f(dk2 ¡+1)) ¡

Sherry ¡Sahebi ¡ 14 ¡

slide-15
SLIDE 15

Implementa0on ¡Using ¡Logis0c ¡Regression ¡

Sherry ¡Sahebi ¡ 15 ¡

log( p 1− p) = w ci ×fci

i

+ Iij wfi ,j ,k × fi,j,k

k

i∈Vj

j∈M

  • P: ¡probability ¡of ¡recommending ¡job ¡y ¡to ¡user ¡u ¡
  • fci: ¡the ¡ith ¡common ¡feature ¡among ¡the ¡domains ¡
  • M: ¡set ¡of ¡meta-­‑data ¡features ¡ ¡
  • Vj: ¡set ¡of ¡values ¡(domains) ¡for ¡the ¡jth ¡meta-­‑data ¡feature ¡ ¡
  • Iij: ¡the ¡binary ¡indicator ¡feature ¡for ¡the ¡domain ¡i ¡of ¡meta-­‑data ¡

feature ¡j ¡ ¡

  • fijk: ¡the ¡kth ¡base ¡feature ¡specific ¡to ¡the ¡ith ¡domain ¡of ¡meta-­‑data ¡

feature ¡j ¡

slide-16
SLIDE 16

Implementa0on ¡Using ¡Logis0c ¡Regression ¡

Sherry ¡Sahebi ¡ 16 ¡

Main ¡Effect ¡Model ¡ Model ¡for ¡Domain ¡1 ¡ Model ¡for ¡Domain ¡2 ¡

slide-17
SLIDE 17

Having ¡Domain ¡Interac0ons ¡ ¡

Sherry ¡Sahebi ¡ 17 ¡

Main ¡Effect ¡Model ¡ Model ¡for ¡Cross ¡Product ¡ ¡

  • f ¡Domain ¡1 ¡& ¡2 ¡
slide-18
SLIDE 18

Experiments ¡with ¡Logis0c ¡Regression ¡ Implementa0on ¡

  • About ¡3 ¡million ¡samples ¡
  • More ¡than ¡150,000 ¡Users ¡
  • 100 ¡base ¡features ¡
  • Domains ¡

– Current ¡func0ons: ¡26 ¡

¡

Sherry ¡Sahebi ¡ 18 ¡

slide-19
SLIDE 19

Experiment ¡Setup ¡

  • Two ¡vs. ¡other ¡domains ¡

– Selected ¡base ¡on ¡coverage ¡

¡

  • Segmen0ng ¡on ¡domain ¡clusters ¡

– Spectral ¡clustering ¡

  • Segmen0ng ¡on ¡all ¡domains ¡

¡

Sherry ¡Sahebi ¡ 19 ¡

Sales ¡ Opera0ons ¡ Other ¡ Sales ¡ Opera0ons ¡ IT ¡ Engineering ¡ Marke0ng ¡ Consul0ng ¡ … ¡ Cluster1 ¡ Cluster2 ¡ Cluster3 ¡ Cluster4 ¡

slide-20
SLIDE 20

Func0on ¡Coverage ¡

Sherry ¡Sahebi ¡ 20 ¡

slide-21
SLIDE 21

Two ¡vs. ¡other ¡domains: ¡Accuracy ¡

  • One ¡model ¡for ¡all ¡

vs ¡

  • Main-­‑effect ¡+ ¡domain-­‑specific ¡models ¡

vs ¡

  • Independent ¡models ¡for ¡each ¡domain ¡ ¡

Sherry ¡Sahebi ¡ 21 ¡

Accuracy ¡

One ¡model ¡ for ¡all ¡ Segmented ¡ Model ¡on ¡All ¡ Features ¡ Independent ¡ Models ¡

Sales ¡ 96.28% ¡ 96.33% ¡ 95.01% ¡ Opera0ons ¡ 96.43% ¡ 96.49% ¡ 94.93% ¡ Sales ¡& ¡ Opera0ons ¡ 96.54% ¡ 96.58% ¡

  • ­‑-­‑ ¡

Other ¡ 96.44% ¡ 96.45% ¡ 96.44% ¡

slide-22
SLIDE 22

Two ¡vs. ¡other ¡domains: ¡Coefficients ¡

  • Different ¡coefficient ¡values ¡
  • Some ¡coefficients ¡are ¡present ¡in ¡only ¡one ¡model ¡

– Segmented: ¡similarity ¡between ¡user ¡loca0on ¡and ¡loca0on ¡of ¡job ¡

Sherry ¡Sahebi ¡ 22 ¡

Red: ¡average ¡coefficient ¡value ¡of ¡the ¡main-­‑effect ¡and ¡domain ¡ specific ¡parts ¡of ¡two-­‑vs-­‑all ¡model ¡ ¡

Blue: ¡coefficient ¡values ¡one-­‑for-­‑all ¡base ¡model ¡

slide-23
SLIDE 23

Two ¡vs. ¡other ¡domains: ¡Coefficients ¡

  • Difference ¡between ¡each ¡of ¡the ¡ ¡

domains ¡

Sherry ¡Sahebi ¡ 23 ¡

slide-24
SLIDE 24

Segmen0ng ¡on ¡domain ¡clusters: ¡Clusters ¡

Sherry ¡Sahebi ¡ 24 ¡

Human ¡Resources ¡

Arts&Design ¡

slide-25
SLIDE 25

Segmen0ng ¡on ¡domain ¡clusters: ¡Accuracy ¡

  • Variance ¡in ¡accuracy ¡improvements ¡

Sherry ¡Sahebi ¡ 25 ¡

Baseline ¡Model ¡ Segment ¡on ¡8 ¡ FuncJon ¡ Clusters ¡and ¡All ¡ Features ¡ Change ¡ Cl1 ¡(13.75%) ¡

96.57% ¡ 96.52% ¡ ¡ 0.05% ¡

Cl2 ¡(29.75%) ¡

96.18% ¡ 96.26% ¡ 0.08% ¡

Cl3 ¡(7.15%) ¡

96.62% ¡ 96.75% ¡ 0.13% ¡

Cl4 ¡(6.07%) ¡

96.98% ¡ 97.09% ¡ 0.11% ¡

Cl5 ¡(2.14%) ¡

97.58% ¡ 97.61% ¡ 0.03% ¡

Cl6 ¡(18.14%) ¡

96.68% ¡ 96.85% ¡ 0.17% ¡

Cl7 ¡(11.14%) ¡

96.56% ¡ 96.61% ¡ 0.05% ¡

Cl8 ¡(11.82%) ¡

96.34% ¡ 96.36% ¡ 0.02% ¡

slide-26
SLIDE 26

Segmen0ng ¡on ¡domain ¡clusters: ¡Coefficient ¡ Values ¡

  • Variance ¡in ¡importance ¡of ¡coefficients ¡in ¡

domain-­‑specific ¡models ¡

Sherry ¡Sahebi ¡ 26 ¡

Coefficient ¡Comparison ¡for ¡Different ¡Features ¡ Similarity ¡of ¡ Search ¡Keyword ¡ To ¡Job ¡Descrip0on ¡ is ¡Important ¡to ¡ Users ¡in ¡Sales, ¡ Marke0ng, ¡etc ¡ ¡

slide-27
SLIDE 27

Segmen0ng ¡on ¡all ¡domains: ¡Accuracy ¡

Sherry ¡Sahebi ¡ 27 ¡

slide-28
SLIDE 28

Segmen0ng ¡on ¡all ¡domains: ¡Coefficients ¡

  • Some ¡coefficients ¡change ¡a ¡lot ¡

compared ¡to ¡baseline ¡

Sherry ¡Sahebi ¡ 28 ¡

Baseline ¡model ¡coefficients ¡compared ¡to ¡the ¡ segmented ¡model ¡coefficient ¡means ¡

Similarity ¡of ¡Search ¡ Keywords ¡with ¡Job ¡ Descrip0on ¡

slide-29
SLIDE 29

Conclusion ¡

  • Segmented ¡Models ¡for ¡Cross-­‑Domain ¡

Recommenda0on ¡

– Efficient ¡use ¡of ¡space ¡(polynomial ¡augmenta0on) ¡ – Ease ¡of ¡implementa0on ¡ – Allows ¡automa0c ¡selec0on ¡of ¡the ¡main ¡effect ¡and ¡ ¡ domain ¡specific ¡features ¡ – Allows ¡for ¡interac0on ¡between ¡domains ¡

  • Offline ¡metrics ¡indicate ¡the ¡effec0veness ¡of ¡cross-­‑

domain ¡

– Coefficient ¡differences ¡ – Accuracy ¡trends ¡

Sherry ¡Sahebi ¡ 29 ¡

slide-30
SLIDE 30

Future ¡Work ¡

  • No0on ¡of ¡Domain ¡

– Experimen0ng ¡with ¡more ¡features ¡(such ¡as ¡ seniority) ¡ ¡ – Automa0cally ¡choosing ¡meta-­‑data ¡features ¡

  • Co-­‑clustering ¡
  • Decision ¡trees ¡
  • Use ¡the ¡segmented ¡model ¡with ¡other ¡

classifica0on ¡algorithms ¡ ¡

  • A/B ¡tes0ng ¡

Sherry ¡Sahebi ¡ 30 ¡

slide-31
SLIDE 31

¡ ¡ Thank ¡You! ¡

ssahebi@cs.pi>.edu ¡

Sherry ¡Sahebi ¡ 31 ¡

slide-32
SLIDE 32

Indicator ¡Features ¡ ¡

  • Meta-­‑data ¡features ¡

– Features ¡chosen ¡to ¡separate ¡ domains ¡by ¡ ¡ – E.g. ¡job ¡func0on ¡

  • Indicator ¡features ¡

– Meta-­‑data ¡feature ¡value/interval ¡ indicators ¡to ¡segment ¡on ¡ ¡ – E.g. ¡I_β ¡≅ ¡(job ¡func0on ¡== ¡Art) ¡

  • Linear ¡feature ¡space ¡

augmenta0on ¡ ¡

– M(I+1) ¡

Sherry ¡Sahebi ¡ 32 ¡

I_α ¡ I_γ ¡ I_β ¡

slide-33
SLIDE 33

Our ¡Segmented ¡Model ¡

  • Linear/polynomial ¡space ¡augmenta0on ¡
  • Ease ¡of ¡implementa0on ¡
  • Automa0cally ¡chooses ¡main ¡effect ¡and ¡

domain ¡specific ¡features ¡

  • Allows ¡for ¡interac0on ¡between ¡domains ¡

Sherry ¡Sahebi ¡ 33 ¡