Problem Most current mutual informa2on (MI) based feature - - PowerPoint PPT Presentation

problem
SMART_READER_LITE
LIVE PREVIEW

Problem Most current mutual informa2on (MI) based feature - - PowerPoint PPT Presentation

Problem Most current mutual informa2on (MI) based feature selec2on techniques are greedy in nature thus are prone to sub-op2mal decisions. Current


slide-1
SLIDE 1
slide-2
SLIDE 2

Problem ¡

  • Most ¡current ¡mutual ¡informa2on ¡(MI) ¡based ¡

feature ¡selec2on ¡techniques ¡are ¡greedy ¡in ¡ nature ¡thus ¡are ¡prone ¡to ¡sub-­‑op2mal ¡

  • decisions. ¡ ¡

Current ¡Solu+on ¡: ¡ ¡

  • Quadra2c ¡Programming ¡Feature ¡Selec2on ¡

(QPFS) ¡

slide-3
SLIDE 3

selected ¡features ¡cannot ¡be ¡deselected ¡at ¡a ¡later ¡stage ¡ (subop2mal ¡solu2on) ¡

slide-4
SLIDE 4

Represents ¡rela2ve ¡feature ¡weights ¡

slide-5
SLIDE 5

¡ ¡ Issues ¡of ¡QPFS: ¡

  • Posi2ve ¡definiteness ¡of ¡H ¡(approxima2on ¡of ¡H ¡) ¡
  • ¡How ¡to ¡treat ¡self-­‑redundancy? ¡

– H_ii ¡= ¡0 ¡then ¡H ¡will ¡be ¡indefinite. ¡ – H_ii ¡= ¡H(X_i) ¡penalizeing ¡features ¡for ¡their ¡intrinsic ¡ entropy ¡

slide-6
SLIDE 6
  • Sub-­‑selec2on ¡
  • ¡quadra2c ¡integer ¡programming ¡problem ¡

Hard ¡combinatorial ¡problem ¡ NP-­‑hard ¡problem ¡

Paper ¡Page ¡3 ¡

¡ ¡

slide-7
SLIDE 7

The ¡extended ¡MRMR ¡family ¡

  • Page ¡3 ¡
slide-8
SLIDE 8

How ¡to ¡properly ¡treat ¡self-­‑redundancy? ¡

  • H_ii ¡= ¡0 ¡

The ¡op2mal ¡solu2on ¡will ¡be ¡changed ¡with ¡different ¡parameter ¡seRng. ¡

slide-9
SLIDE 9
slide-10
SLIDE 10

Spectral ¡relaxa2on ¡

slide-11
SLIDE 11

Global ¡MI-­‑based ¡feature ¡selec2on ¡via ¡ semi-­‑definite ¡programming ¡

slide-12
SLIDE 12

Complexity ¡analysis ¡

  • compu2ng ¡the ¡similarity ¡matrix ¡+ ¡ranking ¡the ¡

features ¡

  • Similarity ¡matrix ¡: ¡O(n^2.d) ¡
slide-13
SLIDE 13

Global ¡feature ¡selec2on ¡for ¡large ¡data ¡

slide-14
SLIDE 14

EXPERIMENTAL ¡EVALUATION ¡

slide-15
SLIDE 15
slide-16
SLIDE 16
slide-17
SLIDE 17
slide-18
SLIDE 18
slide-19
SLIDE 19
slide-20
SLIDE 20

What ¡is ¡ac2ve ¡semi-­‑supervised ¡ learning ¡

  • labeled ¡data ¡is ¡scarce ¡but ¡unlabeled ¡data ¡is ¡

easily ¡available. ¡ ¡

  • A ¡semi-­‑supervised ¡learning ¡technique ¡must ¡

not ¡only ¡learn ¡from ¡the ¡labeled ¡data ¡but ¡also ¡ from ¡the ¡inherent ¡clustering ¡present ¡in ¡the ¡ unlabeled ¡

  • Ac2ve ¡learning ¡try ¡to ¡achieve ¡the ¡maximum ¡

gain ¡in ¡terms ¡of ¡learning ¡ability ¡for ¡a ¡given, ¡ and ¡small, ¡number ¡of ¡label ¡queries. ¡

slide-21
SLIDE 21
  • The ¡authors ¡focus ¡on ¡the ¡problem ¡of ¡pool-­‑

based ¡batch-­‑mode ¡ac2ve ¡semi-­‑supervised ¡ learning ¡ (large ¡sta2c ¡collec2on ¡of ¡unlabeled ¡data ¡from ¡ which ¡a ¡very ¡small ¡percentage ¡of ¡data ¡points ¡ have ¡to ¡be ¡selected ¡in ¡order ¡to ¡be ¡labeled) ¡

slide-22
SLIDE 22

Graph ¡representa2on ¡

  • Nodes ¡: ¡data ¡points ¡
  • Edge ¡Weights ¡: ¡Similari2es ¡between ¡the ¡
  • nodes. ¡
  • Membership ¡func2on ¡of ¡Class ¡‘C’ ¡is ¡a ¡graph ¡

signal ¡(0 ¡or ¡1) ¡

  • Membership ¡func2on ¡is ¡smooth. ¡
slide-23
SLIDE 23
  • The ¡semi-­‑supervised ¡learning ¡problem ¡can ¡be ¡

viewed ¡as ¡a ¡problem ¡of ¡interpola2ng ¡a ¡smooth ¡ graph ¡signal. ¡

slide-24
SLIDE 24
  • Most ¡of ¡the ¡previous ¡works ¡of ¡semi-­‑

supervised ¡methods ¡are ¡global ¡(they ¡require ¡ inversion ¡or ¡eigen ¡decomposi2on ¡of ¡large ¡ matrices ¡associated ¡with ¡the ¡underlying ¡ Graph) ¡

  • Not ¡scalable ¡
slide-25
SLIDE 25
  • A ¡key ¡challenge ¡in ¡graph ¡signal ¡processing ¡is ¡to ¡

design ¡localized ¡algorithms ¡that ¡scale ¡well ¡ with ¡graph ¡sizes. ¡(the ¡output ¡at ¡each ¡vertex ¡ should ¡only ¡depend ¡on ¡its ¡local ¡ neighborhood.) ¡

slide-26
SLIDE 26
slide-27
SLIDE 27

Goal ¡

  • Analyzing ¡and ¡improving ¡upon ¡the ¡mul2fractal ¡

network ¡generator ¡(MFNG) ¡introduced ¡by ¡Palla ¡et ¡

  • al. ¡
  • Pros: ¡MFNG ¡is ¡more ¡flexible ¡than ¡the ¡SKG ¡
  • Cons: ¡ ¡

– only ¡matches ¡a ¡single ¡graph ¡property, ¡such ¡as ¡the ¡ number ¡of ¡nodes ¡with ¡degree ¡d. ¡ – all ¡MFNG ¡sampling ¡techniques ¡are ¡O(|V ¡|^2) ¡ algorithms, ¡making ¡the ¡genera2on ¡of ¡large ¡graphs ¡

  • infeasible. ¡
slide-28
SLIDE 28
slide-29
SLIDE 29
  • Decompose ¡a ¡genera2ng ¡measure ¡W_k ¡with ¡k ¡

recursive ¡levels ¡in ¡k ¡measures ¡with ¡depth ¡one. ¡

slide-30
SLIDE 30

New ¡Problem ¡

  • Given ¡a ¡graph ¡G, ¡we ¡are ¡interested ¡in ¡finding ¡a ¡

probability ¡matrix ¡‘P’, ¡a ¡set ¡of ¡lengths ¡`l’, ¡and ¡a ¡ recursion ¡depth ¡‘k’, ¡such ¡that ¡graphs ¡ generated ¡from ¡the ¡measure ¡W_k(P,l) ¡are ¡ similar ¡to ¡G. ¡

slide-31
SLIDE 31

Experiments ¡

  • Synthe2c ¡data ¡set ¡
  • Real ¡world ¡data ¡(All ¡data ¡sets ¡are ¡from ¡the ¡

SNAP ¡collec2on.) ¡

slide-32
SLIDE 32
slide-33
SLIDE 33
slide-34
SLIDE 34