Cancer Genome Analysis (CONEXIC) Akavia et al. Cell, 2010. - - PowerPoint PPT Presentation

cancer genome analysis conexic
SMART_READER_LITE
LIVE PREVIEW

Cancer Genome Analysis (CONEXIC) Akavia et al. Cell, 2010. - - PowerPoint PPT Presentation

Cancer Genome Analysis (CONEXIC) Akavia et al. Cell, 2010. 02-715 Advanced Topics in Computa<onal Genomics Integrated Approach for Discovering Drivers in Cancer Previous methods:


slide-1
SLIDE 1

Cancer Genome Analysis (CONEXIC)

Akavia ¡et ¡al. ¡Cell, ¡2010. ¡ 02-­‑715 ¡Advanced ¡Topics ¡in ¡Computa<onal ¡ Genomics ¡

slide-2
SLIDE 2

Integrated Approach for Discovering Drivers in Cancer

  • Previous ¡methods: ¡find ¡frequently ¡occurring ¡muta<ons ¡
  • Copy ¡number ¡varia<on ¡in ¡tumor ¡samples ¡can ¡involve ¡a ¡large ¡

region ¡containing ¡mul<ple ¡genes ¡

– Many ¡are ¡passengers: ¡how ¡to ¡dis<nguish ¡passenger ¡and ¡driver ¡genes ¡ in ¡the ¡copy ¡number ¡varia<on ¡region? ¡

  • Integra<ve ¡analysis ¡of ¡copy ¡number ¡varia<ons ¡and ¡gene ¡

expressions ¡

slide-3
SLIDE 3

CONEXIC Modeling Assumption I

  • A ¡driver ¡muta<on ¡should ¡occur ¡in ¡mul<ple ¡tumors ¡more ¡oMen ¡

than ¡would ¡be ¡expected ¡by ¡chance ¡

slide-4
SLIDE 4

CONEXIC Modeling Assumption II

  • A ¡driver ¡muta<on ¡may ¡be ¡associated ¡(correlated) ¡with ¡the ¡

expression ¡of ¡a ¡group ¡of ¡genes ¡that ¡form ¡a ¡module ¡

slide-5
SLIDE 5

CONEXIC Modeling Assumption III

  • A ¡driver ¡muta<on ¡may ¡be ¡associated ¡(correlated) ¡with ¡the ¡

expression ¡of ¡a ¡group ¡of ¡genes ¡that ¡form ¡a ¡module ¡

slide-6
SLIDE 6

Copy Number Variation and Gene Expression

  • Even ¡among ¡the ¡individuals ¡with ¡amplifica<on ¡in ¡copy ¡

numbers, ¡the ¡expression ¡levels ¡for ¡those ¡genes ¡can ¡differ. ¡

slide-7
SLIDE 7

CONEXIC Overview

slide-8
SLIDE 8

CONEXIC Overview

  • Extends ¡module ¡networks ¡to ¡handle ¡cancer ¡copy ¡number ¡

varia<on ¡and ¡gene ¡expression ¡data ¡to ¡find ¡driver ¡muta<on ¡

  • Assumes ¡a ¡driver ¡muta<on ¡affects ¡“gene ¡modules” ¡rather ¡

than ¡individual ¡genes ¡

  • The ¡gene ¡expression ¡as ¡a ¡proxy ¡to ¡dis<nguish ¡between ¡driver ¡

and ¡passenger ¡muta<ons ¡in ¡the ¡large ¡region ¡of ¡copy ¡number ¡ varia<ons ¡

slide-9
SLIDE 9

CONEXIC: Selecting Candidate Drivers

  • Apply ¡GISTIC ¡to ¡find ¡frequently ¡occurring ¡regions ¡of ¡copy ¡

number ¡varia<ons ¡

  • Run ¡CONEXIC ¡with ¡only ¡the ¡genes ¡in ¡the ¡selected ¡regions ¡as ¡

candidate ¡driver ¡genes ¡

slide-10
SLIDE 10

GISTIC

  • Detect ¡frequently ¡occurring ¡CNV ¡regions ¡in ¡cancer ¡samples ¡
  • Typically ¡CNV ¡regions ¡are ¡large ¡

– OMen ¡involve ¡the ¡whole ¡chromosome ¡arms ¡ – Within ¡the ¡amplified ¡region, ¡there ¡are ¡small ¡regions ¡with ¡peaks ¡that ¡

  • Men ¡contain ¡driver ¡genes ¡

– How ¡can ¡we ¡iden<fy ¡these ¡rela<vely ¡small ¡regions? ¡ ¡

slide-11
SLIDE 11

GISTIC

  • For ¡each ¡locus, ¡compute ¡G-­‑scores ¡

– CN(m,i) ¡: ¡copy ¡number ¡measurement ¡for ¡sample ¡i, ¡marker ¡m ¡ – Average ¡copy ¡number ¡scores ¡for ¡marker ¡m ¡

  • Peel-­‑off ¡strategy: ¡Find ¡the ¡peak ¡within ¡the ¡large ¡region ¡of ¡

amplifica<on ¡and ¡set ¡the ¡consecu<ve ¡markers ¡to ¡zero ¡before ¡ looking ¡for ¡the ¡next ¡peak ¡in ¡order ¡to ¡avoid ¡the ¡overlap ¡

– Detects ¡only ¡the ¡highest ¡peak ¡in ¡the ¡large ¡region ¡

slide-12
SLIDE 12

GISTIC

  • How ¡to ¡dis<nguish ¡a ¡single ¡large ¡peak ¡and ¡mul<ple ¡small ¡

peaks ¡

  • Extension ¡of ¡GISTIC ¡for ¡detec<ng ¡focal ¡copy ¡number ¡varia<ons ¡

– During ¡peel ¡off, ¡apply ¡the ¡threshold ¡es<mated ¡from ¡other ¡regions ¡of ¡ DNA ¡

  • Different ¡thresholds ¡for ¡different ¡samples ¡
  • Usually ¡the ¡highest ¡broad ¡aberra<on ¡genome-­‑wide ¡as ¡the ¡

threshold ¡

  • Results ¡are ¡sensi<ve ¡to ¡the ¡threshold ¡value ¡
slide-13
SLIDE 13

GISTIC

slide-14
SLIDE 14

Pre-cursor for CONEXIC (Lee et al., PNAS 2006)

slide-15
SLIDE 15

CONEXIC: Single Modulator

  • Step ¡1: ¡347 ¡candidate ¡drivers ¡aMer ¡applying ¡GISTIC ¡
  • Step ¡2: ¡Run ¡K-­‑means ¡clustering ¡on ¡gene ¡expression ¡levels ¡of ¡

candidate ¡drivers ¡to ¡determine ¡the ¡expression ¡threshold ¡ between ¡normal ¡and ¡amplified/deleted ¡samples ¡

  • Step ¡3: ¡Determine ¡target ¡gene ¡modules ¡influenced ¡by ¡each ¡

candidate ¡driver ¡

– Split ¡the ¡target ¡gene ¡expressions ¡with ¡respect ¡to ¡the ¡threshold ¡in ¡Step ¡ 2 ¡ – Assess ¡the ¡quality ¡of ¡split ¡

slide-16
SLIDE 16

CONEXIC Network-Learning Algorithm

  • The ¡single ¡modulators ¡as ¡ini<aliza<on ¡
  • Iterate ¡between ¡the ¡two ¡steps ¡un<l ¡fewer ¡than ¡10% ¡of ¡the ¡

target ¡ ¡genes ¡have ¡been ¡re-­‑assigned ¡to ¡a ¡different ¡module ¡

– Step ¡1: ¡Learning ¡the ¡regula<on ¡program ¡for ¡each ¡module ¡

  • Construct ¡a ¡regression ¡tree ¡by ¡spligng ¡samples ¡according ¡to ¡the ¡

drivers ¡

  • Con<nue ¡spligng ¡un<l ¡regression ¡model ¡fits ¡the ¡influence ¡of ¡

modulator ¡on ¡the ¡modules ¡well ¡at ¡the ¡leaf ¡ – Step ¡2: ¡Re-­‑assign ¡each ¡gene ¡into ¡the ¡module ¡that ¡best ¡models ¡it ¡ behavior ¡

slide-17
SLIDE 17

LitVAn (Literature Vector Analysis)

  • Literature-­‑based ¡analysis ¡tool ¡for ¡inference ¡of ¡gene ¡module ¡

func<onality ¡

– enrichment ¡analysis ¡for ¡gene ¡modules ¡

  • NCBI ¡database ¡that ¡associates ¡each ¡gene ¡with ¡manually ¡

curated ¡papers ¡(70,000 ¡papers) ¡

  • Bag-­‑of-­‑words ¡assump<on ¡
slide-18
SLIDE 18

LitVAn

  • TF*IDF ¡score: ¡score ¡to ¡words ¡which ¡are ¡overrepresented ¡in ¡a ¡subset ¡
  • f ¡documents ¡rela<ve ¡to ¡the ¡full ¡corpus ¡

– Inverse ¡Document ¡Frequency ¡(IDF): ¡ ¡

  • a ¡score ¡based ¡on ¡the ¡por<on ¡of ¡documents ¡each ¡term ¡appears ¡in, ¡with ¡

high ¡scores ¡for ¡low ¡coverage ¡

  • Computed ¡once ¡for ¡the ¡whole ¡corpus ¡

– Term ¡Frequency ¡(TF): ¡ ¡

  • a ¡direct ¡count ¡for ¡the ¡number ¡of ¡<mes ¡the ¡term ¡appears ¡in ¡the ¡subset ¡
  • f ¡documents ¡ ¡
  • Computed ¡for ¡each ¡module ¡
  • For ¡each ¡set ¡of ¡genes ¡(a ¡module), ¡LitVAn ¡counts ¡the ¡term ¡frequency ¡

in ¡papers ¡associated ¡with ¡these ¡genes ¡and ¡compare ¡this ¡count ¡to ¡ the ¡null ¡distribu<on, ¡using ¡a ¡TF∗IDF ¡score ¡

slide-19
SLIDE 19

Dataset

  • Melanoma, ¡gene ¡expression ¡and ¡copy ¡number ¡from ¡101 ¡

samples ¡

  • 64 ¡modulators ¡and ¡7869 ¡target ¡genes ¡found ¡by ¡CONEXIC ¡
slide-20
SLIDE 20

Highest Modulators Identified by CONEXIC

slide-21
SLIDE 21

Establishing Directionality

  • Copy ¡number ¡varia<on ¡can ¡be ¡used ¡to ¡determine ¡causal ¡

rela<onship ¡

slide-22
SLIDE 22

Multiple Modulators

slide-23
SLIDE 23

MITF Gene Expression/Copy Number Variation

slide-24
SLIDE 24

MITF Modules

slide-25
SLIDE 25

TBC1D16 for Melanoma Growth

  • High ¡correla<on ¡

between ¡TBC1D16 ¡ expression ¡and ¡ target ¡expressions ¡

  • Low ¡correla<on ¡

between ¡expression ¡ and ¡TBC1D16 ¡copy ¡ number ¡varia<on ¡

slide-26
SLIDE 26

TBC1D16 for Melanoma Growth: Experimental Validation

slide-27
SLIDE 27

Summary

  • Copy ¡number ¡varia<on ¡in ¡tumors ¡can ¡involve ¡a ¡large ¡region ¡

that ¡contains ¡many ¡genes ¡

  • CONEXIC ¡integrates ¡gene ¡expression ¡and ¡copy ¡number ¡

varia<on ¡data ¡collected ¡from ¡tumors ¡to ¡iden<fy ¡driver ¡genes ¡ ¡