Discovery of Transcription- Regulating Regions in Genes
Wyeth Wasserman
Centre for Molecular Medicine and Therapeutics Children’s and Women’s Hospital University of British Columbia
Discovery of Transcription- Regulating Regions in Genes Wyeth - - PowerPoint PPT Presentation
Discovery of Transcription- Regulating Regions in Genes Wyeth Wasserman Centre for Molecular Medicine and Therapeutics Childrens and Womens Hospital University of British Columbia Overview CMMT Bioinformatics for detection of
Centre for Molecular Medicine and Therapeutics Children’s and Women’s Hospital University of British Columbia
CMMT
CMMT
TATA URE
A 14 16 4 0 1 19 20 1 4 13 4 4 13 12 3 C 3 0 0 0 0 0 0 0 7 3 1 0 3 1 12 G 4 3 17 0 0 2 0 0 9 1 3 0 5 2 2 T 0 2 0 21 20 0 1 20 1 4 13 17 0 6 4
Set of binding sites AAGTTAATGA CAGTTAATAA GAGTTAAACA CAGTTAATTA GAGTTAATAA CAGTTATTCA GAGTTAATAA CAGTTAATCA AGATTAAAGA AAGTTAACGA AGGTTAACGA ATGTTGATGA AAGTTAATGA AAGTTAACGA AAATTAATGA GAGTTAATGA AAGTTAATCA AAGTTGATGA AAATTAATGA ATGTTAATGA AAGTAAATGA AAGTTAATGA AAGTTAATGA AAATTAATGA AAGTTAATGA AAGTTAATGA AAGTTAATGA AAGTTAATGA Set of binding sites AAGTTAATGA CAGTTAATAA GAGTTAAACA CAGTTAATTA GAGTTAATAA CAGTTATTCA GAGTTAATAA CAGTTAATCA AGATTAAAGA AAGTTAACGA AGGTTAACGA ATGTTGATGA AAGTTAATGA AAGTTAACGA AAATTAATGA GAGTTAATGA AAGTTAATCA AAGTTGATGA AAATTAATGA ATGTTAATGA AAGTAAATGA AAGTTAATGA AAGTTAATGA AAATTAATGA AAGTTAATGA AAGTTAATGA AAGTTAATGA AAGTTAATGA
CMMT
CMMT
CMMT
CMMT
CMMT
% Identity
200 bp Window Start Position (human sequence)
CMMT
0.2 0.4 0.6 0.8 1 1000 2000 3000 4000 5000 6000 7000
100% 80% 60% 40% 20% 0%
% Identity Start Position of 200bp Window
CMMT
CMMT
CMMT
HUMAN HUMAN HUMAN
CMMT
Now driven by the ORCA Aligner
CMMT
SELECTIVITY SENSITIVITY
CMMT
CMMT
CMMT
CMMT
(10 second slide for 3 months of work)
CMMT
years…Berman; Markstein; Frith; Noble; Wagner;…
– Most difficulty comes from local direct repeats
CMMT
genome sequence
CMMT
(COMET)
CMMT
CMMT
CMMT
*Frith et al’s COMET and CISTER algorithms circumvent this problem
CMMT
0.2 0.4 0.6 0.8 1 100 510 920 1330 1740 2150 2560 2970 3380 3790 4200 4610 5020 5430 5840 Series1 Series2 Wildtype Mutant
CMMT
CMMT
CMMT
CMMT
CMMT
CMMT
CMMT
CMMT
CMMT
500 bp
GO GO GO
20 000 bp
GO GO GO GO GO GO GO GO GO
CMMT
10 12 14 16 18 100 200 300 400 500 600
SEQUENCE LENGTH PATTERN SIMILARITY
True Mef2 Binding Sites
CMMT
– Human:Mouse comparison eliminates ~75% of sequence
– Architectural rules
– TFBS patterns are NOT random
CMMT
CMMT
CMMT
CMMT
CMMT
CMMT
CMMT
Score Frequency
CMMT
CMMT
CMMT
CMMT
CMMT
CMMT
CMMT
6 0 0 0 7 0 0 2 8 4 7 1 0 2 0 0 4 0 0 8 0 0 0 0 1 0 0 6
Width Distributions
(Sum of Separations)
Binding Profiles
250
Number
Distribution
3
Separation Distribution
(Default = Uniform)
100bp
Neighbor Interactions µi µj µi µj
Specific Gene Features
CMMT
CMMT
β γ1 γ2 γ3 γ4 α1 α2 α3 α4 τ=5 binding sites µ1 µ2 µ3 µ4 µ5
CMMT
– Region is closest to a skeletal muscle specific gene on the
CMMT
CMMT
Calls to ensEMBL Calls to GeneLynx Calls to BlastZ Module Sampler
CMMT
Wasserman Group – CMMT Dave Arenillas Jochen Brumm Danielle Kemmer Jonathan Lim Chris Walsh Wasserman Group - Karolinska Albin Sandelin Raf Podowski Wynand Alkema Collaborating Trainees Malin Andersson (KTH) Öjvind Johansson (UCSD)
Support: CIHR, CGDN, Merck-Frosst, BC Children’s & Women’s Hospitals, Pharmacia, EC–Marie Curie, KI-Funder
Collaborators Chip Lawrence (Wadsworth) William Thompson (Wadsworth) Boris Lenhard (K.I.) Jens Lagergren (SBC) Christer Höög (K.I.) Brenda Gallie (OCI) Jacob Odeberg (KTH) Niclas Jareborg (AZ) William Hayes (AZ) Group Alumni Elena Herzog Annette Höglund William Krivan Boris Lenhard Luis Mendoza
CMMT
CMMT
CMMT
bHLH-Zip domain bHLH domain