Lecture 7: RNA folding Chapter 6 Problem 6.51 in - - PowerPoint PPT Presentation
Lecture 7: RNA folding Chapter 6 Problem 6.51 in - - PowerPoint PPT Presentation
Lecture 7: RNA folding Chapter 6 Problem 6.51 in Jones and Pevzner and the Turner model Spring 2017 February 7, 2017 RNA Basics
RNA ¡Basics ¡
2
RNA ¡bases ¡A,C,G,U ¡ Canonical ¡Base ¡Pairs ¡
- A-‑U ¡
- G-‑C ¡
- G-‑U ¡“wobble” ¡pairing ¡
- Bases ¡can ¡only ¡pair ¡with ¡
- ne ¡other ¡base. ¡
Image: http://www.bioalgorithms.info/
RNA ¡Structural ¡Levels ¡ ¡
3
Primary
AAUCG...CUUCUUCCA Primary Secondary Tertiary
RNA ¡Secondary ¡Structure ¡
4
Hairpin loop Junction (Multiloop) Bulge Loop Single-Stranded Internal Loop Stack Pseudoknot
Base ¡Pair ¡MaximizaSon ¡
5
U C C A G G A C
Zuker (1981) Nucleic Acids Research 9(1) 133-149
Base ¡Pair ¡MaximizaSon ¡– ¡Dynamic ¡ Programming ¡Algorithm ¡
6
Simple Example: Maximizing Base Pairing
Base ¡Pair ¡MaximizaSon ¡– ¡Dynamic ¡ Programming ¡Algorithm ¡
7
S(i,j) is the folding of the subsequence of the RNA strand from index i to index j which results in the highest number of base pairs
Base ¡Pair ¡MaximizaSon ¡– ¡Dynamic ¡ Programming ¡Algorithm ¡
8
Base ¡Pair ¡MaximizaSon ¡– ¡Dynamic ¡ Programming ¡Algorithm ¡
9
Base ¡Pair ¡MaximizaSon ¡– ¡Dynamic ¡ Programming ¡Algorithm ¡
10
Base ¡Pair ¡MaximizaSon ¡– ¡Dynamic ¡ Programming ¡Algorithm ¡
11
Base ¡Pair ¡MaximizaSon ¡– ¡Dynamic ¡ Programming ¡Algorithm ¡
12
Simple Example: Maximizing Base Pairing
http://bioalgorithms.info
S(i,j) is the folding of the subsequence of the RNA strand from index i to index j which results in the highest number of base pairs
Circular ¡RepresentaSon ¡
13
Images – David Mount
Pseudoknots ¡
14
Pseudoknots ¡cause ¡a ¡breakdown ¡in ¡the ¡presented ¡Dynamic ¡
Programming ¡Algorithm. ¡
In ¡order ¡to ¡form ¡a ¡pseudoknot, ¡checks ¡must ¡be ¡made ¡to ¡ensure ¡
base ¡is ¡not ¡already ¡paired ¡– ¡this ¡breaks ¡down ¡the ¡divide ¡and ¡ conquer ¡recurrence ¡relaSons. ¡
Images – David Mount
Simplifying ¡AssumpSons ¡
- RNA ¡folds ¡into ¡one ¡minimum ¡free-‑energy ¡
- structure. ¡ ¡
- There ¡are ¡no ¡knots ¡(base ¡pairs ¡never ¡cross). ¡
- The ¡energy ¡of ¡a ¡parScular ¡base ¡pair ¡in ¡a ¡double ¡
stranded ¡region ¡is ¡sequence ¡independent. ¡
- Neighbors ¡do ¡not ¡influence ¡the ¡energy. ¡
- Was ¡solved ¡by ¡dynamic ¡programming, ¡Zucker ¡and ¡
Steigler ¡1981 ¡
15
Sequence ¡Dependent ¡Base ¡Pair ¡Energy ¡Values ¡ (Nearest ¡Neighbor ¡Model) ¡
16
U U C G G C A U G C A UCGAC 3’ 5’ U U C G U A A U G C A UCGAC 3’ 5’
Example values: GC GC GC GC AU GC CG UA
- 2.3 -2.9 -3.4 -2.1
Free ¡Energy ¡ComputaSon ¡(Nearest ¡Neighbor ¡ Model) ¡
17
U U A A G C G C A G C U A A U C G A U A 3’ A 5’
- 0.3
- 0.3
- 1.1 mismatch of hairpin
- 2.9 stacking
+3.3 1nt bulge
- 2.9 stacking
- 1.8 stacking
5’ dangling
- 0.9 stacking
- 1.8 stacking
- 2.1 stacking
G= - 4.9 kcal/mol
+5.9 4 nt loop
RNA ¡Secondary ¡Structure ¡
18
Stack
Nearest ¡Neighbor ¡Model ¡
- Stacking ¡energy ¡-‑ ¡assign ¡negaSve ¡energies ¡to ¡these ¡
between ¡base ¡pair ¡regions. ¡
- Energy ¡is ¡influenced ¡by ¡the ¡nearest ¡closing ¡base ¡pair ¡
- These ¡energies ¡are ¡esSmated ¡experimentally ¡from ¡small ¡
syntheSc ¡RNAs. ¡ ¡
- PosiSve ¡energy ¡-‑ ¡added ¡for ¡low ¡entropy ¡regions ¡such ¡
as ¡bulges, ¡loops, ¡etc. ¡
¡
19
RNA ¡Secondary ¡Structure ¡
20
Hairpin loop
Nearest ¡Neighbor ¡Model ¡
- Hairpin ¡energy: ¡
- Experimentally ¡measured ¡for ¡hairpins ¡of ¡length ¡5, ¡6, ¡7, ¡8, ¡… ¡
up ¡to ¡a ¡maximum. ¡ExtrapolaSon ¡above ¡the ¡maximum. ¡
- The ¡closing ¡pair ¡affects ¡the ¡energy. ¡DisSnguish ¡between ¡A-‑
U ¡and ¡C-‑G. ¡ ¡
¡
21
RNA ¡Secondary ¡Structure ¡
22
Bulge Loop Internal Loop
Nearest ¡Neighbor ¡Model ¡
- Bulge/Internal ¡energy: ¡
- Let ¡L1, ¡L2 ¡denote ¡the ¡lengths ¡of ¡the ¡two ¡sides ¡of ¡the ¡bulge/
internal ¡loop. ¡
- Experimentally ¡measured ¡for ¡different ¡values ¡of ¡L1, ¡L2. ¡
- In ¡pracSce ¡for ¡computaSonal ¡convenience, ¡the ¡energy ¡is ¡
given ¡as ¡funcSon ¡of ¡L1 ¡ ¡+ ¡L2 ¡by ¡a ¡lookup ¡table ¡and ¡
- extrapolaSon. ¡
23
RNA ¡Secondary ¡Structure ¡
24
Junction (Multiloop)
Nearest ¡Neighbor ¡Model ¡
- MulSloop ¡energy: ¡
- Let ¡U ¡denote ¡the ¡number ¡of ¡unpaired ¡bases. ¡
- Let ¡P ¡denote ¡the ¡number ¡of ¡base ¡pairs. ¡
¡
- The ¡free ¡energy ¡is ¡an ¡affine ¡funcSon ¡of ¡U ¡and ¡P: ¡
a1 + a2 U + a3 P.
- This ¡is ¡the ¡least ¡accurate ¡component ¡of ¡the ¡NN ¡model. ¡
25