Partitioning and Divide-and- Conquer Strategies Partitioning - PDF document

Partitioning and Divide-and- Conquer Strategies Partitioning Strategies Partitioning simply divides the problem into parts Example - Adding a sequence of numbers We might consider dividing the sequence into m parts of n / m numbers each, ( x 0 … x ( n / m ) − 1 ), ( x n / m … x ( 2n / m ) − 1 ), …, ( x ( m − 1) n / m … x n − 1) , at which point m processors (or processes) can each add one sequence independently to create partial sums. x 0 … x ( n / m ) − 1 x n / m … x (2 n / m ) − 1 … x ( m − 1) n / m … x n − 1 + + + Partial sums + Sum Figure 4.1 Partitioning a sequence of numbers into parts and adding the parts. 120 Parallel Programming: Techniques and Applications using Networked Workstations and Parallel Computers Barry Wilkinson and Michael Allen  Prentice Hall, 1999

Using separate send() s and recv() s Master s = n/m; /* number of numbers for slaves*/ for (i = 0, x = 0; i < m; i++, x = x + s) send(&numbers[x], s, P i ); /* send s numbers to slave */ sum = 0; for (i = 0; i < m; i++) { /* wait for results from slaves */ recv(&part_sum, P ANY ); sum = sum + part_sum; /* accumulate partial sums */ } Slave recv(numbers, s, P master ); /* receive s numbers from master */ part_sum = 0; for (i = 0; i < s; i++) /* add numbers */ part_sum = part_sum + numbers[i]; send(&part_sum, P master ); /* send sum to master */ 121 Parallel Programming: Techniques and Applications using Networked Workstations and Parallel Computers Barry Wilkinson and Michael Allen  Prentice Hall, 1999

Using Broadcast/multicast Routine Master s = n/m; /* number of numbers for slaves */ bcast(numbers, s, P slave_group ); /* send all numbers to slaves */ sum = 0; for (i = 0; i < m; i++){ /* wait for results from slaves */ recv(&part_sum, P ANY ); sum = sum + part_sum; /* accumulate partial sums */ } Slave bcast(numbers, s, P master ); /* receive all numbers from master*/ start = slave_number * s; /* slave number obtained earlier */ end = start + s; part_sum = 0; for (i = start; i < end; i++) /* add numbers */ part_sum = part_sum + numbers[i]; send(&part_sum, P master ); /* send sum to master */ 122 Parallel Programming: Techniques and Applications using Networked Workstations and Parallel Computers Barry Wilkinson and Michael Allen  Prentice Hall, 1999

Using scatter and reduce routines Master s = n/m; /* number of numbers */ scatter(numbers,&s,P group ,root=master); /* send numbers to slaves */ reduce_add(&sum,&s,P group ,root=master); /* results from slaves */ Slave scatter(numbers,&s,P group ,root=master); /* receive s numbers */ . /* add numbers */ reduce_add(&part_sum,&s,P group ,root=master);/* send sum to master */ 123 Parallel Programming: Techniques and Applications using Networked Workstations and Parallel Computers Barry Wilkinson and Michael Allen  Prentice Hall, 1999

Analysis Sequential Requires n − 1 additions with a time complexity of Ο ( n ). Parallel Using individual send and receive routines Phase 1 — Communication t comm1 = m ( t startup + ( n / m ) t data ) Phase 2 — Computation t comp1 = n / m − 1 Phase 3 — Communication Returning partial results using individual send and receive routines t comm2 = m ( t startup + t data ) Phase 4 — Computation Final accumulation t comp2 = m − 1 Overall t p = ( t comm1 + t comm2 ) + ( t comp1 + t comp2 ) = 2 mt startup + ( n + m ) t data + m + n / m − 2 or t p = O( n + m ) We see that the parallel time complexity is worse than the sequential time complexity. 124 Parallel Programming: Techniques and Applications using Networked Workstations and Parallel Computers Barry Wilkinson and Michael Allen  Prentice Hall, 1999

Divide and Conquer Characterized by dividing a problem into subproblems that are of the same form as the larger problem. Further divisions into still smaller sub-problems are usually done by recursion A sequential recursive definition for adding a list of numbers is int add(int *s) /* add list of numbers, s */ { if (number(s) =< 2) return (n1 + n2); /* see explanation */ else { Divide (s, s1, s2); /* divide s into two parts, s1 and s2 */ part_sum1 = add(s1); /*recursive calls to add sub lists */ part_sum2 = add(s2); return (part_sum1 + part_sum2); } } 125 Parallel Programming: Techniques and Applications using Networked Workstations and Parallel Computers Barry Wilkinson and Michael Allen  Prentice Hall, 1999

Initial problem Divide problem Final tasks Figure 4.2 Tree construction. 126 Parallel Programming: Techniques and Applications using Networked Workstations and Parallel Computers Barry Wilkinson and Michael Allen  Prentice Hall, 1999

Parallel Implementation Original list P 0 P 0 P 4 P 0 P 2 P 4 P 6 P 0 P 1 P 2 P 3 P 4 P 5 P 6 P 7 x 0 x n − 1 Figure 4.3 Dividing a list into parts. 127 Parallel Programming: Techniques and Applications using Networked Workstations and Parallel Computers Barry Wilkinson and Michael Allen  Prentice Hall, 1999

x 0 x n − 1 P 0 P 1 P 2 P 3 P 4 P 5 P 6 P 7 P 0 P 2 P 4 P 6 P 0 P 4 P 0 Final sum Figure 4.4 Partial summation. 128 Parallel Programming: Techniques and Applications using Networked Workstations and Parallel Computers Barry Wilkinson and Michael Allen  Prentice Hall, 1999

Parallel Code Suppose we statically create eight processors (or processes) to add a list of numbers. Process P 0 /* division phase */ divide(s1, s1, s2); /* divide s1 into two, s1 and s2 */ send(s2, P 4 ); /* send one part to another process */ divide(s1, s1, s2); send(s2, P 2 ); divide(s1, s1, s2); send(s2, P 1 }; part_sum = *s1; /* combining phase */ recv(&part_sum1, P 1 ); part_sum = part_sum + part_sum1; recv(&part_sum1, P 2 ); part_sum = part_sum + part_sum1; recv(&part_sum1, P 4 ); part_sum = part_sum + part_sum1; The code for process P 4 might take the form Process P 4 recv(s1, P 0 ); /* division phase */ divide(s1, s1, s2); send(s2, P 6 ); divide(s1, s1, s2); send(s2, P 5 ); part_sum = *s1; /* combining phase */ recv(&part_sum1, P 5 ); part_sum = part_sum + part_sum1; recv(&part_sum1, P 6 ); part_sum = part_sum + part_sum1; send(&part_sum, P 0 ); Similar sequences are required for the other processes. 129 Parallel Programming: Techniques and Applications using Networked Workstations and Parallel Computers Barry Wilkinson and Michael Allen  Prentice Hall, 1999

Analysis Assume that n is a power of 2. The communication setup time, t startup , is not included in the following for simplicity. Communication Division phase ( ) n n n n n p – 1 … -- - t data -- - t data -- - t data -- - t data - - - - - - - - - - - - - - - - - - - t data - t comm1 = + + + + = 2 4 8 p p Combining phase t comm2 = t data log p Total communication time ( ) n p – 1 t comm = t comm1 + t comm2 = - - - - - - - - - - - - - - - - - - - - t data + t data log p p Computation n t comp = -- - + log p p Total Parallel Execution Time ( ) n p – 1 n t p = - - - - - - - - - - - - - - - - - - - - t data + t data log p + -- - + log p p p 130 Parallel Programming: Techniques and Applications using Networked Workstations and Parallel Computers Barry Wilkinson and Michael Allen  Prentice Hall, 1999

OR Found/ Not found OR OR Figure 4.5 Part of a search tree. 131 Parallel Programming: Techniques and Applications using Networked Workstations and Parallel Computers Barry Wilkinson and Michael Allen  Prentice Hall, 1999

M -ary Divide and Conquer Divide and conquer can also be applied where a task is divided into more than two parts at each stage. For example, if the task is broken into four parts, the sequential recursive definition would be int add(int *s) /* add list of numbers, s */ { if (number(s) =< 4) return(n1 + n2 + n3 + n4); else { Divide (s,s1,s2,s3,s4); /* divide s into s1,s2,s3,s4*/ part_sum1 = add(s1); /*recursive calls to add sublists */ part_sum2 = add(s2); part_sum3 = add(s3); part_sum4 = add(s4); return (part_sum1 + part_sum2 + part_sum3 + part_sum4); } } Figure 4.6 Quadtree. 132 Parallel Programming: Techniques and Applications using Networked Workstations and Parallel Computers Barry Wilkinson and Michael Allen  Prentice Hall, 1999

Image area First division into four parts Second division Figure 4.7 Dividing an image. 133 Parallel Programming: Techniques and Applications using Networked Workstations and Parallel Computers Barry Wilkinson and Michael Allen  Prentice Hall, 1999

Divide-and-Conquer Examples Sorting Using Bucket Sort Works well if the original numbers are uniformly distributed across a known interval, say 0 to a − 1. This interval is divided into m equal regions, 0 to a / m − 1, a / m to 2 a / m − 1, 2 a / m to 3 a / m − 1, … and one “bucket” is assigned to hold numbers that fall within each region. The numbers are simply placed into the appropriate buckets. The numbers in each bucket will be sorted using a sequential sorting algorithm Unsorted numbers Buckets Sort contents of buckets Merge lists Sorted numbers Figure 4.8 Bucket sort. Sequential time t s = n + m (( n / m )log( n / m )) = n + n log( n / m ) = Ο ( n log( n / m )) 134 Parallel Programming: Techniques and Applications using Networked Workstations and Parallel Computers Barry Wilkinson and Michael Allen  Prentice Hall, 1999

Partitioning and Divide-and- Conquer Strategies Partitioning - PDF document

Partitioning and Divide-and- Conquer Strategies Partitioning Strategies Partitioning simply divides the problem into parts Example - Adding a sequence of numbers We might consider dividing the sequence into m parts of n / m numbers each, ( x 0

Divide-Conquer-Glue Algorithms Divide-and-conquer. Divide up problem into several subproblems.

Week 2 Growth of Functions Divide-and- Divide and Conquer Conquer Min-Max- Problem Tutorial

Divide and Conquer Algorithm Design Techniques Greedy Divide and Conquer Dynamic Programming

Divide and Conquer Summary Divide Identify one or more subproblems Conquer Solve

Divide and conquer 1 The main idea for the divide and conquer is trying to divide a problem into

Divide and conquer Philip II of Macedon Divide and conquer 1) Divide your problem into

Divide-Conquer-Glue Algorithms Divide-and-conquer. Mergesort and Counting Inversions Divide

Divide and Conquer Algorithms Divide-and-Conquer The most-well known algorithm design strategy:

CSC 151 Spring 2020 Topic: Merge Sort May 4, 2020 Day 39 Self Checks Divide and Conquer

Module 2: Divide and Conquer Module 2: Divide and Conquer Harivinod N Harivinod N Dept. of

Outline and Reading Divide-and-conquer paradigm (5.2) Divide-and-Conquer Review Merge-sort

A divide-and-conquer algorithm for a symmetric eigenproblem Binh T. Nguyen Anh-Duc Luong-Thanh

Divide and Conquer Algorithm Theory WS 2012/13 Fabian Kuhn Divide And Conquer Principle

Divide-and-Conquer Divide-and-conquer. Break up problem into several parts. Solve each

CS Lunch Mary Allen Wilkes Wednesday 12:15 Kendade 307 2 Divide and Conquer Divide-and-conquer.

Week 3 Oliver Kullmann Divide-and- Conquer Solving Recurrences Merge Sort Solving

CITY COLLEGE Presented by: Carlito Berlus, Senior Academic Advisor Cover ered ed In In Th

Outline CSci 5271 Big-Picture Introduction Introduction to Computer Security Day 1:

Where does Innovation Management Live? Colin Nelson Director of Enterprise Innovation

Computer certified efficient exact reals in Coq Robbert Krebbers Joint work with Bas Spitters 1

Diverse Critiques and Comments on Some Models and Approaches to Assessment (Presentation Slides)

Can Technology Overcome Social Disadvantage of School Childrens Learning Outcomes? Evidence

Defini3ons Programming Working out algorithms that solve

Daniel Thorson, 33, entered the Monastic Academy in Lowell, Vermont on March 23 for two months of