past and future trends in architecture and hardware
play

Past and Future Trends in Architecture and Hardware David - PowerPoint PPT Presentation

Past and Future Trends in Architecture and Hardware David Pa5erson pattrsn@eecs.berkeley.edu SOSP History Day October 3, 2015 1 Outline Part I - Past Part II Future


  1. Past ¡and ¡Future ¡Trends ¡in ¡ Architecture ¡and ¡Hardware ¡ David ¡Pa5erson ¡ pattrsn@eecs.berkeley.edu SOSP ¡History ¡Day ¡October ¡3, ¡2015 ¡ ¡ 1

  2. Outline Part I - Past Part II – Future 50 years of Computer HW Technology Architecture History: • End of Moore’s Law • 1960s: • Flash vs. Disks Computer Families / • Fast DRAM Microprogramming • Crosspoint NVRAM • 1970s: CISC Open ISA & RISC-V • 1980s: RISC • Case for Open ISAs • 1990s: VLIW • Tour of RISC-V ISA • 2000s: NUMA vs. • RISC-V Software Stack Clusters • RISC-V Chips 2

  3. IBM Compatibility Problem in early 1960s By early 1960’s, IBM had 4 incompatible lines of computers! 701 → 7094 650 → 7074 702 → 7080 1401 → 7010 Each system had its own • Instruction set • I/O system and Secondary Storage: magnetic tapes, drums and disks • Assemblers, compilers, libraries,... • Market niche: business, scientific, real time, ... ⇒ IBM System/360 – one ISA to rule them all 3

  4. IBM 360: A Computer Family ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡Model ¡30 ¡. ¡. ¡. ¡ ¡ ¡Model ¡70 ¡ ¡Storage ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡8K ¡-­‑ ¡64 ¡KB ¡ ¡ ¡256K ¡-­‑ ¡512 ¡KB ¡ ¡Datapath ¡8-­‑bit ¡ ¡ ¡64-­‑bit ¡ ¡Circuit ¡Delay ¡30 ¡nsec/level ¡ ¡5 ¡nsec/level ¡ ¡Registers ¡Main ¡Store ¡ ¡Transistor ¡Registers ¡ The IBM 360 is why bytes are 8-bits long today! IBM ¡360 ¡instruc>on ¡set ¡architecture ¡(ISA) ¡completely ¡hid ¡the ¡ underlying ¡technological ¡differences ¡between ¡various ¡models. ¡ Milestone: ¡The ¡first ¡true ¡ISA ¡designed ¡as ¡portable ¡hardware-­‑ soKware ¡interface! ¡ ¡With ¡minor ¡modifica>ons ¡it ¡s>ll ¡survives ¡today! ¡ 4

  5. IBM System/360 Reference Card (“Green card”) I IBM 1 FEATURE 'INSTRUCTIONS' m ' S y ~ t 8 m / ~ ~ OR (cl OC F L O A ~ N E P ~ I N T - @ P a G k P A W F2 R~hrmca Data Jc.x) . , 3 6 , RR AddN~allted,Extendd AXR I%- D i n n 4 b # ) RDD 86 Add Normdized, Long (c] A D R 2A RR MsDk (n) I S M - m SPM 04 Fdd Normdid, L O ~ B Ic) , AD 8A RX Srorlge Key 4e.d SSK 08 Add Norrndized, Short (01 AER 3A RR a t %s@~n W fpi SSM 80 ' MACHINE IWTRUCTION add Nonnalizad, Short I d hS AE 7A RX Shift Left Dwble (c) SLDA 8F Add Unnormalized, Long (c) AWR 2E RR shift bft ~oubfe ~owical SLDL 8D IUm Add Unnormaltzad, Long (c) AW 6E RX MlWDlllG *;hm~%!#efc) SLA 88 Add Unnomralf*ed, Short (c) AUR 3E RR S M L M Single Logical SLL 89 Apkl (0) AR ICY Add Unnomalited, W r t AU 7E KX Dmlbk bl W b c 3 A R W t SRDA 8E -- Compare, Low ( d Doubh Lagical CDR 29 RR Add AP Shift R w t SRDL 8C Deeimd ( e , d ) ah Cmpm Long (c) CD 69 RX R @ h t $ M e Id SRA 8A Akl Halfvvarel (cl AH 39 Compare, Short (c) CER RR Add Logical (d Wcl Rwt ALR Qry& Logical SRL 88 CE 76 Compare, Short Ic) RX IfQ Y ) Q d add CDBical (d 510 9C AL DiviL, Long DDR 2D RR Sf Sore 50 AND (c) NR Dilde, Long DD 6 0 RX ' store C~Q~~=QC STC 42 AND (c) N Divide, Short DER 3 0 RR St- hl&wd STH So AND (cl Ni m DM&, short DE 7D RX AND (4 90 Nc Long HDR 24 RR W v e . Bmmh and S £ m MuSrir Oontrol (eip) STMC 60 Link BALR Halve, Shon HER 34 RR fbbmlmU S R 16 Branch m d Link BAL LTDR a RR t d Load and Teat, Long (c) Branch a d Stare ( e l SdNmft S 68 W R Load m d Test, Short (c) LTER 32 RR Branch Md Srwe (el 6ubfm&99dm@ lc,d SP FB BAS Load Conplment, Long (c) LCDR 23 RR Q b t F W Wdfword (6) SH 48 BrMCGonCondftion I r n R Load Complement Short (cl LCER RR 8 k 4 w W t & ! & d k) Branah on C;ondEth BIC StR I F wm@ Loeieal (el L - 4 28 S F Long LDR RR BfZmhahCeunt A S t BCT s l w b u k % ~ m LD 68 Load, Long RX on count SVC O A B m n c h 867 mMdwl(c) Load NNegative. Long (cl LNDR 21 RR on Idem H5gh TS 93 8XH Load Negative, SfwR (c) LNER 31 RR ' f M I W 4 % ~ ) BnncSronlhdexL~arEqusl BXLE TCH SF Load Positive, Long (c) LPDR 20 RR l& h 1 (4 %Hi € TI0 9D Conrpors CR Load Padtiva, Shart (c) LPER 3 0 RR ~ ~ . t Wlvsk (cr) r ~ ! ' TM 91 Campare rc) C lQad Rwnded, Extended (x) 26 to Long LRDR RR TR DC fawxm Dschapd bJ) bP Load Rounded, Long to Short Lx) LRER 3S RR OD cMns1*rr,HsWwdnd(cr) ct.E n a m b b d d T ~ TPlT Compnn h m m Laad, Short LER 3 8 RR tat CCR ~~~ UNPK F3 w@ E m & ? Load, Short LE 78 RX 84 eongrr?oLe?iwW CL WRD Multiply. Extended 1x1 MXR 26 RR Wnmv bqhall I 4 ZmQ CLC * ' (GRf) ZAP F8 . Multiply, tong MDR 2C RR -mm Laded I ' CL4 d NQTW Multiply, Long , MD 6C RX @OW PAWLS 1-3 CV& C o - t ( P ~ MXDR n Multiply, LongIExtended. (XI RR r ~mrmtta f e m m d . Decimel feamte code is load& cwwM.ta kwmal CVD m u & W a a $ o a n W fentwm e. Model67 Privileged instruction MulrOpIy, LonaIExtended (x) 87 RX m w m - I(d * MER New o . km&tifm ctoFla it s e t n . condition Extended pwcision Multiply, Short 3 C RR m DhFkk floating point feature Multiply, Short M E 7C RX M i D w Store, Long STD 60 RX Idl Mvlrs *al ~dit #i&CMl#E FORMATS ST € 70 jt?,d)\ ED RX Rl,D2lX2,B2) Editarralnkk 0 E W C H&@WQFID 1 1 SECOND HRLFWORD 2 1 THIRD HALFWORD 3 SDR 28 R R R1.W E & q h 951 tc) -- XR SD 68 RX Rl.M(X2.62~ Em#wiv# OR d c ) X SER xi 38 RR Rl.R2 Ewhsb OR Ce) ' SE 78 RX Rl,D2tX2,02) I EfdwbmQA le) XC E&-Y EX llQ) tc&J H I 0 fnaort Ghlmer IC KgY (w) 1 S K LR Lwd LBlu$ L LQadMdw8, LA (4 eapdaml T w r t LTR Lod l z a w m e n t (c) LCR Lordxdiliword LH - mu^ I & IrduWe Coharol (@a) Lod LMC LNR ' ~ ~ w ( C ) Loai 4 W a o r i t h LPR PSW l F l ( h , p ) Losd LPmY Losd Reid Ackkm (c,e$l LRA MVI MVC !Eswmda W N ~uswithOfkDIst AII"VQ M a m z o M a M W Z value of addms M u l O b MR M MMl*lv w Decbd t d b M u * AfiutalplVHsitmxd M H aR OR 0 OR fc) OR (d 01 5

  6. Control versus Datapath ▪ Processor designs can be split between datapath , where numbers are stored and arithmetic operations computed, and control , which sequences operations on datapath ▪ Biggest challenge for early computer designers was getting control circuitry correct � Maurice ¡Wilkes ¡invented ¡the ¡ Control ¡ idea ¡of ¡ microprogramming ¡ to ¡ InstrucUon ¡ Control ¡Lines ¡ CondiUon? ¡ design ¡the ¡control ¡unit ¡of ¡a ¡ processor, ¡1958 ¡ Registers ¡ ¡ Datapath ¡ Inst. ¡Reg. - ¡Logic ¡expensive ¡compared ¡to ¡ ALU ¡ PC ¡ ROM ¡or ¡RAM ¡ - ¡ROM ¡cheaper ¡than ¡RAM ¡ - ¡ROM ¡much ¡faster ¡than ¡RAM ¡ Busy? ¡ Address ¡ Data ¡ Main ¡Memory ¡ 6

  7. Microprogramming in IBM 360 Model ¡ M30 ¡ M40 ¡ M50 ¡ M65 ¡ Datapath ¡width ¡ 8 ¡bits ¡ 16 ¡bits ¡ 32 ¡bits ¡ 64 ¡bits ¡ Microcode ¡size ¡ 4k ¡x ¡50 ¡ 4k ¡x ¡52 ¡ 2.75k ¡x ¡85 ¡ 2.75k ¡x ¡87 ¡ 750 ¡ns ¡ 625 ¡ns ¡ ¡ 500 ¡ns ¡ 200 ¡ns ¡ ¡ Clock ¡cycle ¡Ume ¡(ROM) ¡ Main ¡memory ¡cycle ¡Ume ¡ 1500 ¡ns ¡ 2500 ¡ ¡ns ¡ 2000 ¡ns ¡ 750 ¡ns ¡ Annual ¡rental ¡fee ¡(1964 ¡$) ¡ $48,000 ¡ $54,000 ¡ $115,000 ¡ $270,000 ¡ $570,000 ¡ $650,000 ¡ $1,400,000 ¡ $3,200,000 ¡ Annual ¡rental ¡fee ¡(2015 ¡$) ¡ 7

  8. IC technology, Microcode, and CISC ▪ Logic, RAM, ROM all implemented using MOS transistors ▪ Semiconductor RAM ≈ same speed as ROM ▪ With Moore’s Law, memory for control store could grow ▪ Allowed more complicated instruction sets (CISC) ▪ Minicomputer (TTL server) Example: Digital Equipment VAX ISA in 1978 8

  9. Microprocessor Evolution ▪ Rapid progress in 1970s, fueled by advances in MOS ▪ ▪ technology, imitated minicomputers and mainframe ISAs ▪ ▪ Intel i432 - - Most ambitious 1970s micro - started in 1975 - released 1981 - 32-bit capability-based object-oriented architecture - Instructions variable number of bits long - Heavily microcoded - Severe performance, complexity, and usability problems ▪ Intel 8086 (1978, 8MHz, 29,000 transistors) - “Stopgap” 16-bit processor, architected in 10 weeks - Extended accumulator architecture - Assembly-compatible with 8080 - 20-bit addressing through segmented addressing scheme ▪ IBM PC uses Intel 8088 for 8-bit bus (and Motorola 68000 was late) - Estimated sales of 250,000; 100,000,000s sold 9

Download Presentation
Download Policy: The content available on the website is offered to you 'AS IS' for your personal information and use only. It cannot be commercialized, licensed, or distributed on other websites without prior consent from the author. To download a presentation, simply click this link. If you encounter any difficulties during the download process, it's possible that the publisher has removed the file from their server.

Recommend


More recommend