0% found this document useful (0 votes)

17 views19 pages

Week 10 Part 1 Pipelined Processor

Uploaded by

dewierbarbell0n

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

17 views19 pages

Week 10 Part 1 Pipelined Processor

Uploaded by

dewierbarbell0n

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

You are on page 1/ 19

COM1031 Computer Logic

Week 10
Pipelined Processor
Week 10

• Pipelined Processor

Digital Design and Computer Architecture: ARM® Edition © 2015

Review: Single-Cycle ARM Processor
PCSrc
Control
MemtoReg
Unit
31:28 MemWrite
Cond
27:26 ALUControl
Op
25:20 ALUSrc
Funct
15:12
Rd ImmSrc
RegWrite

Flags
ALUFlags

RegSrc
0 1 CLK CLK
CLK
19:16
Instr

0 RA1 WE3 SrcA WE

1 PC' PC A1 RD1
A RD 15 1 ALUResult ReadData

ALU
0 3:0 A RD
Instruction 0 RA2
A2 RD2 0 SrcB Data
Memory 1
15:12 1 Memory
A3 Register WriteData
WD
4 WD3 File
PCPlus8 1
R15
+

PCPlus4 0
+

4
23:0
Extend ExtImm
Result

Digital Design and Computer Architecture: ARM® Edition © 2015

Pipelined ARM Processor
• Aim to really improve performance
• Use temporal parallelism
• Divide single-cycle processor into 5 stages:
– Fetch
– Decode
– Execute
– Memory
– Writeback
• Add pipeline registers between stages

Digital Design and Computer Architecture: ARM® Edition © 2015

Single-Cycle vs. Pipelined
Single-Cycle
0 100 200 300 400 500 600 700 800 900 1000 1100 1200 1300 1400 1500
Instr
Dec Execute Memory Wr Time (ps)
Fetch
1 Read
Instruction Reg
ALU Read / Write Reg
Fetch Dec Execute Memory Wr
2 Read
Instruction Reg
ALU Read / Write Reg

Instr
Pipelined
Fetch Dec Execute Memory Wr
1 Read
Instruction Reg
ALU Read / Write Reg
Fetch Dec Execute Memory Wr
2 Read
Instruction Reg
ALU Read / Write Reg
Fetch Dec Execute Memory Wr
3 Read
Instruction Reg
ALU Read / Write Reg

(b)

Digital Design and Computer Architecture: ARM® Edition © 2015

Pipelined Processor Abstraction
1 2 3 4 5 6 7 8 9 10

Time (cycles)
R0
LDR DM R2
LDR R2, [R0, #40] IM RF 40 + RF

R9
ADD DM R3
ADD R3, R9, R10 IM RF R10 + RF

R1
SUB DM R4
SUB R4, R1, R5 IM RF R5 - RF

R12
AND DM R5
AND R5, R12, R13 IM RF R13 & RF

R1
STR DM R6
STR R6, [R1, #20] IM RF 20 + RF

R11
ORR DM R7
ORR R7, R11, #42 IM RF 42 | RF

Digital Design and Computer Architecture: ARM® Edition © 2015

Single-Cycle & Pipelined Datapath
Single-Cycle
CLK CLK
CLK
19:16

Instr
0 RA1 WE3 SrcA WE
1 PC' PC A1 RD1
A RD 15 1 ALUResult ReadData

ALU
0 3:0 A RD
Instruction 0 RA2
A2 RD2 0 SrcB Data
Memory 1
15:12 1 Memory
A3 Register WriteData
WD
4 WD3 File
PCPlus8 1
R15

+
PCPlus4 0
+

4
23:0
Extend ExtImm
Result

Pipelined
CLK CLK CLK CLK
CLK CLK
CLK
InstrF

InstrD

19:16
0 RA1D WE3 SrcAE WE
1 PC' PCF A1 RD1
A RD 15 1 ALUResultE ReadDataW

ALU
0 3:0 A RD
Instruction 0 RA2D
A2 RD2 0 SrcBE Data
Memory 1
15:12 WA3D 1 Memory
A3 Register WriteDataE
WD
4 WD3 File
PCPlus8 1
R15 ALUOutM ALUOutW
+

PCPlus4F 0
+

4
23:0
Extend ExtImmE
ResultW

Fetch Decode Execute Memory Writeback

Digital Design and Computer Architecture: ARM® Edition © 2015

Pipeline Hazards
• When an instruction depends on result from
instruction that hasn’t completed
• Types:
– Data hazard: register value not yet written back to
register file
– Control hazard: next instruction not decided yet
(caused by branch)

Digital Design and Computer Architecture: ARM® Edition © 2015

Data Hazard
1 2 3 4 5 6 7 8

Time (cycles)
R4
ADD DM R1
ADD R1, R4, R5 IM RF R5 + RF

R1
AND DM R8
AND R8, R1, R3 IM RF R3 & RF

R6
ORR DM R9
ORR R9, R6, R1 IM RF R1 | RF

R1
SUB DM R10
SUB R10, R1, R7 IM RF R7 - RF

Digital Design and Computer Architecture: ARM® Edition © 2015

Handling Data Hazards
• Insert NOPs in code at compile time
• Rearrange code at compile time
• Forward data at run time
• Stall the processor at run time

Digital Design and Computer Architecture: ARM® Edition © 2015

Compile-Time Hazard Elimination
• Insert enough NOPs for result to be ready
• Or move independent useful instructions forward
1 2 3 4 5 6 7 8 9 10

Time (cycles)
R4
ADD DM R1
ADD R1, R4, R5 IM RF R5 + RF

NOP DM
NOP IM RF RF

R1
AND DM R8
AND R8, R1, R3 IM RF R3 & RF

R6
ORR DM R9
ORR R9, R6, R1 IM RF R1 | RF

R1
SUB DM R10
SUB R10, R1, R7 IM RF R7 - RF

Digital Design and Computer Architecture: ARM® Edition © 2015

Data Forwarding
1 2 3 4 5 6 7 8

Time (cycles)
R4
ADD DM R1
ADD R1, R4, R5 IM RF R5 + RF

R1
AND DM R8
AND R8, R1, R3 IM RF R3 & RF

R6
ORR DM R9
ORR R9, R6, R1 IM RF R1 | RF

R1
SUB DM R10
SUB R10, R1, R7 IM RF R7 - RF

Digital Design and Computer Architecture: ARM® Edition © 2015

Data Forwarding
1 2 3 4 5 6 7 8

Time (cycles)
R4
ADD DM R1
ADD R1, R4, R5 IM RF R5 + RF

R1
AND DM R8
AND R8, R1, R3 IM RF R3 & RF

R6
ORR DM R9
ORR R9, R6, R1 IM RF R1 | RF

R1
SUB DM R10
SUB R10, R1, R7 IM RF R7 - RF

• Check if register read in Execute stage matches register

written in Memory or Writeback stage
• If so, forward result

Stalling
1 2 3 4 5 6 7 8

Time (cycles)
R4
LDR DM R1
LDR R1, [R4, #40] IM RF 40 + RF

Trouble!
R1
AND DM R8
AND R8, R1, R3 IM RF R3 & RF

R6
ORR DM R9
ORR R9, R6, R1 IM RF R1 | RF

R1
SUB DM R10
SUB R10, R1, R7 IM RF R7 - RF

Stalling
1 2 3 4 5 6 7 8 9

Time (cycles)
R4
LDR DM R1
LDR R1, [R4, #40] IM RF 40 + RF

R1 R1
AND DM R8
AND R8, R1, R3 IM RF R3 RF R3 & RF

R6
ORR ORR DM R9
ORR R9, R6, R1 IM IM RF R1 | RF

Stall R1
SUB DM R10
SUB R10, R1, R7 IM RF R7 - RF

Control Hazards
• B:
– branch not determined until the Writeback stage
of pipeline
– Instructions after branch fetched before branch
occurs
– These 4 instructions must be flushed if branch
happens
• Writes to PC (R15) similar

Control Hazards
1 2 3 4 5 6 7 8 9 10

Time (cycles)

B DM
20 B 3C IM RF RF

R1
AND DM
24 AND R8, R1, R3 IM RF R3 & RF

R6 Flush
ORR DM
28 ORR R9, R6, R1 IM RF R1 | RF these
instructions
R1
SUB DM
2C SUB R10, R1, R7 IM RF R7 - RF

R1
SUB DM
30 SUB R11, R1, R8 IM RF R8 - RF

34 ...
...
R3
ADD DM R12
64 ADD R12, R3, R4 IM RF R4 RF

+
Branch misprediction penalty
• number of instruction flushed when branch is taken (4)
• May be reduced by determining BTA earlier

Pipelined Performance Example
• SPECINT2000 benchmark:
– 25% loads
– 10% stores
– 13% branches
– 52% data processing
• Suppose:
– 40% of loads used by next instruction
– 50% of branches mispredicted
• What is the average CPI?
– Load CPI = 1 when not stalling, 2 when stalling
So, CPIlw = 1(0.6) + 2(0.4) = 1.4
– Branch CPI = 1 when not stalling, 3 when stalling
So, CPIbeq = 1(0.5) + 3(0.5) = 2

Average CPI = (0.25)(1.4) + (0.1)(1) + (0.13)(2) + (0.52)(1) = 1.23

Digital Design and Computer Architecture: ARM® Edition: Sarah L. Harris and David Money Harris
No ratings yet
Digital Design and Computer Architecture: ARM® Edition: Sarah L. Harris and David Money Harris
28 pages
Blueprints in Neurology PDF
100% (1)
Blueprints in Neurology PDF
246 pages
FemtoRV32 Piplined Processor Report
No ratings yet
FemtoRV32 Piplined Processor Report
25 pages
ARM Unit 1 - Lecture Notes
100% (2)
ARM Unit 1 - Lecture Notes
19 pages
ARM Processors Interview Questions
100% (3)
ARM Processors Interview Questions
2 pages
The First Encounter
50% (2)
The First Encounter
44 pages
Risc Processor - Arm 9
No ratings yet
Risc Processor - Arm 9
84 pages
Lecture 3
100% (1)
Lecture 3
88 pages
ARM Processor Asczsignment
No ratings yet
ARM Processor Asczsignment
6 pages
ARM Architecture Overview
100% (1)
ARM Architecture Overview
19 pages
ARM Processor
No ratings yet
ARM Processor
88 pages
ARM Processor Core
No ratings yet
ARM Processor Core
34 pages
Development of The ARM Architecture
No ratings yet
Development of The ARM Architecture
44 pages
Lec Arm PDF
No ratings yet
Lec Arm PDF
25 pages
COA Chapter 6
No ratings yet
COA Chapter 6
6 pages
MCES - IA 1-Solution
No ratings yet
MCES - IA 1-Solution
8 pages
Lec 3
No ratings yet
Lec 3
20 pages
ARM Architecture2
No ratings yet
ARM Architecture2
58 pages
Unit 2 Arm7
No ratings yet
Unit 2 Arm7
67 pages
ARM Pipelining
No ratings yet
ARM Pipelining
43 pages
MPMC Unit - 4
No ratings yet
MPMC Unit - 4
15 pages
CH2 Arm
No ratings yet
CH2 Arm
68 pages
CO4 - ARM & PIC Part 1
No ratings yet
CO4 - ARM & PIC Part 1
25 pages
Module 4 - Introduction To Embedded System and ARM
No ratings yet
Module 4 - Introduction To Embedded System and ARM
29 pages
1.ARM Architecture, Instruction
No ratings yet
1.ARM Architecture, Instruction
50 pages
Lecture Notes For ARM Architecture - Module I
No ratings yet
Lecture Notes For ARM Architecture - Module I
45 pages
5-Stage Pipeline CPU Hardware
No ratings yet
5-Stage Pipeline CPU Hardware
24 pages
Lecture 3
No ratings yet
Lecture 3
88 pages
Unit Ii Arm
No ratings yet
Unit Ii Arm
243 pages
18CS44 Module1
No ratings yet
18CS44 Module1
46 pages
1083708977
No ratings yet
1083708977
57 pages
04 - The ARM Architecture and ISA
No ratings yet
04 - The ARM Architecture and ISA
73 pages
ARM Architecture
No ratings yet
ARM Architecture
30 pages
Computer Organisation & Architecture Project Report Topic:: Course Code: CO206
No ratings yet
Computer Organisation & Architecture Project Report Topic:: Course Code: CO206
18 pages
Embedded Lecture 4 ARM
No ratings yet
Embedded Lecture 4 ARM
47 pages
21CS43 SIMP Questions-TIE
No ratings yet
21CS43 SIMP Questions-TIE
60 pages
Lecture6 ARM
No ratings yet
Lecture6 ARM
50 pages
Module 4 - ECE3014 Introduction To Embedded System and ARM-1
No ratings yet
Module 4 - ECE3014 Introduction To Embedded System and ARM-1
27 pages
Digital Design and Computer Architecture:: ARM® Edition
No ratings yet
Digital Design and Computer Architecture:: ARM® Edition
29 pages
ARM
No ratings yet
ARM
44 pages
5-Stage Pipeline CPU Hardware
No ratings yet
5-Stage Pipeline CPU Hardware
43 pages
ARM Notes1
No ratings yet
ARM Notes1
15 pages
Unit 4 - ARM Processors
No ratings yet
Unit 4 - ARM Processors
68 pages
Real Time System Lect10 A
No ratings yet
Real Time System Lect10 A
25 pages
Module 4 Final
No ratings yet
Module 4 Final
28 pages
ARM Introduction & Architecture
No ratings yet
ARM Introduction & Architecture
33 pages
Wa0001.
No ratings yet
Wa0001.
108 pages
Unit I-Emb. Proc Part B Q&A
No ratings yet
Unit I-Emb. Proc Part B Q&A
14 pages
Module 5 ARM Basic
No ratings yet
Module 5 ARM Basic
52 pages
CA07 2022S3 New
No ratings yet
CA07 2022S3 New
29 pages
MES Not Fail-Act 1
No ratings yet
MES Not Fail-Act 1
17 pages
Unit 5 MPMC
No ratings yet
Unit 5 MPMC
12 pages
MPMC Unit 3 by KS
No ratings yet
MPMC Unit 3 by KS
110 pages
The First Encounter: Authors: Nemanja Perovic, Prof. Dr. Veljko Milutinovic
No ratings yet
The First Encounter: Authors: Nemanja Perovic, Prof. Dr. Veljko Milutinovic
44 pages
General Purpose Processor
No ratings yet
General Purpose Processor
13 pages
Timingdiagram 1
No ratings yet
Timingdiagram 1
14 pages
Assignment 2 Solution
0% (1)
Assignment 2 Solution
4 pages
Elet 3405 HW 4
0% (1)
Elet 3405 HW 4
6 pages
Hazard (Computer Architecture)
No ratings yet
Hazard (Computer Architecture)
10 pages
Addressing Modes in 8085 Microprocessor
No ratings yet
Addressing Modes in 8085 Microprocessor
5 pages
MULTIcycle OPERATIONS
No ratings yet
MULTIcycle OPERATIONS
24 pages
Chapter 4 The Processor
No ratings yet
Chapter 4 The Processor
72 pages
String Instructions of 8086
No ratings yet
String Instructions of 8086
47 pages
Instruction Set of 8085 Microprocessor
No ratings yet
Instruction Set of 8085 Microprocessor
12 pages
Tomasulo With Re-Order Buffer-V3
No ratings yet
Tomasulo With Re-Order Buffer-V3
10 pages
Pipeline Architecture
No ratings yet
Pipeline Architecture
33 pages
Beyond RISC - The Post-RISC Architecture Submitted To: IEEE Micro 3/96
No ratings yet
Beyond RISC - The Post-RISC Architecture Submitted To: IEEE Micro 3/96
20 pages
LOOG Improving GPU Efficiency With Light-Weight Out-Of-Order Execution
No ratings yet
LOOG Improving GPU Efficiency With Light-Weight Out-Of-Order Execution
4 pages
Addressing Modes
No ratings yet
Addressing Modes
21 pages
Pipelining - Modified1
No ratings yet
Pipelining - Modified1
51 pages
Microprocessor - 8085 Branching Instructions
No ratings yet
Microprocessor - 8085 Branching Instructions
5 pages
HW Monitor
No ratings yet
HW Monitor
39 pages
8086 Jump Instructions 12 G
No ratings yet
8086 Jump Instructions 12 G
12 pages
5 - RISCV - SingleCycle - Arch1
No ratings yet
5 - RISCV - SingleCycle - Arch1
44 pages
15CS72 ACA Module3 Chapter2finalnotes
No ratings yet
15CS72 ACA Module3 Chapter2finalnotes
20 pages
S.no RTL Name Signals Required: Horizontal Microcode
No ratings yet
S.no RTL Name Signals Required: Horizontal Microcode
10 pages
Lecture4نظم
No ratings yet
Lecture4نظم
50 pages
Problem Solutions To Problems Marked With A in Logic Computer Design Fundamentals, Ed. 2
No ratings yet
Problem Solutions To Problems Marked With A in Logic Computer Design Fundamentals, Ed. 2
2 pages
HPC Lesson Plan
No ratings yet
HPC Lesson Plan
8 pages
Dynamic Scheduling
No ratings yet
Dynamic Scheduling
70 pages
Computer Architecture: Trần Trọng Hiếu
No ratings yet
Computer Architecture: Trần Trọng Hiếu
29 pages
Tentang Sistem
No ratings yet
Tentang Sistem
10 pages
Happyfish Code
No ratings yet
Happyfish Code
6 pages
Quiz5 Solutions
No ratings yet
Quiz5 Solutions
2 pages
PLC: Programmable Logic Controller – Arktika.: EXPERIMENTAL PRODUCT BASED ON CPLD.
From Everand
PLC: Programmable Logic Controller – Arktika.: EXPERIMENTAL PRODUCT BASED ON CPLD.
Franco Mario
No ratings yet
The RTX 5090 Blueprint: A Guide for Power Users
From Everand
The RTX 5090 Blueprint: A Guide for Power Users
Terrance Young
No ratings yet
Digital PDP15 Price List April, 1970
From Everand
Digital PDP15 Price List April, 1970
Archive Classics
1/5 (1)
LEARN MPLS FROM SCRATCH PART-B: A Beginners guide to next level of networking
From Everand
LEARN MPLS FROM SCRATCH PART-B: A Beginners guide to next level of networking
POONAM DEVI
No ratings yet
Practical Reverse Engineering: x86, x64, ARM, Windows Kernel, Reversing Tools, and Obfuscation
From Everand
Practical Reverse Engineering: x86, x64, ARM, Windows Kernel, Reversing Tools, and Obfuscation
Bruce Dang
No ratings yet
PC Engine / TurboGrafx-16 Architecture: Architecture of Consoles: A Practical Analysis, #16
From Everand
PC Engine / TurboGrafx-16 Architecture: Architecture of Consoles: A Practical Analysis, #16
Rodrigo Copetti
No ratings yet

Week 10 Part 1 Pipelined Processor

Uploaded by

Week 10 Part 1 Pipelined Processor

Uploaded by

COM1031 Computer Logic

Digital Design and Computer Architecture: ARM® Edition © 2015

0 RA1 WE3 SrcA WE

Digital Design and Computer Architecture: ARM® Edition © 2015

Digital Design and Computer Architecture: ARM® Edition © 2015

Digital Design and Computer Architecture: ARM® Edition © 2015

Digital Design and Computer Architecture: ARM® Edition © 2015

Fetch Decode Execute Memory Writeback

Digital Design and Computer Architecture: ARM® Edition © 2015

Digital Design and Computer Architecture: ARM® Edition © 2015

Digital Design and Computer Architecture: ARM® Edition © 2015

Digital Design and Computer Architecture: ARM® Edition © 2015

Digital Design and Computer Architecture: ARM® Edition © 2015

Digital Design and Computer Architecture: ARM® Edition © 2015

• Check if register read in Execute stage matches register

Digital Design and Computer Architecture: ARM® Edition © 2015

Digital Design and Computer Architecture: ARM® Edition © 2015

Digital Design and Computer Architecture: ARM® Edition © 2015

Digital Design and Computer Architecture: ARM® Edition © 2015

Digital Design and Computer Architecture: ARM® Edition © 2015

Digital Design and Computer Architecture: ARM® Edition © 2015

Average CPI = (0.25)(1.4) + (0.1)(1) + (0.13)(2) + (0.52)(1) = 1.23

Digital Design and Computer Architecture: ARM® Edition © 2015

You might also like