Moving To Parallel With CUDA - Hello Program

Uploaded by

owboostrsh2

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

17 views14 pages

Moving To Parallel With CUDA - Hello Program

Uploaded by

owboostrsh2

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 14

CUDA Programming

Hello Program
Outline
CUDA Programming
Functions Qualifiers
Built-in Device Variables
Variable Qualifiers
Addition on the device
Moving to parallel using blocks
Moving to parallel using threads
Combining blocks and threads
Cuda Programming
• Kernels are C functions with some
restrictions
– Can only access GPU memory
– Must have void return type
– No variable number of arguments (“varargs”)
– Not recursive
– No static variables
• Function arguments automatically copied
from CPU to GPU memory
Function Qualifiers
• __ global__ : invoked from within host (CPU) code,
– cannot be called from device (GPU) code
– must return void
• __device__ : called from other GPU functions,
– cannot be called from host (CPU) code
• __host__ : can only be executed by CPU, called from
host
• __host__ and __device__ qualifiers can be combined
– Sample use: overloading operators
– Compiler will generate both CPU and GPU code
Variable Qualifiers (GPU code)
• __device__
– Stored in device memory (large, high latency, no cache)
– Allocated with cudaMalloc (__device__ qualifier implied)
– Accessible by all threads
– Lifetime: application
• __shared__
– Stored in on-chip shared memory (very low latency)
– Allocated by execution configuration or at compile time
– Accessible by all threads in the same thread block
– Lifetime: kernel execution
• Unqualified variables:
– Scalars and built-in vector types are stored in registers
– Arrays of more than 4 elements stored in device memory
CUDA Built-in Device Variables
All __global__ and __device__
functions have access to these
automatically defined variables
• dim3 gridDim;
– Dimensions of the grid in
blocks (at most 2D)
• dim3 blockDim;
– Dimensions of the block in
threads
• dim3 blockIdx;
– Block index within the grid
• dim3 threadIdx;
– Thread index within the block © NVIDIA Corporation
CUDA Compile
CUDA Compile
Hello World!
int main(void) {
printf("Hello World!\n");
return 0;
}
Output:
Standard C that runs on the host
$ nvcc
hello_world.cu
NVIDIA compiler (nvcc) can be used to $ a.out
compile programs with no device code Hello World!
$

int main(void) {
mykernel<<<1,1>>>();
printf("Hello World!\n");
return 0;
}

Two new syntactic elements…

• Triple angle brackets mark a call from host

code to device code
– Also called a “kernel launch”
– We’ll return to the parameters (1,1) in a moment

• That’s all that is required to execute a function

Output:
int main(void) {
mykernel<<<1,1>>>();
$ nvcc
printf("Hello World!\n");
hello.cu
return 0;
$ a.out
}
Hello World!
$
•mykernel() does nothing

© NVIDIA 2013
Hello World! with Device Code
__global__ void mykernel(void){
printf("Hello World!\n");
}
Output:
int main(void) {
$ nvcc
mykernel<<<1,1>>>();
hello.cu
return 0;
$ a.out
}
Hello World!
$

© NVIDIA 2013
Hello World! with Device Code
__global__ void mykernel(void){
printf("Hello World!\n");
}
Output:
int main(void) {
$ nvcc
mykernel<<<2,2>>>();
hello.cu
return 0;
$ a.out
}
Hello World!
Hello World!
Hello World!
Hello World!
$
© NVIDIA 2013

PayU - Sales Deck
No ratings yet
PayU - Sales Deck
27 pages
CUDA Programming: Lei Zhou, Yafeng Yin, Yanzhi Ren, Hong Man, Yingying Chen
No ratings yet
CUDA Programming: Lei Zhou, Yafeng Yin, Yanzhi Ren, Hong Man, Yingying Chen
28 pages
Unit 6 Chapter 1 Parallel Programming Tools Cuda - Programming
No ratings yet
Unit 6 Chapter 1 Parallel Programming Tools Cuda - Programming
28 pages
Cuda 1
No ratings yet
Cuda 1
45 pages
21.L18 Intro To GPU and CUDA C
No ratings yet
21.L18 Intro To GPU and CUDA C
89 pages
Cuda Talk
100% (1)
Cuda Talk
82 pages
Cuda C/C++ Basics: NVIDIA Corporation
No ratings yet
Cuda C/C++ Basics: NVIDIA Corporation
67 pages
Introduction To CUDA C 3
No ratings yet
Introduction To CUDA C 3
67 pages
Programming Gpus With Cuda: John Mellor-Crummey
No ratings yet
Programming Gpus With Cuda: John Mellor-Crummey
42 pages
CUDAProg Model
No ratings yet
CUDAProg Model
24 pages
CUDA PPT Anurita Unit3
No ratings yet
CUDA PPT Anurita Unit3
42 pages
Introduction To CUDA C
No ratings yet
Introduction To CUDA C
67 pages
HPC Final 4-8
No ratings yet
HPC Final 4-8
25 pages
High Performance Computing On Gpu
No ratings yet
High Performance Computing On Gpu
37 pages
Chapter7 GPU
No ratings yet
Chapter7 GPU
45 pages
Cuda C
No ratings yet
Cuda C
70 pages
CUDA Programming Invert
No ratings yet
CUDA Programming Invert
36 pages
Introduccion CUDA C
No ratings yet
Introduccion CUDA C
51 pages
CUDA Compute Unified Device Architecture
No ratings yet
CUDA Compute Unified Device Architecture
26 pages
Cuda Review 1
No ratings yet
Cuda Review 1
13 pages
Govind 6
No ratings yet
Govind 6
4 pages
Unit 5 - CUDA Architecture
No ratings yet
Unit 5 - CUDA Architecture
17 pages
CUDA
No ratings yet
CUDA
18 pages
Gpu History and Cuda Programming Basics
No ratings yet
Gpu History and Cuda Programming Basics
44 pages
Lecture 11 Programming On Gpus Part 1 Zxu2acms60212 40212 S15lec 11 Gpupdf
No ratings yet
Lecture 11 Programming On Gpus Part 1 Zxu2acms60212 40212 S15lec 11 Gpupdf
121 pages
A Beginner'S Guide To Programming Gpus With Cuda: Mike Peardon
No ratings yet
A Beginner'S Guide To Programming Gpus With Cuda: Mike Peardon
21 pages
04 IntroductionGPUsCUDA
No ratings yet
04 IntroductionGPUsCUDA
25 pages
Lecture2 Cuda Basic 2010
No ratings yet
Lecture2 Cuda Basic 2010
44 pages
Lecture 2
No ratings yet
Lecture 2
77 pages
GPU Basics
No ratings yet
GPU Basics
93 pages
Gpu Cuda
No ratings yet
Gpu Cuda
204 pages
Topic GPU1
No ratings yet
Topic GPU1
32 pages
CUDA Programming Basic: High Performance Computing Center Hanoi University of Science & Technology
No ratings yet
CUDA Programming Basic: High Performance Computing Center Hanoi University of Science & Technology
38 pages
217 Lec2
No ratings yet
217 Lec2
24 pages
Overview of GPGPU's
No ratings yet
Overview of GPGPU's
81 pages
3 Computation
No ratings yet
3 Computation
28 pages
лк CUDA - 1 PDCn
No ratings yet
лк CUDA - 1 PDCn
31 pages
Lecture 12 GPU Programming
No ratings yet
Lecture 12 GPU Programming
65 pages
Endsem Imp HPC Unit 5
No ratings yet
Endsem Imp HPC Unit 5
24 pages
Basic-Cuda
No ratings yet
Basic-Cuda
49 pages
GPU Programming: CUDA
No ratings yet
GPU Programming: CUDA
29 pages
CUDA Putting It All Together
No ratings yet
CUDA Putting It All Together
39 pages
CUDA Introduction Mod
No ratings yet
CUDA Introduction Mod
50 pages
GPU Programming Slides 2
No ratings yet
GPU Programming Slides 2
37 pages
CUDA Introduction
No ratings yet
CUDA Introduction
39 pages
1 Cuda
100% (1)
1 Cuda
173 pages
ACA Unit3 Revised
No ratings yet
ACA Unit3 Revised
53 pages
Lecture3 Fundamentals of CUDA (Part1) - 2025
No ratings yet
Lecture3 Fundamentals of CUDA (Part1) - 2025
52 pages
Cheat Sheet CUDA
No ratings yet
Cheat Sheet CUDA
2 pages
Lecture 1: An Introduction To CUDA: Mike Giles
No ratings yet
Lecture 1: An Introduction To CUDA: Mike Giles
247 pages
Lecture 1: An Introduction To CUDA: Mike Giles
No ratings yet
Lecture 1: An Introduction To CUDA: Mike Giles
40 pages
CUDA Tutorial
No ratings yet
CUDA Tutorial
50 pages
Lec 1
No ratings yet
Lec 1
27 pages
Intro To CUDA
No ratings yet
Intro To CUDA
76 pages
CUDA Part-1
No ratings yet
CUDA Part-1
52 pages
8 Cud A 1
No ratings yet
8 Cud A 1
38 pages
Foundation Course for Advanced Computer Studies
From Everand
Foundation Course for Advanced Computer Studies
Franck Ismael Djédjé
No ratings yet
Exploring Arduino: Tools and Techniques for Engineering Wizardry
From Everand
Exploring Arduino: Tools and Techniques for Engineering Wizardry
Jeremy Blum
4.5/5 (5)
Core Java Programming Book
From Everand
Core Java Programming Book
Manish Soni
No ratings yet
Programming In ‘C’
From Everand
Programming In ‘C’
Rajendra Kawale
No ratings yet
Arduino For Beginners: How to get the most of out of your Arduino, including Arduino basics, Arduino tips and tricks, Arduino projects and more!
From Everand
Arduino For Beginners: How to get the most of out of your Arduino, including Arduino basics, Arduino tips and tricks, Arduino projects and more!
Matthew Oates
No ratings yet
GIScience2013 Week13a
No ratings yet
GIScience2013 Week13a
61 pages
ARIAEpic ProductBrief RAD10383A Feb2020
100% (1)
ARIAEpic ProductBrief RAD10383A Feb2020
2 pages
Sepam: User's Manual
No ratings yet
Sepam: User's Manual
40 pages
ONB 2.0 Furnish Equipment Integration To External - v2.1
No ratings yet
ONB 2.0 Furnish Equipment Integration To External - v2.1
29 pages
ACD301 Exam Valid Dumps
No ratings yet
ACD301 Exam Valid Dumps
10 pages
Data Model Fact
No ratings yet
Data Model Fact
4 pages
Clear-Com Concert v2.7 Administrator Guide
No ratings yet
Clear-Com Concert v2.7 Administrator Guide
48 pages
Resume Details
No ratings yet
Resume Details
40 pages
User Manual Tuya Smart IR + RF Ufo R2 Control WiFi Universale
No ratings yet
User Manual Tuya Smart IR + RF Ufo R2 Control WiFi Universale
1 page
Resume For Media Internship
100% (2)
Resume For Media Internship
8 pages
Long TMK
No ratings yet
Long TMK
2 pages
Binary Tutorial
No ratings yet
Binary Tutorial
10 pages
Interview Questions For Freshers MMCOE
No ratings yet
Interview Questions For Freshers MMCOE
4 pages
0x08 Python - More Classes and Objects
No ratings yet
0x08 Python - More Classes and Objects
16 pages
Autodesk Raster Design Manual
100% (1)
Autodesk Raster Design Manual
166 pages
BasicGuide - RISO SF9x50EII - ENG
No ratings yet
BasicGuide - RISO SF9x50EII - ENG
10 pages
Jacobi Method
No ratings yet
Jacobi Method
6 pages
Action Plan Ict Sy2019-2020
100% (1)
Action Plan Ict Sy2019-2020
10 pages
ISU Master Data V0.7
No ratings yet
ISU Master Data V0.7
28 pages
HyperView Tutorials
No ratings yet
HyperView Tutorials
88 pages
LIS Communication Protocol Specification - 20191126 - Rev.0.2
No ratings yet
LIS Communication Protocol Specification - 20191126 - Rev.0.2
6 pages
Fall Semester 2021-22 CSE1007 - Java Programming Lab Practice Problems On Threads and Exceptions
No ratings yet
Fall Semester 2021-22 CSE1007 - Java Programming Lab Practice Problems On Threads and Exceptions
2 pages
Edu32fp Manual Ritter
No ratings yet
Edu32fp Manual Ritter
22 pages
Oracle Fusion Middleware Administration: Atul Kumar
No ratings yet
Oracle Fusion Middleware Administration: Atul Kumar
27 pages
A Multi-View Feature Fusion Approach For Effective Malware Classification Using Deep Learning
No ratings yet
A Multi-View Feature Fusion Approach For Effective Malware Classification Using Deep Learning
15 pages
Out of Memory Problems On Oracle 10 - Solaris 10
No ratings yet
Out of Memory Problems On Oracle 10 - Solaris 10
2 pages
Rest Dissertation Roy Fielding
100% (2)
Rest Dissertation Roy Fielding
5 pages
PIIS235271102300153X
No ratings yet
PIIS235271102300153X
8 pages
Ransomware Groups and Mitre Analysis
No ratings yet
Ransomware Groups and Mitre Analysis
50 pages

Moving To Parallel With CUDA - Hello Program

Uploaded by

Moving To Parallel With CUDA - Hello Program

Uploaded by

CUDA Programming

Two new syntactic elements…

• Triple angle brackets mark a call from host

• That’s all that is required to execute a function

You might also like