0% found this document useful (0 votes)

84 views3 pages

Lab1 PGPU

This document introduces CUDA programming and provides guidance on measuring performance of CUDA applications. It describes running the DeviceQuery application to identify GPU properties. It also outlines creating a CUDA project in Visual Studio and modifying a demo application to perform vector addition with each element calculated by a separate GPU thread. Finally, it discusses two approaches to measuring execution time: using CPU timers or the CUDA Event API, and introduces the CUDA Visual Profiler tool.

Uploaded by

Mihai Alexandru Olaru

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

84 views3 pages

Lab1 PGPU

Uploaded by

Mihai Alexandru Olaru

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

Master CI Programarea GPU

Laborator 1

Programarea GPU – Introducere in CUDA

Hello CUDA World!

1. Rulati aplicatia DeviceQuery utilizand NVIDIA GPU Computing SDK Browser si

identificati proprietatile device-urilor CUDA instalate pe statiile din laborator:
CUDA Device
# of Multiprocessors
# of Cores per MP
Total # of cores
Global Memory (MB)
Warp size
# of Threads per block
minimum # of threads processed in SIMD
fashion by a CUDA multiprocessor
Dimensiunile maxime ale unui grid
Dimensiunile maxime ale unui bloc

2. Creati un proiect CUDA in Visual Studio.

a. Urmariti structura programului demo si identificati: portiunea de cod ce se
executa pe GPU, nr. de thread-uri GPU ce executa codul paralel.
b. Modificati aplicatia demo astfel incat sa variati nr. de elemente din vectorii
ce se aduna, iar fiecare element din vectorul rezultat sa fie calculate pe un
thread separate pe GPU. Incercati diferite valori pt. nr de elemente: 1000,
100000, 1000000, 10000000,…. (asigurati-va ca ati furnizat o configuratie
de executie fezabila!)

Urmariti tutorialele CUDA accesibile la:

https://developer.nvidia.com/how-to-cuda-c-cpp
https://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html

1
Master CI Programarea GPU
Laborator 1

Analiza performantelor unei aplicatii CUDA

1. Masurarea timpului de executie

Varianta 1 – Utilizarea unui Timer pe CPU

cudaMemcpy(…);

t1 = myCPUTimer();
myKernel<<<……>>(…);
cudaDeviceSynchronize();
t2 = myCPUTimer();

cudaMemcpy(…);

Nota: Apelul kernelului CUDA este asincron!! Controlul revine pe CPU imediat dupa apel
(foarte posibil inainte de terminarea executiei kernelului pe GPU). Astfel, este obligatorie
sincronizarea CPU-GPU!

Varianta 2 – Utilizarea Event API

CUDA Event API Management Functions:

cudaEventCreate
cudaEventCreateWithFlags
cudaEventDestroy
cudaEventElapsedTime
cudaEventQuery
cudaEventRecord
cudaEventSynchronize
cudaEvent_t start,stop;

// Generate events
cudaEventCreate(&start);
cudaEventCreate(&stop);

// Trigger event 'start'

cudaEventRecord(start, 0);

/* CUDA Host / Device / Kernel Code ... */

cudaEventRecord(stop, 0); // Trigger Stop event

cudaEventSynchronize(stop); // Sync events (BLOCKS till last
(stop in this case) has been recorded!)

2
Master CI Programarea GPU
Laborator 1

float elapsedTime; // Initialize elapsedTime;

cudaEventElapsedTime(&elapsedTime, start, stop); // Calculate
runtime, write to elapsedTime -- cudaEventElapsedTime returns
value in milliseconds. Resolution ~0.5ms

printf("Execution Time: %f", elapsedTime); // Print Elapsed

time

// Destroy CUDA Event API Events

cudaEventDestroy(start);
cudaEventDestroy(stop);

2. CUDA Visual Profiler

https://developer.nvidia.com/nvidia-visual-profiler

CUDA occupancy calculator:

http://developer.download.nvidia.com/compute/cuda/CUDA_Occupancy_calculator.xls

Lecture 12 GPU Programming
No ratings yet
Lecture 12 GPU Programming
65 pages
01 Cuda C Basics
No ratings yet
01 Cuda C Basics
32 pages
Parallel Programming With CUDA - Architecture, Analysis
No ratings yet
Parallel Programming With CUDA - Architecture, Analysis
93 pages
GPU Basics
No ratings yet
GPU Basics
93 pages
CS 179 Lecture 14: Pipeline Parallelism and Multi - Gpu Programming
No ratings yet
CS 179 Lecture 14: Pipeline Parallelism and Multi - Gpu Programming
23 pages
Nvidia Cuda Thesis
100% (3)
Nvidia Cuda Thesis
8 pages
CSE Lec4 Cuda
No ratings yet
CSE Lec4 Cuda
91 pages
Lecture12 GPUArchCUDA02-CUDAMem
No ratings yet
Lecture12 GPUArchCUDA02-CUDAMem
67 pages
From CPU To GPU With CUDA C Language: Michele Tuttafesta Dottorato Di Ricerca in Fisica 25 Ciclo
No ratings yet
From CPU To GPU With CUDA C Language: Michele Tuttafesta Dottorato Di Ricerca in Fisica 25 Ciclo
71 pages
Lập Trình Trên Bộ Xử Lý Song Song GPU Có Hỗ Trợ Lõi CUDA
No ratings yet
Lập Trình Trên Bộ Xử Lý Song Song GPU Có Hỗ Trợ Lõi CUDA
18 pages
Thesis Gpu Programming
100% (2)
Thesis Gpu Programming
6 pages
GPUProgramming Talk
No ratings yet
GPUProgramming Talk
18 pages
GPU Programming: Dr. Florian Ferreira
No ratings yet
GPU Programming: Dr. Florian Ferreira
101 pages
Day1 1
No ratings yet
Day1 1
25 pages
Introduction To The Cuda Programming
No ratings yet
Introduction To The Cuda Programming
25 pages
CUDA Introduction Mod
No ratings yet
CUDA Introduction Mod
50 pages
Lecture 2
No ratings yet
Lecture 2
77 pages
27th Aug - Introduction To GPGPU - Part 1
No ratings yet
27th Aug - Introduction To GPGPU - Part 1
32 pages
Threads
No ratings yet
Threads
54 pages
Gpu Cuda
No ratings yet
Gpu Cuda
204 pages
Basic-Cuda
No ratings yet
Basic-Cuda
49 pages
Chapter 5 - General Purpose PGPU, CUDA
No ratings yet
Chapter 5 - General Purpose PGPU, CUDA
70 pages
CUDA Programming Invert
No ratings yet
CUDA Programming Invert
36 pages
HPC Final 4-8
No ratings yet
HPC Final 4-8
25 pages
Cuda 1
No ratings yet
Cuda 1
45 pages
Data Parallelism, Task Parallelism, CPU, GPU
No ratings yet
Data Parallelism, Task Parallelism, CPU, GPU
13 pages
Data Parallelism, Task Parallelism, CPU, GPU
No ratings yet
Data Parallelism, Task Parallelism, CPU, GPU
13 pages
CUDA Programming Model
No ratings yet
CUDA Programming Model
14 pages
04 IntroductionGPUsCUDA
No ratings yet
04 IntroductionGPUsCUDA
25 pages
Lec 2 PDC
No ratings yet
Lec 2 PDC
31 pages
Lec 6
No ratings yet
Lec 6
16 pages
Chapter 8
No ratings yet
Chapter 8
58 pages
CUDA Programming: Lei Zhou, Yafeng Yin, Yanzhi Ren, Hong Man, Yingying Chen
No ratings yet
CUDA Programming: Lei Zhou, Yafeng Yin, Yanzhi Ren, Hong Man, Yingying Chen
28 pages
Lecture GPUArchCUDA01
No ratings yet
Lecture GPUArchCUDA01
57 pages
CUDAProg Model
No ratings yet
CUDAProg Model
24 pages
Intro GPUs
No ratings yet
Intro GPUs
36 pages
Introduction To CUDA: CAP 4730 Spring 2012
No ratings yet
Introduction To CUDA: CAP 4730 Spring 2012
35 pages
Lecture 11 Programming On Gpus Part 1 Zxu2acms60212 40212 S15lec 11 Gpupdf
No ratings yet
Lecture 11 Programming On Gpus Part 1 Zxu2acms60212 40212 S15lec 11 Gpupdf
121 pages
GPU Programming Slides 2
No ratings yet
GPU Programming Slides 2
37 pages
Unit 6 Chapter 1 Parallel Programming Tools Cuda - Programming
No ratings yet
Unit 6 Chapter 1 Parallel Programming Tools Cuda - Programming
28 pages
Lec 1
No ratings yet
Lec 1
27 pages
CUDA Introduction
No ratings yet
CUDA Introduction
39 pages
A Beginner'S Guide To Programming Gpus With Cuda: Mike Peardon
No ratings yet
A Beginner'S Guide To Programming Gpus With Cuda: Mike Peardon
21 pages
GPU Cluster4
No ratings yet
GPU Cluster4
31 pages
Topic GPU1
No ratings yet
Topic GPU1
32 pages
Industrial Monitor Converter
100% (1)
Industrial Monitor Converter
9 pages
High Performance Computing On Gpu
No ratings yet
High Performance Computing On Gpu
37 pages
Cuuda Nvidai Guide - Part1
No ratings yet
Cuuda Nvidai Guide - Part1
15 pages
Cuda Review 1
No ratings yet
Cuda Review 1
13 pages
A Jump Start To Opencl: March 15, 2009 Cis 565/665 - Gpu Computing and Architecture
No ratings yet
A Jump Start To Opencl: March 15, 2009 Cis 565/665 - Gpu Computing and Architecture
74 pages
DS1822 - Parallel Computing-Unit3
No ratings yet
DS1822 - Parallel Computing-Unit3
17 pages
лк CUDA - 1 PDCn
No ratings yet
лк CUDA - 1 PDCn
31 pages
CUDA
No ratings yet
CUDA
33 pages
If Return: Void Float Float Float Int Int
No ratings yet
If Return: Void Float Float Float Int Int
2 pages
GPGPU Programming With CUDA: Leandro Avila - University of Northern Iowa
No ratings yet
GPGPU Programming With CUDA: Leandro Avila - University of Northern Iowa
29 pages
NVIDIA OpenCL JumpStart Guide
No ratings yet
NVIDIA OpenCL JumpStart Guide
15 pages
Aca Lab Manual Final
No ratings yet
Aca Lab Manual Final
28 pages
From Waiter To Tech Titan The Rise of Jensen Huang
No ratings yet
From Waiter To Tech Titan The Rise of Jensen Huang
10 pages
Config MP - CFG
No ratings yet
Config MP - CFG
9 pages
ECE 498AL The CUDA Programming Model
No ratings yet
ECE 498AL The CUDA Programming Model
37 pages
ElementsofQuaternions 10632581
No ratings yet
ElementsofQuaternions 10632581
616 pages
Programming Gpus With Cuda: John Mellor-Crummey
No ratings yet
Programming Gpus With Cuda: John Mellor-Crummey
42 pages
Cuda Supported Cards
0% (2)
Cuda Supported Cards
1 page
Implementation of Fast Fourier Transform (FFT) On Graphics Processing Unit (GPU)
No ratings yet
Implementation of Fast Fourier Transform (FFT) On Graphics Processing Unit (GPU)
61 pages
Hellen, Riquelme, Ariana (Mi Computadora)
No ratings yet
Hellen, Riquelme, Ariana (Mi Computadora)
3 pages
Oegax Shop Invoice: London E17 9ly United Kingdom 43 Ravenswood RD
No ratings yet
Oegax Shop Invoice: London E17 9ly United Kingdom 43 Ravenswood RD
1 page
Bus Controller
No ratings yet
Bus Controller
26 pages
V - This Has Caused Irreversible Damage To The Industr - Video Games - 4chan
No ratings yet
V - This Has Caused Irreversible Damage To The Industr - Video Games - 4chan
61 pages
EasyPC - 2024 01 07
No ratings yet
EasyPC - 2024 01 07
57 pages
Compu-Zone Hardware - 20-05-2020
100% (1)
Compu-Zone Hardware - 20-05-2020
2 pages
CABLES Vga
No ratings yet
CABLES Vga
9 pages
Lastexception 63876577074
No ratings yet
Lastexception 63876577074
42 pages
Lenovo LOQ 15IRH8 Datasheet EN
No ratings yet
Lenovo LOQ 15IRH8 Datasheet EN
2 pages
Canright Compact Rijndael
No ratings yet
Canright Compact Rijndael
72 pages
GeForce 256
No ratings yet
GeForce 256
3 pages
Hardware Performance Simulations of Round 2 Advanced Encryption Standard Algorithms
No ratings yet
Hardware Performance Simulations of Round 2 Advanced Encryption Standard Algorithms
55 pages
TimGood AESonFPGA
No ratings yet
TimGood AESonFPGA
14 pages
CIV LogFile
No ratings yet
CIV LogFile
52 pages
Lastexception 63871787236
No ratings yet
Lastexception 63871787236
11 pages
Compatibility List Nvidia
No ratings yet
Compatibility List Nvidia
20 pages
Programming The SVGA
No ratings yet
Programming The SVGA
4 pages
Yu-Gi-Oh! Power of Chaos - Yugi The Destiny System Requirements - System Requirem
No ratings yet
Yu-Gi-Oh! Power of Chaos - Yugi The Destiny System Requirements - System Requirem
5 pages
Log20211113 205404
No ratings yet
Log20211113 205404
23 pages
SSD1963 LCD Controller Graphics Card: DM320210 DM320113 DM320209 AC320005-4 AC320005-5
No ratings yet
SSD1963 LCD Controller Graphics Card: DM320210 DM320113 DM320209 AC320005-4 AC320005-5
6 pages
AcerMonitor 1.0 Eng P206H
No ratings yet
AcerMonitor 1.0 Eng P206H
23 pages
Geforce RTX 4070 Ti Gaming X Trio 12g
No ratings yet
Geforce RTX 4070 Ti Gaming X Trio 12g
1 page
Design of Stable Fuzzy Controllers For An AGV
No ratings yet
Design of Stable Fuzzy Controllers For An AGV
8 pages
Furmark Log
No ratings yet
Furmark Log
2 pages
Msi Rtx-2060-Super-Gaming-X (06 - 2020)
No ratings yet
Msi Rtx-2060-Super-Gaming-X (06 - 2020)
1 page
Aes Cryptocore: Students: Mihai Olaru Cătălina Sârbu Teacher: Dan Dobrea
No ratings yet
Aes Cryptocore: Students: Mihai Olaru Cătălina Sârbu Teacher: Dan Dobrea
11 pages
Faculty of Automatic Control and Computer Engineering Iasi
No ratings yet
Faculty of Automatic Control and Computer Engineering Iasi
10 pages
Lastexception 63856159776
No ratings yet
Lastexception 63856159776
1 page
Graphics Card Hierarchy Chart October 2010
No ratings yet
Graphics Card Hierarchy Chart October 2010
3 pages
ZT B50800D 10P Brochure
No ratings yet
ZT B50800D 10P Brochure
1 page
TCL To Python Server Conversion
No ratings yet
TCL To Python Server Conversion
1 page
Lastexception 63821672754
No ratings yet
Lastexception 63821672754
2 pages
Rijndael Sbox PDF
No ratings yet
Rijndael Sbox PDF
3 pages
Windows USB Client
No ratings yet
Windows USB Client
3 pages
S Box
No ratings yet
S Box
2 pages
Dsadas
No ratings yet
Dsadas
2 pages

Lab1 PGPU

Uploaded by

Lab1 PGPU

Uploaded by

Master CI Programarea GPU

Programarea GPU – Introducere in CUDA

Hello CUDA World!

1. Rulati aplicatia DeviceQuery utilizand NVIDIA GPU Computing SDK Browser si

2. Creati un proiect CUDA in Visual Studio.

Urmariti tutorialele CUDA accesibile la:

Analiza performantelor unei aplicatii CUDA

1. Masurarea timpului de executie

Varianta 1 – Utilizarea unui Timer pe CPU

Varianta 2 – Utilizarea Event API

CUDA Event API Management Functions:

// Trigger event 'start'

/* CUDA Host / Device / Kernel Code ... */

cudaEventRecord(stop, 0); // Trigger Stop event

float elapsedTime; // Initialize elapsedTime;

printf("Execution Time: %f", elapsedTime); // Print Elapsed

// Destroy CUDA Event API Events

2. CUDA Visual Profiler

CUDA occupancy calculator:

You might also like