CUDA Additionof2Vector

The document presents a CUDA program that performs addition of two large vectors. It allocates memory on both the host and device, initializes the vectors, and executes a kernel to compute the sum. The program verifies the result and confirms successful vector addition before freeing allocated memory.

Uploaded by

yaseeniqbal365

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

4 views2 pages

CUDA Additionof2Vector

Uploaded by

yaseeniqbal365

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

CUDA Program for Addition of Two Large Vectors

#include <stdio.h>
#include <stdlib.h>
#include <cuda_runtime.h>

// CUDA kernel for vector addition

__global__ void vectorAdd(int *a, int *b, int *c, int n) {
int i = blockIdx.x * blockDim.x + threadIdx.x;
if (i < n) {
c[i] = a[i] + b[i];
}
}

int main() {
int n = 1000000;
int *a, *b, *c;
int *d_a, *d_b, *d_c;
int size = n * sizeof(int);

// Allocate host memory

a = (int*) malloc(size);
b = (int*) malloc(size);
c = (int*) malloc(size);

// Initialize vectors
for (int i = 0; i < n; i++) {
a[i] = i;
b[i] = i;
}

// Allocate device memory

cudaMalloc((void**)&d_a, size);
cudaMalloc((void**)&d_b, size);
cudaMalloc((void**)&d_c, size);

// Copy host to device

cudaMemcpy(d_a, a, size, cudaMemcpyHostToDevice);
cudaMemcpy(d_b, b, size, cudaMemcpyHostToDevice);

// Launch kernel
int blockSize = 256;
int gridSize = (n + blockSize - 1) / blockSize;
vectorAdd<<<gridSize, blockSize>>>(d_a, d_b, d_c, n);

// Copy result back to host

cudaMemcpy(c, d_c, size, cudaMemcpyDeviceToHost);

// Verify result
for (int i = 0; i < n; i++) {
if (c[i] != 2 * i) {
printf("Error: c[%d] = %d\n", i, c[i]);
break;
}
}

printf("Vector addition successful!\n");

// Free memory
cudaFree(d_a); cudaFree(d_b); cudaFree(d_c);
free(a); free(b); free(c);

return 0;
}

Output:
Vector addition successful!

01 Cuda C Basics
No ratings yet
01 Cuda C Basics
32 pages
Gpu History and Cuda Programming Basics
No ratings yet
Gpu History and Cuda Programming Basics
44 pages
Addition Cuda
No ratings yet
Addition Cuda
2 pages
Cuda Add Mult
No ratings yet
Cuda Add Mult
3 pages
Cuda
No ratings yet
Cuda
4 pages
CUDA - Part 1 LMS
No ratings yet
CUDA - Part 1 LMS
51 pages
CUDA Exercises
No ratings yet
CUDA Exercises
185 pages
CUDA PPT Anurita Unit3
No ratings yet
CUDA PPT Anurita Unit3
42 pages
2023 CSC14120 Lecture01 CUDAIntroduction
No ratings yet
2023 CSC14120 Lecture01 CUDAIntroduction
32 pages
Combinepdf
No ratings yet
Combinepdf
28 pages
Moving To Parallel - Addition of 2 Matrices
No ratings yet
Moving To Parallel - Addition of 2 Matrices
14 pages
CUDA Programming Invert
No ratings yet
CUDA Programming Invert
36 pages
Group A Assignment 4 (A) : Two Large Vectors
No ratings yet
Group A Assignment 4 (A) : Two Large Vectors
5 pages
Intro To CUDA
No ratings yet
Intro To CUDA
76 pages
CUDA Part-1
No ratings yet
CUDA Part-1
52 pages
周03
No ratings yet
周03
65 pages
Introduction To CUDA C 3
No ratings yet
Introduction To CUDA C 3
67 pages
Introduction To CUDA C
No ratings yet
Introduction To CUDA C
67 pages
Hetero Lecture Slides 002 Lecture 1 Lecture-1-5-Cuda-API
No ratings yet
Hetero Lecture Slides 002 Lecture 1 Lecture-1-5-Cuda-API
11 pages
L06 GPGPU CUDA Programming 1
No ratings yet
L06 GPGPU CUDA Programming 1
23 pages
CUDAProg Model
No ratings yet
CUDAProg Model
24 pages
PDC Assignment
No ratings yet
PDC Assignment
9 pages
CUDA
No ratings yet
CUDA
3 pages
TP1: Converting Vector Addition To CUDA.: Listing 1 An Example of Vector Addition Implemented in C
No ratings yet
TP1: Converting Vector Addition To CUDA.: Listing 1 An Example of Vector Addition Implemented in C
1 page
217 Lec2
No ratings yet
217 Lec2
24 pages
CUDA Programming Model
No ratings yet
CUDA Programming Model
14 pages
Csnb594csnb4423 Lab 5 01a Harveen Velan Sw0104101
No ratings yet
Csnb594csnb4423 Lab 5 01a Harveen Velan Sw0104101
19 pages
Google Colab Solution Activity
No ratings yet
Google Colab Solution Activity
5 pages
Rishi
No ratings yet
Rishi
30 pages
Allocate The Device Memory Where We Will Copy M
No ratings yet
Allocate The Device Memory Where We Will Copy M
2 pages
Parallel Scan in C CUda
No ratings yet
Parallel Scan in C CUda
3 pages
GPU Series III CUDA Compilation Host Side 1721302802
No ratings yet
GPU Series III CUDA Compilation Host Side 1721302802
8 pages
3 Some Commonly Used CUDA API: 3.1 Function Type Qualifiers
No ratings yet
3 Some Commonly Used CUDA API: 3.1 Function Type Qualifiers
7 pages
Lab7 GPU
No ratings yet
Lab7 GPU
10 pages
CUDA MatrixMultiplication
No ratings yet
CUDA MatrixMultiplication
2 pages
Department of Computer Engineering BE Laboratory Practice-I A.Y 2021-22 SEM1
No ratings yet
Department of Computer Engineering BE Laboratory Practice-I A.Y 2021-22 SEM1
45 pages
Input: Output: 1. Sub String Program
No ratings yet
Input: Output: 1. Sub String Program
8 pages
Cuda Firstprograms PDF
No ratings yet
Cuda Firstprograms PDF
6 pages
5 Computation
No ratings yet
5 Computation
13 pages
Threads
No ratings yet
Threads
54 pages
Basic-Cuda
No ratings yet
Basic-Cuda
49 pages
BECOA157 Parallel Matrix Multiplication
No ratings yet
BECOA157 Parallel Matrix Multiplication
3 pages
Vector Addition
No ratings yet
Vector Addition
3 pages
LP 1,,1
No ratings yet
LP 1,,1
5 pages
3 Cuda
No ratings yet
3 Cuda
5 pages
Cuda 1
No ratings yet
Cuda 1
45 pages
20 Quiz 14
No ratings yet
20 Quiz 14
12 pages
HPC (Pra 04)
No ratings yet
HPC (Pra 04)
11 pages
Introduction To CUDA: CAP 4730 Spring 2012
No ratings yet
Introduction To CUDA: CAP 4730 Spring 2012
35 pages
Ejercicio 2 Práctica 3: CUDA Desempeño en Función de La Homogeneidad para Acceder A Memoria y de La Regularidad Del Código
No ratings yet
Ejercicio 2 Práctica 3: CUDA Desempeño en Función de La Homogeneidad para Acceder A Memoria y de La Regularidad Del Código
8 pages
Lab 1 Parallel
No ratings yet
Lab 1 Parallel
4 pages
Lecture 11 Programming On Gpus Part 1 Zxu2acms60212 40212 S15lec 11 Gpupdf
No ratings yet
Lecture 11 Programming On Gpus Part 1 Zxu2acms60212 40212 S15lec 11 Gpupdf
121 pages
Lecture2 Cuda Basic 2010
No ratings yet
Lecture2 Cuda Basic 2010
44 pages
Lab Report 6
No ratings yet
Lab Report 6
12 pages
Mulmatrix Cu
No ratings yet
Mulmatrix Cu
3 pages
Cuda Review 1
No ratings yet
Cuda Review 1
13 pages
Introduccion CUDA C
No ratings yet
Introduccion CUDA C
51 pages
Cuda C/C++ Basics: NVIDIA Corporation
No ratings yet
Cuda C/C++ Basics: NVIDIA Corporation
67 pages

CUDA Additionof2Vector

Uploaded by

CUDA Additionof2Vector

Uploaded by

CUDA Program for Addition of Two Large Vectors

// CUDA kernel for vector addition

// Allocate host memory

// Allocate device memory

// Copy host to device

// Copy result back to host

printf("Vector addition successful!\n");

You might also like