博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
【CUDA开发】Cuda C++ Thrust API与 Cuda Runtime API程序比较
阅读量:5045 次
发布时间:2019-06-12

本文共 2083 字,大约阅读时间需要 6 分钟。

今天买了本新书《高性能CUDA应用设计与开发方法与最佳实践》,今天读了第一章有点出获,分享给大家。

程序功能:给向量填充数据并计算各元素之和

1. CPU串行运行的代码:

//seqSerial.cpp:串行执行数组的填充及求和

#include<iostream>
#include<vector>
using namespace std;

int main()

{
 const int N=50000;
 //任务1:创建数组
 vector<int> a(N);
 //任务2:填充数组
 for(int i=0;i<N;i++)a[i]=i;
 //任务3:计算数组各元素之和
 int sumA=0;
 for(int i=0;i<N;i++)sumA+=a[i];
 //任务4:计算0-N-1之和
 int sumCheck=0;
 for(int i=0;i<N;i++)sumCheck+=i;
 //任务5:检查结果是否正确
 if(sumA==sumCheck) cout<<"Test Succeeded!"<<endl;
 else {cerr<<"TestFailed!"<<endl;return(1);}
 return (0);
}

 2.Cuda Thrust C++ API 程序

#include<iostream>

using namespace std;

#include<thrust\/reduce.h>

#include<thrust/sequence.h>
#include<thrust/host_vector.h>
#include<thrust/device_vector.h>

int main()

{
 const int N=50000;
 //任务1:创建数组
 thrust::device_vector<int>a(N);
 //任务2:填充数组,并行运算
 thrust::sequence(a.begin(),a.end(),0);
 //任务3:计算数组元素之和,并行计算
 int sumA=thrust::reduce(a.begin(),a.end(),0);
 //
 int sumCheck=0;
 for(int i=0;i<N;i++)
  sumCheck+=i;
 //
 if(sumA==sumCheck)cout<<"Test Succeeded!"<<endl;
 else
 {
  cerr<<"Test Failed!"<<endl;
  return(1);
 }
 getchar();
 return (0);
}

 

3.仅对数据填充改为Runtime API 程序

//使用cuda Runtime API完成向数组中填充连续整数

#include<iostream>
using namespace std;

#include<thrust\/reduce.h>

#include<thrust/sequence.h>
#include<thrust/host_vector.h>
#include<thrust/device_vector.h>

__global__ void fillKernel(int *a,int n)

{
 int tid=blockIdx.x*blockDim.x+threadIdx.x;
 if(tid<n) a[tid]=tid;
}

void fill(int *d_a,int n)

{
 int nThreadsPerBlock=512;
 //int nBlocks=n/nThreadsPerBlock+(n%nThreadsPerBlock)?1:0);
 int nBlocks=(n+nThreadsPerBlock)/nThreadsPerBlock;
 fillKernel<<<nBlocks,nThreadsPerBlock>>>(d_a,n);
}

int main()

{
 const int N=50000;
 //任务1:创建数组
 thrust::device_vector<int>a(N);
 //任务2:填充数组,使用Runtime API 填充数组
 fill(thrust::raw_pointer_cast(&a[0]),N);
 //任务3:计算数组元素之和,并行计算
 int sumA=thrust::reduce(a.begin(),a.end(),0);
 //任务4:计算0-N-1之和
 int sumCheck=0;
 for(int i=0;i<N;i++)
  sumCheck+=i;
 //任务5:检查结果的正确性
 if(sumA==sumCheck)cout<<"Test Succeeded!"<<endl;
 else
 {
  cerr<<"Test Failed!"<<endl;
  return(1);
 }
 getchar();
 return (0);
}

 

转载于:https://www.cnblogs.com/huty/p/8517921.html

你可能感兴趣的文章
Eigen vs Numpy时间对比
查看>>
Java学习笔记(七)——获取类中方法的信息,java的LinkedList
查看>>
js修改伪类元素样式
查看>>
SQL常用语句
查看>>
多线程之ReadWriteLock模拟缓存(九)
查看>>
工作碰到的非代码问题总结
查看>>
构造函数与析构函数
查看>>
GetCursorPos
查看>>
Web前端性能优化进阶——完结篇
查看>>
【转】Git 修改已提交的commit注释
查看>>
JAVA_IO
查看>>
(转)内核模块操作命令-lsmod+rmmod+modinfo+modprobe
查看>>
poj3984
查看>>
URAL 1099 Work scheduling 一般图的最大匹配 带花树算法(模板)
查看>>
高斯消元方程组
查看>>
centos:SSH登录时间很慢
查看>>
HTTP协议概述
查看>>
mysql删除主键
查看>>
总结一下web前端常用的各类网站(不全,后期有更新)
查看>>
mysql使用笔记
查看>>