CUDA入门
1. GPU并行计算
2. 深度学习与GPU:
(1)深度学习介绍以及GPU在其中的作用
(2)caffe框架介绍及mnist训练和测试讲解
3. GPU体系架构
4. OpenMP介绍
5. CUDA环境搭建
CUDA入门
1. CUDA C编程基础
(1)CUDA编程模式:block和thread
(2)CUDA存储模式:global memory/shared memory
(3)CUDA C关键字及内核调用
(4)示例:向量加法
(5)课上练习:矩阵加法
2. CUDA线程调度
3. CUDA调试方法
4. 课上练习:调试方法练习
CUDA高级编程
1. 存储器优化技巧:
(1)矩阵乘法-global memory
(2)矩阵乘法-shared memory
2. 访存优化:bank conflict,bandwidth
3. 流与事件
4. 多GPU编程
5. 测试时间方法
6. 课上练习:
CUDA高级编程
1. 并行算法设计的一般原则
2. 并行算法设计方法
3. 优化技巧实战:卷积计算step by step优化性能
4. 调优工具:NSight分析性能瓶颈
|