欢迎光临 x-algo
关注算法在工业界应用
Hi, 这是一个关注大数据算法在工业界应用的网站

cuBLAS简单使用

详细精准的介绍直接去官网

一般流程

作为NVIDIA推出主打线性代数技术的GPU库,效率应该比自己手写kernel函数要高。在CNN网络中,一般最后的全链接层可以通过此库实现(全链接直接就是矩阵乘法)。使用流程为:

  1. 申请handle,方便多线程之间隔离
  2. 申请device内存,并将host内存考入到device准备计算
  3. 执行计算操作
  4. 将计算结果拷贝出来
  5. 释放内存和handle

样例代码

缩放元素的值

上面代码保存为文件cublas_test.c, 编译和执行:

矩阵乘法

需要注意的是,数据都是列存储。

 

未经允许不得转载:大数据算法 » cuBLAS简单使用

评论 抢沙发

*

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

关注大数据算法在工业界应用

本站的GitHub关于本站