欢迎光临 x-algo
关注算法在工业界应用
Hi, 这是一个关注大数据算法在工业界应用的网站

GPU编程

GPU矩阵运算和BFS

leihao阅读(1439)评论(0)

矩阵稀疏表示 矩阵中有大量的0之后可以考虑使用稀疏表示,稀疏表示的时候可以使用类似邻接表的方式(按招行或者列都可以)存储;具体实现不仅可以使用二维嵌套数组,也可以使用三个一维数组实现,按行存储,三个数组分别存储值、列号、换到第几行。 稀疏矩...

cuBLAS简单使用

leihao阅读(3446)评论(0)

详细精准的介绍直接去官网。 一般流程 作为NVIDIA推出主打线性代数技术的GPU库,效率应该比自己手写kernel函数要高。在CNN网络中,一般最后的全链接层可以通过此库实现(全链接直接就是矩阵乘法)。使用流程为: 申请handle,方便...

GPU编程sort实现原理

leihao阅读(2106)评论(0)

冒泡排序 对于有n个元素的待排序数组,去n/2个计算单元,最多执行step为n,对于任何一个线程i,交替和自己的左边和右边元素比大小,大小逆序就更换元素的值。这个方式step复杂度为 \(O(n)\) ,work复杂度为 \(O(n^2)\...

GPU算子Reduce和Scan算法原理

leihao阅读(2618)评论(0)

终于开始学习GPU的开发了,里面算法的知识比想象的有趣,不少地方还是很考验编程基本功的。 这里介绍的两个操作的实现很有意思,对于理解GPU并行计算的「思维模式」很有帮助。 Reduce reduce操作的定义很简单,输入一个数组和作用在数组...

关注大数据算法在工业界应用

本站的GitHub关于本站