欢迎光临 x-algo
关注算法在工业界应用
Hi, 这是一个关注大数据算法在工业界应用的网站

leihao的文章

第4页
GPU编程

GPU矩阵运算和BFS

leihao阅读(1168)评论(0)

矩阵稀疏表示 矩阵中有大量的0之后可以考虑使用稀疏表示,稀疏表示的时候可以使用类似邻接表的方式(按招行或者列都可以)存储;具体实现不仅可以使用二维嵌套数组,也可以使用三个一维数组实现,按行存储,三个数组分别存储值、列号、换到第几行。 稀疏矩...

GPU编程

cuBLAS简单使用

leihao阅读(2775)评论(0)

详细精准的介绍直接去官网。 一般流程 作为NVIDIA推出主打线性代数技术的GPU库,效率应该比自己手写kernel函数要高。在CNN网络中,一般最后的全链接层可以通过此库实现(全链接直接就是矩阵乘法)。使用流程为: 申请handle,方便...

CNN

YOLOv2/YOLO9000模型原理

leihao阅读(18681)评论(0)

看本文之前,最好已经了解SSD原理和YOLO模型 更好 可以对9k的object分类,我是惊呆了 YOLO9000重点解决recall和location方面的误差 YOLO-v2和YOLO9000是两个不同的模型,论文一并提出,YOLOv2...

CNN

SSD原理

leihao阅读(5566)评论(0)

性能信息 来源:https://github.com/weiliu89/caffe/tree/ssd 特性 在每一个feature map location,将bounding box离散化为不同的比例和大小(类似Faster R-CNN的...

CNN

YOLO模型原理

leihao阅读(8454)评论(0)

看此文之前,最好已经了解Faster R-CNN。 YOLO的特点 直接对bounding box回归,并不是计算候选和gt之间的 \(\Delta\) ,并且不构造 hard negatives 速度快,将检测过程变为一个回归问题,简化了...

Deep Learning

Tensorflow添加自定义Operator

leihao阅读(3866)评论(3)

本文是按照官网教程的一个实际操作,中间遇到一个编译的坑。 基本原理 同一个Operator由于可能在CPU或GPU执行,如果想要支持两个设备,就需要写两份代码。 编写CPU版本程序 基础代码 下面代码的功能是将输入的数组第一个元素保留,后面...

GPU编程

GPU编程sort实现原理

leihao阅读(1615)评论(0)

冒泡排序 对于有n个元素的待排序数组,去n/2个计算单元,最多执行step为n,对于任何一个线程i,交替和自己的左边和右边元素比大小,大小逆序就更换元素的值。这个方式step复杂度为 \(O(n)\) ,work复杂度为 \(O(n^2)\...

GPU编程

GPU算子Reduce和Scan算法原理

leihao阅读(2127)评论(0)

终于开始学习GPU的开发了,里面算法的知识比想象的有趣,不少地方还是很考验编程基本功的。 这里介绍的两个操作的实现很有意思,对于理解GPU并行计算的「思维模式」很有帮助。 Reduce reduce操作的定义很简单,输入一个数组和作用在数组...

图像

Faster R-CNN原理介绍

leihao阅读(12846)评论(0)

看本文之前需要先了解Fast RCNN。 Faster R-CNN提出了一种加快计算region proposals的方法,就是通过建立RPN(Region Proposal Network)网络。RPN是一个全连接的卷积网络,通过 end...

图像

Fast R-CNN结构介绍

leihao阅读(6419)评论(0)

看本文之前最好已经了解RCNN和SPP-net,被SPP-net暴漏各种RCNN的弊端之后,RCNN作者做了升级,搞出来了Fast RCNN,无论是训练还是测试速度都比SPP-net要快,并且效果好。 结构 现在整个结构开始变得比较简洁,借...

关注大数据算法在工业界应用

本站的GitHub关于本站