大数据算法

欢迎光临 x-algo
关注算法在工业界应用
Hi, 这是一个关注大数据算法在工业界应用的网站

最新发布 第5页

GPU编程

cuBLAS简单使用

leihao阅读(3343)评论(0)

详细精准的介绍直接去官网。 一般流程 作为NVIDIA推出主打线性代数技术的GPU库,效率应该比自己手写kernel函数要高。在CNN网络中,一般最后的全链接层可以通过此库实现(全链接直接就是矩阵乘法)。使用流程为: 申请handle,方便...

CNN

YOLOv2/YOLO9000模型原理

leihao阅读(22377)评论(0)

看本文之前,最好已经了解SSD原理和YOLO模型 更好 可以对9k的object分类,我是惊呆了 YOLO9000重点解决recall和location方面的误差 YOLO-v2和YOLO9000是两个不同的模型,论文一并提出,YOLOv2...

CNN

SSD原理

leihao阅读(7078)评论(0)

性能信息 来源:https://github.com/weiliu89/caffe/tree/ssd 特性 在每一个feature map location,将bounding box离散化为不同的比例和大小(类似Faster R-CNN的...

CNN

YOLO模型原理

leihao阅读(10948)评论(0)

看此文之前,最好已经了解Faster R-CNN。 YOLO的特点 直接对bounding box回归,并不是计算候选和gt之间的 \(\Delta\) ,并且不构造 hard negatives 速度快,将检测过程变为一个回归问题,简化了...

Deep Learning

Tensorflow添加自定义Operator

leihao阅读(4717)评论(3)

本文是按照官网教程的一个实际操作,中间遇到一个编译的坑。 基本原理 同一个Operator由于可能在CPU或GPU执行,如果想要支持两个设备,就需要写两份代码。 编写CPU版本程序 基础代码 下面代码的功能是将输入的数组第一个元素保留,后面...

GPU编程

GPU编程sort实现原理

leihao阅读(2000)评论(0)

冒泡排序 对于有n个元素的待排序数组,去n/2个计算单元,最多执行step为n,对于任何一个线程i,交替和自己的左边和右边元素比大小,大小逆序就更换元素的值。这个方式step复杂度为 \(O(n)\) ,work复杂度为 \(O(n^2)\...

GPU编程

GPU算子Reduce和Scan算法原理

leihao阅读(2546)评论(0)

终于开始学习GPU的开发了,里面算法的知识比想象的有趣,不少地方还是很考验编程基本功的。 这里介绍的两个操作的实现很有意思,对于理解GPU并行计算的「思维模式」很有帮助。 Reduce reduce操作的定义很简单,输入一个数组和作用在数组...

图像

Faster R-CNN原理介绍

leihao阅读(16770)评论(0)

看本文之前需要先了解Fast RCNN。 Faster R-CNN提出了一种加快计算region proposals的方法,就是通过建立RPN(Region Proposal Network)网络。RPN是一个全连接的卷积网络,通过 end...

NLP

LSTM+CRF介绍

liming阅读(18513)评论(0)

LSTM和CRF要解决问题的:序列标注问题(中文分词、词性识别、命名实体识别、机器翻译等) 本文先介绍LSTM的基本结构,再介绍LSTM与CRF结合的方法(CRF的具体算法介绍不包括在本文中)。 LSTM是RNN的一种特殊形式,首先看一下R...

图像

Fast R-CNN结构介绍

leihao阅读(8080)评论(0)

看本文之前最好已经了解RCNN和SPP-net,被SPP-net暴漏各种RCNN的弊端之后,RCNN作者做了升级,搞出来了Fast RCNN,无论是训练还是测试速度都比SPP-net要快,并且效果好。 结构 现在整个结构开始变得比较简洁,借...

关注大数据算法在工业界应用

本站的GitHub关于本站