欢迎光临 x-algo
关注算法在工业界应用
Hi, 这是一个关注大数据算法在工业界应用的网站

Mask R-CNN原理

先要了解一下FCN结构Faster R-CNN原理

整体逻辑图

QQ20170329-141812

在Faster R-CNN上面进行修改,添加了一个分支,这个分支最后也放到统一的损失函数中进行学习。

特点

  1. 将分类、检测、实体切分(instance segmentation)放到一个网络中,损失函数有三部分组成 \(L_{loc}+L_{cls} + L_{mask}\) ,三个分支分别处理不同的问题
  2. 将原来实体切分中多类别softmax改为二分类,对类别的预测交给分类模型。
  3. 传统的RoI Pooling可能使用上取整决定在feature map上面像素的归属,这样可以做到不重复、不遗漏;但是不能整除的时候会导致pooling时候输入大小是不一样的(相差一个feature map上的像素)。使用RoIAlign通过双线性插值解决这个问题
  4. Inference过程对top100的box传入mask 分支
  5. 效果上,和Faster R-CNN类似,合理的定义正负样本是训练效果的关键因素

未经允许不得转载:大数据算法 » Mask R-CNN原理

评论 抢沙发

*

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

关注大数据算法在工业界应用

本站的GitHub关于本站