欢迎光临 x-algo
关注算法在工业界应用
Hi, 这是一个关注大数据算法在工业界应用的网站

FCN结构

本文介绍论文《Fully Convolutional Networks for Semantic Segmentation》中的FCN的结构。

介绍

Semantic Segmentation这项任务是将不同的object从图像中在像素级别进行分类。如下图:

QQ20170327-185832

FCN定义

定义很简单,就是整个网络中,只有「卷积层」,接下来介绍一个重要的公式。

这是一个很有意思的公式,如果用 \(f_{k,s}\) 表示卷积的映射,其中k表示卷积核大小,s表示步长,那么两个卷积叠加操作,有下面公式成立:

\(f_{k,s} \cdot g_{k',s'} = (f \cdot g)_{k'+(k-1)s', ss'}\)

所以也可以用上面的公式对FCN进行定义。熟悉yolo2的会发现, yolo2就是一个全卷积的网络,配合Avg pooling,可以处理任何大小的图像。

全连接新视角

可以将全连接看做是卷积操作,卷积核的大小是整个feature map的大小。具体如下图:

QQ20170327-210338

迁移学习中,全连接可以充当「防火墙」,详细点我

Shift-and-stitch is filter rarefaction

没看懂。。。

放一张来自论文《MUST-CNN: A Multilayer Shift-and-Stitch Deep Convolutional Architecture for Sequence-based Protein Structure Prediction》的图,可能可以帮助理解

QQ20170329-115843

 

Upsampling

经过和线性差值等上采样方法的对比,发现deconvolution是效果最好的方式,实现起来也很简单,就是反向卷积操作。

更多资料

http://blog.csdn.net/happyer88/article/details/47205839

https://www.zhihu.com/question/43609045

未经允许不得转载:大数据算法 » FCN结构

评论 抢沙发

*

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

关注大数据算法在工业界应用

本站的GitHub关于本站