图像分类是图像级别的,图像语义分割是到像素点级别的。
FCN可作为图像语义分割的基础框架参考。FCN论文,FCN原作代码
FCN的提出主要解决了:一般的CNN分类网络,如VGG和Resnet,会在网络的最后加入全连接层,经过softmax获取类别概率信息,但这个概率是一维的,所以只能对整个图片进行分类,是谓图像级别。
FCN结构提出将后面几个全连接替换成卷积,便可以获得一张2维的feature map,然后再接softmax便可获得每个像素点的分类信息,是谓像素点级别。可以支持解决图像语义分割问题。
图像语义分割整体流程:下采样+上采样 > 特征融合 > 获取像素级别类别判断