文字监测网络TextBoxes基于下列哪个网络( )
Fast-rcnn
Faster r-cnn
SSD
Y0L0
提出了一种端到端可训练的快速场景文本检测器,名为TextBoxes,它可以在单个网络正向通道中以高精度和高效率检测场景文本,除标准非最大抑制外,不涉及后处理。它继承了流行的VGG-16体系结构(Simonyan和Zisserman 2014),保持从conv1_1到conv4_3的层次。最后两个完全连接的VGG-16层被转换为通过参数下采样卷积层(Liu et al。2016)。 它们之后是一些额外的卷积和合并层,即conv6到pool11。多个输出层(我们称之为文本框图层)被插入到最后和一些中间卷积层之后。它们的输出被聚合并经历非最大抑制(NMS)过程。输出层也是卷积的。总而言之,TextBoxes仅包含卷积和合并图层,因此完全卷积。它适用于训练和测试中的任意大小的图像。