定义
识别图中有【哪些物体】,确定他们的【类别】并标出各自在图中的【位置】
识别+定位
图像分类与目标检测的区别
图像分类:整幅图像经过识别后被分类为【单一的标签】
目标检测:除了识别出图像中的【一个或多个目标】,还需要找到目标在图像中的【具体位置】
评估指标
交并比 IoU
定义:在分子项中,是真实边界框和预测边界框重叠的区域,分母是一个并集,是由预测边界框和真实边界框所包括的区域,两者相除就得到了最终的得分
<span class="equation-text" contenteditable="false" data-index="0" data-equation="{{重叠的区域 interseaction} \over {包括的区域 Union}}"><span></span><span></span></span>
精确度 Precision
定义:目标检测模型判断该图片为正类,该图片确实是正类的概率
<span class="equation-text" contenteditable="false" data-index="0" data-equation="{{TP} \over {TP+FP}}"><span></span><span></span></span>
召回率 Recall
定义:一个分类器能把所有的正类都找出来的能力
<span class="equation-text" contenteditable="false" data-index="0" data-equation="{{TP} \over {TP+FN}}"><span></span><span></span></span>
平均精度值 mAP
定义:各类别平均精度均值,把每个类别的AP都单独拿出来,然后计算所有类别AP的平均值,代表者对检测到的目标平均精度的一个综合评价
反映整体精度,值介于0到1之间
数据集与网络
常用数据集:PASCAL VOC --- 一个包含20个类别的小型图像数据集
相关神经网络:CenterNet