🟠 目标检测(识别朝向)

功能描述

算子基于深度学习对输入图像执行目标检测。与标准的矩形框检测不同,该算子可用于识别并输出物体的旋转角度,从而可以区分目标的朝向,生成能更紧密贴合物体的旋转矩形框。

使用场景

当应用场景中不仅需要定位物体,还需要知道其精确的摆放姿态或朝向时,可选择此算子。例如在自动化装配流程中,确保零部件以正确的角度进行对位和安装;检查产品上的特定特征是否在正确的旋转角度上;根据物体的朝向进行分类等。

输入输出

输入项

图像:待检测的单张彩色图像。

输出项

检测结果:一个检测实例列表。列表中每个元素都代表一个被识别的物体,包含其类别、置信度得分以及一个描述其精确位置和方向的旋转矩形框。

参数说明

权重文件

参数说明

加载预先训练好的、用于旋转目标检测的模型文件。

调参说明

选择上传针对当前特定应用场景和目标物体训练好的模型文件,模型的质量直接决定了结果的准确率和鲁棒性。

参数范围

文件格式要求为.pth格式。

置信阈值

参数说明

用于设定模型输出结果的“可信度”门槛。模型在识别每个物体时,都会给出一个0到1之间的分数,表示其对该识别结果的可信任程度有多高,只有分数高于此阈值的物体才会被作为有效结果输出。

调参说明

  • 调高数值:筛选条件变得更严格。算子只会输出模型非常有把握的结果。这会减少误识别,但可能会漏掉一些识别特征不明显或被部分遮挡的真实目标。

  • 调低数值:筛选条件变得更宽松。算子会输出更多可能的目标,但有可能引入更多的误识别。 如果发现有很多不是目标的物体被错误输出,可以尝试调高此阈值;如果发现有明显的目标没有被识别出来,可适当调低此阈值。

参数范围

[0,1],默认值:0.5

启用GPU加速

参数说明

控制算子是使用CPU还是GPU进行计算。由于深度学习模型计算量较大,使用GPU可以极大地提升处理速度。

调参说明

  • 关闭(默认):算子将使用CPU进行计算。虽然通用性好,不需要特殊硬件,但处理一张图片可能需要更长时间,不适用于对速度要求高的场景。

  • 开启(推荐):如果本机设备支持GPU显卡,建议开启此选项,将大大提升处理速度。

启用旋转

参数说明

设置模型是否训练角度旋转,用以旋转检测框使之更加贴近目标。

调参说明

  • 开启:当模型是旋转目标检测模型时,必须启用旋转,算子可通过解析模型输出的角度信息,生成旋转的检测框。

  • 关闭:如果训练的模型是普通的、只能输出水平矩形框的标准目标检测模型,则需要关闭此项。

旧版标注模型

参数说明

用于处理使用旧版数据标注方式训练的模型。

调参说明

  • 开启:如果模型使用的是早期“严格顺序四点标注”方式训练的,请开启此项。

  • 关闭:如果模型使用的是标准的“旋转矩形”方式标注训练的,请关闭此项。 如果不确定是否是旧版标注模型,可以两种设置都尝试一下。当检测框的角度明显错误时(例如,角度总是偏移90度),可切换此选项尝试解决问题。一般对于新训练的模型默认关闭此选项即可。