🟠 实例分割V1

功能描述

算子可通过深度学习对输入的彩色图像进行实例分割。上传一个预先训练好的深度学习模型(.pth文件),并利用该模型分析输入图像,最终输出每个被识别对象的位置、类别、置信度得分等数据。

使用场景

在背景复杂或物体相互靠近、重叠的场景中,识别物体的精确轮廓,将每个物体实例分离出来,以便进行独立的分析,规划更可靠、更贴合的抓取姿态。

输入输出

输入项

图像:待进行实例分割的单张彩色图像。

输出项

检测结果:一个列表,包含了图像中所有被成功识别的物体实例。列表中的每一个元素都代表一个物体,包含该物体的类别、置信度得分、外接矩形框和轮廓多边形等信息。

参数说明

一次只能处理一张图像,如果输入多张,默认只处理第一张图像。

模型文件

参数说明

用于加载训练好的、用于实例分割的深度学习模型。

调参说明

选择上传针对当前特定应用场景和目标物体训练好的模型文件,模型的质量直接决定了结果的准确率和鲁棒性。

参数范围

文件格式要求为.pth格式。

置信阈值

参数说明

用于设定模型输出结果的“可信度”门槛。模型在识别每个物体时,都会给出一个0到1之间的分数,表示其对该识别结果的可信任程度有多高,只有分数高于此阈值的物体才会被作为有效结果输出。

调参说明

  • 调高数值:筛选条件变得更严格。算子只会输出模型非常有把握的结果。这会减少误识别,但可能会漏掉一些识别特征不明显或被部分遮挡的真实目标。

  • 调低数值:筛选条件变得更宽松。算子会输出更多可能的目标,但有可能引入更多的误识别。 如果发现有很多不是目标的物体被错误输出,可以尝试调高此阈值;如果发现有明显的目标没有被识别出来,可适当调低此阈值。

参数范围

[0,1],默认值:0.9

启用GPU加速

参数说明

控制算子是使用CPU还是GPU进行计算。由于深度学习模型计算量较大,使用GPU可以极大地提升处理速度。

调参说明

  • 关闭(默认):算子将使用CPU进行计算。虽然通用性好,不需要特殊硬件,但处理一张图片可能需要更长时间,不适用于对速度要求高的场景。

  • 开启(推荐):如果本机设备支持GPU显卡,建议开启此选项,将大大提升处理速度。