GroundDino提示检测

功能

使用GroundDINO模型用语言提示进行图片检测,本模型依赖groundingdino这一python库,若没装则需要在qianyi的pypi源中用pip install groundingdino安装,由于运行需要下载一些数据,且网站有限制,可能会报错,若运行时报错 We couldn’t connect to 'https://huggingface.co' to load this file,couldn’t find it in the cached files and it looks like bert-base-uncased is not the path to a directory containing a file named config.json 则可使用链接(http://10.10.10.98:9000/inference/groundingdino/models—​bert-base-uncased.zip) 下载相应文件,并解压到 /home/XXX/.cache/huggingface/hub 路径下,若已存在该文件夹,则替换掉即可。

输入参数

名称 类型 合法范围 缺省值 含义

图像

ColorImage

输入图片,需要RGB通道的彩色图片

输出参数

名称 类型 合法范围 缺省值 含义

检测结果

DetectInstance

{}

返回包围框,分类,分数和polygon

初始化: 需要

初始化参数

名称 类型 合法范围 缺省值 含义

权重文件

File

['.pth']

模型文件,模型需要与模型类型中对应选择SwinB和SwinT_OGC,可下载路径 http://10.10.10.98:9000/inference/groundingdino/groundingdino_swint_ogc.pthhttp://10.10.10.98:9000/inference/groundingdino/groundingdino_swinb_cogcoor.pth

模型类型

String

['SwinT_OGC', 'SwinB']

SwinT_OGC

模型类型

开启GPU

Bool

False

设置是否使用GPU做推理, 若开启需要电脑具有显卡环境

运行时参数

名称 类型 合法范围 缺省值 含义

提示词句

String

给定英文提示词或句子,根据词句对图像进行检测,找到对应检测框,若有多个类别目标,可用英文符号.或,分隔开词语

类别映射

String

根据设置的给定英文提示词或句子,设定类别为0、1、2、3等大于等于0的值,用于后续对结果根据类别的过滤, 多个类别可用英文符号.或,分隔开,且类别数量需大于等于提示词句数量,若不一致或不设置,则按默认的0、1、2、3、4

检测框置信阈值

Float

[0.0, 1.0]

0.3

检测框阈值

检测类别置信阈值

Float

[0.0, 1.0]

0.25

检测类别阈值