GroundDino提示检测
功能:
使用GroundDINO模型用语言提示进行图片检测,本模型依赖groundingdino这一python库,若没装则需要在qianyi的pypi源中用pip install groundingdino安装,由于运行需要下载一些数据,且网站有限制,可能会报错,若运行时报错 We couldn’t connect to 'https://huggingface.co' to load this file,couldn’t find it in the cached files and it looks like bert-base-uncased is not the path to a directory containing a file named config.json
则可使用链接(http://10.10.10.98:9000/inference/groundingdino/models—bert-base-uncased.zip)
下载相应文件,并解压到 /home/XXX/.cache/huggingface/hub
路径下,若已存在该文件夹,则替换掉即可。
输入参数:
名称 | 类型 | 合法范围 | 缺省值 | 含义 |
---|---|---|---|---|
图像 |
ColorImage |
无 |
无 |
输入图片,需要RGB通道的彩色图片 |
输出参数:
名称 | 类型 | 合法范围 | 缺省值 | 含义 |
---|---|---|---|---|
检测结果 |
DetectInstance |
无 |
{} |
返回包围框,分类,分数和polygon |
参数设置:
名称 | 类型 | 合法范围 | 缺省值 | 含义 |
---|---|---|---|---|
权重文件 |
File |
['.pth'] |
无 |
模型文件,模型需要与模型类型中对应选择SwinB和SwinT_OGC,可下载路径 http://10.10.10.98:9000/inference/groundingdino/groundingdino_swint_ogc.pth 和 http://10.10.10.98:9000/inference/groundingdino/groundingdino_swinb_cogcoor.pth |
模型类型 |
String |
['SwinT_OGC', 'SwinB'] |
SwinT_OGC |
模型类型 |
开启GPU |
Bool |
无 |
False |
设置是否使用GPU做推理, 若开启需要电脑具有显卡环境 |
提示词句 |
String |
无 |
给定英文提示词或句子,根据词句对图像进行检测,找到对应检测框,若有多个类别目标,可用英文符号.或,分隔开词语 |
|
类别映射 |
String |
无 |
根据设置的给定英文提示词或句子,设定类别为0、1、2、3等大于等于0的值,用于后续对结果根据类别的过滤, 多个类别可用英文符号.或,分隔开,且类别数量需大于等于提示词句数量,若不一致或不设置,则按默认的0、1、2、3、4 |
|
检测框置信阈值 |
Float |
[0.0, 1.0] |
0.3 |
检测框阈值 |
检测类别置信阈值 |
Float |
[0.0, 1.0] |
0.25 |
检测类别阈值 |