GroundDino提示检测

功能：

使用GroundDINO模型用语言提示进行图片检测，本模型依赖groundingdino这一python库，若没装则需要在qianyi的pypi源中用pip install groundingdino安装，由于运行需要下载一些数据，且网站有限制，可能会报错，若运行时报错 We couldn’t connect to 'https://huggingface.co' to load this file,couldn’t find it in the cached files and it looks like bert-base-uncased is not the path to a directory containing a file named config.json 则可使用链接(http://10.10.10.98:9000/inference/groundingdino/models—bert-base-uncased.zip) 下载相应文件，并解压到 /home/XXX/.cache/huggingface/hub 路径下，若已存在该文件夹，则替换掉即可。

输入参数：

名称	类型	合法范围	缺省值	含义
图像	ColorImage	无	无	输入图片,需要RGB通道的彩色图片

名称

类型

合法范围

缺省值

含义

图像

ColorImage

无

输入图片,需要RGB通道的彩色图片

输出参数：

名称	类型	合法范围	缺省值	含义
检测结果	DetectInstance	无	{}	返回包围框,分类,分数和polygon

名称

类型

合法范围

缺省值

含义

检测结果

DetectInstance

无

{}

返回包围框,分类,分数和polygon

初始化：需要

初始化参数：

名称	类型	合法范围	缺省值	含义
权重文件	File	['.pth']	无	模型文件，模型需要与模型类型中对应选择SwinB和SwinT_OGC，可下载路径 http://10.10.10.98:9000/inference/groundingdino/groundingdino_swint_ogc.pth 和 http://10.10.10.98:9000/inference/groundingdino/groundingdino_swinb_cogcoor.pth
模型类型	String	['SwinT_OGC', 'SwinB']	SwinT_OGC	模型类型
开启GPU	Bool	无	False	设置是否使用GPU做推理, 若开启需要电脑具有显卡环境

名称

类型

合法范围

缺省值

含义

权重文件

File

['.pth']

无

模型文件，模型需要与模型类型中对应选择SwinB和SwinT_OGC，可下载路径 http://10.10.10.98:9000/inference/groundingdino/groundingdino_swint_ogc.pth 和 http://10.10.10.98:9000/inference/groundingdino/groundingdino_swinb_cogcoor.pth

模型类型

String

['SwinT_OGC', 'SwinB']

SwinT_OGC

模型类型

开启GPU

Bool

无

False

设置是否使用GPU做推理, 若开启需要电脑具有显卡环境

运行时参数：

名称	类型	合法范围	缺省值	含义
提示词句	String	无		给定英文提示词或句子，根据词句对图像进行检测，找到对应检测框，若有多个类别目标，可用英文符号.或,分隔开词语
类别映射	String	无		根据设置的给定英文提示词或句子，设定类别为0、1、2、3等大于等于0的值，用于后续对结果根据类别的过滤，多个类别可用英文符号.或,分隔开，且类别数量需大于等于提示词句数量，若不一致或不设置，则按默认的0、1、2、3、4
检测框置信阈值	Float	[0.0, 1.0]	0.3	检测框阈值
检测类别置信阈值	Float	[0.0, 1.0]	0.25	检测类别阈值

名称

类型

合法范围

缺省值

含义

提示词句

String

无

给定英文提示词或句子，根据词句对图像进行检测，找到对应检测框，若有多个类别目标，可用英文符号.或,分隔开词语

类别映射

String

无

根据设置的给定英文提示词或句子，设定类别为0、1、2、3等大于等于0的值，用于后续对结果根据类别的过滤，多个类别可用英文符号.或,分隔开，且类别数量需大于等于提示词句数量，若不一致或不设置，则按默认的0、1、2、3、4

检测框置信阈值

Float

[0.0, 1.0]

0.3

检测框阈值

检测类别置信阈值

Float

[0.0, 1.0]

0.25

检测类别阈值