FastSAM提示分割

功能：使用FastSAM模型，输入boxes或points或语言提示进行图片的分割, 本模型依赖fastsam这一python库，若没装则需要在qianyi的pypi源中用pip install fastsam安装

输入参数：

名称	类型	合法范围	缺省值	含义
图像	ColorImage	无	无	输入图片,需要RGB通道的彩色图片
提示点列表	List	无	无	(np.ndarray or None): Nx2的数组，数组每一行代表一个提示点像素位置(X, Y)
提示框列表	Box2D	无	无	(np.ndarray or None): Nx4x2的数组，数组每一行代表一个提示框的四个点的坐标，会根据此计算出其左上角和右下角进行计算

名称

类型

合法范围

缺省值

含义

图像

ColorImage

无

输入图片,需要RGB通道的彩色图片

提示点列表

List

无

(np.ndarray or None): Nx2的数组，数组每一行代表一个提示点像素位置(X, Y)

提示框列表

Box2D

无

(np.ndarray or None): Nx4x2的数组，数组每一行代表一个提示框的四个点的坐标，会根据此计算出其左上角和右下角进行计算

输出参数：

名称	类型	合法范围	缺省值	含义
检测结果	DetectInstance	无	{}	返回包围框,分类,分数和polygon

名称

类型

合法范围

缺省值

含义

检测结果

DetectInstance

无

{}

返回包围框,分类,分数和polygon

参数设置：

名称	类型	合法范围	缺省值	含义
权重文件	File	['.pt']	无	模型文件，模型需要与模型类型相对应，官方模型下载路径为 http://10.10.10.98:9000/inference/fast_sam/FastSAM-x.pt、 http://10.10.10.98:9000/inference/fast_sam/FastSAM-s.pt
开启GPU	Bool	无	False	设置是否使用GPU做推理, 若开启需要电脑具有显卡环境，本节点为了让其在1650显卡上运行GPU版本，在后处理部分使用了CPU运行，以防止显存溢出。所以打开GPU的情况下，如果置信阈值较小，检测结果过多，进行后处理的时间会变长。
图像尺寸	Integer	无	640	在运行分割时将图像缩放到的尺寸，默认640,也可用1024、512、256等2的幂次
置信阈值	Float	[0.0, 1.0]	0.5	检测阈值，此值越大分割出来结果越少后处理时间会更少，越小则分割出来结果越多，后处理时间会增加
IOU阈值	Float	[0.0, 1.0]	0.9	结果的IOU阈值，IOU大于此值时过滤掉目标
分割类型	String	['box_prompt', 'point_prompt', 'text_prompt', 'everything']	box_prompt	推荐box_prompt方法，选择使用box提示、points提示、文字提示还是分割一切，此参数的值需与输入的点、box、文字prompt对应，否则会默认分割everything
类别名	String	['0', '1', '2', '3', '4', '5', '6', '7', '8', '9', '10', '11', '12', '13', '14', '15', '16', '17', '18', '19', '20', '21', '22', '23', '24', '25', '26', '27', '28', '29']	0	可根据场景设置类别名称，以进行过滤等操作
面积阈值	Float	[0.0, 10000000]	100	通过mask面积过滤掉部分结果
提示词	String	无		可根据图片内容和待分割目标进行设置，如：bag
文字提示阈值	Float	[0.0, 10]	0.01	文字提示阈值，将文字检测结果过滤掉一部分低于得分的值，注意：此阈值并非结果图中显示的阈值，一般不能设置太高

名称

类型

合法范围

缺省值

含义

权重文件

File

['.pt']

无

模型文件，模型需要与模型类型相对应，官方模型下载路径为 http://10.10.10.98:9000/inference/fast_sam/FastSAM-x.pt、 http://10.10.10.98:9000/inference/fast_sam/FastSAM-s.pt

开启GPU

Bool

无

False

设置是否使用GPU做推理, 若开启需要电脑具有显卡环境，本节点为了让其在1650显卡上运行GPU版本，在后处理部分使用了CPU运行，以防止显存溢出。所以打开GPU的情况下，如果置信阈值较小，检测结果过多，进行后处理的时间会变长。

图像尺寸

Integer

无

640

在运行分割时将图像缩放到的尺寸，默认640,也可用1024、512、256等2的幂次

置信阈值

Float

[0.0, 1.0]

0.5

检测阈值，此值越大分割出来结果越少后处理时间会更少，越小则分割出来结果越多，后处理时间会增加

IOU阈值

Float

[0.0, 1.0]

0.9

结果的IOU阈值，IOU大于此值时过滤掉目标

分割类型

String

['box_prompt', 'point_prompt', 'text_prompt', 'everything']

box_prompt

推荐box_prompt方法，选择使用box提示、points提示、文字提示还是分割一切，此参数的值需与输入的点、box、文字prompt对应，否则会默认分割everything

类别名

String

['0', '1', '2', '3', '4', '5', '6', '7', '8', '9', '10', '11', '12', '13', '14', '15', '16', '17', '18', '19', '20', '21', '22', '23', '24', '25', '26', '27', '28', '29']

可根据场景设置类别名称，以进行过滤等操作

面积阈值

Float

[0.0, 10000000]

100

通过mask面积过滤掉部分结果

提示词

String

无

可根据图片内容和待分割目标进行设置，如：bag

文字提示阈值

Float

[0.0, 10]

0.01

文字提示阈值，将文字检测结果过滤掉一部分低于得分的值，注意：此阈值并非结果图中显示的阈值，一般不能设置太高