大規模モデルプロンプト分割

機能: Segment Anythingモデルを使用し、ボックスまたはポイントプロンプトを入力して画像のセグメンテーションを実行します。このモデルはsegment-anything pythonライブラリに依存しています。インストールされていない場合は、Qianyiのpypiソースから`pip install segment-anything`を使用してインストールする必要があります。

入力パラメータ

名称 タイプ 正当な範囲 デフォルト値 意味

画像

ColorImage

なし

なし

画像を入力してください。RGBチャンネルのカラー画像が必要です。

ヒントポイント一覧

List

なし

なし

(np.ndarrayまたはNone):Nx 2配列、配列の各行はヒントピクセルの位置( X、Y )を表します。

ツールチップリスト

List

なし

なし

(np.ndarrayまたはNone):Nx 4 x 2配列、配列の各行はプロンプトボックスの4つの点の座標を表し、その左上隅と右下隅はこの計算に従って計算されます。

出力パラメータ

名称 タイプ 正当な範囲 デフォルト値 意味

テスト結果

DetectInstance

なし

{}

バウンディングボックス、タクソノミー、スコア、ポリゴンを返します。

パラメータ設定

名称 タイプ 正当な範囲 デフォルト値 意味

重量ファイル

File

['.pth']

なし

モデルファイル。モデルはモデルタイプに対応する必要があります。公式モデルのダウンロードパスは次のとおりです: Baseモデル:http://10.10.10.98:9000/inference/sam/sam_vit_b_01ec64.pth, Largeモデル:http://10.10.10.98:9000/inference/sam/sam_vit_l_0b3195.pth, Hugeモデル:http://10.10.10.98:9000/inference/sam/sam_vit_h_4b8939.pth

モデルタイプ

String

['vit_b', 'vit_l', 'vit_h']

vit_b

モデルタイプ。

GPUを有効にする

Bool

なし

false

推論にGPUを使用するかどうかを設定します。GPUがオンになっている場合、コンピュータにはグラフィックスカード環境が必要です。

信頼閾値

Float

[0.0, 1.0]

0.5

検出しきい値。

複数の結果を出力

Bool

なし

false

各プロンプトについて、複数の結果を出力するかどうか、trueの場合、各プロンプトは3つのマスクを出力し、falseの場合、1つのみが出力されます。

カテゴリー名

String

['0', '1', '2', '3', '4', '5', '6', '7', '8', '9', '10', '11', '12', '13', '14', '15', '16', '17', '18', '19', '20', '21', '22', '23', '24', '25', '26', '27', '28', '29']

0

シーンに応じてカテゴリ名を設定して、フィルタリングなどの操作を実行できます。