YOLOv8/v10の検出とセグメンテーション

機能説明

このオペレータは、高度なYOLOv8またはYOLOv10深層学習モデルを利用して、入力カラー画像に対して物体検出、インスタンスセグメンテーション、または回転物体検出タスクを実行し、.pt、.onnx、.epicnnなどの複数のモデル形式をサポートします。

使用シナリオ

  • 物体検出:画像内の複数の物体を迅速に特定・識別し、そのバウンディングボックスとカテゴリを出力します。部品認識、欠陥特定、物品計数などに適しています。

  • インスタンスセグメンテーション:物体検出を基礎として、識別された各物体インスタンスに対して正確なピクセルレベルのセグメンテーションマスク(輪郭)をさらに生成します。把持位置特定、面積測定など、正確な形状情報が必要なシナリオに適しています。

  • 回転物体検出:任意の向きを持つ物体を検出し、それらを密接に囲む回転バウンディングボックスとその角度を出力します。傾斜または任意に配置された物体の検出に適しています。

入력/출력

入力項目

画像:検出またはセグメンテーションを行うカラー画像(RGB形式である必要があります)。現在、単一画像の入力のみをサポートしています。

出力項目

テスト結果:検出/セグメンテーション結果を含むリスト。

パラメータ説明

  • 入力画像:入力フォーマットはカラ―RGB画像である必要があります。Epicシリーズカメラはデータに特別な処理を施しているため、出力画像はすべてYOLOアルゴリズムによる検出とセグメンテーションに対応しています。

  • 単一画像処理:現在のオペレータ実装は、一度に1つの画像の処理のみをサポートしています。

  • GPU環境:GPUを有効にする場合、特にONNXモデルを使用する場合は、CUDA環境とonnxruntime-gpuライブラリが正しくインストールされ、互換性があることを必ず確認してください。

  • Epicnnモデル:.epicnnモデルを使用する場合、「推定タイプ」パラメータを正しく設定する必要があります。

重量ファイル

パラメータ説明

推論に使用するYOLOモデルの重みファイルを指定します。PyTorch(.pt)、ONNX(.onnx)、およびepicnn(.epicnn)形式をサポートします。有効なモデルファイルを選択する必要があります。

パラメータ調整ガイド

タスクの要件とハードウェア能力に適したモデルファイルを選択してください。

  • .ptファイルは通常、トレーニングとデバッグに使用されます。

  • .onnxファイルはクロスプラットフォームの互換性が高く、CPUでの実行速度が比較的速いです。

  • .epicnnファイルは、最適なパフォーマンスを得るために専用のインテリジェントカメラプラットフォーム用です。

GPUを有効にする

パラメータ説明

モデル推論計算にGPUを使用するかどうかを選択します。チェックした場合、コンピュータに利用可能なNVIDIAグラフィックカードと対応するCUDA環境があることを確認する必要があります。

パラメータ調整ガイド

このオプションをチェックすると、特に大規模モデルや高解像度画像の場合、処理速度が大幅に向上します。

  • .onnxモデルを使用し、GPUが有効になっている場合は、プロンプトに従ってCUDAバージョンに一致するonnxruntime-gpuライブラリをインストールする必要があります。

  • 互換性のあるGPUがないか、環境が正しく構成されていない場合は、チェックを外す必要があります(CPUを使用)。

  • .epicnnモデルの場合、このオプションは無効です。

推定タイプ

パラメータ説明

.epicnn重みファイルを選択した場合にのみ有効です。.epicnnモデルがどのタスク(検出、セグメンテーション、回転検出)用で、どのYOLOバージョン(v8またはv10)に基づいているかをオペレータに明示的に通知するために使用されます。

パラメータ調整ガイド

.epicnnファイルをロードする場合、モデルの実際のトレーニングタスクに基づいて正しい推論タイプを選択する必要があります。そうしないと、後処理エラーが発生する可能性があります。

たとえば、YOLOv8セグメンテーションモデルから変換された.epicnnファイルをロードする場合は、「yolov8セグメンテーション」を選択する必要があります。.ptおよび.onnxモデルの場合、オペレータはタスクタイプを自動的に識別し、このパラメータは無視されます。

信頼閾値

パラメータ説明

検出/セグメンテーション結果をフィルタリングするための信頼度スコアのしきい値。このしきい値よりも高いスコアのインスタンスのみが出力されます。

パラメータ調整ガイド

これは最も一般的に調整されるパラメータです。この値を大きくすると、出力結果が少なくなり、モデルが非常に確信しているオブジェクトのみが保持され、誤検出を効果的に減らすことができます。この値を小さくすると、より多くの検出結果が得られ、確信度が低い、または品質の低いターゲットが含まれる可能性がありますが、見逃されたターゲットをいくつか取り戻すこともできます。実際のアプリケーションシナリオに基づいて、再現率と適合率の間でトレードオフを行う必要があります。通常はデフォルト値から開始し、効果に基づいて調整します。

パラメータ範囲

[0.005, 1],デフォルト値:0.8