🟧 画像正規化

機能説明

このオペレーターは、入力画像の各ピクセルの輝度情報を再調整し、異なるスケールまたは分布のピクセル値を標準的な基準に統一し、輝度、コントラスト、またはデータビット深度の違いによる画像間の数値差異を排除します。

使用シナリオ

  • 深層学習モデルは、入力画像のピクセル値が標準範囲内([0, 1]または[-1, 1]など)にあることを要求したり、標準正規分布(平均値0、分散1)に従うことを要求する場合があり、画像正規化により前処理を行うことができます。

  • 異なる照明条件下で撮影された画像は、画像の輝度が一致しない可能性があります。正規化により照明変化の影響を減少させ、アルゴリズムのロバスト性を向上させることができます。

入力出力

入力項目

画像:処理待ちの入力画像または画像リスト。グレースケール画像またはカラー画像が可能です。

出力項目

正規化画像:正規化処理後の画像または画像リスト。

パラメータ説明

正規化方法

パラメータ説明

画像ピクセル値を正規化するアルゴリズムを選択します。

調整説明

  • 最大最小値正規化:この方法は元のデータの分布構造を保持し、ピクセル値を線形に引き伸ばして、特定のターゲット範囲にマッピングします。ピクセル値の相対関係を保持する必要がある汎用シーンに適しています。

  • 平均分散正規化:ピクセル値を標準化された分布(通常は平均値0、標準偏差1)に変換し、その後正規化範囲最大値を掛けてデータのスケールを調整します。深層学習でよく使用され、多くのモデルが入力データが標準正規分布であることを前提としているためです。

  • 最大絶対値正規化:画像内の最大絶対値ピクセルを見つけ、各ピクセルをこの値で除算し、指定された範囲にスケーリングします。この方法は画像の「中心」、つまり正負の値の相対分布を変更しません。

  • 対数正規化:画像内の輝度差が非常に大きい場合(例:少量の明るいピクセルと大量の暗いピクセル)、対数正規化は各ピクセル値の対数をとり、明るい領域の差を減少させ、暗い領域の詳細を強調することで、画像全体をより均衡に見せることができます。

正規化範囲最大値

パラメータ説明

正規化後の数値範囲の最大値またはスケーリング係数を設定します。

調整説明

  • 最大最小値正規化を使用する場合、このパラメータは出力範囲の上限を設定します。例えば255に設定すると、出力範囲は[0, 255]となり、8ビット画像として直接表示するのに適しています。1に設定すると、出力範囲は[0, 1]となり、深層学習でよく使用されます。

  • その他の正規化方法では、このパラメータは正規化計算後に適用される乗算スケーリング因子として機能します。

パラメータ範囲

[1,10000000]、デフォルト値:1

切り捨てを有効にする

パラメータ説明

正規化後の結果を指定された最小値と最大値の間に強制的に制限するかどうかを制御します。

調整説明

  • オフ(デフォルト):切り捨ては行われません。

  • オン:切り捨て機能を有効にします。正規化結果が期待範囲を超える極端な値を生成する可能性がある場合、このオプションを有効にすることで、これらの外れ値を効果的に抑制し、出力値が最小値と最大値の間にあることを保証できます。

有効ノード

パラメータ説明

このオペレーターが演算を実行するかどうかを制御します。

調整説明

  • オン(デフォルト):このオペレーター機能を正常に実行します。

  • オフ:オペレーターは何も操作せず、入力データを直接出力します。