論文

・ Year : 2023
リンク
github

1.どんなものか

noiseラベルを持つデータに対して,特徴量の観点からアプローチを行った論文. 深層特徴マップと呼ばれるを用いてclenaとnoisyデータを見分けられることを経験則的に発見した. 具体的には,誤予測したサンプルの特徴マップに差分があり,cleanデータで学習した得t票マップは対象物体について 注目しているが,noiseラベルで学習したデータは対象物体ではなく背景部分に注目しているといった傾向があった. これを利用して敵対的ノイズマスキングと呼ばれる新たなロバストな学習アプローチを提案している.

2.先行研究との差分

正則化については様々損失関数の面からアプローチはあったものの,オーグメントに関する 正則化について取り組んでいる論文は極めて少ない.私の知る限りではこの論文のほかに1つしかない.

3.技術や研究のキモ

入力画像の特定の部分のみマスキングすることによって多様な活性化マップを制止絵師,認識バイアス を緩和するモデルを明示的に正則化する手法.これについてnoiseデータを用いたtrainingについても調査した.

Adversarial Noisy Masking

各サンプル$x_i$から期待値最大化アルゴリズムによって得られたCEロスに対してガウスコンポーネントが2のGMMにあてはめる. これはdevidemixと同じであると思われる.
そこから$x_i$に対する重み$G_i$を獲得.$x_i$から得られた特徴量$F_i$とそれに対するモデルの予測値$\tilde{y_i}$について 以下のように活性化マップを定める. $$ A_i = CAM(F_i, argmax(\tilde{(y_i)})) $$ ここでGMMは全体的に正しいと仮定している.GMMから獲得される重みについてはまだ改善の余地がもしかしたらあるかもしれない.
今までの仮説であるcleanなデータと比較してnoiseデータは対象物体以外の無駄な背景領域について注目しているという観点について 損失関数$L(x_i,y_i)$について適応的な摂動$max L(x_i,y_i)$の存在を仮定し,noiseの多いデータに対しては最大活性化領域に対して より比率の多いマスクを生成する.これにより残り領域に対して注意を向けるようにモデルに強制する.
ここでGMMによる分離段階で閾値によるフィルタリングではモデルの活性化マップが無意味な背景に散らばってしまう(らしい,なんで??)

Decoda $M_D$

画像に対しては,元からついているラベルに関してはdevidemixと同様に洗練を行う.その後は,devidemixとは異なりマスク比を導出しマスク画像 に対するラベル(予測確率)を生成.予測確率を用いて更にEncoderを訓練すると同時に,マスク予測を行うことで自己教師あり学習のpre-texttaskとして成立.

4.有効性の証明

cifar10,cifar100,clothing1mで実験.
対象ノイズの入ったcifar10,100における実験結果

対象ノイズの入ったcifar10における実験結果

clothing1mにおける実験結果

その他,cifar10,100においてsanmの各モジュールを機能させた場合や,他の手法と組み合わせた場合の実験結果


5.議論