論文

・ Year : ECCV2018
リンク
github

1.どんなものか

data cleansingとは...
データクレンジングとは、モデルの精度を向上させる手法の一つ。 モデルに悪影響のあるインスタンスをのぞく部分集合を特定し精度向上を目指す。

2.先行研究との差分

先行研究のData Cleansing for Models Trained with SGDでは線形影響度LIEの推論の際に 学習時に用いたミニバッチ,学習率,モデルパラメータなどの情報が必要であり,計算コストが高かった. これに対して,推論時に用いろ学習時の情報を最終エポックのみにし,データ効率の良い手法を提案.

3.技術や研究のキモ

学習時に保持する情報について最終時のパラメータのみを用いることで 大幅に使用メモリ量を削減.これによって大規模なデータセット等に対しても適用できるようになった.

4.有効性の証明

先行研究と同様に,mnist,cifar10で分類問題を行った. また,バッチサイズに対して32~256に範囲においてクレンジングの挙動を確認.

5.議論

特になし