Class-Balanced Loss Based on Effective Number of Samples - 医療系AIエンジニアの技術メモ

f:id:y_kurashina:20190224213132j:plain

2019年1月公開

実効サンプル数
- $\beta$ : あるサンプルが他のサンプルと特徴量空間でオーバーラップしない確率
- $n_y$ : クラス $y$ のサンプル数
- $\beta=0$ の場合(全サンプルが同一の特徴量を持つ) ： $E_{n_y} = 1$
- $\beta=1$ の場合(全サンプルが完全に異なる特徴量を持つ) ： $E_{n_y} = n_y$
損失関数は実行サンプル数の逆数で補正する
を事前に知ることは困難であるため、ハイパーパラメータとなっている
- 論文では0.9～0.9999の間で、適用するデータセット(CIFER、iNaturalist, ILSVRC)ごとに調整
- 一般的には、 $\beta$ はクラスごとに異なると考えられるが、クラス共通のパラメータとしている
Focal Lossとの組み合わせが相性が良い。
- クラスアンバランス調整項 $\alpha$ として使用できる