LightGBMでの予測値がすべて同じ値になるときの原因と対処

原因

対処方法

補足

min_child_samplesは、末端ノードに含まれる最小のデータ数。

初期値が20となっており、これを下回るような分割はされない。

従って、初期値設定のままだと、数十程度のデータセットだとトレーニングまともにできず、予測値がすべて同じ値になる場合がある。

対処方法としては、データ量を増やすことが一番良いが、 min_child_sampleの値を小さくすることである程度ましになる。

Check it out on github Last updated: 23/05/2020 06:04:24