<< TOPへ
Isolation Forest
- Isolation Forestは、Random Forestと同様に決定木に基づいて構築される。
- その基本的なアイディアは、**データが孤立するまでの距離(深さ)から異常値を推定する**というもの。
- 全データを使って決定木を一つだけ作成すると過学習してしまうため、データをサンプリングした上で大量の決定木を作成し、各データが孤立するまでの距離の平均を使用して異常値スコアを算出する。
参考)https://qiita.com/daishiro_jp/items/c8d824e7bea659289464