線形手法と非線形手法の両方を試す
データ分析プロジェクトでは、何らかの分析手法を利用することになります。予測モデルを作るなら教師あり学習手法を用いてモデル化していくでしょうし、じっくり探索するような場面ではグラフや統計モデルを使いながらあれこれ試行錯誤するかもしれません。 分析の目的、つまり問題設定によってデータ分析アプローチは大きく変わります。その一方で、同じような問題であったとしても、利用できるデータ分析手法はたくさんあります。 もし、コストと時間を無限に使えるのでしたら、世界中にある分析手法をすべて試して最も問題に適したアプローチを採用すればよいでしょう。しかし、現実にはそれは難しいことですし、分析チームが古今東西のすべての手法に精通するというのも現実的ではないと思います。 そこで、すべての分析手法を試す時間がないときに「線形手法と非線形手法の両方を試してみる」という戦術をよく使います。これは、回帰のような予測タスクであっても、教師あり学習手法を用いた探索であっても同様です。特に分析の初期フェーズでは問題の難しさを見るうえで便利です。 分類問題の例 例えば、離職予測モデルを作るような場面を想像してみま...