散布図
散布図とは? 散布図は2つの量的変数の関係を分析するために使うグラフです。 散布図では、グラフの縦軸と横軸に量的変数をとり、一つ一つのデータを点で表します。点がどのように分布しているか、何か特徴的な傾向はないかなど確認していきます。 上にあげた散布図の例は、会社従業員の年齢と勤続年数の関係を表したグラフになります。年齢が高いほど勤続年数も高くなっていることがわかります。このように、2つの量的変数の大きさが連動しているような関係を相関関係と呼びます。 また、こちらの散布図を見ると、中央下部に全体から外れた点が存在していることもわかります。これも大切な情報で、「これらの外れたデータは何を意味するのだろう?」と考えてみると、様々な発見につながることがあります。 Pythonで散布図を描く この記事で掲載している散布図は、当サイトで提供している人事トイデータ(拡張版)を使用したものです。また、ツールとしてPythonのSeabornを用いて作図しました。具体的なPythonコードは以下のようになります。 まずは初期設定とデータの読み込みから。 # ライブラリの読み込みと初期設...