散布図による多変量の可視化

散布図を使った人事データの可視化例です。量的変数同士の関係やクラスターの存在を確認する上で散布図は有効です。また、縦軸と横軸に加えて3つ目の変数で点のカラーを変更することで、クラスターの傾向を確認することもできます。

人事データ可視化の例

人事データ可視化の狙い

エンゲージメントと働き方の関係を調査する。

人事データ可視化アプローチ

利用するグラフ

散布図：量的変数と量的変数の関係を可視化。

アプローチ

散布図に含まれる点の分布を見て、働き方の特徴を観察。
エンゲージメントで点に色を付けることで、働き方の特徴との関連を探る。

グラフの作り方

Pythonのseaborn.scatterplotによる可視化例。

import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.ticker as ticker
import japanize_matplotlib
import seaborn as sns

sns.set_theme(style='ticks')
plt.rcParams["figure.figsize"] = (6, 6)
japanize_matplotlib.japanize()

# データの読み込み
df_hr = pd.read_csv('./hr-toydata-basic-600.csv')

# グラフ
fig, ax = plt.subplots()
sns.scatterplot(data=df_hr.query("部 == '営業部'"),
  x='時間外時間数_月平均', y='年休消化率', hue='エンゲージメント',
  alpha=.8,  ax=ax)
ax.set_title('働き方とエンゲージメントの関係（営業部）')
ax.legend(loc="upper left", bbox_to_anchor=(1, 1), title='エンゲージメント')