層別散布図

散布図を使った人事データの可視化例です。散布図を使うことで量的変数同士の関係を確認したり、クラスターの存在を発見したりすることができます。

人事データの可視化例

人事データ可視化の狙い

時間外勤務と年次有給休暇の消化状況の関係を把握する。

人事データ可視化アプローチ

利用するグラフ

散布図：量的変数と量的変数の関係を可視化。

アプローチ

散布図に含まれる点の分布を見て、働き方の特徴を観察。
年代を順序尺度の変数に変換した上で散布図の点を色分けし、年代別の特徴を観察する。
全体の分布から外れた特異なクラスターがないか確認する。

グラフの作り方

Pythonのseaborn.scatterplotを使った可視化例。

import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.ticker as ticker
import japanize_matplotlib
import seaborn as sns

sns.set()
plt.rcParams["figure.figsize"] = (6, 6)
japanize_matplotlib.japanize()

# データの読み込みと加工
df_hr = pd.read_csv('./HRトイデータ_人事情報_拡張版.csv')
df_hr['年代'] = pd.Categorical(df_hr['年代'], categories = [20,30,40,50,60])

# グラフ
fig, ax = plt.subplots()
sns.scatterplot(data=df_hr, x='時間外時間数_月平均', y='年休消化率', hue='年代', style='年代', markers=['o','X','<','>','^'], alpha=.7, ax=ax)
ax.set_title('年代別 時間外と年休消化率の関係')