散布図を使った人事データの可視化例です。散布図を使うことで量的変数同士の関係を確認したり、クラスターの存在を発見したりすることができます。
人事データの可視化例

人事データ可視化の狙い
- 時間外勤務と年次有給休暇の消化状況の関係を把握する。
人事データ可視化アプローチ
利用するグラフ
- 散布図: 量的変数と量的変数の関係を可視化。
アプローチ
- 散布図に含まれる点の分布を見て、働き方の特徴を観察。
- 年代を順序尺度の変数に変換した上で散布図の点を色分けし、年代別の特徴を観察する。
- 全体の分布から外れた特異なクラスターがないか確認する。
グラフの作り方
- Pythonのseaborn.scatterplotを使った可視化例。
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.ticker as ticker
import japanize_matplotlib
import seaborn as sns
sns.set()
plt.rcParams["figure.figsize"] = (6, 6)
japanize_matplotlib.japanize()
# データの読み込みと加工
df_hr = pd.read_csv('./HRトイデータ_人事情報_拡張版.csv')
df_hr['年代'] = pd.Categorical(df_hr['年代'], categories = [20,30,40,50,60])
# グラフ
fig, ax = plt.subplots()
sns.scatterplot(data=df_hr, x='時間外時間数_月平均', y='年休消化率', hue='年代', style='年代', markers=['o','X','<','>','^'], alpha=.7, ax=ax)
ax.set_title('年代別 時間外と年休消化率の関係')
