箱ひげ図を使った人事データの可視化例です。箱ひげ図は四分位数を利用して量的変数の分布を素早く捉えることができます。
データ可視化の例

データ可視化の狙い
- 採用プロセスの改善点を探るために、パフォーマンスと採用時評価の関係を考察する。
データ可視化アプローチ
利用するグラフ
- 箱ひげ図: 四分位数を利用して量的変数の分布を確認する。
アプローチ
- 量的変数である採用時能力評定の分布を成績別に箱ひげ図で可視化する。
- 成績を順序変数に変換することで、人事評価の意味と表示順番を合わせる。
- 成績別の箱ひげ図を採用種別で分け、採用プロセスの違いも考慮しながら比較する。
グラフの作り方
- Pythonのseaborn.boxplotによる可視化例。
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.ticker as ticker
import japanize_matplotlib
import seaborn as sns
sns.set_theme(style='darkgrid')
plt.rcParams["figure.figsize"] = (6, 6)
japanize_matplotlib.japanize()
# データの読み込みと加工
df_hr = pd.read_csv('./HRトイデータ_人事情報_拡張版.csv')
df_hr['成績'] = pd.Categorical(df_hr['成績'], categories = ['SA','A','B','C','D'])
#グラフ
fig, ax = plt.subplots()
sns.boxplot(data=df_hr, x='採用時能力評価', y='成績', hue='採用種別')
ax.set_title('採用評価とパフォーマンスの関係')
ax.legend(loc='upper left', bbox_to_anchor=(1, 1), title='採用種別')
