箱ひげ図を使った人事データの可視化例です。箱ひげ図は四分位数を利用して量的変数の分布を素早く捉えることができます。

データ可視化の例

箱ひげ図

データ可視化の狙い

  • 採用プロセスの改善点を探るために、パフォーマンスと採用時評価の関係を考察する。

データ可視化アプローチ

利用するグラフ

  • 箱ひげ図: 四分位数を利用して量的変数の分布を確認する。

アプローチ

  • 量的変数である採用時能力評定の分布を成績別に箱ひげ図で可視化する。
  • 成績を順序変数に変換することで、人事評価の意味と表示順番を合わせる。
  • 成績別の箱ひげ図を採用種別で分け、採用プロセスの違いも考慮しながら比較する。

グラフの作り方

  • Pythonのseaborn.boxplotによる可視化例。
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.ticker as ticker
import japanize_matplotlib
import seaborn as sns

sns.set_theme(style='darkgrid')
plt.rcParams["figure.figsize"] = (6, 6)
japanize_matplotlib.japanize()

# データの読み込みと加工
df_hr = pd.read_csv('./hr-toydata-basic-600.csv')
df_hr['成績'] = pd.Categorical(df_hr['成績'], categories = ['SA','A','B','C','D'])

#グラフ
fig, ax = plt.subplots()
sns.boxplot(data=df_hr, x='採用時能力評価', y='成績', hue='採用種別')
ax.set_title('採用評価とパフォーマンスの関係')
ax.legend(loc='upper left', bbox_to_anchor=(1, 1), title='採用種別')

この記事で使ったデータ

以下のページでデータを配布しています。

人事トイデータの公開
こちらのページでは、クニラボで作成した人事トイデータを公開しています。 トイデータとは? トイデータ(Toy Data)とは、演習用に使えるリアルでないデータのことをいいます。データ分析や機械学習のライブラリに附属する場合もあり、手元にデータがなくてもそのライブラリをすぐに試せるのが利点です。 人事データ分析の演習にご活用ください ピープルアナリティクスを学んでみたいが手元に良いデータがない、という方も多いのではないでしょうか。人事データは個人情報を含むため、ピープルアナリティクスプロジェクトの正式なメンバーでないと触ることができません。 そこで、演習用にデータを自作しGoogleドライブより公開しています。これまでも代表のnote記事の中でリンクを張っていたのですが、複数の記事で利用するためこのページを作りました。 * 2023/11/29追記 「HRトイデータ_人事情報_拡張版.csv 」を追加しました。 * 2024/3/23追記 「HRトイデータ_月別時間外.csv 」を追加しました。 * 2024/11/18追記 「HRトイデータ_エンゲージメントスコア