バイオリンプロットを使った人事データの可視化例です。カテゴリ別に量的変数のばらつきや分布を比較する際に利用します。箱ひげ図よりも分布の形状を捉えやすい利点がありますが、データが少ない場合は曲線のフィッティングが不安定になることもあります。

人事データ可視化例

バイオリンプロット

人事データ可視化の狙い

  • グレード別のエンゲージメントの分布を確認し、組織開発のヒントを探る。

人事データ可視化アプローチ

利用するグラフ

  • バイオリンプロット: 量的変数の分布を滑らかな曲線と四分位数(箱ひげ図)で確認する。

アプローチ

  • 量的変数であるエンゲージメントをグレード別に分け、バイオリンプロットで可視化することで分布の違いを確認する。
  • グレードを順序尺度変数に変換することで、グレードの並び順を変更する。
  • 図の中心にある箱ひげ図の上端と下端を確認し、曲線の意味合いに留意する。

グラフの作り方

  • Pythonのseaborn.violinplotを使った可視化例。
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.ticker as ticker
import japanize_matplotlib
import seaborn as sns

sns.set_theme(style='darkgrid')
japanize_matplotlib.japanize()

# データの読み込みと加工
df_hr = pd.read_csv('./HRトイデータ_人事情報_拡張版.csv')
df_hr['グレード'] = pd.Categorical(df_hr['グレード'], categories = ['E','S','L','M'])

# グラフ
fig, ax = plt.subplots(figsize=(6,6))
sns.violinplot(data=df_hr, x='グレード', y='エンゲージメント', ax=ax)
ax.set_title('グレード別 エンゲージメントの分布')

※2024/9/3 画像を差し替え