ストリッププロットを使った人事データの可視化例です。ストリッププロットは量的変数のばらつきを点群で可視化する手法で、量的変数とカテゴリ変数の関係を確認するために利用されます。カラーの透過性を調整することで、データの密度を観察することもできます。

人事データの可視化例

ストリッププロット

人事データ可視化の狙い

  • 年代別に時間外勤務のばらつきを確認する。

人事データ可視化アプローチ

利用するグラフ

  • ストリッププロット: カテゴリカル変数でグループ分けした量的変数の分布を観察する。

アプローチ

  • 時間外時間数を年代でグループ分けして分布を比較する。
  • 年代を順序尺度変数に変換することで、表示順に統一性を持たせる。
  • ストリッププロットの点の散布を観察し、ばらつきの違いを確認する。
  • それぞれのグループ内で更にグループ分けする余地があるか確認する。(複数のクラスターの存在を確認)

グラフの作り方

  • Pythonのseaborn.stripplotによる可視化例。
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.ticker as ticker
import japanize_matplotlib
import seaborn as sns

sns.set_theme(style='darkgrid')
plt.rcParams["figure.figsize"] = (6, 6)
japanize_matplotlib.japanize()

# データの読み込みと加工
df_hr = pd.read_csv('./HRトイデータ_人事情報_拡張版.csv')
df_hr['年代'] = pd.Categorical(df_hr['年代'], categories = [20,30,40,50,60])

# グラフ
fig, ax = plt.subplots()
sns.stripplot(data=df_hr, x='年代', y='時間外時間数_月平均', hue='年代', alpha=.7)
ax.set_title('年代別 時間外勤務時間数の分布')