比率順の帯グラフ

比率順に並べた帯グラフを使って人事データを可視化した例です。注目する指標やデータ観点があった場合、その比率が高い組織と低い組織がどのように分布しているのか確認する上で役立ちます。

人事データ可視化の例

人事データ可視化の狙い

パイパフォーマーを多く排出している組織またはマネジャーを探す。
人事評価のバイアスを確認する。

人事データ可視化アプローチ

利用するグラフ

帯グラフ（横型の100%積み上げ棒グラフ）：データが持つカテゴリカル変数の属性に対し、データ全体またはグループ別の構成比を色分けされた帯状のグラフで可視化する。

アプローチ

成績情報の中で、関心のある項目をまとめあげて新しいデータ項目として保存する。
所属別に新しいデータ項目に対する帯グラフを描き、分布の偏りを確認する。
帯グラフをソートし、パイパフォーマーを多く輩出している組織を探索する。

グラフの作り方

Pythonのpandas.plot.barを使った可視化例。

import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.ticker as ticker
import japanize_matplotlib
import seaborn as sns

sns.set_theme(style='darkgrid')
japanize_matplotlib.japanize()

# データの読み込みと加工
df_hr = pd.read_csv('./HRトイデータ_人事情報_拡張版.csv')
df_hr['評価分布'] = 'B以下'
df_hr['評価分布'].mask(df_hr['成績'].isin(['SA','A']), 'SA/A', inplace=True)

# グラフ
fig, ax = plt.subplots(figsize=(8,10))
pd.crosstab(df_hr['所属'], df_hr['評価分布'],normalize='index').\
  sort_values('SA/A').plot.barh(stacked=True, width=1, ax=ax)
ax.set_title('組織別ハイパフォーマー在籍率')
ax.tick_params(axis="x", labelrotation=0)

# 凡例
ax.legend(handles=h[::-1],labels=l[::-1], loc='upper left', bbox_to_anchor=(1, 1), title='評価')