比率順に並べた帯グラフを使って人事データを可視化した例です。注目する指標やデータ観点があった場合、その比率が高い組織と低い組織がどのように分布しているのか確認する上で役立ちます。
人事データ可視化の例

人事データ可視化の狙い
- パイパフォーマーを多く排出している組織またはマネジャーを探す。
- 人事評価のバイアスを確認する。
人事データ可視化アプローチ
利用するグラフ
- 帯グラフ(横型の100%積み上げ棒グラフ): データが持つカテゴリカル変数の属性に対し、データ全体またはグループ別の構成比を色分けされた帯状のグラフで可視化する。
アプローチ
- 成績情報の中で、関心のある項目をまとめあげて新しいデータ項目として保存する。
- 所属別に新しいデータ項目に対する帯グラフを描き、分布の偏りを確認する。
- 帯グラフをソートし、パイパフォーマーを多く輩出している組織を探索する。
グラフの作り方
- Pythonのpandas.plot.barを使った可視化例。
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.ticker as ticker
import japanize_matplotlib
import seaborn as sns
sns.set_theme(style='darkgrid')
japanize_matplotlib.japanize()
# データの読み込みと加工
df_hr = pd.read_csv('./hr-toydata-basic-600.csv')
df_hr['評価分布'] = 'B以下'
df_hr['評価分布'].mask(df_hr['成績'].isin(['SA','A']), 'SA/A', inplace=True)
# グラフ
fig, ax = plt.subplots(figsize=(8,10))
pd.crosstab(df_hr['所属'], df_hr['評価分布'],normalize='index').\
sort_values('SA/A').plot.barh(stacked=True, width=1, ax=ax)
ax.set_title('組織別ハイパフォーマー在籍率')
ax.tick_params(axis="x", labelrotation=0)
# 凡例
ax.legend(handles=h[::-1],labels=l[::-1], loc='upper left', bbox_to_anchor=(1, 1), title='評価')この記事で使ったデータ
以下のページでデータを配布しています。
人事トイデータの公開
こちらのページでは、クニラボで作成した人事トイデータを公開しています。 トイデータとは? トイデータ(Toy Data)とは、演習用に使えるリアルでないデータのことをいいます。データ分析や機械学習のライブラリに附属する場合もあり、手元にデータがなくてもそのライブラリをすぐに試せるのが利点です。 人事データ分析の演習にご活用ください ピープルアナリティクスを学んでみたいが手元に良いデータがない、という方も多いのではないでしょうか。人事データは個人情報を含むため、ピープルアナリティクスプロジェクトの正式なメンバーでないと触ることができません。 そこで、演習用にデータを自作しGoogleドライブより公開しています。これまでも代表のnote記事の中でリンクを張っていたのですが、複数の記事で利用するためこのページを作りました。 * 2023/11/29追記 「HRトイデータ_人事情報_拡張版.csv 」を追加しました。 * 2024/3/23追記 「HRトイデータ_月別時間外.csv 」を追加しました。 * 2024/11/18追記 「HRトイデータ_エンゲージメントスコア

