ヒートマップを用いた相関行列の可視化例です。この例では人事基本情報やコンピテンシー、エンゲージメント、時間外などの相関を分析した例になっています。
人事データ可視化の例

人事データ可視化の狙い
- 量的変数間の相関関係を把握する。
- エンゲージメントなど組織サーベイと関連のある項目を探索的に探す。
人事データ可視化アプローチ
利用するグラフ
- ヒートマップ: クロス集計表や行列の値に応じて色付けすることで、平均から比べて当た値が高い(または低い)セルを視覚的に探しやすくする。
アプローチ
- 相関係数を用いて、入手データの量的変数同士の相関関係を網羅的に把握する。
- 入手データの量的変数に対して相関係数を計算し、相関行列を作る。
- 相関行列を入力としてヒートマップを描く。このとき、ゼロを中心に正負で異なる色を持つカラーバーを用いて視覚的に探索しやすくする。
グラフの作り方
- Pythonのseaborn.heatmapを使った可視化例。
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.ticker as ticker
import japanize_matplotlib
import seaborn as sns
sns.set()
japanize_matplotlib.japanize()
# データの読み込みと相関係数の計算
df_hr = pd.read_csv('./hr-toydata-basic-600.csv')
corr_mat = df_hr.drop('年度', axis=1).corr(numeric_only=True)
# グラフ
fig, ax = plt.subplots(figsize=(10,9))
sns.heatmap(corr_mat, annot=True, fmt='.2f',
cmap='coolwarm', center=0,
annot_kws={'fontsize': 8}, ax=ax)
ax.set_title('相関行列')※2024/9/3 コードを一部修正
この記事で使ったデータ
以下のページでデータを配布しています。
人事トイデータの公開
こちらのページでは、クニラボで作成した人事トイデータを公開しています。 トイデータとは? トイデータ(Toy Data)とは、演習用に使えるリアルでないデータのことをいいます。データ分析や機械学習のライブラリに附属する場合もあり、手元にデータがなくてもそのライブラリをすぐに試せるのが利点です。 人事データ分析の演習にご活用ください ピープルアナリティクスを学んでみたいが手元に良いデータがない、という方も多いのではないでしょうか。人事データは個人情報を含むため、ピープルアナリティクスプロジェクトの正式なメンバーでないと触ることができません。 そこで、演習用にデータを自作しGoogleドライブより公開しています。これまでも代表のnote記事の中でリンクを張っていたのですが、複数の記事で利用するためこのページを作りました。 * 2023/11/29追記 「HRトイデータ_人事情報_拡張版.csv 」を追加しました。 * 2024/3/23追記 「HRトイデータ_月別時間外.csv 」を追加しました。 * 2024/11/18追記 「HRトイデータ_エンゲージメントスコア

