Lowess(局所加重散布図平滑化)を使った人事データの可視化例です。散布図にノンパラメトリックな曲線をフィットさせることで、量的変数同士の非線形な関係を捉えることができます。
人事データ可視化の例

人事データ可視化の狙い
- 年休消化率改善のため時間外との関連を探る。
人事データ可視化アプローチ
利用するグラフ
- 散布図: 量的変数と量的変数の関係を可視化。
- Lowess: 変数と変数の非線形な関係を推測し可視化する。
アプローチ
- 分析対象とする組織のデータに絞り込み、散布図を用いて働き方の特徴を観察する。
- 散布図から非線形な関連があると想定し、Lowessを用いて関係性を考察する。
グラフの作り方
- Pythonのseaborn.regplotによる可視化例。
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.ticker as ticker
import japanize_matplotlib
import seaborn as sns
sns.set_theme(style='darkgrid')
japanize_matplotlib.japanize()
# データの読み込み
df_hr = pd.read_csv('./hr-toydata-basic-600.csv')
# グラフ
fig, ax = plt.subplots(figsize=(6,6))
sns.regplot(data=df_hr.query('部 == "開発部"'), x='時間外時間数_月平均', y='年休消化率', scatter_kws={'alpha': .5}, lowess=True, ax=ax)
ax.set_title('開発部の働き方')この記事で使ったデータ
以下のページでデータを配布しています。
人事トイデータの公開
こちらのページでは、クニラボで作成した人事トイデータを公開しています。 トイデータとは? トイデータ(Toy Data)とは、演習用に使えるリアルでないデータのことをいいます。データ分析や機械学習のライブラリに附属する場合もあり、手元にデータがなくてもそのライブラリをすぐに試せるのが利点です。 人事データ分析の演習にご活用ください ピープルアナリティクスを学んでみたいが手元に良いデータがない、という方も多いのではないでしょうか。人事データは個人情報を含むため、ピープルアナリティクスプロジェクトの正式なメンバーでないと触ることができません。 そこで、演習用にデータを自作しGoogleドライブより公開しています。これまでも代表のnote記事の中でリンクを張っていたのですが、複数の記事で利用するためこのページを作りました。 * 2023/11/29追記 「HRトイデータ_人事情報_拡張版.csv 」を追加しました。 * 2024/3/23追記 「HRトイデータ_月別時間外.csv 」を追加しました。 * 2024/11/18追記 「HRトイデータ_エンゲージメントスコア

