Python

Python

Pythonに関する実践知やノウハウを発信しています。

29 posts
箱ひげ図・ストリッププロット

箱ひげ図・ストリッププロット

箱ひげ図とは? 箱ひげ図は量的変数のばらつきを視覚的に表すことができるグラフで、中央値を中心にデータがどのように分布しているか一目で確認することができます。 ひとつの量的変数に対して箱ひげ図を作ることもできますが、別の質的変数でグループを作ってグループ同士でばらつきを比較するときによく使います。中央値、四分位数といった統計量を用いて描写するため、データ量が多くても素早く描写することができます。 箱ひげ図の見方 箱ひげ図は、量的変数に対する統計量である四分位数を線と箱で描写したものです。 具体的には、データを小さい順に並べて四等分し、その境界にあるデータ点を統計量としてとらえて作図していきます。 * 最小値 * 25%点(第1四分位数) * 中央値(第2四分位数) * 75%点(第3四分位数) * 最大値 このうち、25%点から75%点に含まれるデータ範囲を四分位範囲といい、中央値を中心に全体の半分のデータが収まる範囲となります。箱ひげ図では四分位範囲を四角い箱で描写します。また、最小値から25%点、75%点から最大値までの間は線で表現され、「ひげ」と呼...

バイオリンプロット

バイオリンプロット

バイオリンプロットを使った人事データの可視化例です。カテゴリ別に量的変数のばらつきや分布を比較する際に利用します。箱ひげ図よりも分布の形状を捉えやすい利点がありますが、データが少ない場合は曲線のフィッティングが不安定になることもあります。 人事データ可視化例 人事データ可視化の狙い * グレード別のエンゲージメントの分布を確認し、組織開発のヒントを探る。 人事データ可視化アプローチ 利用するグラフ * バイオリンプロット: 量的変数の分布を滑らかな曲線と四分位数(箱ひげ図)で確認する。 アプローチ * 量的変数であるエンゲージメントをグレード別に分け、バイオリンプロットで可視化することで分布の違いを確認する。 * グレードを順序尺度変数に変換することで、グレードの並び順を変更する。 * 図の中心にある箱ひげ図の上端と下端を確認し、曲線の意味合いに留意する。 グラフの作り方 * Pythonのseaborn.violinplotを使った可視化例。 import pandas as pd import matplotlib.pyplot as...

You’ve successfully subscribed to People Analytics Idea HUB
Welcome back! You’ve successfully signed in.
Great! You’ve successfully signed up.
Success! Your email is updated.
Your link has expired
Success! Check your email for magic link to sign-in.
Please enter at least 3 characters 0 results for your search