データによる予測手法の選択戦術
予測問題にチャレンジするデータアナリストに向けて、予測問題の位置づけや手法選択のための戦術をお伝えします。
クニラボが発行するデータ分析に関するニュースレターです。無料購読された方のみ全文を読むことができます。(2026年3月まで「データ分析ダンジョン探索ガイド」として発行していたレターをリニューアルしました)
予測問題にチャレンジするデータアナリストに向けて、予測問題の位置づけや手法選択のための戦術をお伝えします。
最近人事分野では、「スキルベース組織(skills-based-organization)」というキーワードがトレンドになりつつあります。このレターではスキルデータの活用シーンとハンドリングについて考えてみます。
こんにちは。データ経営コンサルタントの武田邦敬です。 リニューアル後1回目の配信になります。 本レターでは、しばらくデータアナリストやデータサイエンティストが抱える課題感について考えてみたいと思います。今回のテーマは「データ分析ダンジョンに潜む魔物」ということで、データ分析プロジェクトの最大の障壁を取り上げます。チームの状況や経験年数によって壁は変わってくると思いますが、過去の自分やチームメンバーが直面してきた課題から、もっとも重たいものをあげてみました。 まずは、過去の失敗事例からお伝えしたいと思います。...
「人事データ分析入門講座」講師の武田です。 本日もよろしくお願いします。 今回は、前回の続きで、カテゴリカル変数の外観を捉える方法をお伝えしていきます。 カテゴリカル変数の分析を始める前に 量的変数は定量的な比較ができますが、カテゴリカル変数は直接的には量的な分析を行うことはできません。そのため、量的変数に何らかのまとまり(グループ)を与えるものとして利用している方も多いのではないでしょうか。例えば、所属別に時間外時間数を比較したり、男女別にエンゲージメントを集計したり。 人事データ分析では人や組織の観点が重要で、それらが持つ属性情報が分析の切り口になります。そして、人や組織の属性情報の多くがカテゴリカル変数で表現されています。そのため、カテゴリカル変数は分析の切り口として大きな意味を持ちます。 それでは、人事データ分析を始める前にカテゴリカル変数の外観を捉えるとは、どのような作業を指すのでしょうか? 第一にやるべきことは、カテゴリカル変数に含まれる要素(カテゴリー)の種類を確かめることです。例えば、性別や所属、グレード(あるいは等級)というデータ項目があった場合、そのデ...
「人事データ分析入門講座」講師の武田です。 本日もよろしくお願いします。 今回は、「変数の外観を捉える #1」の続きで、量的変数の外観を捉える方法をお伝えしていきます。 量的変数の分析を始める前に 量的変数を用いた分析は日常的なものです。例えば、次のような疑問に答えるために日々データと向き合っていらっしゃるのではないでしょうか。 * どの部署が時間外が多いか。働き方の改善には何が必要か。 * エンゲージメントが極端に高い、もしくは低い職場はあるか。課題は何か。 * 部署の年齢構成はどうなっているのか。配置施策をどうするか。 これらの疑問に答えるためには、関心事に対応した量的変数を調べてみる必要があります。ここでいうと、時間外、エンゲージメント、年齢ですね。そして、これらのデータを使って分析を始める前に、データの全体像を押さえておくことが大切です。 例題として年齢について考えてみたいと思います。当サイトで公開している「HRトイデータ_人事情報_拡張版」から10件ほどランダムサンプリングして年齢を確認すると、以下のような値となりました。 37, 34, 24, 2...
「人事データ分析入門講座」講師の武田です。 久しぶりの配信となりますが、本日もよろしくお願いします。 前回まで、「データがやってきたら、まず何をやるべきか?」というテーマでお伝えしてきました。そして、人事データ分析ではWho(誰)という視点でデータの外観を捉え、分析対象である人と組織に対する理解を深めておくことが重要だとお伝えしました。 Whoという視点でデータの外観を捉えることをお伝えしました。 具体的には、「データ」「システム」「従業員」それぞれでどんな人が含まれているのか把握することが大切で、いずれも分析対象である人への理解を深めることがポイントになります。 データがやってきたら、まず何をやるべきか?(後編) 本投稿より、データから外観を捉える方法についてお伝えしていきます。 さて、データから外観を捉える場合、データ項目の種類によってアプローチが変わってきます。人事データに含まれるデータ項目は、大きく分けて以下2つの種類にわけることができます。 * 質的変数: 大小関係を比較したり演算ができる変数(年齢、時間外勤務時間数など) * カテゴリカル変数: そのままで...
こんにちは。 「人事データ分析入門講座」講師の武田です。本日もよろしくお願いします。 この講座では、人事データ分析に取り組み始めた方に向けて、データ分析の考え方や方法をお伝えしています。本レターで7回目の配信となりました。 今回は昨年末に配信した「データがやってきたら、まず何をやるべきか」の続きになります。 前編では、データ分析を始める前にデータの発生源を押さえるため、What, Where, When, Howという観点で確認することをお伝えしました。本レターでは、Whoという視点でデータの外観を捉えることをお伝えしていきます。 手元に人事データがやってきたとき、「そのデータには誰が含まれているのか?」と問うことは大変重要です。 人事データ分析の主軸は人と組織です。 組織が人の集合体と考えると、データの外観を捉える上で「誰が」という切り口はもっとも大切な要素といえます。 3つの観点でWhoを考える 皆さんの手元に人事データやサーベイの結果があったとします。さて、このデータはどのような経路をたどってやってきたのでしょうか? 前編で取り上げたWhat, When...
★2025.8.13追記 ピープルアナリティクスを学ぶ人におすすめする本を改めてまとめ直しました。人事からデータ分析技術まで幅広い本を整理しています。こちらの記事もご覧くださいませ。 * ピープルアナリティクスを学ぶ人におすすめする本 あけましておめでとうございます。 「人事データ分析入門講座」講師の武田です。 この講座では、人事データ分析に取り組み始めた方に向けて、データ分析の考え方や方法をお伝えしています。本レターで6回目の配信となりました。 年初1回目の配信ということで、今回はいつもと嗜好を変え、人事データ分析に役立つ本をご紹介します。一度ではすべてをご紹介できませんので、月イチで本を紹介していければと考えております。 本日は初回ということで、人事データ分析のスキルアップに直結する入門書を2冊ご紹介します。 人事のためのデータサイエンス,入江崇介著 Amazon.co.jp: 人事のためのデータサイエンス 電子書籍: 入江崇介: Kindleストア 人事データ分析といえばこの本!というくらい有名な本です。2018年出版の本で、人事データ分析を始め...
こんにちは。「人事データ分析入門講座」講師の武田です。本日もよろしくお願いします。 このニュースレターでは、人事データ分析に取り組み始めた方に向けて、データ分析の考え方や方法をお伝えしています。本レターで5回目の配信となりました。年末ということで年内では最後の配信になりますね。 前回は、人事データ分析を進めていくためのヒントとして、分析テーマから必要なデータを考える方法と、分析を深掘りするための切り口についてお伝えしました。また、人事データ分析でよく利用するデータ項目をマインドマップにしてご提供しました。 マインドマップをご覧いただくと、ひと口に人事データといっても多種多様なデータ項目があることが分かるかと思います。分析テーマとこれらのデータ項目を結びつけることが、基本的なアプローチになります。 ところで、目の前に人事データがあって、その中から目的のデータ項目が見つかれば、すぐに分析を開始することができるのでしょうか? 本レターでは、データが手元にやってきたときに分析者がやるべきことをお伝えしていきます。...