テキストマイニング(HRテック)

鉱山からダイヤモンドを採掘するように、大量のテキストの中から人材・企業のパフォーマンス向上に役立つ声・想い・志向を掘り出すための分析手法。HRテック文脈では社員アンケートの自由回答・業務日報・面談記録などの非構造化データを解析するために活用される。

構成技術

テキストマイニングは「自然言語処理」と「データマイニング」の2技術で成立する:

  • 自然言語処理(NLP):コンピュータで処理しづらい文章の要素・構造・意味を解析
  • データマイニング:統計処理〜AIの手法でデータから相関やパターンを見つけ出す

自然言語処理の3つの解析技術

技術内容
形態素解析文章を意味を持つ最小単位(単語)に分割する「単語分かち書き」。検索エンジンにも使用
構文解析単語間の係り受け(主語・述語・修飾関係)を解析。日本語の倒置・複雑な表現に対応することがテキストマイニングのコア技術
辞書言葉の「ゆらぎ」(表記揺れ・略語・類義語)を吸収するための辞書データ

ポジティブな言葉とネガティブな言葉を判別する感情分析も重要機能の一つ。

HRテックでの主要ユースケース

1. 離職ワードによる予兆検知

過去に退職した社員の満足度調査回答から共通キーワード(離職ワード)を抽出し、現社員の回答とマッチング。離職ワードをスコア化・ランキングすることで離職予兆を事前に検知できる。

金融機関の「解約予兆モデル」と同じ発想:退職者の足跡を「次につながるヒント」として活用する。

2. 不満原因の特定

社員アンケートの自由回答欄から不満に関連する単語を抽出し、不満の原因を分類する:

  • 事業内容への不満
  • 業務量への不満
  • 人事異動への不満
  • 経営方向性への不満

3. 単語ランキングから希望・意向を把握

「気になる言葉」を使った社員を特定し、実際の回答を参照することで:

  • 業務負荷の調整
  • 現業務への適性確認
  • 新事業への人材抜擢候補発掘

4. 採用スクリーニング

現在活躍中の社員(ハイパフォーマー)の採用時の志望動機・面談記録と、成果が期待以下だった社員のそれとを比較分析。自社にマッチした人材の特性・傾向を抽出し、次回採用基準に反映する。

PDCA への統合

目的に沿ってデータ収集
    ↓
テキストマイニングで解析
    ↓
パターンを読み取り仮説を立てる
    ↓
仮説検証 → 施策実施
    ↓
フィードバック蓄積(PDCA)

全体と個の双方向アプローチ

テキストマイニングの特性として、「全体から個を俯瞰する」(全社の傾向をつかむ)と「個から全体を仰ぎ見る」(特定人物の声を全体文脈に置く)の両方向が可能。

関連