テキストマイニング（HRテック）

鉱山からダイヤモンドを採掘するように、大量のテキストの中から人材・企業のパフォーマンス向上に役立つ声・想い・志向を掘り出すための分析手法。HRテック文脈では社員アンケートの自由回答・業務日報・面談記録などの非構造化データを解析するために活用される。

構成技術

テキストマイニングは「自然言語処理」と「データマイニング」の2技術で成立する：

技術	内容
形態素解析	文章を意味を持つ最小単位（単語）に分割する「単語分かち書き」。検索エンジンにも使用
構文解析	単語間の係り受け（主語・述語・修飾関係）を解析。日本語の倒置・複雑な表現に対応することがテキストマイニングのコア技術
辞書	言葉の「ゆらぎ」（表記揺れ・略語・類義語）を吸収するための辞書データ

ポジティブな言葉とネガティブな言葉を判別する感情分析も重要機能の一つ。

過去に退職した社員の満足度調査回答から共通キーワード（離職ワード）を抽出し、現社員の回答とマッチング。離職ワードをスコア化・ランキングすることで離職予兆を事前に検知できる。

金融機関の「解約予兆モデル」と同じ発想：退職者の足跡を「次につながるヒント」として活用する。

社員アンケートの自由回答欄から不満に関連する単語を抽出し、不満の原因を分類する：

「気になる言葉」を使った社員を特定し、実際の回答を参照することで：

現在活躍中の社員（ハイパフォーマー）の採用時の志望動機・面談記録と、成果が期待以下だった社員のそれとを比較分析。自社にマッチした人材の特性・傾向を抽出し、次回採用基準に反映する。

目的に沿ってデータ収集
    ↓
テキストマイニングで解析
    ↓
パターンを読み取り仮説を立てる
    ↓
仮説検証 → 施策実施
    ↓
フィードバック蓄積（PDCA）

テキストマイニングの特性として、「全体から個を俯瞰する」（全社の傾向をつかむ）と「個から全体を仰ぎ見る」（特定人物の声を全体文脈に置く）の両方向が可能。