もしAI素人が「明日からAIエージェント作ってくれ」と言われたら

著者: Moriya(IVRy AIエンジニア) 出典: note, 2025-12-01 URL: https://note.com/moriya_gekko/n/n47aa474cf658 脈絡: IVRy Advent Calendar 2025「IVRy AIブログリレー Part2」1日目


概要

IVRyのAIエンジニアMoriyaが、AIエージェント開発の経験ゼロ状態から始めるための実践的な5ステップを解説。「AIエージェントを作って」という社内号令に対し、どのようにプロジェクトを進めるかをIVRyでのプロダクト開発経験をもとに言語化した記事。


5ステップ:AIエージェント開発の進め方

Step 1: 「現状のプロセス」を言語化する

AIエージェント開発の出発点は「今の人間が何をしているか」を言語化すること。

  • 業務プロセスの棚卸し: インプット・タスク・アウトプットを詳細に書き出す
  • 「人間の行動」の観察・定義: 思考・判断・アクションを言語化する
  • 非効率な部分の特定: 時間がかかる・ミスが出やすい・ルーティン化している箇所を見極める

ポイント: 2025年末の時点でLLMがいかに優秀でも「無から新しいことを成し遂げる」ことはできない。何をやらせたいかの要件定義が必須。

Step 2: 「AIの必要性」と「任せる範囲」を考える

「ただのプログラムで十分」な可能性を先に排除する。

  • AIが適するタスク: 不確実性を伴うタスク群
  • AIが不要なタスク: 確実性が高く、分岐がシンプルな処理
  • 任せる範囲の言語化: タスクの「明確さ」と「失敗時の影響度(重要度)」の2軸で判断

Step 3: 評価基準(ゴール)を設定する

「AI開発は評価こそが全て」。実装前に評価基準を決める。

評価種別評価軸例(カスタマーサポートエージェント)
オフライン評価技術的実現可能性・基礎性能テストデータ正答率80%以上、平均応答5秒以内
オンライン評価ビジネスインパクト・UX実問い合わせ解決率70%以上、ユーザー満足度4.0以上

Step 4: 「AIに任せるタスク」を細分化して実装する

比喩: 自分の仕事を他の人にお願いするとしたら、どういう手順書を書けばミス無く実行してくれるか?という意識。

Step 5: 評価基準に基づいて試行錯誤を繰り返す

  • デバッグのコツ: Step 4で作った「最小粒度のタスクが動いているか」を確認することが問題切り分けの鍵
  • 改善サイクル: 評価 → 問題特定 → タスク分割見直し → プロンプト修正 → 再評価

キーインサイト

  • AIエージェント開発の成功要因は技術より要件定義・評価設計・タスク細分化にある
  • 「AIエージェントが必要か」を問う前に「何を自動化したいのか」を言語化することが前提
  • IVRyではLLM Observabilityによるイテレーションを重視(評価ベースの改善サイクル)

関連概念

関連エンティティ

  • Moriya — 著者、IVRy AIエンジニア