【教材まとめ】これ全部やったら流石に誰でもつよつよAIエンジニアになれる

著者: eureka-ai(GEEK OFFER) 出典: Qiita, 2024-10-28 URL: https://qiita.com/eureka-ai/items/6c55e3b6d9617ae58afa 脈絡: AI知識ゼロからAIエンジニアとして実務にチャレンジできるレベルを目指すロードマップ記事(Qiita 1685いいね)


概要

AIエンジニアを目指す初学者向けに、ゼロから実務レベルまで到達するための学習コンテンツをロードマップ形式でまとめた記事。生成AIの台頭・SakanaAIの大型資金調達・Hinton氏らのノーベル賞受賞を背景に、AIへの注目が集まる中で「学び始めたのに挫折する人が多い」課題に答える。

5つのフェーズ(概観・AI基礎・ソフトウェア開発基礎・論文リサーチ・おまけ)で構成されており、「実務に必要なのはAIの基礎知識だけではない」という認識を伝えることを目的とする。


構成と学習ロードマップ

0|概観

  • 人工知能は人間を超えるか(松尾豊著)— AI史と深層学習の画期性を体系的に解説
  • 一から始める機械学習(Qiita記事)— AI・機械学習・深層学習の違いと背景を整理
  • 機械学習エンジニアの働き方系記事 — 社会実装の実例、エンジニアリングスキル、キャリアパスの3本立て

1|AI基礎

プログラミング基礎(マインドセット)

コンテンツポイント
誰も教えてくれないググり方「ググり力」は情報精度に直結
RTFM公式ドキュメントを読む姿勢が重要
強いエンジニアのなり方読解力・目的意識・フィードバックサイクルが鍵

Python学習

  • Python公式チュートリアル — 日本語・公式ドキュメント
  • Pythonプログラミング入門(東京大学公開)— 基本文法〜正規表現、練習問題付き
  • ProgateのPython講座 — レッスン形式で基礎から順に学習
  • 便利なPythonのヒント100選 — 実用的なコード感覚を養う

データサイエンス基礎

ライブラリ学習リソース
包括的学習GCI(東大松尾研グローバル消費インテリジェンス寄附講座)、データサイエンス100本ノック
NumPy公式ドキュメント、NumPy 100本ノック
Pandas公式ドキュメント、Pandas 100本ノック
Matplotlib公式ドキュメント(Google Colab推奨)

機械学習(非Deep系)

  • Pythonではじめる機械学習(O’Reilly)— scikit-learnベースの特徴量エンジニアリング入門
  • パターン認識と機械学習(PRML)— 定番書、数学的基礎(微積・線形代数・統計)が前提
  • scikit-learnLightGBMXGBoost — 各公式ドキュメントとパラメータチューニング記事

深層学習

  • ゼロから作るDeep Learning(ゼロつく)①② — 外部ライブラリなしでゼロから実装、NLP編も
  • 東大松尾研「DL基礎」 — 毎年春開講、学生無料。ニューラルネット〜画像・NLP・最先端AI
  • PyTorchチュートリアル(日本語) — ビジネス現場での主流フレームワーク
  • Chainer公式ドキュメント — Google Colab対応

分野別深層学習

分野リソース
画像処理画像処理100本ノック
音声処理音声情報処理n本ノック
自然言語処理言語処理100本ノック
強化学習誰でもわかる強化学習、強化学習アルゴリズム・マップ
LLM / 生成AIAIの進化と日本の戦略、RAGシステム概要、面倒なことはChatGPTにやらせよう

その他ツール・実験管理

  • Optuna — ハイパーパラメータ最適化フレームワーク(Preferred Networks製)
  • Weights & Biases(WandB) — 実験管理プラットフォーム
  • DVC — 機械学習プロジェクトのデータ・バージョン管理ツール(Gitと併用)
  • Kaggleで勝つデータ分析の技術 — データ前処理・モデル精度向上の実践書

2|ソフトウェア開発基礎

チーム開発では以下を最低限習得すること。

チーム開発スキル

  • Git・GitHub — サル先生のGit入門など
  • クラウド — AWS(東大工学部講義資料)、GCP
  • Docker — 公式ドキュメント(日本語)、チュートリアル和訳。仮想環境でOSをまたがった環境再現
  • VirtualBox / Linux — Linuxを仮想マシンで動かす環境構築

ソフトウェア基礎(個人開発含む)

  • エディタ: VS Code(拡張機能豊富・無料)、PyCharm(機能充実・教育機関無料)、JupyterLab・Google Colab(データ分析用)、Cursor(AI支援エディタ)、Vim(リモートサーバー用)
  • Linux: Linuxコマンド一覧、シェルスクリプト、SSH基礎
  • データベース: SQL入門(MySQL)

3|論文リサーチ基礎

AIインターンでは最先端論文を参考にモデルを実装・評価するプロジェクトが存在する。

ツール用途
Google Scholar論文検索の王道
arXiv査読前論文(コンピュータサイエンス・AI系多数)
arXivTimes機械学習論文の調査・共有リポジトリ
Papers with Code実装コード付き論文、最高性能モデルで絞り込み可能
CiNii日本語論文を網羅的に検索

論文の読み方: 落合フォーマット(高速読み)、矢谷流(東大矢谷研)、松尾豊氏の書き方資料

4|おまけ

  • 海外大学講義: MIT講義(英語)、CS50 for Japanese(Harvard・和訳)
  • YouTube: Alcia Solid Project(数学科出身データサイエンティスト・Vtuber)、nnablaディープラーニングチャンネル
  • コンペ: Kaggle、SIGNATE(日本語)、Nishika(日本語)、AtCoder(競技プログラミング)
  • プログラミングスクール: 42Tokyo(フランス発・C言語・試験あり・無料)
  • 基礎数学・統計: 高校数学の美しい物語、AIプログラミングのための数学本
  • 学習ロードマップ: 東大松尾研「人工知能・深層学習を学ぶためのロードマップ」(学生・社会人別・10時間/200時間コース)

キーインサイト

  • 「AIの基礎知識だけでは不十分」 — ソフトウェア開発スキル(Git・クラウド・Docker・Linux・SQL)がほぼ100%必要
  • 東大松尾研のコンテンツが学習の軸 — GCI・DL基礎・学習ロードマップと、無料で体系的に学べるコンテンツが充実
  • 「100本ノック」形式が実践的 — NumPy・Pandas・画像・音声・NLP・データサイエンスと分野横断で量をこなせる
  • Optuna・WandB・DVCの三種の神器 — ハイパラ最適化・実験管理・データバージョン管理でMLOps基礎を習得
  • コンペ(Kaggle/SIGNATE)で学習成果を測る — 「実務とコンペは違う」が、初期学習には非常に有効

関連概念

関連エンティティ