【教材まとめ】これ全部やったら流石に誰でもつよつよAIエンジニアになれる
著者: eureka-ai(GEEK OFFER) 出典: Qiita, 2024-10-28 URL: https://qiita.com/eureka-ai/items/6c55e3b6d9617ae58afa 脈絡: AI知識ゼロからAIエンジニアとして実務にチャレンジできるレベルを目指すロードマップ記事(Qiita 1685いいね)
概要
AIエンジニアを目指す初学者向けに、ゼロから実務レベルまで到達するための学習コンテンツをロードマップ形式でまとめた記事。生成AIの台頭・SakanaAIの大型資金調達・Hinton氏らのノーベル賞受賞を背景に、AIへの注目が集まる中で「学び始めたのに挫折する人が多い」課題に答える。
5つのフェーズ(概観・AI基礎・ソフトウェア開発基礎・論文リサーチ・おまけ)で構成されており、「実務に必要なのはAIの基礎知識だけではない」という認識を伝えることを目的とする。
構成と学習ロードマップ
0|概観
- 人工知能は人間を超えるか(松尾豊著)— AI史と深層学習の画期性を体系的に解説
- 一から始める機械学習(Qiita記事)— AI・機械学習・深層学習の違いと背景を整理
- 機械学習エンジニアの働き方系記事 — 社会実装の実例、エンジニアリングスキル、キャリアパスの3本立て
1|AI基礎
プログラミング基礎(マインドセット)
| コンテンツ | ポイント |
|---|---|
| 誰も教えてくれないググり方 | 「ググり力」は情報精度に直結 |
| RTFM | 公式ドキュメントを読む姿勢が重要 |
| 強いエンジニアのなり方 | 読解力・目的意識・フィードバックサイクルが鍵 |
Python学習
- Python公式チュートリアル — 日本語・公式ドキュメント
- Pythonプログラミング入門(東京大学公開)— 基本文法〜正規表現、練習問題付き
- ProgateのPython講座 — レッスン形式で基礎から順に学習
- 便利なPythonのヒント100選 — 実用的なコード感覚を養う
データサイエンス基礎
| ライブラリ | 学習リソース |
|---|---|
| 包括的学習 | GCI(東大松尾研グローバル消費インテリジェンス寄附講座)、データサイエンス100本ノック |
| NumPy | 公式ドキュメント、NumPy 100本ノック |
| Pandas | 公式ドキュメント、Pandas 100本ノック |
| Matplotlib | 公式ドキュメント(Google Colab推奨) |
機械学習(非Deep系)
- Pythonではじめる機械学習(O’Reilly)— scikit-learnベースの特徴量エンジニアリング入門
- パターン認識と機械学習(PRML)— 定番書、数学的基礎(微積・線形代数・統計)が前提
- scikit-learn、LightGBM、XGBoost — 各公式ドキュメントとパラメータチューニング記事
深層学習
- ゼロから作るDeep Learning(ゼロつく)①② — 外部ライブラリなしでゼロから実装、NLP編も
- 東大松尾研「DL基礎」 — 毎年春開講、学生無料。ニューラルネット〜画像・NLP・最先端AI
- PyTorchチュートリアル(日本語) — ビジネス現場での主流フレームワーク
- Chainer公式ドキュメント — Google Colab対応
分野別深層学習
| 分野 | リソース |
|---|---|
| 画像処理 | 画像処理100本ノック |
| 音声処理 | 音声情報処理n本ノック |
| 自然言語処理 | 言語処理100本ノック |
| 強化学習 | 誰でもわかる強化学習、強化学習アルゴリズム・マップ |
| LLM / 生成AI | AIの進化と日本の戦略、RAGシステム概要、面倒なことはChatGPTにやらせよう |
その他ツール・実験管理
- Optuna — ハイパーパラメータ最適化フレームワーク(Preferred Networks製)
- Weights & Biases(WandB) — 実験管理プラットフォーム
- DVC — 機械学習プロジェクトのデータ・バージョン管理ツール(Gitと併用)
- Kaggleで勝つデータ分析の技術 — データ前処理・モデル精度向上の実践書
2|ソフトウェア開発基礎
チーム開発では以下を最低限習得すること。
チーム開発スキル
- Git・GitHub — サル先生のGit入門など
- クラウド — AWS(東大工学部講義資料)、GCP
- Docker — 公式ドキュメント(日本語)、チュートリアル和訳。仮想環境でOSをまたがった環境再現
- VirtualBox / Linux — Linuxを仮想マシンで動かす環境構築
ソフトウェア基礎(個人開発含む)
- エディタ: VS Code(拡張機能豊富・無料)、PyCharm(機能充実・教育機関無料)、JupyterLab・Google Colab(データ分析用)、Cursor(AI支援エディタ)、Vim(リモートサーバー用)
- Linux: Linuxコマンド一覧、シェルスクリプト、SSH基礎
- データベース: SQL入門(MySQL)
3|論文リサーチ基礎
AIインターンでは最先端論文を参考にモデルを実装・評価するプロジェクトが存在する。
| ツール | 用途 |
|---|---|
| Google Scholar | 論文検索の王道 |
| arXiv | 査読前論文(コンピュータサイエンス・AI系多数) |
| arXivTimes | 機械学習論文の調査・共有リポジトリ |
| Papers with Code | 実装コード付き論文、最高性能モデルで絞り込み可能 |
| CiNii | 日本語論文を網羅的に検索 |
論文の読み方: 落合フォーマット(高速読み)、矢谷流(東大矢谷研)、松尾豊氏の書き方資料
4|おまけ
- 海外大学講義: MIT講義(英語)、CS50 for Japanese(Harvard・和訳)
- YouTube: Alcia Solid Project(数学科出身データサイエンティスト・Vtuber)、nnablaディープラーニングチャンネル
- コンペ: Kaggle、SIGNATE(日本語)、Nishika(日本語)、AtCoder(競技プログラミング)
- プログラミングスクール: 42Tokyo(フランス発・C言語・試験あり・無料)
- 基礎数学・統計: 高校数学の美しい物語、AIプログラミングのための数学本
- 学習ロードマップ: 東大松尾研「人工知能・深層学習を学ぶためのロードマップ」(学生・社会人別・10時間/200時間コース)
キーインサイト
- 「AIの基礎知識だけでは不十分」 — ソフトウェア開発スキル(Git・クラウド・Docker・Linux・SQL)がほぼ100%必要
- 東大松尾研のコンテンツが学習の軸 — GCI・DL基礎・学習ロードマップと、無料で体系的に学べるコンテンツが充実
- 「100本ノック」形式が実践的 — NumPy・Pandas・画像・音声・NLP・データサイエンスと分野横断で量をこなせる
- Optuna・WandB・DVCの三種の神器 — ハイパラ最適化・実験管理・データバージョン管理でMLOps基礎を習得
- コンペ(Kaggle/SIGNATE)で学習成果を測る — 「実務とコンペは違う」が、初期学習には非常に有効
関連概念
- AIエンジニア学習ロードマップ — 本記事の構造を抽象化した概念ページ
- 機械学習ツールチェーン(ML Engineering) — scikit-learn・LightGBM・XGBoost・Optuna・WandB・DVCの体系
- 深層学習フレームワーク(PyTorch・Chainer) — PyTorch中心の深層学習実装環境
- 論文リサーチの基礎 — arXiv・Papers with Code・落合フォーマットによる論文調査手法
関連エンティティ
- eureka-ai — 著者、GEEK OFFER
- 松尾豊 — 「人工知能は人間を超えるか」著者、東大松尾研教授(松尾研(東京大学))
- Preferred Networks — Optuna開発元