GPT-5.5
OpenAI が2026年4月23日にリリースした最新フラッグシップLLM。コードネームは「Spud」。OpenAIが「最も複雑な業務向け」と位置づけており、OpenAI Codex の推奨モデルとして搭載されている。
主要スペック
| 指標 | 値 |
|---|
| リリース日 | 2026年4月23日 |
| コードネーム | Spud |
| コンテキストウィンドウ | 1,050,000トークン(日本語約80万文字 ≒ 新書8冊) |
| 最大出力 | 128,000トークン |
| マルチモーダル | テキスト・画像・音声・動画 |
| 推論努力レベル | none / low / medium / high / xhigh(5段階) |
ベンチマーク
| ベンチマーク | GPT-5.5 | Claude Opus 4.7 | Gemini 3.1 Pro |
|---|
| Terminal-Bench 2.0(エージェント自動化) | 82.7%(歴代1位) | 69.4% | — |
| GPQA Diamond(大学院レベル知識) | 93.6% | 94.2% | 94.3% |
| SWE-Bench Pro(ソフトウェアエンジニアリング) | 58.6% | 64.3% | — |
→ エージェント自動化(Terminal-Bench 82.7%歴代1位)がCodexとの組み合わせでの最大の競争優位。全カテゴリ圧勝するモデルは存在しないが、Codex×GPT-5.5は自動化用途で現状最強の組み合わせとされている。
API料金
| 利用方式 | 入力(1Mトークン) | 出力(1Mトークン) |
|---|
| 標準 | $5.00 | $30.00 |
| Batch / Flex(50%オフ) | $2.50 | $15.00 |
| 長コンテキスト(272k超) | $10.00(2倍) | $45.00(1.5倍) |
比較:GPT-5.4は入力2.50・出力15.00(GPT-5.5の半額)。コスト最適化の観点では「普段はGPT-5.4、複雑な処理だけGPT-5.5」が推奨される。
推論努力レベルの使い分け
| レベル | 適用場面 |
|---|
| none / low | 簡単な変換・定型処理(最速) |
| medium | 一般的なコーディング・質問回答(デフォルト) |
| high | 複雑なアルゴリズム設計・デバッグ |
| xhigh | 最高難度のエージェントタスク |
コストは推論努力に比例するため、全タスクを xhigh で実行するのは非効率。
ChatGPTプランでの利用
| プラン | 月額 | GPT-5.5利用 |
|---|
| Free | $0 | 利用可 |
| Go | $8 | 利用可 |
| Plus | $20 | 利用可 |
| Pro | 100〜200 | フル機能 |
関連