GPT-5.5

OpenAI が2026年4月23日にリリースした最新フラッグシップLLM。コードネームは「Spud」。OpenAIが「最も複雑な業務向け」と位置づけており、OpenAI Codex の推奨モデルとして搭載されている。

主要スペック

指標
リリース日2026年4月23日
コードネームSpud
コンテキストウィンドウ1,050,000トークン(日本語約80万文字 ≒ 新書8冊)
最大出力128,000トークン
マルチモーダルテキスト・画像・音声・動画
推論努力レベルnone / low / medium / high / xhigh(5段階)

ベンチマーク

ベンチマークGPT-5.5Claude Opus 4.7Gemini 3.1 Pro
Terminal-Bench 2.0(エージェント自動化)82.7%(歴代1位)69.4%
GPQA Diamond(大学院レベル知識)93.6%94.2%94.3%
SWE-Bench Pro(ソフトウェアエンジニアリング)58.6%64.3%

→ エージェント自動化(Terminal-Bench 82.7%歴代1位)がCodexとの組み合わせでの最大の競争優位。全カテゴリ圧勝するモデルは存在しないが、Codex×GPT-5.5は自動化用途で現状最強の組み合わせとされている。

API料金

利用方式入力(1Mトークン)出力(1Mトークン)
標準$5.00$30.00
Batch / Flex(50%オフ)$2.50$15.00
長コンテキスト(272k超)$10.00(2倍)$45.00(1.5倍)

比較:GPT-5.4は入力15.00(GPT-5.5の半額)。コスト最適化の観点では「普段はGPT-5.4、複雑な処理だけGPT-5.5」が推奨される。

推論努力レベルの使い分け

レベル適用場面
none / low簡単な変換・定型処理(最速)
medium一般的なコーディング・質問回答(デフォルト)
high複雑なアルゴリズム設計・デバッグ
xhigh最高難度のエージェントタスク

コストは推論努力に比例するため、全タスクを xhigh で実行するのは非効率。

ChatGPTプランでの利用

プラン月額GPT-5.5利用
Free$0利用可
Go$8利用可
Plus$20利用可
Pro200フル機能

関連