OpenAIは4月23日、コードネーム「Spud」としてGPT-5.5を発表した。これまでで最も高性能な自律型・多段階作業向けモデルとして位置付ける。
このローンチは、AnthropicがClaude Opus 4.7をリリースした1週間後に行われた。両者の最新モデルの直接比較が可能となった。
GPT-5.5はエージェント作業とコーディングを主眼
GPT-5.5は、継続的な人的監督なしで計画・実行・検証・反復をツール横断で実現することを目指す。OpenAIは公式サイトで「実務およびエージェントのための新たな知能クラス」と説明している。
X(旧Twitter)でフォローして最新ニュースをリアルタイムで入手
「私たちは反復的な展開を信条とする。GPT-5.5は既に高性能だが、今後急速に改善される見通し。反復的展開は当社の安全戦略の重要な一部であり、AIのレジリエンスというチームスポーツで世界が最善の備えをできるよう、この方針をとる」 サム・アルトマンCEOが投稿した。
現在、ChatGPT Plus、Pro、Business、Enterprise各プランのユーザーに提供を開始した。より高性能なProバージョンも用意されている。APIの価格は入力トークン100万件ごとに5ドル、出力トークン100万件ごとに30ドルとなっており、トークンコンテキストウィンドウは100万件。
OpenAI独自のベンチマークで、GPT-5.5は複数のエージェント系タスクでClaude Opus 4.7を上回った。Terminal-Bench 2.0ではGPT-5.5が82.7%、Opus 4.7は69.4%だった。
FrontierMath Tier 1~3では51.7%で、Opus 4.7の43.8%を上回った。初期の独立系テストでもコーディングやナレッジワーク評価で同様の傾向が報告された。
Claude Opus 4.7が依然優位な分野
独立系レビューによれば、Anthropicのモデルはリサーチ執筆や法的・財務的推論、指示の一貫性維持などで優れている。
Opus 4.7は3.75メガピクセルまでの高解像度ビジョンもサポートし、前モデルの3倍以上。
パソコン操作分野では差が縮まった。GPT-5.5がOSWorld-Verifiedで78.7%、Opus 4.7は78.0%だった。
ウェブ閲覧ベンチマークでは両者が接戦を展開、GPT-5.5 Proは90.1%、Opus 4.7は79.3%と差を広げた。
AI競争、2026年さらに加速
相次ぐ新モデル投入は業界全体の傾向とも合致する。OpenAIは今年GPT-5.xバージョンを複数発表しており、Anthropicも連続的なリリースでClaudeの機能を向上させてきた。
グーグルのGemini 3.1 Proも同じ企業向け市場を狙う。
両者の選択は用途次第となる見通し。GPT-5.5はエージェント自動化や長期的なコーディングに強みを持つとみられる。
一方、Claude Opus 4.7は、精緻な分析フローにより適している可能性がある。OpenAIが公表したデータを独立したベンチマークが裏付けるかは、近日中に明らかとなる。
YouTubeチャンネルを登録して、専門家や記者によるインサイトをチェック





