OpenAI、GPT-5.5を公開 クロードOpus 4.7に対抗

  • OpenAIは本日GPT-5.5を発表し、Claude Opus 4.7に対してベンチマークで優位に立つと主張した。
  • 同モデルは、自律的コーディング、ツール利用、タスクの自動完了を目指す。
  • APIの価格は入力トークン100万件あたり$5からで、Anthropic社の水準と同じだ。
プロモーション

OpenAIは4月23日、コードネーム「Spud」としてGPT-5.5を発表した。これまでで最も高性能な自律型・多段階作業向けモデルとして位置付ける。

このローンチは、AnthropicがClaude Opus 4.7をリリースした1週間後に行われた。両者の最新モデルの直接比較が可能となった。

スポンサード
スポンサード

GPT-5.5はエージェント作業とコーディングを主眼

GPT-5.5は、継続的な人的監督なしで計画・実行・検証・反復をツール横断で実現することを目指す。OpenAIは公式サイトで「実務およびエージェントのための新たな知能クラス」と説明している。

X(旧Twitter)でフォローして最新ニュースをリアルタイムで入手

「私たちは反復的な展開を信条とする。GPT-5.5は既に高性能だが、今後急速に改善される見通し。反復的展開は当社の安全戦略の重要な一部であり、AIのレジリエンスというチームスポーツで世界が最善の備えをできるよう、この方針をとる」 サム・アルトマンCEOが投稿した

現在、ChatGPT Plus、Pro、Business、Enterprise各プランのユーザーに提供を開始した。より高性能なProバージョンも用意されている。APIの価格は入力トークン100万件ごとに5ドル、出力トークン100万件ごとに30ドルとなっており、トークンコンテキストウィンドウは100万件。

スポンサード
スポンサード

OpenAI独自のベンチマークで、GPT-5.5は複数のエージェント系タスクでClaude Opus 4.7を上回った。Terminal-Bench 2.0ではGPT-5.5が82.7%、Opus 4.7は69.4%だった。

FrontierMath Tier 1~3では51.7%で、Opus 4.7の43.8%を上回った。初期の独立系テストでもコーディングやナレッジワーク評価で同様の傾向が報告された。

Claude Opus 4.7が依然優位な分野

独立系レビューによれば、Anthropicのモデルはリサーチ執筆や法的・財務的推論、指示の一貫性維持などで優れている。

Opus 4.7は3.75メガピクセルまでの高解像度ビジョンもサポートし、前モデルの3倍以上。

パソコン操作分野では差が縮まった。GPT-5.5がOSWorld-Verifiedで78.7%、Opus 4.7は78.0%だった。

ウェブ閲覧ベンチマークでは両者が接戦を展開、GPT-5.5 Proは90.1%、Opus 4.7は79.3%と差を広げた。

AI競争、2026年さらに加速

相次ぐ新モデル投入は業界全体の傾向とも合致する。OpenAIは今年GPT-5.xバージョンを複数発表しており、Anthropicも連続的なリリースでClaudeの機能を向上させてきた。

グーグルのGemini 3.1 Proも同じ企業向け市場を狙う

両者の選択は用途次第となる見通し。GPT-5.5はエージェント自動化や長期的なコーディングに強みを持つとみられる。

一方、Claude Opus 4.7は、精緻な分析フローにより適している可能性がある。OpenAIが公表したデータを独立したベンチマークが裏付けるかは、近日中に明らかとなる。

YouTubeチャンネルを登録して、専門家や記者によるインサイトをチェック


BeInCryptoの最新の暗号資産市場分析は、こちらをご覧ください

免責事項

当ウェブサイトに掲載されているすべての情報は、誠意をもって作成され、一般的な情報提供のみを目的としています。当ウェブサイトに掲載されている情報に基づいて行う一切の行為については、読者ご自身の責任において行っていただきますようお願いいたします。

スポンサード
スポンサード