クロード・フェイブル5への反発拡大　利用者が主力AIの「制限」指摘

Googleで私たちを選んでください

著者：

Lockridge Okoth

編集：

Mohammad Shahid

03日 7月 2026年, 06:30 JST

Claude Fable 5のBridgeBenchデバッグスコアは、再リリース後に86.2から25.9へ大幅に低下した。
12件中3件のデバッグ作業のみが、劣るOpus 4.8へのフォールバックなしで実行された。
アンソロピックは誤検知が増えたことを認めたが、コアモデル自体は変更していないと説明した。

#AI関連ニュース

#AI インサイト

AnthropicのClaude Fable 5が、7月1日の再リリース以降、批判の声が高まっている。ユーザーからは、ガードレールの強化により主力モデルのコーディング、デバッグ、エージェント機能が著しく制限されたとの指摘が相次いでいる。

ベンチマークグループのBridgeMindは、自社のBridgeBenchスイート全体でスコアが大幅に低下したと報告した。一方、Anthropicは基盤モデルに変更はないと主張しており、摩擦の要因は安全性判定の強化にあると説明している。

スポンサード

Claude Fable 5、再リリース後にベンチマークスコア急落

BridgeMindは7月1日版のFable 5を再テストし、成績の急激な悪化を記録した。デバッグは86.2から25.9に、リファクタリングは73.6から38.4に、ハルシネーション処理も75.9から61.7にそれぞれ低下した。

再リリース前後におけるClaude Fable 5のBridgeBenchスコア　出典：Xのユーザー — 再リリース前後におけるClaude Fable 5のBridgeBenchスコア　出典： Xのユーザー

この数値の背景も重要だ。12件のデバッグタスクのうち3件のみがClaude Opus 4.8へのフォールバックなしに完了し、フォールバック時はいずれもスコアがゼロだった。

したがって、スコアの急落は推論力低下ではなく、タスク自体がブロックされたことを反映している。

BridgeMindは、タスクが完了まで実行された場合、Fable 5は6月版と同等の性能を示すと強調した。

「モデル自体が劣化したのではない。檻に入れられただけだ」と指摘した。

最新ニュースはXでも随時配信中

経緯をみると、対立の理由が浮かび上がる。Anthropicは6月9日にFable 5を公開し、3日後にワシントン当局がオフラインにした。規制当局は6月30日に輸出規制を解除し、その4日前には約100の米国機関向けにMythos 5のアクセスも再開した。

ただし、再開された利用にも制限がある。Fable 5は7月7日まで週次利用上限の50%のみ利用可能で、その後は有料クレジットに切り替わる。

Anthropic、広範な安全マージンを擁護

Anthropicは6月30日の声明で今回のトレードオフについて説明した。同社は安全マージンの意図的な拡大により、現状では本来無害なリクエストも判定でブロックされる場合があるとした。改良されたフィルターはバイパス技術にも対応し、アマゾンの研究者によれば99%以上の試行で封じ込めているという。

Claude Fable 5 will be available again globally tomorrow.

After a series of productive conversations with the US government, we're redeploying the model with a new set of classifiers to target and block more cybersecurity tasks. In the near term, some routine tasks like coding…
— Anthropic (@AnthropicAI) July 1, 2026