AnthropicのClaude Fable 5が、7月1日の再リリース以降、批判の声が高まっている。ユーザーからは、ガードレールの強化により主力モデルのコーディング、デバッグ、エージェント機能が著しく制限されたとの指摘が相次いでいる。
ベンチマークグループのBridgeMindは、自社のBridgeBenchスイート全体でスコアが大幅に低下したと報告した。一方、Anthropicは基盤モデルに変更はないと主張しており、摩擦の要因は安全性判定の強化にあると説明している。
Claude Fable 5、再リリース後にベンチマークスコア急落
BridgeMindは7月1日版のFable 5を再テストし、成績の急激な悪化を記録した。デバッグは86.2から25.9に、リファクタリングは73.6から38.4に、ハルシネーション処理も75.9から61.7にそれぞれ低下した。
この数値の背景も重要だ。12件のデバッグタスクのうち3件のみがClaude Opus 4.8へのフォールバックなしに完了し、フォールバック時はいずれもスコアがゼロだった。
したがって、スコアの急落は推論力低下ではなく、タスク自体がブロックされたことを反映している。
BridgeMindは、タスクが完了まで実行された場合、Fable 5は6月版と同等の性能を示すと強調した。
「モデル自体が劣化したのではない。檻に入れられただけだ」と 指摘した。
経緯をみると、対立の理由が浮かび上がる。Anthropicは6月9日にFable 5を公開し、3日後にワシントン当局がオフラインにした。規制当局は6月30日に輸出規制を解除し、その4日前には約100の米国機関向けにMythos 5のアクセスも再開した。
ただし、再開された利用にも制限がある。Fable 5は7月7日まで週次利用上限の50%のみ利用可能で、その後は有料クレジットに切り替わる。
Anthropic、広範な安全マージンを擁護
Anthropicは6月30日の声明で今回のトレードオフについて説明した。同社は安全マージンの意図的な拡大により、現状では本来無害なリクエストも判定でブロックされる場合があるとした。改良されたフィルターはバイパス技術にも対応し、アマゾンの研究者によれば99%以上の試行で封じ込めているという。
ブロックされたリクエストはOpus 4.8へルーティングされ、ユーザーには通知が届く。ただしAnthropicも、今回のフィルターが従来より多くの正当なコーディングやデバッグ作業を誤って検知していることを認めている。
自社テストでもFable 5が特有のリスクを持たないことが示された。他社モデル、GPT-5.5やKimi K2.7も同様の脆弱性を特定している。
Anthropicによれば、米国商務省の研究者も両方の安全対策バージョンを検証し、極めて強固と評価した。
影響は1つの製品サイクルにとどまらない。一時停止により欧州はAnthropicの誘致を目指す動きを見せ、中国のAIモデルも米国先端研究機関に追随しつつある。
Anthropicはアマゾン、マイクロソフト、グーグルとともに脱獄リスクの重大性フレームワークも策定中だ。安全判定における誤検知がどれだけ迅速に解消されるかが、ヘビーユーザーの離反防止の鍵となる可能性がある。









