ミュトス再登場 アンソロピックの検証でファブル5の独自リスク否定

  • テストの結果、Opus 4.8、GPT-5.5、Kimi K2.7はいずれも同じ脆弱性を特定できた。
  • 「Claude Fable 5」は、より多くの安全策を備えて7月2日に全世界で再登場する。
  • Fable 5の新たな分類器は、より無害なコーディングやデバッグ作業も検出対象としている。
プロモーション

アンソロピック、内部テストで「クロード・フェーブル5」が特有のサイバーセキュリティ上の危険性を示さなかったと発表、クロード・ミュトス5は7月2日に全世界で再開

フェーブル5の世界的な再開に合わせ、アンソロピックが明らかにした。本モデルは6月12日に米国の輸出規制により18日間の提供停止となっていた。アンソロピックは規制の実質的な脅威を測るため、他社モデルでも独自にテストを実施した。

スポンサード
スポンサード

アンソロピックがフェーブル5提供停止に踏み切った理由

フェーブル5とミュトス5は6月9日に同時公開された。いずれもコアモデルは同一だが、フェーブル5は一般公開、ミュトス5は限定された信頼できる「プロジェクト・グラスウィング」パートナー向けに防御的なサイバーセキュリティ用途でのみ提供された。

輸出規制は、アマゾンの研究者がフェーブル5の安全対策を回避する手法を発見したことを受けて発動された。この手法によって、モデルがソフトウェアの脆弱性を特定し、一部のケースでは実際にエクスプロイトの例示まで行う事態となった。

アンソロピックによる社内テストでは、クロード・オーパス4.8、GPT-5.5、Kimi K2.7もフェーブル5と同様に、アマゾンの報告書で特定された脆弱性を検知可能であることが判明。すべてのテストモデルが、唯一のエクスプロイト例示も再現できた。

この結果は、規制がフェーブル固有の脅威でなく、業界横断の課題に向けられていることを示す。アンソロピックは、それでもなお回避手法を遮断するために、より強固な分類器を新たに構築。通常のコーディングやデバッグのリクエストまで従来より広く検知・遮断する仕組みも導入した。

安全策の実際の仕組み

フェーブル5は、アンソロピックがこれまで構築した中で最も強固な安全対策を備えたモデルとして登場。分類器は明確な有害リクエストだけでなく、わずかでもリスクのある要求も遮断する。アマゾンの報告後に新たに訓練した分類器は、報告された回避手法を99%以上のケースで遮断できるとアンソロピックは説明。遮断リクエストは自動的にオーパス4.8へ転送される仕組みとなった。

その分、安全策にはコストも伴う。分類器は無害なコーディングやデバッグ依頼も検知してしまう事例が増えており、アンソロピックは今後も誤検知の削減に向け調整を続ける方針。ガードレールの少ないミュトス5は、6月26日に政府による確認を受けた機関限定での再開となった。ミュトス5提供再開について

アンソロピックの社内データは新たな論点も投げかける。より性能の低いモデルさえ本件で禁止されたことを実現できていた場合、次に先端モデルが登場した際、規制当局はどのような基準を適用するのかが問われる。


BeInCryptoの最新の暗号資産市場分析は、こちらをご覧ください

免責事項

当ウェブサイトに掲載されているすべての情報は、誠意をもって作成され、一般的な情報提供のみを目的としています。当ウェブサイトに掲載されている情報に基づいて行う一切の行為については、読者ご自身の責任において行っていただきますようお願いいたします。

スポンサード
スポンサード