AnthropicとOpenAI、AI開発競争を科学研究分野へ

  • Anthropicは、60以上の科学データベースと連携したAI作業台「Claude Science」を公開した。
  • OpenAIは、計算生物学分野におけるAIの判断力を評価するベンチマーク「GeneBench-Pro」を公開した。
  • OpenAIの最上位モデルは、GeneBench-Proの生物学問題のうち、わずか28.7%に正解した。
プロモーション

AnthropicとOpenAIは火曜日、科学研究分野を舞台にした競争で新たな局面を迎えた。Anthropicは研究者向けAIワークベンチ「Claude Science」を発表し、OpenAIは計算生物学向けのベンチマーク「GeneBench-Pro」を公開した。

同日に行われた発表は、AI競争がチャットボットやプログラミングを越え、実験室分野に拡大する動きを示す。Anthropicは科学者が実際に現場で使えるツールを提供した。一方、OpenAIは技術の進捗を測る基準を構築した。

スポンサード
スポンサード

Claude Scienceの概要

Claude Scienceは、科学者が利用するデータベース、コード、計算資源を単一のアプリに集約する。ゲノミクス、プロテオミクス、ケミインフォマティクスの分野で60以上の科学データベースと連携している。

Claude Scienceは新たなAIモデルではなくアプリケーションである。Anthropicの最強モデルであるFable 5やMythos 5は米国の輸出規制下で依然制限されている状況。すべての出力結果は監査が可能で、生成元のコードまで遡ることができる。

このワークベンチは、Anthropicが2025年10月に開始したライフサイエンス領域の取り組みを拡張するもの。ベータ版では、アレン研究所のジェローム・ルコック氏が従来最大2年かかっていたレビューを圧縮するために活用した。

Anthropicは最大50件の研究プロジェクトに対して、それぞれ最大3万ドル分のクレジットを提供する予定。

OpenAI「GeneBench-Pro」が求める新基準

AnthropicがClaude Scienceを発表した直後、OpenAIはGeneBench-Proをリリースした。このベンチマークは、AIエージェントが実際の生物学研究で必要とされる判断を下せるかどうかを検証するために設計されている。

スポンサード
スポンサード

ベンチマークには、ゲノミクス、定量生物学、トランスレーショナルメディシン分野にまたがる129件の問題が含まれる。

OpenAIの最強モデル「GPT-5.6 Sol」は、最高の推論レベルで28.7%の課題を解決した。Proモードではその割合が31.5%に上昇した。段階的なGPT-5.6リリースはワシントン当局の要請を受けて行われた。

GPT-5は初代GeneBenchで5%未満の成績にとどまり、AnthropicのOpus 4.8モデルは難易度の高いテストで16%を記録した。

X(旧Twitter)で最新ニュースをリアルタイムでチェック

2つの戦略、1つの競争

今回の発表は、同じゴールに向かう異なるアプローチを示している。Anthropicは日々の実験室業務に使えるプロダクトを提供。一方OpenAIは、雑然としたデータからどれだけAIが確実に推論できるかを測定している。

両者の発表は、中国発のAIモデルが研究分野で存在感を増す中で行われた。OpenAI自身の調査結果も、同社の最高モデルでさえGeneBench-Proの多くの課題で失敗していることから、過度なブームを戒める内容。

競争は地政学的かつ科学的な側面を持つ。米国の輸出規制でAnthropicは、自社モデルの新たな拠点を検討する動きも見せている。

GeneBench-Proの審査員は、1問の課題ごとに専門家1人が20~40時間を要し、費用も数千ドルに達すると試算した。OpenAIは、自社モデルがこれらを数ドル規模で処理したと述べている。

生物老化学者のオーブリー・デ・グレイ氏は「AIは今後、研究の主要なボトルネックの解消に寄与する」と見解を示す。一方、より幅広い効果の実現には、なお時間がかかるとの認識も示している。

「AIによって、ごく近い将来、特に創薬開発の一部プロセスがもはやボトルネックにならなくなるだろう」オーブリー・デ・グレイ氏(Longevity Escape Velocity Foundation会長兼最高科学責任者)、BeInCryptoポッドキャストにて

デ・グレイ氏はまた、研究の高速化が実際に承認された治療につながるかどうかは、規制やリスク許容度にも左右されると警鐘を鳴らした。

研究者は迅速な普及を予想

専門家の一部は、すでに変化が始まっていると指摘する。免疫学者のデリヤ・ウヌトマズ教授は、同じBeInCryptoパネルで「AIは自身の判断を上回る」と語った。

「私は自分の専門分野で、AIの意見の方を自らの考えより信頼している」

同氏は、こうしたAIへの依存が臨床現場にも急速に波及するとみている。

「医療でAIを使わないことは非倫理的で、間もなく過失と見なされる時代が来るだろう」

こうした楽観論は依然ベンチマークの先を行く。今後数カ月で、科学者がこれらのツールを実際に現場採用するのか、GeneBench-Proのスコアが向上するのかが注目点。


BeInCryptoの最新の暗号資産市場分析は、こちらをご覧ください

免責事項

当ウェブサイトに掲載されているすべての情報は、誠意をもって作成され、一般的な情報提供のみを目的としています。当ウェブサイトに掲載されている情報に基づいて行う一切の行為については、読者ご自身の責任において行っていただきますようお願いいたします。

スポンサード
スポンサード