グーグルは7日、音声や動画、コーディングなどにも対応するマルチモーダル型の生成系AI「Gemini・ジェミニ」を発表した。英語版は同日から利用可能で、日本のユーザーはGoogleアカウントの言語設定を英語に変更することで利用できる。Geminiは声、画像、動画などの情報を扱い、論理的回答を生成する。
グーグルのTensor Processing UnitsでトレーニングされたGeminiは、前モデルより速く、コスト効率よく動作する。グーグルは画像と音声用の別モデルをトレーニングする代わりに、多感覚モデルを構築した。
Geminiには3つのバージョンがある。「ジェミニウルトラ」は最大で高機能、「ジェミニプロ」は広範囲タスク向け、「ジェミニナノ」はデバイス上タスク用に設計された。特に「ジェミニウルトラ」は30の学術ベンチマークで最先端の結果を達成しOpenAIのGPT4を上回った。同バージョンはデータセンターやエンタープライズアプリケーション向けで24年初頭に公開予定だ。
「ジェミニプロ」は13日からグーグルの「Vertex AI」を通じてAPIで利用可能に。「ジェミニナノ」は6日からグーグルの「Pixel 8 Pro」で使用可能になっており、録音アプリの書き起こしテキストをインターネット接続なしでの要約機能を提供する。GeminiはPython、Java、C++、Goで高品質コードを生成し、理解する能力がある。DeepMindによって開発されたAIプログラム「AlphaCode 2」は85%以上のコーディングコンペ参加者より優れたパフォーマンスを示した。これはオリジナル「AlphaCode」の50%からの大幅向上だ。
ピチャイCEO、AGIには慎重な姿勢を示す
グーグルのサンダー・ピチャイCEOとDeepMindのデミス・ハサビスCEOは同発表にあたって、汎用人工知能(AGI)に向け慎重な姿勢を示した。ハサビスCEOはAGIは自己改善能力を持ち、人間より賢い可能性がある。「AGIに近づくにつれ事態は異なる」と述べ、「慎重かつ楽観的なアプローチが必要」と強調した。競合のOpenAIは11月末、コメントを控えたが、AGIプロジェクト「Q*(キュースター)」プロジェクトに関する内部メッセージを認めた。同社はQを人工汎用知能(AGI)への突破口と見なしている。
OpenAIの投資家、「AIが無料の医療を提供する」
OpenAIに出資をするヴィノド・コスラ氏は3日米ビジネスインサイダーへのインタビューに対し、AIの進歩により、10年以内に無料の医療や教育、法律サービスが実現し、48年までに10億の二足歩行ロボットが登場するの見解を示した。同氏はまた、GPT-4の後継であるGPT-5がAIの未踏領域を開拓すると見ている。
コスラ氏は、AIが医療従事者の仕事の80%を置き換える可能性があると述べ、AIの進化が人類に大きな利益をもたらすとした。同氏はAIの潜在的な否定的な面よりも、プラスの影響に焦点を当てるべきだと主張し、AIを通じて全人類に資源豊かな生活の提供が可能だと述べている。同氏の会社Khosla VenturesはOpenAIに5000万ドルを投資し、他のAIスタートアップへも資金を提供している。
金融大手ゴールドマン・サックスが3月に発表したレポートによれば、日本がAIを本格導入した場合、全体業務の25%が自動化される。これは世界で3番目に高い水準だ。
Follow us on:
X(Twitter):@BeInCryptoJapan
Telegramチャンネル:@BeInCrypto Japan オフィシャルチャンネル
免責事項 - Disclaimers
当ウェブサイトに掲載されているすべての情報は、誠意をもって作成され、一般的な情報提供のみを目的としています。当ウェブサイトに掲載されている情報に基づいて行う一切の行為については、読者ご自身の責任において行っていただきますようお願いいたします。
