メタ(旧フェイスブック)はこのほど、画像生成系AI(人工知能)「CM3leon(カメレオン)」を発表した。CM3leonは、テキストから画像へ、また、画像からテキストへの生成が可能なマルチモーダル基盤モデルだ。
M3leonは、文章データと画像データを元に学習を行い、CM3leonは以前のトランスフォーマーベースの方法よりも5倍の計算能力と小さなトレーニングデータセットを使用。テキストから画像のみ、または画像からテキストのみであった以前のモデルの機能が大幅に拡張され、テキストガイド付き画像の生成と編集、画像に関する質問であるテキストタスクなどが可能となる。
同社によるパフォーマンスを比較すると、CM3Leonはスコアが4.88で、テキストから画像への生成を行うGoogleのPartiを上回った。メタはCM3leonのようなAIモデルがメタバースの創造性とアプリ開発に有用であると考え、今後もマルチモーダル言語モデルの開発に注力し、さらなるモデルリリースするとしている。
Open AIが開発するChat GPTでは7月、コードインタプリタ機能の追加により有料プランで使用可能な機能GPT4にて画像認識が可能になった。グーグルが開発・提供を行う生成系AI「Bard」は13日にアップデートを実施され画像入力機能を実装。これにより画像の読み取りが可能となった。
Follow us on:
X(Twitter):@BeInCryptoJapan
Telegramチャンネル:@BeInCrypto Japan オフィシャルチャンネル
免責事項 - Disclaimers
当ウェブサイトに掲載されているすべての情報は、誠意をもって作成され、一般的な情報提供のみを目的としています。当ウェブサイトに掲載されている情報に基づいて行う一切の行為については、読者ご自身の責任において行っていただきますようお願いいたします。