アップルとカリフォルニア大学サンタバーバラ校(UCSB)は5日、共同研究によって開発されたマルチモーダル大規模言語モデル(MLLM)を基にした新しいAI画像編集ツール「MGIE」を公開した。同モデルは、自然言語での指示(を実行可能な命令に変換し、画像生成や変更を行うことが可能。
MGIEはGitHubでオープンソースソフトウェアとしてダウンロードでき、Hugging Spacesプラットフォーム上のウェブデモを通じて誰でも試用できる。MGIEモデルは、画像のトリミングやサイズ変更、フィルターの追加などの基本的な編集から、写真内の特定オブジェクトの形状変更や輝度向上といった複雑なタスクまで、幅広い画像編集作業をテキストプロンプトを介して行うことができる。
MGIEモデルは、MicrosoftのDeepSpeedというライブラリおよびツールのスイートを使用して開発されたがAppleのシリコンとの直接的な互換性はない。このことからMGIEモデルが現在の形でアップルのハードウェア上でローカルに動作する可能性は低いとみられている。また、本稿執筆時点では実行までに時間がかかるとの声が散見された。
AI競争の「ダークホース」のアップル、24年は存在感を増すか
AppleはこれまでAI競争において比較的控えめな姿勢を保ってきたが、AI関連の買収や採用を強化し、最新MR端末「Vision Proの発売に先立ってAIに関する大規模な計画を予告してきた。24年にはiOS 18のプレビューを通じてさらに多くのAI関連の発表があると見られている。金融大手モルガン・スタンレーのアナリストは、このモバイルソフトウェアが生成型AI対応で、LLMによって駆動する音声アシスタントSiriを含む可能性があると予測している。
Appleのティム・クックCEOは、このほどの業績発表で「24年後半にAI分野で進行中の取り組みの詳細を共有できる」と述べていた。Appleはオープンソースの機械学習フレームワークであるMLXをリリースするなど、自社のMシリーズCPU上でAIモデルをより容易に訓練するための取り組みを進めている。
Follow us on:
X(Twitter):@BeInCryptoJapan
Telegramチャンネル:@BeInCrypto Japan オフィシャルチャンネル
免責事項 - Disclaimers
当ウェブサイトに掲載されているすべての情報は、誠意をもって作成され、一般的な情報提供のみを目的としています。当ウェブサイトに掲載されている情報に基づいて行う一切の行為については、読者ご自身の責任において行っていただきますようお願いいたします。