詳細を見る

OpenAI、ビデオ生成AI「Sora」を発表=最長1分の動画を生成

5 mins

ヘッドライン

  • OpenAIは16日、テキスト指示に基づいてリアルで想像力豊かなシーンを生成する新しいビデオ生成モデル「Sora」を発表した
  • Soraは、複数のキャラクターや特定の動作タイプ、そして対象物や背景の正確な詳細を含む複雑なシーンを作成する能力を持つ
  • Soraは現在、モデルの潜在的な危害やリスクを評価している「レッドチーム」にのみ利用可能であり、いくつかの視覚アーティスト、デザイナー、映画製作者にもアクセスが提供されている
  • promo

OpenAIは16日、テキスト指示に基づいてリアルで想像力豊かなシーンを生成する新しい動画生成モデル「Sora」を発表した。Soraは、複数のキャラクターや特定の動作タイプ、そして対象物や背景の正確な詳細を含む複雑なシーンを作成する能力を持つ。

Soraは現在、モデルの潜在的な危害やリスクを評価している「レッドチーム」にのみ利用可能であり、いくつかの視覚アーティスト、デザイナー、映画制作者にもアクセスが提供されている。Soraは現段階で、物理法則の正確なシミュレーションや特定の原因と効果の理解にはまだ課題がある。例えば、クッキーをかじった後にかじった痕が残らないなどの問題が挙げられる。

誤情報拡散防止のためAIによる生成コンテンツの差別化も

安全性に関して、OpenAIはレッドチームと協力し、誤情報や悪意あるコンテンツ、偏見に関する問題を探究し、Soraが生成した動画を検出するためのツール開発に取り組んでいる。また、動画にコンテンツの起源が確認可能なC2PAメタデータを含める予定であり、DALL·E 3にはウォーターマークと呼ばれるAIによって生成されたコンテンツを視覚的に区別する印を追加すると明かした。

Soraの研究と開発には、DALL·EやGPTモデルからの知見が活かされており、動画と画像をGPTのトークンのような小さなデータ単位となるパッチとして表現し、異なる期間、解像度、画面比率の視覚データに対する訓練が可能となっている。Soraは、テキスト指示だけでなく、既存の静止画から動画を生成する能力や、動画を拡張または不足フレームを埋める能力も備えている。

SoraはAGI達成に向けた重要なマイルストーンとなる

OpenAIは、Soraを通じて、現実世界を理解しシミュレートするモデルの基礎を築き、AGI(人工汎用知能)達成のための重要なマイルストーンと位置づけている。既にMeta、Stability AI、Googleなどが短秒数の動画生成モデルをリリースしているが、Soraの特徴は最長1分間の動画を生成できる点にある。同社サム・アルトマンCEOは1月、GPT-5はマルチモダリティを重視し、特にビデオの入出力が可能になる見込みだと述べていた

同社は13日、ChatGPTのメモリ機能をテスト中であると明かした。同機能では全チャットでの話題を記憶することで、情報の繰り返しを省く。OpenAIはこのほど、ユーザーのデバイスを引き継ぎ複雑なタスクを自動化する新型エージェントソフトウェア開発に着手した。情報筋が7日、米新興メディアThe Informationに語った。同ソフトウェアは、企業に関する公開データの収集、旅程の作成、航空券の予約といったWebベースのタスクを扱う。同取り組みは、個人的および業務的タスクを人間の指示のもと、より複雑に実行する新世代のアシスタント、「エージェント」としての役割を果たす。

ベスト暗号資産取引所

Trusted

Follow us on:

X(Twitter):@BeInCryptoJapan
Telegramチャンネル:@BeInCrypto Japan オフィシャルチャンネル

免責事項 - Disclaimers

当ウェブサイトに掲載されているすべての情報は、誠意をもって作成され、一般的な情報提供のみを目的としています。当ウェブサイトに掲載されている情報に基づいて行う一切の行為については、読者ご自身の責任において行っていただきますようお願いいたします。

wpua-150x150.png
Shota Oba
国際関係の大学在籍中に国内ブロックチェーンメディアでのインターンを経て、2つの海外暗号資産取引所にてインターントレーニング生として従事。現在は、ジャーナリストとしてテクニカル、ファンダメンタル分析を問わずに日本暗号資産市場を中心に分析を行う。暗号資産取引は2021年より行っており、経済・社会情勢にも興味を持つ。
READ FULL BIO
スポンサー
スポンサー