OpenAIが驚愕の動画生成AI「Sora」を発表
2024年2月15日にOpenAIがテキストから動画生成が可能なAI「Sora」を発表し、そのクオリティの高さが注目を集めました。「Sora」とはどのようなことができるのか、OpenAIの公式ホームページにアップされたサンプル動画も紹介しながら解説いたします。
Soraとは
「Sora」はOpenAIが発表した動画生成AIで、ユーザーのプロンプトをもとに最長1分の高品質な動画を生成することが可能なAIです。「Sora」という名前は日本語の「空」が由来となっており、無限のアイデアが創造できるという意味があるそうです。
公式ホームページによると
“Soraは、複数のキャラクター、特定の種類のモーション、被写体と背景の正確な詳細を含む複雑なシーンを生成できます。モデルは、ユーザーがプロンプトで何を要求したかだけでなく、それらのものが物理世界にどのように存在するのかも理解します。”
引用元:OpenAI公式ホームページ
とあります。
実際に生成された動画を見てみましょう。公式ホームページのトップに紹介されていた動画がこちら▼
(プロンプトが動画の下に記載されています)
動画のクオリティは非常に高く、東京のネオン街や赤いドレスを着たスタイリッシュな女性など、細かい指示に対しても忠実に再現された動画となっています。
▼こちらは先ほどの動画の1シーンですが、女性のメガネに映る景色も表現されていて、物理世界で本当に存在するかのような繊細な動画が生成されています。
Soraでできることとは?
「Sora」はテキストから動画を生成する「Text-To-Video」の他にも、たくさんの機能があります。「Sora」の機能について見てみましょう。
テキストから動画を生成する「Text-To-Video」
テキストによるプロンプトのみで高品質で最長1分のビデオが生成されます。
既存の画像を動画にしたりイラストをアニメーション化
「Sora」では静止画を動画にしたり、イラストに動きをつけてアニメーション化することができます。公式ページに掲載されていたものは画像生成AIのDELL・E2、DELL・E3で生成した画像を動画にしていました。
▼こちらが元となる画像
▼画像から動画にしたものがこちら
生成した動画の時間を前後に拡張
「Sora」は生成された動画の延長も可能です。
▼以下の3つの動画は、始まり方はそれぞれ違いますが、最終的に同じシーンで終了します。生成された動画の前の部分に動画を追加(延長)したような形です。
2つの動画を接続させる
「Sora」では2つの異なる動画を違和感なくシームレスに繋げて1つの動画に接続することができます。
動画①
動画②
動画①と②が接続された動画
2つの異なる世界観を持つ動画ですが、まるで元々一つの動画だったかのように違和感なく接続されています。この動画をAIが作ったとは驚きです。
公式ホームページ(https://openai.com/sora)では他にもたくさんの動画が公開されていますので興味がある方は是非チェックしてみてください。
最後に
今回は生成AI界に衝撃を与えた「Sora」についての解説でした。様々な驚きの機能を備えた「Sora」ですが、現在、一般公開はされておらず、一部のクリエイターや映画製作者がアクセスできるのみとなっています。公開については悪用されるリスクなど問題点が多くあるため慎重な判断が必要になりそうですね。
筆者Y.S