OpenAI 次世代動画AI「sora」解説

OpenAI テキストから作る次世代動画AI「sora」解説

OpenAI 次世代動画AI「sora」解説
スポンサーリンク

はじめに

2024年2月15日にChatGPTで一躍有名になったOpenAI社がテキストから動画が作れる「Soraを発表しました。

sora-サイト

 

AIでは動画は苦手な分野でしたが、このsoraはどんなものなのかを今回はご紹介します。

もし今回のsoraにも使われているDALL-E3という技術に興味のある方は以下の記事もご参照ください。

関連記事

はじめにChatGPT(会話形式で答えてくれるAIチャット)は今までは画像生成する機能はなく、テキストベースで画像生成のプロンプト(命令文)を作成して、別サイトのDALL(ダリ)-E3にそのプロンプトを入力することで画像生成していました[…]

GhatGPTにDALL-E3が追加。使い方を完全攻略!

soraとは?

アメリカのメディアでは「無限の可能性を呼び起こす」ことを意味する日本語の「空」が由来という噂あります。

テキスト入力後に最長1分間でAIが考えたストーリーで動画作成できるそうです。

現状はこの機能は一般公開されておらず、安全性などの確認をしたのちに一般公開予定となってますので、いつ使えるかは現状は未定です。

作成にかかる時間は公開されてませんが、CEOのSam Altman氏が発表後に何か要望あればsoraで動画作るということを言って、作って公開してました。

その時間的には修正版も含めて1時間以内には要望の動画を公開していたことからおそらく数分から数十分程度で作成できるのではないかと想像できます。

スポンサーリンク

最新情報(2024.3.25)

OpenAIのブログ記事でデザイナー、クリエイティブ ディレクター、映画制作者がSoraを使ったインタビューや動画が公開されていました。

Sora が最も威力を発揮するのは、古いものを複製するのではなく、他の方法では決して目にする機会がなかった新しい不可能なアイデアを実現するときです。

ポール・トリロ、監督

 

Sora は現実のように見えるものを生成するのが得意ですが、私たちを興奮させるのは、完全に超現実的なものを作成する能力です。

シャイ キッズ、マルチメディア制作会社

 

Soraは「今までの常識を変える不可能な世界を映す動画」となりそうです!

soraが作成する動画

では実際の動画もご紹介します。

スポンサーリンク

①東京の街を歩く女性


この動画のテキストは「スタイリッシュな女性が、温かく輝くネオンとアニメーションの都市の看板で満たされた東京の街を歩いています。彼女は黒いレザージャケット、長い赤いドレス、そして黒いブーツを着ています。」とのことです。

A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots,

 

②ドローンで撮影した景色

この動画のテキストは「ドローンカメラがアマルフィ海岸沿いの岩の突出部に建てられた美しい歴史的な教会を取り囲むように周ります。その眺めは歴史的で壮大な建築の細部や段々になった小道、テラスを披露しています。波が下の岩に打ちつけられ、眺めはアマルフィ海岸イタリアの海岸線と丘陵地帯を見下ろしており、遠くにいくつかの人々がドラマチックな海の景色を楽しんで歩いている様子が見えます。午後の太陽の暖かい輝きがシーンに魔法的でロマンチックな雰囲気を与え、美しい写真で見事に捉えられた景色です。」とのことです。

Prompt: A drone camera circles around a beautiful historic church built on a rocky outcropping along the Amalfi Coast, the view showcases historic and magnificent architectural details and tiered pathways and patios, waves are seen crashing against the rocks below as the view overlooks the horizon of the coastal waters and hilly landscapes of the Amalfi Coast Italy, several distant people are seen walking and enjoying vistas on patios of the dramatic ocean views, the warm glow of the afternoon sun creates a magical and romantic feeling to the scene, the view is stunning captured with beautiful photography.

③水没したNYのサメたち

この動画のテキストは「ニューヨークシティがアトランティスのように水没しています。魚、クジラ、ウミガメ、サメがニューヨークの通りを泳いでいます。」とのことです。

New York City submerged like Atlantis. Fish, whales, sea turtles and sharks swim through the streets of New York.

④ロボットの人生

この動画のテキストは「サイバーパンクの舞台でのロボットの生涯の物語。」とのことです。

 The story of a robot’s life in a cyberpunk setting.

 

soraの課題

AIが苦手とする動画AIに激震を与える「sora」ですが、やはり完璧ではないようで複雑な物体関係(複数の物体が重なる)などではうまく動画できないこともあります。

また現実ではありえない物理理論になっていたりします。

例えば、次の動画は「椅子の物理作用を無視して、途中から空中浮遊」などしてます。その他にも背景などみても違和感を感じるところも多いです。


この動画のテキストは「考古学者たちが砂漠で普通のプラスチック製の椅子を発見し、丹念に発掘して大事にほこりを払います。」とのことです。

Archeologists discover a generic plastic chair in the desert, excavating and dusting it with great care.

まとめ

課題はまだあるものの実際にクオリティも高いので、今後の未来の進化は楽しみです。

いつかAIで映画をつくられる時代もすぐ先なのかもしれません。

 

PRサイト
「ChatGPTと何か?副業に挑戦したい、資格を取得したい、悩みがある」など解決できるオンライン学習おすすめサイトはこちら

 

  

 

 

 

スポンサーリンク