Google、文章から動画を生み出すAI「Imagen Video」を発表

投稿日 2022年10月6日

画像生成AIがSNSなどでトレンド入りする中、Googleの研究チームGoogle Researchは現地時間10月5日、自然言語から動画を生成するAIシステム「Imagen Video」をサンプルとともに公開した。

Imagen Videoの特設サイトでは、「A Panda is driving a car（車を運転するパンダ）」や「A bunch of autumn leaves falling on a calm lake to form the text ‘Imagen Video’（静かな湖に落ちた紅葉の葉束が“Imagen Video”の文字を象る）」といった短い文章から生成されたサンプル映像が公開されている。

Imagen Videoは、Googleが5月に発表した文章から画像を生成する「Imagen」に基づいたもので、その詳細についてのリサーチペーパー（英語）も公開されている。

そのリサーチペーパーによると、動画生成の大まかな流れは、まず入力された文章を自然言語処理AI「T5」で処理し、拡散モデルで24×48ピクセル、毎秒3フレームの16フレームの映像を生成する。

そして、これを「時間的超解像度(Temporal Super-Resolution)」と「空間的超解像(Spatial Super-Resolution)」というモデルでアップサンプリングして、最終的に1280×768ピクセル、毎秒24フレームで128フレーム（約5.3秒）の映像を生成するという。

また「Imagen Video」の大きな特徴として、紅葉で“Imagen Video”を象るような、テキストをそのスタイルでレンダリングすることができる点が挙げられている。さらに著名な芸術家の作風を反映させたり、映像内に3Dモデルを登場させることもできる。

しかし、Googleが披露した今回のサンプルにはまだ不自然な部分が多いと指摘されており、今後どのようにAIが進化を遂げるかが注目されています。

また、GoogleはImagenと同様に、露骨で暴力的なコンテンツが生成される懸念が軽減されるまでは、Imagen Videoのモデルおよびソースコードは公開しないとしている。

Imagen Video Webサイト

前の記事次の記事

ARTICLE

AIの記事一覧

2023.01.23

ChatGPT Professional Plan、月額42ドルで一部ユーザーに向けて公開

2023.01.20

1923年、アメリカの漫画が2023年のAIを予言していた

2023.01.18

DeepMind、チャットボット「Sparrow」を開発中であることを明らかに

2023.01.17

Microsoft、ChatGPTやDALL-E 2などが利用できるクラウドサービス『Azure OpenAI Service』の一般提供を開始

2023.01.12

OpenAI、ChatGPTの有料版「ChatGPT Professional」の提供開始に向けて準備中であることが明らかに

2023.01.10

Microsoft、3秒の音声サンプルで人間の音声を合成するAI「VALL-E」を発表

2022.12.29

Cathcy、新年の抱負を生成するAIツール「新年の抱負作成AI」をリリース

2022.12.26

Ellie.AI、OpenAIの言語モデルをベースにしたメールアシスタントAIが登場

2022.12.23

Tome、DALL-E 2搭載のストーリーテリングフォーマット生成AIのβ版が公開

2022.12.21

OpenAI、テキストから3Dオブジェクトを生成するAI「Point-E」を発表

ARTICLE

の記事一覧

2023.01.23

ChatGPT Professional Plan、月額42ドルで一部ユーザーに向けて公開

2023.01.23

Meta、Hand-Tracking Ver.2.1がリリース。繊細な手の動きも追跡可能に。

2023.01.20

1923年、アメリカの漫画が2023年のAIを予言していた

2023.01.18

DeepMind、チャットボット「Sparrow」を開発中であることを明らかに

2023.01.17

Microsoft、ChatGPTやDALL-E 2などが利用できるクラウドサービス『Azure OpenAI Service』の一般提供を開始

2023.01.16

NFT Plazas、最も高価で取引された7つのNTFアートを紹介

2023.01.13

BRELYON、次世代没入型パノラマディスプレイ「Virtual Display」を発表

2023.01.12

OpenAI、ChatGPTの有料版「ChatGPT Professional」の提供開始に向けて準備中であることが明らかに

2023.01.10

Microsoft、3秒の音声サンプルで人間の音声を合成するAI「VALL-E」を発表

2023.01.09

holoride、あらゆる車にVRシステムを搭載できるデバイス「holoride retrofit」を発表

カテゴリー

SNS

更新のお知らせを受け取ろう

Twitter

Tweets by oca_ja

LINE

LINEで友だちに追加

IF YOU’RE INTERESTED…

ITのお仕事に興味がある高校生へ

資料請求無料

OCAをもっと知りたい方に、
学校案内パンフレットを無料でプレゼント！

オープンキャンパス

オンライン・来校どちらもOK！
ITのお仕事を体験してみよう！

専攻情報

興味のあることから選べる
最先端のITを学ぶ5専攻！