名古屋市新事業支援センターでITマネージャーの日でした。
生成AIに関する相談が本当に多い日でしたが、早速OpenAI社の動画生成AIであるSora2についての話題が出てきました。
相談者の方には実際にSora2を使っていただき、Veo3などの他のツールとも比較をしてもらいました。
それぞれのツールで画像や動きのリアルさ、そして日本語音声の精度には差があり、好みが分かれるところかなと感じました。
ChatGPTで作った画像には、なんとなくChatGPTらしさが出てしまうものです。
おそらく肌の質感や色合いからそう感じるのだと思います。Sora2も若干そのような雰囲気の映像になることがあると感じました。
一方で、NanoBananaとVeo3の組み合わせで作られた画像のリアルさは、やはり素晴らしいと感じました。
ただし、ここで気になってくるのが日本語音声の生成具合です。Sora2はこれが素晴らしいです。
今、私が個人的に楽しんで取り組んでいることに「パオパオ復活計画」というものがあります。
これは、パオパオの思い出を振り返り、その映像を復活させるというプロジェクトです。
おそらくこんなことを考えていたのかなと想像しながら、パオパオにセリフを言わせて動画にするのです。
会話が入るので、Veo3はやや片言になりますが、Sora2で試してみると、パオパオが動いて喋っている様子が嬉しくなってきます。

https://sora.chatgpt.com/p/s_68e2dc013d2881918780e22f7f8f09ad

https://sora.chatgpt.com/p/s_68e2dc11eff48191a65622cffa59d880

日本語の音声が自然に生成されることの価値を、改めて実感しました。生成AIにはさまざまな使い方があると思います。
業務効率化、生産性向上、アイデアの具体化など、その用途は多岐にわたります。
自分はブログを振り返ったり、そこから新たに考えを形にしたり…と、振り返りツールとしてが一番役に立っていると感じます。
Sora2も、これからますます進化していくのだと思います。
プロンプト次第で忠実にセリフを再現し、リアルに表現してくれる動画生成機能は、「記憶の再現」で大きな可能性を秘めています。
生成AIの技術の進化は目覚ましいものがありますが、それをどう使うかは人それぞれで、それを共有できると嬉しいです。
自分の顔を動画に取り込むCameoという機能も試してみました。
座禅し瞑想しながら「パオパオ」を思い出す、という設定の動画を作ってみたのですが、確かに自分らしい表情が再現されていると思いました。
Sora2の登場時に心配された著作権侵害で完全アウトの動画を生成してしまう件もコントールが入って少しずつ解消されているようです。
自由も大切ですが、間違った使われ方ができないようにコントールすることは大切だと思います。特に生成AIは。


