静止画がリアルに動き出す!アリババが公開したAI「EMO」とは?
最近、写真を歌わせるアプリが流行っており動画サイトやSNSなどでアップされていますが、2024年2月27日に中国の大手IT企業であるアリババの研究グループが静止画の人物をリアルに喋らせたり歌わせたりするAI「EMO」を発表しました。今回は「EMO」について紹介します。
EMOとは?
「EMO」は「Emote Portrait Alive(エモート・ポートレート・アライブ)」の略で、顔写真と音声(喋り声や歌声)があれば、その音声に合わせて写真が喋ったり歌ったりしているような動画を生成するAIです。今はアプリでも簡単に写真の人物を歌わせるものがありますが、多くの場合、顔だけが動いたり、口だけが動いたりといったもので、不自然な動画となっていました。「EMO」は音声に合わせて眉を動かしたりまばたきしたりと自然な表情を作り出すことができます。
実際の動画
▼動画左にある写真が元となった写真で、右がその写真と音声で作成された動画です。
(※音声注意)
歌に合わせた体の動きや、髪の動きも表現されており、まったく違和感のない動画になっています。
▼こちらは絵画で有名なモナリザが喋り出す動画です。
(※音声注意)
動くはずのない絵画にまるで命が吹き込まれたかのように自然に喋っています。
音声だけでここまでの動画が生成されるのは驚きですね。「EMO」は音声の分析も行い音声に合わせて表情や動きなども生成しているそうです。
「EMO」はまだ公開はされておらず使うことができませんが、近々公開されるのではないかと言われています。
EMO公式ホームページ(https://humanaigc.github.io/emote-portrait-alive/)では他にもたくさんのサンプル動画がアップされていますので、興味がある方はぜひチェックしてみてください。
AI技術の進化がもたらす危険性
「EMO」だけに言えることではありませんが、AIが悪用された例で、過去に岸田総理のフェイク動画が拡散されたり、バイデン米大統領のフェイク音声によるなりすまし電話などがあります。技術が進化すればするほど、より精巧なフェイク動画が生成され、本物との見分けがつかなくなるという問題があります。AI技術の進化により巧妙なフェイク動画が作られることで、政治的な混乱や経済的な損害などの懸念が高まっています。
最後に
今回は、発表されたばかりの生成AI「EMO」についての紹介でした。写真やイラスト1枚からリアルな動画が作れてしまうと、映画業界や俳優業界にも影響を与えてしまいそうですね。「EMO」を開発したアリババは中国の企業ですが、中国では今、AIを活用したアニメなどの製作に力を入れているようです。いつかAIが脚本、演出、出演(CG制作)までを担当するような映画やドラマが出てくるかもしれません。
筆者Y.S