挫折した夢はAIが叶える。Sora2 x Sunoで見えた、僕が演出し“AIの僕”が歌う時代へ

いま、改めて生成AIが面白い
1. 挫折した夢の続きが見えてきた
Sora2で遊ぶのは単純に楽しい
1. Sora2はソーシャルな動画生成AI
2. 自分の顔や声を動画の生成に使用することができます（Cameo）
まるで本当に自分が歌っているみたい！
Sora2とSunoに自分の曲を作らせ、歌わせる未来が見えた
具体的なワークフローのイメージ
それでも手触りは自分のもの
生きてて良かった

いま、改めて生成AIが面白い

生成AIが出てきてからずっと楽しんでいるわけですが、ここ最近は本当に面白いものが立て続けに出てきてさらに夢中になっております。

例えば、OpenAIの動画生成AIというか、ソーシャルというか、のSora2。
他にも、音楽作成AIのSuno。
どちらも単なるツールではなく、「創作の形」そのものを変えつつあります。

今は少し落ち着いてきたと思いますが、Sora2はリリース直後はSora2で生成された動画がみなさんのタイムラインにも沢山流れてきたのではないでしょうか。純粋に生成を楽しむ人、AIの未来を分析する人、クリエイティブの行方を憂う人、冷ややかに見ている人。立場も温度もバラバラで、そのカオス自体も僕は楽しんでいます。

じゃあ僕はどうかというと、めちゃくちゃ興奮しています（笑）。

挫折した夢の続きが見えてきた

これから書くことは、昔、音楽をやっていて挫折した、自分だけの感覚かもしれないです。なので他の人には一般化できないかもしれませんが、あの頃の引っかかりみたいなものに、続きが生まれる気がしています。

Sora2で遊ぶのは単純に楽しい

Sora2はソーシャルな動画生成AI

まず動画生成AI、Sora2の話。Sora2について軽く説明すると、単純な動画生成AIではなく、ソーシャルになっています。つまり、自分のアカウントで動画を公開してそこにいいねがついたりコメントがついたり。フォローしたりされたりもします。

自分の顔や声を動画の生成に使用することができます（Cameo）

Sora2には「Cameo」という機能があります。
自分の顔や声を素材として登録し、動画生成に使うことができる機能です。
さらに、他のユーザーにそれを使わせるかどうかも自分で設定できます。
たとえば設定項目は以下のようなものです。

利用範囲（Who can use this）

自分だけ
承認した人
相互フォローのみ
誰でも

キャラクター属性（Gender など）

OpenAIのCEOであるSam Altmanを使ったおもしろ動画が一時期沢山タイムラインに流れてきたのでSNSをやっている方は一度は目にしたことがあるのではないでしょうか。

僕も試してみましたが、あまり面白く思わなかったので自分（Sora2ではCameoという）を素材に動画をいくつか作ってみました。これが本当に楽しい。「自分っぽい」んです。かなりの精度。ついにここまできたか、という感じ。

これは僕の友人に見せても渋谷で普通に撮影したと思う人は多いんじゃないかと思います。これ、もちろん渋谷で撮影したものではなく、自宅で適当に撮影した自分の動画を元にSora2が生成した動画となります。

自分に見える、というのは非常に楽しいですね。自分ならやらないようなことをやらせてみたりいろいろ試してみました。

そして行き着いたのは、音楽。

まるで本当に自分が歌っているみたい！

声も顔も、自分っぽい。
そして歌い方まで、まるで自分のクセを再現しているように感じます。

これを投稿してみたところ、この曲自体の評判が良かったので、この曲の続きを作成してくれないかとSora2にお願いしてできたのがこちらの曲。

残念ながらキーもテンポも違うので曲は続きではないですが、映像はリアル。しかも、僕は泣いてる（笑）。

さらに、もう少し違うものを試してみました

これは歌番組などでオーケストラをバックに歌ってるシーンをイメージしたものなんですが、紅白にでも出ているかのような映像になりました（笑）。

本当はまだまだ無数に音楽動画はあるので、お見せしたいところなんですが、このくらいにしておきますね。

Sora2とSunoに自分の曲を作らせ、歌わせる未来が見えた

とても精度の高い動画でしたが、Sora2のこの動画をフルバージョンで、高画質で出してもAI生成のものとして片付けられてしまうと思います。たとえ自分の顔と声でも。

ですが、Sora2を単に動画生成AIとしてだけでしか見ていないと見落とす景色があるような気がします。僕にはSora2が僕の挫折した夢の続きを見させてくれる未来がはっきりと見えてきました。

僕が書いた歌詞とメロディをAIがアレンジし、「AIの僕」が歌う。
僕は演出に集中する。
この形こそ、ずっと望んでいた“創作の完成形”なのかもしれません。

ここで強調したいのは僕の心理なのです。単に面白いね、という話ではなくて、自分が歩みたかった未来がリアルにそこに描かれているのです。そしてそれは後悔とかじゃなくて、妙な満足感と、音楽に対する想いがまたぶり返しつつあることを否定できないのです。本当の自分が演じているわけではないのですが自分の声で、自分の姿で演じられている生成AIによる動画に心を揺さぶられています（笑）。

音楽生成AIのSunoと組み合わせてもいいですよね。Sunoでほとんどオートで作った曲をSora2の僕に歌わせるだけだと単にAI生成のものとして扱われて、作品とは見られないかもしれないですが、僕が書いた歌詞で、メロディも何度もリミックスを重ねて精査されたものだったらどうでしょうか。

自作の言葉と旋律に、AIが編曲・演奏で手を入れ、Soraが映像と歌のパフォーマンスを乗せる。

これ、ずっと望んでいたことかもしれない。僕はバンドをやっていたけど「自分で演る」ことを強く望んでいたわけじゃないんですよね。”自分の曲を形にしたい”という思いが強かったんです。もちろん、自分の頭の中どおりにできるならそれが最高。でも、そこに自分で到達できないストレスの方が大きかったんです。だったら、よりイメージ通りに仕上げてくれるAIの方が、結果的に僕の理想に近いのではないかと。

ついにこんな時代がきたか。まさに新時代。

具体的なワークフローのイメージ

20数年前の僕に出来たのは作詞作曲と歌うこと、あと軽くギターが弾けるくらいだったので、1人でやるには限界があったんですよね。それが、

作詞（自分）：作品の核となる言葉は自分で書く。
作曲（AI）：納得いくまで生成と調整を繰り返す。
編曲・演奏（AI）：スタイルを指示し、伴奏を任せる。
歌唱・演技（AIの僕）：表情や演出をディレクション。
仕上げ（僕）：テンポやカメラワークを統合。

この分業だと、創作の「ストレスポイント」が劇的に減りますよね。もちろん現時点では未実装のことばかりですが、技術的にはそう難しいものではないんじゃないでしょうか。

オプションで肖像権のある建造物や会場を使うなら課金する、みたいなことは容易にできそうな気がします。

それでも手触りは自分のもの

大事なのは、最終的な手触りが「自分っぽい」ことではないかと。

Sora2で自分のCameoを動かしたときの興奮は、まさにそこにあったわけです。自分の輪郭を保ったまま、表現の解像度だけが上がっていく感じ。

正直、もう「遠い未来の話」じゃないですよね。

ほんの少し前まで不可能だと思っていた制作スタイルが、いつのまにか現実となって手の届くところまで来ているような感じがします。

生きてて良かった

このストーリーは、Sora2をはじめとした動画生成AIの唯一の未来として語っているわけではないです。ただ、こんなことは出来るんじゃないかな、と。そして出来るようになったら嬉しいな、と。

僕が生きている間に、この世界がやってきてよかった。
挫折の続きができるなんて思ってなかったな。
Sora2とSuno。
組み合わせた瞬間に、僕の中の音楽はもう一度、動き出した。
……なんてね（笑）。

少し長くなってしまったのでSunoの話はまた今度。

最後に、このブログ記事ではポジティブな未来について光を当てましたが、もちろんAIに学習させない権利など様々な乗り越えるべきハードルについても同時に考えさせられています。

月	火	水	木	金	土	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31