とうとう来てしまった時代。
楽器って難しいですよね。ずっと練習していないとすぐに下手になるし。いちおう僕もキーボード、ギター、ベースとずっと保有してましたが、この前粗大ごみでギターとベースは廃却しました。
もちろん人前でライブやるような腕前ではないし、一人遊びレベルです。
老後になったらちゃんと練習して、作詞作曲して、YouTubeに楽曲でも上げようかなと思っていたのですが、とうとう楽器が不要になりました。
今後どうしたらいいのかな?
上記の主文を以下に書き起こしておきます。ご参考まで。
2024年2月、全てを生成AIで制作した音楽アルバム 「The Odyssey of Echoes」が誕生した(図1)。
収録された12曲は共通するテーマを持った、いわゆる「コンセプトアルバム」と呼ばれるフォーマットにのっとっている。ザ・ビートルズの「Sgt. Pepper’s Lonely Hearts Club Band」やピンク・フロイドの 「The Dark Side of the Moon」などの名作の流れを汲んだ楽曲集だ。長さは30分弱。アルバムとしては小粒だが、全体の統一感は取れている。
作品作りに丸ごとAIが関与
アルバムの収録曲は、全てAIが作詞・作曲・演奏・歌唱までこなした。 個々の楽曲だけでなく、アルバムのコンセプトや収録曲のタイトル、音楽スタイル、さらにはこれを演奏するバンド 「The Midnight Odyssey」 や5人のメンバーの名前、プロフィール、そして容姿までをAIが考案した(図2、図3)。
全楽曲を完成させるのに要した時間はわずか数時間。最終的に商業サイトの「Spotify」や「Apple Music」 などでの配信にまでこぎ着けた。
やったことは基本的に、生成AIとの文章(テキスト)のやり取りだけ。 読者の皆さんがやってみようと思えば実践できる、そんな内容だ(図4)。
作曲AIサービスの「Suno」は、歌詞と音楽スタイルを入力すれば、指示に従って曲を生成してくれる。有料プランに入っていれば、生成された曲はユーザーの所有物となり、商用利用も可能。一度の生成で2曲が同時に生まれ、数十秒で楽曲が出来上がる。同じ歌詞と音楽スタイルで気に入るまで何度でも試行できる。
歌詞も音楽スタイルも、自分で考えることは可能だが、今回はあえて AIにやってもらった(図4)。
ChatGPTを司令塔に
司令塔である「ChatGPT」への指示は、「ロックのコンセプトアルバムを作りたいので、12曲のタイトルと歌詞、そしてその曲調をそれぞれ英語で記述して」だけ(図5)。その答えをSunoに入力して生成していった。数回試行するだけで、満足のいく楽曲が生まれた。
作詞は別のアプリやSunoにやらせることも可能だが、ChatGPTはアルバム全体の構想を持っているので、一任した。ポピュラーソングの定石であるライム (韻を踏むこと)もちゃんとできている(図6)。
曲の途中に「Verse 1」 「Chorus] といった文字列があるのは、日本ではAメロ、サビと呼ばれる楽曲の構造を示す用語だ。Sunoに入れるときは [Verse 1] などと変換するが、その作業もChatGPTに任せた。
次にバンドメンバーの名前、担当楽器、そしてバンドの略歴も生成 (図7)。2015年に結成された現在5人組のロックバンドで、2022年に女性キーボードプレーヤー兼シンガーが加入したことにより、男性ボーカル、女性ボーカルを抱えたプログレッシブ・アート・ロックバンドという体裁になった。
このメンバーでそれらしいバンドのアーティスト写真が出せるように数十枚生成した中から良さそうなものを選び、メンバーに割り当てた。
さらに悪ノリして、このアルバムの解説文と、メンバーが日本の音楽雑誌からインタビューを受けたという架空の記事もChatGPTに生成させた(図8、図9)。
バンドの詳細な設定が固まったら、 次はアルバムのビジュアル作りだ。 カバーアート (ジャケット)の画像は、1年以上前の制作時点ではChatGPTの画像生成能力がそれほど高くなかったため、画像のプロンプトを考えさせ、画像生成サービスを通し、「Stable Diffusion」で出力した。今なら、同程度の画像はChatGPT內でも生成可能だ。
今ならもっと簡単に
このアルバムを制作してから1年と2ヵ月が過ぎ、SunoもChatGPT も大きく進化した。Sunoは作詞奏の品質が大幅に向上し、一度に生成できる曲の長さも4分まで伸びた。 さらに、ベルソナという機能を使うことで、ボーカルや音楽スタイルを固定できるようにもなった。
アルバム完成から2ヵ月後、友人でテクノロジーライターの大谷和利氏から、The Midnight Odyssey のミュージックビデオをフルAIで作りたいというオファーをいただいた。
筆者が作ったAIミュージックビデオは細かいカット割は極力回避し、長回しのリップシンクと次々に移り変わっていくトランジションの組み合わせ。これに対し、大谷氏の手法は伝統的な細かいカット割による作品で、バンドメンバーの顔写真から生成した演奏シーンも含まれる。
現在ならば、「Runway Gen-4 Turbo」で10秒の動画生成が2分ほどででき、リップシンクも簡単だ。 「FramePack」という動画生成AIツールを自分のパソコンで動かせば、 4分の動画を一度の操作で作り上げられる。
ChatGPTには「耳」も付いた。作った曲をアップロードしたら、その曲の感想や改善点も教えてくれる。
これまで触れてきた音楽やミュージックビデオが、自分とAIが生み出す音楽を表現するヒントになる。 皆さんもやってみませんか?
by日経パソコン25/5/26
半年ほど前に定期的に「チキンジョージ」で単独ライブする人とサシで飲んだのですが、しんどいのはマネジメントだそうです。ハコ側も定期的に商売が成り立つ「信用」があるからオファーするわけで。
演奏して応援してくれる人に喜んでもらえるのはうれしいのですが、チケット売ったり段取りしたり、それに付随する付き合いがあったり、もろもろはしんどいみたいです。
で、その人が言ってたのは「音楽」は詩が大事ってこと。
まあそうだとは思っていましたが。そうじゃないのもありますよね。Vaundyの踊り子なんて詩なんかまったくでサウンドが気持ちいいだけやし。
何が言いたいかというと、自分で良い詩を書いたり、うまく韻が踏めないなら、ブライアンウイルソンがペットサウンズでやったように、お題を与えてプロの作詞家に作ってもらって若干手直ししたらいい。そのプロの作詞家の段取りが、AI時代ならAIに頼めるという。
凄い時代になりました。
最近カラオケでよく歌ってる「踊り子」をどうぞ♪
sunoでつくられた曲がYouTubeにあったので、ついでに貼っときます。
(関連記事)
【ビーチボーイズのペットサウンズ】全11曲を和訳
https://book-jockey.com/archives/13934
レコード会社なんていらない
https://book-jockey.com/archives/12999
Googleアップデートで個人ブログが壊滅した理由
https://book-jockey.com/archives/19951
生成AI徹底比較(全15種)
https://book-jockey.com/archives/22268