からあげ帝国の国歌(メロディ)を作りたかった
※技術的要素は今回なしです、期待していた方、すみません
翡翠です。
毎年、この時期になると Qiita のアドベントカレンダーを読んでは、楽しくて盛り上がる一方、自分も書きたいがそんなネタがない、と指を加えて読んでました。
からあげさんとは、一回お会いしたのみですが、「からあげ帝国のアドベントカレンダー楽しみ!」とポストしたところ、入国許可を得ました👏
帝国について調査したところ、国歌のテキストを作成している民がいて、
「僕はそれをメロディにしてみたい!」と思い、音楽生成 AI のインプットを始めました。
結論、作れなかった
僕は撃沈しました。
音楽生成モデルを探していたところ、「プロンプトで音楽生成できるじゃん!」で、翡翠のやる気は撃沈してしまったのです。
ここまで進んだか、生成AI
つい、一年前くらいはプロンプトだけでこんなにも自由なことを実現できなかったはず、一年でここまで進んだか、という激動な時代に自分がいることに驚きです。
ガラケーからスマホまで、浸透するのにどれくらいの時間を要したか、メールから LINE にみんなが移行するまでにどれだけ時間がかかったか。
生成AI といえば、著作権やら倫理やら、検討の余地がたくさんある
ヨーロッパでは法的な規制が入っているところだと僕の中で記憶しています。
反対に生成 AI を肯定的に導入しようという国もあります。
- それは人間や人間の創造物を守ることになるのか
- 技術の進歩を止めることになるのか
そのあたりは全く僕には見えません。
「からあげにレモンをかけてはいけない」くらいわかりやすいものだと、使用する側(食べる側)も安心なのですが...
音楽生成の確率を知りたい
人間が聞き取ることができる音の周波数範囲は、通常 20 ヘルツから 20,000 ヘルツと言われています。
これは健康な成人の平均だそうです。
僕の耳はモスキート音を聞き取れないくらい耳が悪いので、高域範囲は聞こえませんが、かなりの音を拾うことができるようです。
しかし、楽器により表現できる音程は変わるものなので、今回はピアノの 88のキーにフォーカスして、生成できるパターンをもう少し絞ります。
不協和音もいれたり、複数のキーを同時に弾くケースを考慮すると、88 キーだけでもいろんな表現ができます。
更に、音楽は曲によって音の色も変動します(ハ長調やト長調など)。
上記のパターンより、かなりのパターンを生成できるわけなので、僕の中では、組み合わせが算出できなくなりました。
確率によっては、似ている音楽を生成するのでは
これは画像やイラスト生成でも同じことが言えるのかと思いますが、人間が作曲した場合も、同様に似ている曲ができあがりますよね、というケースはいくつかあると思います。
誰々の曲のパクリなのでは?みたいなケースです。
誰のどの曲が...は、ここに記載しませんが、みなさんもどこかで一度は聞いたことがあるのではないでしょうか?
今までの音楽の世界はこのような状況だったかと思います。
しかし、生成AI が音楽も詩も、声も生成できるようになって、それが世の中に出回ったら。
誰が何を作成したかわからない世界になっていしまい、著作権問題もどこに訴えてよいのかわからなくなってしまうのではないでしょうか?
僕も多少歌うので、「歌ってみた」を密かにやっているのですが、使用する音源など、ルールを守って投稿してます。
しかし、生成AI が歌い始めてしまったら、もう何もかも「わからん状態」になりそうです。
「声は個人情報」 というワードを今日、たまたま見かけて「そうだよな、勝手に学習されたら嫌だよな」と感じましたが、そのあたりはふんわりとわからなくなってしまうのでしょうか。
結局何が言いたいのか
生成AI 使ったらこんなの作成できたよ!! が今の段階で、これから生成物が増えるとして、当たり前のように SNS やネット上で見かけることになるでしょう。
そのときに「誰が作成したもの?」って、どこかで重要になる気がするのです。
からあげさんだから、からあげ帝国を築き上げたのであって(そう思っている)、AI だったらからあげ帝国を築き上げていないんじゃないかなという、僕なりの考えです。
もし、からあげさんがAI だったら、僕はこのアドベントカレンダーに参加することも、からあげ帝国に入国することもなかったでしょう。
今まで簡単にできなかったことができるようになり、自由を手に入れた反面、失われていく何かを僕は追求していきたいと思ってます。
最後に
Qiita でなく note に書くべき内容だったなと反省しております。
こちらは技術系がよかった...
からあげさん、今度関東へいらしたら、からあげ食べに行きましょう。