yoppa.org


生成動画「幻覚 – バッド・トリップ」講評 / AIと音楽制作

本日の内容

本日は、まず生成動画「幻覚 – バッド・トリップ」の講評を行います。次に本日はAIを活用した音楽制作について解説していきます。まず始めに生成AIを用いた音楽創作のための技術について、様々な実例や作品を紹介します。最後に実習としてSuno AIを用いてAIによる音楽生成に挑戦します。

スライド資料

生成動画「幻覚 – バッド・トリップ」講評

今回も提出用のオンラインフォームを作成しました!
以下のリンクからアクセスしてください。

https://x.gd/xFivJ

  • 生成した動画ファイルをアップロードしてください (最大5個)
  • 動画ファイル名は「学籍番号_名前_番号.拡張子」の形式で保存してください
  • (例: 12345678_tadokoro_01.mov)

AIと音楽制作

生成AIによる音楽の創作

徳井直生 – AI DJ Project (2016)

徳井直生 – AI DJ Projectは、人工知能(AI)と人間のDJが交互に曲をかけ合う「バック・トゥ・バック」形式のライブパフォーマンス。AIはディープラーニング技術を活用し、曲の選択やミックスを行う。このプロジェクトは、AIと人間の対話を通じて新たな音楽的創造性を探求する試みであり、国内外で注目を集めている。

Holly Herndon & Jlin (feat. Spawn) – Godmother (2018)

2018年に発表された「Godmother」は、Holly HerndonとJlinが共同制作し、AI「Spawn」を活用した楽曲である。Spawnは、Herndonと彼女のパートナーであるMat Dryhurstが開発した人工知能であり、Jlinの音楽スタイルを学習し、Herndonの声で再現することを試みた。このプロジェクトは、AIが人間の創造性とどのように共存し、新たな音楽表現を生み出せるかを探求する試みとして注目された。

参考:

Brien Eno – Reflextion

ブライアン・イーノのアルブライアン・イーノ(Brian Eno)が『Reflection』で行う自己省察
バム『Reflection』は、ジェネラティブ・ミュージックの手法を用いて制作された。彼は複数のサウンドやフレーズを集め、それらに特定のルールを設定し、システムを作動させることで、常に異なる音楽を生成することを目指した。このプロセスは、AIの自動生成的なアプローチと類似しており、イーノは自身の役割を作曲家からプログラマーや観察者へと変化させ、音楽の生成過程を楽しんだ。

参考: ブライアン・イーノ(Brian Eno)が『Reflection』で行う自己省察

The Beatles – Now And Then (2023)

The Beatles – Now And Thenは、ジョン・レノンが1970年代後半に自宅で録音したデモテープを基に、AI技術を活用して完成された楽曲である。当時の技術では、ピアノとボーカルの分離が困難であったが、最新のAIを用いることで、レノンの声をクリアに抽出することが可能となった。これにより、ポール・マッカートニーとリンゴ・スターが新たな演奏を加え、ビートルズの最後の楽曲として2023年にリリースされた。

参考: ビートルズ最後の新曲「Now and Then」はどうやって作られたのか

その他の事例

参考: AIと音楽制作:現段階の状況

AI技術が音楽制作に与える影響を分析している。AIはステムの分離やボーカルのディープフェイクなど、従来の制作ツールに新たな可能性をもたらしている。しかし、音楽制作におけるAIの活用は、創造性や所有権、信頼性に関する議論を引き起こしている。記事は、AIが人間の創造性を脅かすのか、それとも増大させるのかを探求し、音楽制作の未来を見据えている。

音楽生成ツールとしての生成AI

Google + Deep Mind – NSynth Super (2017)

NSynth Superは、GoogleのMagentaプロジェクトとDeepMindが共同開発したシンセサイザーである。このシンセサイザーは、機械学習アルゴリズム「NSynth」を活用し、既存の楽器音を組み合わせて新たな音色を生成することが可能である。NSynthは、WaveNetスタイルのオートエンコーダーを使用し、約30万の楽器音データセットから学習を行う。NSynth Superは、タッチスクリーンを備えたハードウェアインターフェースを持ち、ユーザーは4つの異なる音源を選択し、それらを組み合わせて新しい音色を直感的に作成できる。このプロジェクトは、オープンソースとしてGitHub上で公開されており、誰でも自作可能である。NSynth Superの登場により、AIを活用した音楽制作の新たな可能性が広がり、アーティストやクリエイターに革新的なツールを提供している。

Neutone (Qosmo, 徳井直生) – Neutone Morpho (2024)

Neutone Morphoは、株式会社Neutoneが開発した機械学習ベースのオーディオプラグインである。このプラグインは、入力された音を別の音に瞬時に変換する新しいタイプのエフェクターであり、例えば、声をバイオリンやジャンベの音にリアルタイムで変換することが可能である。Neutone Morphoは、AI技術を活用して音楽制作に革新をもたらし、アーティストやクリエイターの創造性を拡張することを目指している。このプラグインの開発は、AIと音楽の融合を推進する株式会社Qosmoの代表であり、Neutoneの設立者でもある徳井直生氏が主導している。Neutone Morphoのリリースにより、音楽制作の現場でAIを活用した新たな表現手法が広がり、音楽業界におけるAIの可能性を示す重要なステップとなっている。

Jacob Collier + Google, MusicFX DJ | Google Lab Sessions (2024)

2024年、グラミー賞受賞アーティストのジェイコブ・コリアーは、Google DeepMindおよびGoogle Labsと協力し、AI音楽生成ツール「MusicFX DJ」の開発に携わった。このツールは、ユーザーが楽器、ジャンル、感情などのプロンプトを組み合わせることで、リアルタイムに音楽を生成し、AIを活用した即興演奏を可能にする。コリアーは、直感的な操作性と創造性を重視し、初心者からプロまで幅広いユーザーが利用できるよう設計に貢献した。また、生成された音楽は他者と共有・リミックス可能で、共同制作の新たな形を提案している。

音楽生成AIを使ってみる!

Google MusicFX DJ

Googleの「MusicFX DJ」は、AIを活用した音楽生成ツールである。ユーザーはテキストでジャンルや楽器、雰囲気などを指定することで、リアルタイムに音楽を生成・操作できる。直感的なインターフェースにより、音楽制作の専門知識がなくても、誰でも簡単にオリジナルの楽曲を作成可能である。また、生成した音楽はダウンロードや共有が可能であり、創造的なコラボレーションを促進する。

Suno AI

Suno AIは、テキスト入力に基づき音楽を自動生成するAIツールである。ユーザーが入力した歌詞や曲のイメージに応じて、ボーカルや楽器、バックトラックを含む楽曲を作成することが可能である。日本語にも対応しており、日本語の歌詞を用いた楽曲制作も容易である。無料プランでは1日最大10曲の生成が可能で、商用利用を希望する場合は有料プランへの加入が必要である。2024年5月のアップデートにより、最大4分の楽曲生成が可能となり、機能が大幅に向上した。ただし、著作権に関する問題も指摘されており、商用利用時には注意が必要である。

Suno AIを活用して音楽を生成する際の主な方法

  • テキストプロンプトの入力:楽曲のテーマや雰囲気をテキストで指定し、AIに楽曲を生成させる。
  • 歌詞の入力:ユーザーが作成した歌詞を入力し、それに基づいてメロディや伴奏を生成する。
  • ジャンルの選択:ポップ、ジャズ、クラシックなど、希望する音楽ジャンルを選択して、特定のスタイルの楽曲を生成する。
  • カスタムモードの活用:テンポ、楽器構成、ボーカルスタイル、楽曲の長さなど、詳細な設定を行い、より個別化された楽曲を作成する。
  • インストゥルメンタルの生成:ボーカルなしの楽曲を生成するために、インストゥルメンタルオプションを選択する。
  • 楽曲の延長:生成された楽曲をさらに延長し、より長い楽曲を作成する。

参考: Neutone Morpho

Neutone Morphoは、最先端の機械学習技術を活用したリアルタイムのトーンモーフィングプラグインである。入力された音声を異なる音色やスタイルに変換し、新たなサウンドを創出することが可能である。例えば、ユーザーの声をバイオリンの音色に変換したり、日常の物音をドラムセットの音に変換することができる。このプラグインは、事前にトレーニングされたAIモデルを使用し、入力されたオーディオをリアルタイムで変換する。無料版では4種類のモデルが利用可能であり、有料版では追加のモデルやカスタムモデルの作成も可能である。 Neutone Morphoは、Mac(Apple Siliconネイティブサポート)およびWindowsで動作し、AU/VST3形式に対応している。ユーザーは、DAW上でリアルタイムに音声を変換し、創造的な音楽制作を行うことができる。

Neutone Morphoの主な機能

  • リアルタイムのトーンモーフィング:入力された音声をリアルタイムで異なる音色やスタイルに変換する。
  • 多様なAIモデルの利用:事前にトレーニングされたモデルを使用し、ドラム、声、コーラス、バイオリン、エフェクトなど多彩なサウンドに変換可能。
  • カスタムモデルの作成:独自の音声データを用いて、ユーザー専用のAIモデルをトレーニングし、オリジナルのサウンドを生成できる。
  • マクロおよびマイクロビューの操作:マクロビューでは4つのノブでモデルの一般的な動作を調整し、マイクロビューでは詳細なパラメータを微調整可能。
  • プリ/ポストプロセッシング機能:ピッチシフト、フィードバックディレイ、コンプレッサー、ノイズゲート、リミッターなどのDSP機能を搭載し、最適な音質を実現。

実習: 生成AI映像に音楽をつける

  • 前回作成した生成動画「幻覚 – バッド・トリップ」の映像に音楽をつけてみる
  • まずは映像にあわせた音楽の生成に挑戦
  • もし可能な人は、映像編集アプリで映像に音を入れてみる
    • Davinch Resolve
    • Adobe Premir
    • Apple Final Cut Pro
      … など

アンケート

本日の講義に参加した方は以下のアンケートに回答してください。

https://x.gd/Ta35P


p5.jsで画像データを扱う – 画像の分析・再合成

p5.jsのp5.Imageクラスは、外部のビットマップ画像(Jpeg, GIF、PNGなど)をデータとしてプログラムに読み込むことができます。読み込んだ画像は単に画面に表示するだけでなく、色や明度やサイズを変更して表示することができます。さらには、画像に含まれる全てのピクセルの色情報を読み取り配列に格納することが可能です。そのデータをもとに別の画像を再生成することが可能となり、読み込んだ画像データの色情報をもとにした多彩な表現が可能となります。

今回はp5.jsに画像を読み込んで、分析再合成することで、様々な表現の可能性について探っていきます。

映像資料

スライド資料

サンプルプログラム

応用

本日の課題!

課題: p5.jsに読み込んだ画像ファイルのデータで表現する!

  • p5.jsに読み込んだ画像ファイルの情報から、新たなイメージを生成する
  • 読み込む画像は自由です
  • 作品は、OpenProcessingに投稿
  • 完成した作品に、タイトルをつける
  • 投稿したURLをアンケートから提出
  • 投稿の際にsfc241115のタグをつけてください!
  • 締切: 2023年11月29日(水)まで! (次回は三田祭休みのため再来週)

アンケートフォーム

  • 今回も、前回の提出作品の人気投票を行います!
  • 前回のタグsfc241108でOpenProcessingで検索 (検索方法をSketches that are tagged にする必用あり)
  • 一番良いと思った作品に1票投票 (自信があれば自分の作品でも可)

TouchDesigner中級編(2) – オーディオリアクティブ表現 (1)

TouchDesigner入門(4) – 音楽に連動させよう! の回では、音楽の音量に反応させて図形を描く基本を学習しました。今回から数回は、このテクニックをさらに応用して、音の様々なパラメータを解析したビジュアル表現について探求していきます。まず初回の今回は、音量による反応をより詳細に取り上げていきます。

今回の内容は、比嘉了さんによる東京藝術大学での講義「映像音響処理概説 2019」の「第11回: 音反応」を参考にしています。

参考映像

[triggering2018] Live performance for new 3 tracks (demo ver.)
Alva Noto – unitxt/univrs (Derivative Version)
[CHANNEL13] Daisuke Tanabe x HEXPIXELS

スライド資料

サンプルファイル

本日の課題

今回の講義資料およびサンプルプログラムを参考にして、音に反応して変化するグラフィック表現をTouchDesignerで行ってください。

課題提出 + アンケート

本日の課題の提出は下記から行ってください。


動画生成AIを使ってみる

本日は、生成AIを利用した動画生成に挑戦します。まず始めに現状の動画生成AIの状況について解説します。その上で現在利用可能な様々な動画生成のサービスとその特徴を紹介し、実際に動画生成を体験してみます。最後に参考として無料で利用可能な動画編集アプリケーションを紹介します。

スライド資料

本日の内容

  • 生成AIによる動画の生成に挑戦
  • 様々な動画生成AIサービスを紹介
  • 実際に使用してみる
  • フリーの動画編集アプリの紹介

生成AIによる動画の生成に挑戦

現状での動画生成AIの注意点

  • 画像生成AIと同様、様々なサービスが公開されている
  • しかしながら、フリーで制限無く利用できるサービスは少ない印象
  • 日々進化しているので、今回の情報も来年には古くなっている可能性大

数年前までのAIによる動画生成状況

Deep Dream by Google (2015)

Memo Akten, Journey through the layers of the mind (2015)

Neural style transfer

Memo Akten, Learning to see: Gloomy Sunday (2017)

Sora AI の衝撃!

  • Sora AI: OpenAIが開発した動画生成AIモデル、2024年2月発表
  • テキストプロンプトから高品質な動画を生成
  • ディフュージョンモデルを活用し、連続性と詳細な映像を実現
  • 一般公開は未定で、現在はクリエイターや映画製作者と協力し、フィードバックを収集中

Sora AIのデモ動画

Playlist – Sora by Open AI

プレイリストからいくつか抜粋

air head · Made by shy kids with Sora
Tammy Lovin · Sora Showcase
Niceaunties · Sora Showcase

別の動画生成AI (Runway ML) による短編映画

Battalion – My First Ever 5 Minute Gen AI Short Film

主要な動画生成サービス

参考: (まだ一般には非公開)

Dream Machine by Luma AI

Luma AIの「Dream Machine」は、テキストや画像から高品質な動画を生成するAIツール。ユーザーはプロンプトを入力するだけで、最大5秒間のリアルな動画を簡単に作成可能。無料プランでは月30回の動画生成が可能で、商用利用には有料プランへの登録が必要。

Gen-3 Alpha by Runway

Runwayの「Gen-3 Alpha」は、テキストや画像から高品質な動画を生成するAIツールである。ユーザーはプロンプトを入力するだけで、最大10秒間のリアルな動画を簡単に作成可能だ。無料プランでは利用できず、有料プランへの登録が必要である。

Pika 1.5 by Pika Labs

Pikaは、AIを活用した動画生成プラットフォームである。ユーザーはテキストや画像を入力することで、短い動画を自動的に作成できる。特に、3Dアニメーションやカートゥーンスタイルの動画生成と編集が可能で、直感的なユーザーインターフェースを備えている。また、Discord上で動作し、無料で利用可能である。

Kling Video 1.5 by Kling AI

Kling Videoは、中国の動画共有プラットフォーム「快手(Kuaishou)」が開発した動画生成AIツールである。ユーザーはテキストや画像を入力することで、最大10秒間の高品質な動画を生成可能だ。解像度は1080p、フレームレートは30fpsに対応し、物理法則の理解や複雑な動作の正確なモデリングに優れている。また、メールアドレスでの登録により、世界中のユーザーが利用できるようになった。

ノードベースで動画生成できるツールも

Comfy UI

その他にもいろいろなサービスが!

参考: The 9 best AI video generators in 2024

  • Runway for generative AI video
  • Descript for editing video by editing the script
  • Wondershare Filmora for polishing video with AI tools
  • Capsule for simplifying video production workflows with AI
  • Fliki for social media videos
  • Peech for content marketing teams
  • Synthesia for using digital avatars
  • Vyond for animated character videos from a prompt
  • Visla for turning a script into a video

実習: 動画生成AIを使ってみる

どの動画生成AIを使うか?

無料で使用したい!

Luma AI Dream Machineがおススメ

  • プロンプトから生成
  • 画像をアップロードして続きの動画を生成
  • 生成した動画の結果から、さらに次の動画を生成
  • いろいろ試してみましょう!

より本格的に動画生成を行いたい

Runway MLがおススメ

  • プロンプトから生成
  • 画像をアップロードして続きの動画を生成
  • カメラワークなどを細かく指定
  • 無料で試せる回数はごく僅か (クレジット制)

参考: Runwayによる動画生成のテクニック


Masterclass: AI film Directing in Runway Gen 3 – Create Stunning Cinematic Shots!

参考: フリーの動画編集アプリの紹介

生成した動画素材をどうやって編集するか?

しかし無料でとても高機能の動画編集アプリもあります

DaVinci Resolve

  • フリーで利用可能な動画編集アプリ
  • Ultra HD 4K (3840×2160) までの解像度に対志
  • 高度なカラーグレーディング機能

次回までの課題

制作課題:「幻覚 – バッド・トリップ」

課題:

現代の生成AI技術がもたらす映像生成の可能性を探りながら、「幻覚 – バッド・トリップ」というテーマを動画で表現してください。不安や混乱、非現実的な体験をもたらすような映像作品を制作してください。視覚的な歪みや感覚の揺らぎといった要素を取り入れ、現実と幻覚の境界が曖昧になるような演出を試みてください。

  • 映像の長さ: 5秒〜1分程度
  • 動画生成AIを使用した映像を素材にすること
  • 生成した動画を素材にして映像編集アプリで編集しても良い
  • 次回の演習で提出と発表をしていただきます!

アンケート

本日の講義に参加した方は以下のアンケートに回答してください。

アンケート


TidalCycles導入 – インストール

この演習の後半はより本格的なライブコーディングのパフォーマンスを実践します。そのために、これまで使ってきたStrudelからステップアップしてTidalCyclesというより本格的なライブコーディングの環境を使用していきます。

TidalCyclesのインストール方法はOS (Windows / Mac) によって微妙に異なります。自身が使用しているOSにあわせて以下のリンクを参照してインストールを進めてください。

インストールには非常に時間がかかります。また安定したネット接続が必要です。ネット環境が整備されている場所でじっくりと作業していきましょう。

アンケート

本日の講義を履修した方は以下のアンケートに回答してください。

※ 旧カリ「サウンドプログラミング」「環境情報デザイン」で履修の方はこちら


TouchDesigner中級編(1) – インスタンシングとカメラワーク

前回までの内容で、SOPとGeometry COMPを用いることで3Dオブジェクトをレンダリングすることができるようになりました。このやり方で複数のSOPをレンダリングすることも可能ですが、大量のオブジェクトを配置するとすぐにPCの描画性能の限界になってしまいます。

TouchDesingerの描画に使用されているOpenGLでは、ジオメトリーのコピー (インスタンス) を大量に生成してGPUで処理することが可能です。そうすることで、大量の3Dオブジェクトを一度に描画することが可能となります。この手法を「インスタンシング (ジオメトリーインスタンシング)」と呼んでいます。インスタンシングによって大量の3D形状の全体的な動きや色をコントロールして量感のある表現が可能となります。TouchDesignerの表現力を高める重要な手法となりますので、しっかりと理解していきましょう!

映像教材

【TouchDesigner初中級講座】 インスタンシングとカメラワーク #09

サンプルファイル

スライド教材

本日の課題

今日つくったプログラムを改造して以下のようなプログラムを作成してみましょう!

  • インスタンスの形状を変えてみる (円、立方体、グリッド、トーラス…)
  • 頂点情報を抽出している形状を変形させてみる
    • 立体の形状を変更
    • 立体を変形 (スケール、ノイズ)

自分なりに工夫して、美しい形状を作ってみましょう!

課題提出とアンケート

作成した課題は以下のオンラインフォームから提出してください。