芸大 - 人工知能と創作 2024
ChatGPTへ至る30年の歴史、画像生成AI導入
本日の内容
- 「ChatGPTに至る30年の歴史」ChatGPT: 30 Year History | How AI Learned to Talk 映像視聴
- 画像生成AI導入
- まずは、いろいろなサービスに登録して使ってみる!
ChatGPTに至る30年の歴史
ChatGPT: 30 Year History | How AI Learned to Talk
動画の要旨
- チャットGPTの登場: チャットGPTは一般人が会話できる最初のプログラムで、チューリングテストを打ち破った。
- 言語の複雑さ: 以前、多くの言語学者はコンピューターが人間の言語を理解することは不可能だと考えていたが、今はその多くが考えを改めている。
- 教師あり学習の説明: 過去のニューラルネットワーク研究は、固定された目標に対して一つのタスクを学習するものであったが、汎用的なシステムへの道筋は見えていなかった。
- 順序学習の初期研究: 1986年、ジョーダンは再帰型ニューラルネットワーク(RNN)を使ってシンボルの順序を予測させる実験を行い、ネットワークに記憶の概念を導入した。
- エルマンの研究: ジェフリー・エルマンは、言語における単語の境界をニューラルネットワークが自動的に学習することを発見した。
- Transformerの導入: 2017年、言語翻訳の問題に対応するためにTransformerアーキテクチャが開発され、これが現在の大規模言語モデル(LLM)の基盤となった。
- GPTシリーズの進化:
- GPT-1: Transformerアーキテクチャを使用し、次の単語予測問題に適用。
- GPT-2: ウェブから収集したデータを使用し、さらに大規模なネットワークで優れた言語生成を実現。
- GPT-3: 1750億のパラメーターを持つネットワークで、ゼロショット学習などの新しい機能を発揮。
- 哲学的な議論: AIが本当に「思考」しているのか、それとも思考をシミュレートしているだけなのかについて、研究者間で議論が続いている。
さらにGPTの構造を深く知りたい人のために…
GPTとは何か Transformerの視覚化 | Chapter 5, Deep Learning
参考: ChatGPTを活用してYouTube動画の内容を要約する
- ChatGPTでYoutubeの要約をする方法とプロンプトをわかりやすく解説!
- 「ChatGPT: 30 Year History」を要約した際のChatGPTプロンプト
画像生成AIを試してみる!
現在、様々な画像生成AIが公開されている。今回は以下の画像生成AIサービスを試してみましょう。(参考)
- Imagen 3 in ImageFX
- Midjourney
- Adobe Firefly
- Microsoft Designer’s Image Creator
- OpenAI’s DALL-E 3
- Leonardo AI
- Craiyon
- Stability AI’s DreamStudio
- Wombo Dream
- Generative AI by Getty Images
Imagen 3 in ImageFX
現状では総合的にベストなAI画像ジェネレーター
長所
- 使いやすい
- 高品質な結果
- プロンプトごとに4つの画像
短所
- Googleアカウントが必要
- 画像は1:1比率のみ
Midjourney
高品質の画像のためのAI画像ジェネレーター
長所
- 非常に高品質な出力
- 失敗出力が少ない
- Discordコミュニティオプション
短所
- 有料 (月10ドル〜)
Adobe Firefly
参考写真がある場合に最適なAI画像ジェネレーター
長所
- 構造とスタイルのリファレンス
- 商業用にも安全
- 無料 (Adobeアカウントがあれば)
短所
- Adobeアカウントが必要
- 月間生成クレジット限度額があり
Microsoft Designer’s Image Creator
DALL-E 3にアクセスするための最適なAI画像ジェネレーター
長所
- DALL-E 3を搭載
- 素早い
- アクセスが便利
短所
- Microsoftアカウントが必要
- DALL-Eより少し時間がかかる
OpenAI’s DALL-E 3
オリジナルを体験したいなら最高のAI画像ジェネレーター
長所
- OpenAIモデル
- 著作権なし
- 正確な描写
短所
- 世代制限
- プロンプトごとに1つの画像出力
Leonardo AI
著作権のあるキャラクターのために最適なAI画像ジェネレーター
長所
- 制限が少ない
- 豊富なカスタマイズオプション
- 直感的なUI
短所
- 有料コンテンツが多数
- 他の多くのサービスと同様
Craiyon
シンプルなAI画像ジェネレーター
長所
- 無料
- 無制限アクセス
- 9つの画像出力
短所
- 待ち時間が長くなる
- 一貫性のない画像
Stability AI’s DreamStudio
カスタマイズに最適な AI 画像ジェネレーター
長所
- 特定の指示を受け入れる
- オープンソース
- カスタマイズのための追加エントリ
短所
- 有料クレジット
- アカウントを作成する必要あり
Wombo Dream
モバイル環境に最適なAI画像ジェネレーター
長所
- モバイルアプリ
- 自分の画像をリミックスする
- 複数のテンプレート
短所
- プロンプトごとに1つの画像
- フルアクセスのサブスクリプション料金
Generative AI by Getty Images
商用利用に最適な AI 画像ジェネレーター
長所
- 商業的に安全
- 貢献者報酬プログラム
- パーソナライズされたストック写真
短所
- 価格が明確でない
- 個人向けではない
まずはいろいろ試してみる!
- 画像生成AIをいろいろ試してみましょう!
- サービス、画像生成モデルによって個性がある
- 個人的なお勧め
- Imagen 3 in ImageFX (Googleアカウントがあれば)
- Microsoft Designer’s Image Creator (Microsoftアカウントがあれば)
- OpenAI’s DALL-E 3
実習、次回までの課題
課題: 画像生成AIで自画像を作成
- いくつかの画像生成AIを試してみる
- 気にいったサービスを1つ選択
- 自分自身の自画像を生成してみる
- 写実的、イラスト調、油彩調などスタイルは自由
- 自分に似せるにはどのようなプロンンプト(指示)が良いか?
- 次回、一番似ている人は誰かコンテスト
アンケート
本日の講義に参加した方は以下のアンケートに回答してください。