こんにちは。PS事業部のしゃるたんです。
最近は帰ったらドラクエ3のリメイク版を毎日やっています。小学生の時にファミコン版をやっている身としては感慨深い(-。-)y-゜゜゜ボスフエトル
さて、そんな前振りはさておき今回は画像生成にチャレンジしたいと思います。
試してみるサービスはGoogleの「ImageFx」となります。
ImageFx:https://aitestkitchen.withgoogle.com/ja
こちらはGoogle自動認証で簡単に登録できて、無料で使えるサービスとなります。
さっそく使っていきましょう(*^^)vガンバルゾ!
Googleの画像生成AIサービス、ImageFxの使い方
中央のImageFXより「IMAGEFXを開始ボタン」をクリックします。
画面左から2段目の「A macro photogfaph of a・・・」欄に作りたい画像イメージのテキストを入力します。
日本語でも作れますが、英語の方が確実です。
どのようなテキストを入力したら良いかのテクニックは後半に説明しますが、今回は試しに「1girl, smaile, short_hair, japanese, 25_years_old, night sky」と入力してみましょう。入力したら作成ボタンをクリックします。
お! 無事にできました(^^♪ヤッター
画像は4枚作られますが、作れない時はコンテンツが見つかりませんと表示されます。
次は要素を変更してみたいと思います。
ImageFxが認識している要素であれば変更できるので「Smaile」から「angry」に変えて再作成してみます。
ガチ切れのヤバめ画像ができました( ゚Д゚)ヤバッ
作った画像は、メニューのマイラブリーから閲覧できます。
画像のダウンロードや、右下の「カードをめくる」というボタンを押すと
先ほど入力したテキストを閲覧することができます。
生成AIの難しさは再現性がない点にありますので、同じテキストを入力しても同じ画像は生成されません。再現させるには、よほど細かく指定する必要があるかと思うのですが、テキストが長いとエラーになるので難しいですね。
欲しい画像を生成するコツ
さて、ここからは期待通りの画像を作るためのコツを紹介します。
・・といっても自己流の知ったかぶり情報なので、ご参考程度でお願いします。
私が考えるプロント作成術は下記4パターンとなります。
【①地力で作る】
単語をカンマでつなげていき、イメージ画像を作っていく
【②GPTで作る】
作りたい原文から「Dalle-3用の画像生成プロンプトを作って」と指示する
【③Geminiで作る】
作りたいイメージに近い画像を読み込ませて「この画像をつくるプロンプトを作って」と指示する
【④Civitaiからプロンプトをコピー】
作りたいイメージ画像をCivitaiから探してきて、プロンプトを参考にする
Civitai:https://civitai.com/
地力で作る
それでは、最初に【①地力で作る】をご紹介させて頂きます<m(__)m>
単語をカンマでつなげていき、イメージ画像を作っていく方法です。
■基本ポイント
・英単語で作成する
・カンマで区切る
・強調する (要素 :倍率)
変更前)1girl, short_hair,smaile
変更後)1girl, short_hair,(smaile:4.5)
※当社比4.5倍の笑顔に強調です
■プロンプト種別
ⅰ.画質
masterpiece (傑作)
best_quality(最高画質)
very_high_resolution(高画質)
※ImageFXで作成する場合は最高画質で固定されてるので指定不要
ⅱ.被写体
1girl, 2boy
smaile, (笑顔)
short_hair, (ショートヘア)
18_years_old,(18歳)
ⅲ.追加要素
looking at viewer, (カメラ目線)
ⅳ.背景
night sky, (夜空)
starry sky, (星空)
tokyo, (都会らしい景色)
outside, (屋外)
ⅴ.アスペクト比の指定
1:1 (正方形)
4:3 (従来の標準比率)
16:9 (ワイドスクリーン)
3:2 (デジタルカメラ標準)
2:1 (シネマスコープ)
9:16 (モバイル向け縦長動画)
※ImageFXで作成する場合は設定よりアスペクト比は指定できます
プロンプトは単語区切りにせず、文章でも作れますが、単語区切りの方が調整しやすいので、地力で作る時は単語区切りを採用しています。画像生成サービスは他にもたくさんあるのですが、日本語が上手く認識しないことが多い印象です。
それではさっそく実践です。基本は足したり減らしたりしていく感じです。
ステップ1の作りたい画像イメージを頭に思い描きながら進めていきますよ~。
ステップ1:作りたい画像イメージの文章を作成し、その文章から単語を抜き出し英語にする
<作りたい画像イメージ>
大都会のビルの屋上に近未来のロボットが着陸。ロボットは恐竜型で残虐性と凶暴性を兼ね揃えたティラノサウルスである。
メカ●ジラが暴れている感じですかね(・ω・)ナゼ?
それでは最初の作業は、文章から単語を抜き出し、英語に翻訳してみましょう。
metropolis (大都会)
building (ビル)
rooftop (屋上)
near future (近未来)
robot (ロボット)
landing/landed (着陸)
robot (ロボット)
dinosaur type (恐竜型)
cruelty (残虐性)
ferocity (凶暴性)
equipped with (兼ね揃えた)
Tyrannosaurus (ティラノサウルス)
ステップ2:英単語をカンマでつなげていく
そして英単語をカンマ区切りでつなげてみます。robotが重複したので1つだけにします。
<結合した英単語>
metropolis,building,rooftop,near future,robot,landing/landed,dinosaur type,cruelty,ferocity,equipped with,Tyrannosaurus
ステップ3:プロンプトにセットして画像生成する
それではこちらの内容をプロンプトにセットして画像生成です!!
単語をつなげただけだけど、初回としては良い感じです(#^^#)ヨキ♪
ステップ4:不要な単語、必要な単語を考え、調整を繰り返していく
さて、ここからが調整です。
構図として「ビルの屋上」と「着陸」は不要そうなので削除します。
そもそもティラノサウルスが屋上にいる時点で画角がよく分からん( ;∀;)
あとは「夜」にロボットが「光っている」方がいい絵になりそうです。
ついでに人々が驚き、逃げている情景も追加してみましょうかね。
削除:landing/landed (着陸)、building (ビル)、rooftop (屋上)
追加:night(夜)、Shine(光る)、People(人々)、shocked(驚く)、running away(逃げる)
<変更後のプロンプト>
metropolis,near future,robot,dinosaur type,cruelty,ferocity,equipped with,Tyrannosaurus,night,Shine,People,shocked,running away
さっきよりも良い感じです。
やはり近未来は夜の方が良いですね。ここから更に調整です。
実はブログ書く前に実験した時には、ここで小さい恐竜ロボットが入り込んできたので、1robotに変更して一匹を強調したのですが今回は現れず。でもせっかくなので編集します。また、ロボット感をアピールしたいので強力な武器を実装してみます。
変更:robot➡1robot
追加:Railgun cannon(レールガン砲)
<変更後のプロンプト>
metropolis,near future,1robot,Grenade Launcher,Railgun cannon,dinosaur type,cruelty,ferocity,equipped with,Tyrannosaurus,night,Shine,People,shocked,running away
う~ん、何だろ・・・微妙や(・ω・)
ロボットがダサいのかな。メカに変更するか。
あとは攻撃している絵が欲しいな。攻撃はFireでいいのかな?(/・ω・)/??
それと恐竜をもう少し大きくしてみよう!!
変更:1robot➡1Mecha
追加:big(大きい)、Big Mouth(大きい口)、Fire(ファイアー)、Fear(恐怖)
<変更後のプロンプト>
metropolis,near future,1Mecha,big,Railgun cannon,Fire,dinosaur type,Big Mouth,Fear,cruelty,ferocity,equipped with,Tyrannosaurus,night,Shine,People,shocked,running away
個人的には右上の画像は好きだけど恐竜メカではなく、謎のメカが主となってしまいました。bigが余計だったか。
若干、着地点を見失ってしまった感はありますが、こんな感じで単語を追加・削除していくだけで簡単にイメージした画像に近づけていくことができます。
ちなみに当初イメージのビルの屋上にいる恐竜はこんな感じです('ω')ノ
本日はだいぶ長文となってしまったので、画像生成の続きは次回にしたいと思います。
それでは~ ('ω')ノフリフリ
この記事を書いた人
【ニックネーム】しゃるたん
【経歴】入社23年目です。最初の10年は大手証券会社の約定報告システムの開発・保守を担当しました。その後、別の大手証券会社で9年ほどシステム部門で社員代替として、ユーザー部門からの相談に乗ってシステム起案したり、ベンダーとの橋渡しを行いました。単にユーザー要求をベンダーへ依頼するということではなく、ユーザー・ベンダーそれぞれとって最適で価値のあるシステムを一緒に考えて提案することが大変でした。
証券業務に約19年間従事した後、開発本部長として自社の開発部門を3年間取り仕切りました。直近では自社サービスの開発に係る業務や、開発の新機軸を探るための検討を行っています。
【得意な言語】VBA、C
【趣味】ゲーム、漫画
【一言】モンハンの新作とドラクエ3のリメイクが楽しみです(≧▼≦)ワッフ-イ