New model alert! Check out Pika 2.0, and rule reality with Scene Ingredients.
画像生成AIサービスの「Midjourney」に3月12日、新機能「Creative Reference」が追加。1枚の画像から特徴を引き継いだ画像を生成できるようになり、同じキャラクターに別のポーズをとらせるなど様々な画像を作れるようになりました。これまで画像生成AI「Stable Diffusion」などで同じキャラクターの画像を作るには「LoRA」という追加学習をするのが一般的でしたが、それが必要ないため、キャラクターの再現が劇的に簡単になってきました。 画像1枚で“似た顔” Midjourneyの新機能「Creative Reference」 使い方は、MidjourneyのDiscordに画像をアップロードして、「Creative reference」のタグ(cref)をつけてプロンプトを入力するだけ。CW 0〜100までのパラメーターがあり、0だと顔だけが共通になり、あとは数字
やなぎや・とものり/1972年12月生まれ。1998年からITライターとして活動しており、ガジェットからエンタープライズ向けのプロダクトまで幅広い領域で執筆する。2018年から、NPO法人デジタルリテラシー向上機構(DLIS)を設立し、ネット詐欺の被害をなくすために活動している。 https://prof.yanagiya.biz/ https://peraichi.com/landing_pages/view/dlis/ 仕事を256倍速くするツールを探せ! ITの世界は日進月歩。一昔前ならとても無理だったことや、人間がやらなくてはならなかったことをどんどんコンピュータに任せられるようになっています。連載「仕事を256倍速くするツールを探せ!」では、最近出てきたサービスの中から、特にビジネスや勉強に役立つサービスやソフトウエア、ハードウエアをピックアップ。ライターが実際に使用し、使い方や
画像生成AI「Midjourney」の開発チームが、2023年3月16日(木)に「Midjourney V5」のアルファ版をリリースしました。「Midjourney V5」では超高画質な画像生成が可能となっているだけでなく、画像生成AIの課題であった「『手』を正確に描写できない問題」が解決されたという報告も寄せられています。 Starting today our community can test Midjourney V5. It has much higher image quality, more diverse outputs, wider stylistic range, support for seamless textures, wider aspect ratios, better image prompting, wider dynamic range and more
こちらの記事は2023年3月9日に投稿された旧バージョンです。特段の理由がなければ、最新事情を盛り込んだ「AIイラストが理解る!StableDiffusion超入門」をご覧ください。 こんばんは、スタジオ真榊です。このところ、ツイッター経由で公式サイトやこちらのFANBOXへのアクセスが急増しており、これからAIイラストを始め...
人工知能(AI)は、ウェブサイト制作を、根本から変えてしまうでしょう。 今のところ、AI画像生成ツールは、呪文(プロンプト)を唱える、ちょっとしたコツを覚えることで、以下のようなWebレイアウトを作成できます。 beautiful landing for spiderman website, design, ux/ui, ux, ui --ar 3:2 --v 4 --q 2 「花屋、フラワーショップ」をテーマにすると、一発でWebサイト向けレイアウトを錬成できます。 「日本」をテーマにすると、こんな美しいUIデザインに。 実際にAI画像生成ツールを使いこむうちに、少しずつわかってきた、AIツールでウェブサイトやUIデザイン画像を生成するコツを、メモ的にご紹介。 アップデート、継続していきます。 コンテンツ目次 ✨ AI画像生成ツールとは? ✨ 唱える呪文(プロンプト)って何? ✨ 画像を
近年、Stable DiffusionやMidjourneyなどの画像生成AIの開発が急速に進んでおり、誰でも手軽にAIによるコンテンツ生成を実行できる環境が整いつつあります。そんな中、中国政府が画像やムービーを生成できるAIについて「ユーザーの実名登録」や「AIによって生成された旨の表示」を義務付ける規則を発表しました。 国家互联网信息办公室等三部门发布《互联网信息服务深度合成管理规定》-中共中央网络安全和信息化委员会办公室 http://www.cac.gov.cn/2022-12/11/c_1672221949318230.htm China bans deepfakes created without permission or for evil • The Register https://www.theregister.com/2022/12/12/china_deep_syn
写真に写り込んだ不要な被写体や、画像の中に含まれる邪魔な文字など、画像の一部を消したい状況は多く発生します。画像の中の不要な部分をキレイに削除できる無料ツール「Lama Cleaner」を見つけたので、PCへの導入方法や使い方をまとめてみました。 GitHub - Sanster/lama-cleaner: Image inpainting tool powered by SOTA AI Model https://github.com/Sanster/lama-cleaner Lama CleanerはPython向けのパッケージ管理システム「pip」を用いてインストールすることもできますが、今回はPythonなどの準備が整っていないPCでも一発で「Lama Cleaner」をインストールできる「Lama Cleaner One Click Installer」を使ってPCにインストール
画像生成AIのStable Diffusionは、ノイズを除去することで画像を生成する「潜在拡散モデル」で、オープンソースで開発されて2022年8月に一般公開されたため、学習用のデータセットを変えることで特定の画像を生成するのに特化したフォークモデルが多数存在します。そんなStable Diffusionから派生して生まれた特化型モデルとその特徴や生成例をまとめてみました。 Stable Diffusion Models https://rentry.org/sdmodels 実際に複数のモデルとシード値で、同一のプロンプト・ステップ数・CFGスケールで画像を生成した結果をまとめてみました。 モデルは左からStable Diffusion v1.4、Waifu-Diffusion v1.2、Trinart Stable Diffusion、Hentai Diffusion、Zack3D_K
その日、私はなんとなく思い付きでそのキーワードを入れた指示文をMidjourneyに与えました。 Three Kingdoms, Warlords, 3D, 12K, octane render, cinematic lighting, Photorealism --testp Discordで見かけるMidjourneyの絵柄はヨーロッパの神話のキャラクターやアニメやゲームのキャラクターが多く、自分で書いた小説の挿絵にしたがる人が多かったりするのでファンタジー的な要素の多い絵をたくさん見かけます。その分アジア的な絵柄はあるようでない。 日本的な絵柄は「anime」や「kawaii」という要素ならば有効ですが伝統的な日本の絵柄はなかなか難しい。「北斎」と入れても出てくるのは波ばかりでそれ以外の絵柄を描かせることは不可能に近い。黒人の絵もうまく描けているのに。アジアは難しいのだろうか。ならば
大ウケした「Midjourney」と炎上した「mimic」の大きな違い “イラスト生成AI”はどこに向かう?:小寺信良のIT大作戦(1/2 ページ) 8月9日に本連載で公開した「AIが描いた絵の著作権は、誰が持つのか Midjourney画像の扱いを考える」というエントリーは、著作権の観点でAI生成画像を扱った記事が少なかったこともあり、当時かなりよく読まれた。ところが最近また別の視点で、読まれるようになっている。AIが学習する画像に対する著作権の位置付けも、この記事の中で扱っていたからである。 その点だけかいつまんで紹介すると、日本の著作権法では2018年の改正で柔軟な権利制限規定として、AIに学習させるソースとしては著作権が制限される、すなわち権利者の許諾がなくても自由に使える事になっている。 ただ当時の利用イメージとしては、自動運転が念頭にあったのではないかとも思う。つまりインプット
画像生成AI「Stable Diffusion」は入力したキーワードに沿って画像を出力してくれるAIで、簡単なお絵かきとキーワードを合わせて意図した画像を生成したり、「この画像っぽい○○」といった指示でイメージを形にできたりと、さまざまな機能や手法が生み出されています。そんなStable Diffusionについて、「画像を学習するAIは、ウェブ上のどのような画像を学習しているのか?」という疑問を解明するために、23億枚のデータセットから1200万枚を抜粋して集計した調査結果を、技術者・ブロガーのアンディ・バイオ氏が公開しています。 Exploring 12 Million of the 2.3 Billion Images Used to Train Stable Diffusion's Image Generator - Waxy.org https://waxy.org/2022/0
「Stable Diffusion」で遊んでいたところ、定期的に謎の画像に差し変えられてしまう皆さん
グーグルが開発した画像圧縮ツールSquoosh。フロント開発向けにNode.jsで扱う方法まとめ 『Squooshスクーシュ』というGoogleが開発した画像圧縮ウェブアプリがあります。ブラウザで変換結果を見ながら圧縮設定ができるので、画像圧縮の難しい知識を持たない方でも使いやすいことが特徴です。圧縮だけでなく、WebPなどの各種フォーマットへの変換・リサイズといったこともできる便利ツールです。 このSquooshをNode.jsで扱える『libSquoosh』が存在します。libSquooshは大量の画像を一括で圧縮、WebPへの変換、リサイズなどの処理をこれ1つで完結できるのがポイントです。昨今のウェブはページの読み込み時間が重視される傾向があります。画像のファイルサイズは読み込み時間に大きく影響するため、画像圧縮は重要なテクニックです。libSquooshをwebpack・Viteと
Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米イリノイ大学アーバナ・シャンペーン校の研究チームが開発した「JoJoGAN: One Shot Face Stylization」は、入力した1枚の顔画像を漫画「ジョジョの奇妙な冒険」のキャラクター風に変換する機械学習フレームワークだ。「空条承太郎」など、作中のキャラクタースタイルに似せた顔に変換する。このフレームワークは、大量のペア画像データセットを使わず、1枚の顔画像から学習できる特性を持つ。 画像をスタイル変換するモデルは、大量のペア画像データセットを必要とするが、そのデータを準備するにはコストがかかる。数枚の画像からスタイル変換する研究も報告されているが、詳細なスタイルや多様性を
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く