Waifu Diffusion 1.4+αを試してみた

目次

 

 

初めに

 

 最近、WD 1.4が公開されて、ようやく試せる環境になったので、早速試してみたという記事です。この記事は画像が大量にあるので注意して下さい。

 また、Civitaiというモデル共有サイトの存在を知ったので、公開されている他のモデルも試してみました。因みに、ログイン必須です。何故か、通常のEmailでのアカウント作成が上手くいかなかったので、AI用のGoogleアカウントでアカウント作成しました。

 因みに、NSFWモデルも公開されているので、閲覧の際には注意して下さい。一応、モザイクはかかってますが...。

 

手順

 

 見ている方は正直分っている方がほとんどだと思うので、簡単に説明と紹介。あくまで紹介手順はAutomatic1111でのやり方です。

 Automatic1111の方法・作成方法は下記サイトを参照するか各自調べてみて下さい。ただ、情報が古いものだったりしますが、ある程度は問題ありません。

 

※ 1/5時点でGithubページが消えてるみたいです。その為、現状では他の手段で実行するしかありません。

追記1:別のサイトでホストされているようです。つまり、恐らく公式の代替サイトを立ち上げたという事ですね。

追記2:1/6時点でGitHubのページが復旧したみたいです。なので上記については気にする必要がありません。

 

wikiwiki.jp

github.com

dskjal.com

 

ダウンロード

 

モデル↓

huggingface.co

 モデル名は「wd-1-4-anime_e1.ckpt」で、場所は「models/Stable-diffusion/」内に突っ込んでください。

 1点注意点なのですが、「wd-1-4-anime_e1.yaml」も同じ場所にダウンロードして下さい。モデルの切り替え時にエラーが発生すると思うので、その解決に必要です。詳細は下記サイトをご覧ください。

bookyakuno.com

 初回の切り替え時に数GBのダウンロードが始まると思いますが、暫く待機した後にきちんと切り替われば成功です。2回目以降は比較的高速に切り替わります。

 また、この時にERRORが出たら「.yaml」の関係で失敗している可能性があります。

 

紹介

 

 内容は適当に思いついた「こちらを見ているビーチにいる女性(上半身のみ)」です。色々と弄ってみるのもいいのですが、テストなので問題ありません。

 内容には一切手を加えていません、txt2imgのままで出力しています。なので、若干内容がおかしいとは思いますが、気にしてはいけません。

 

呪文等

 

基本プロンプト

 

調整を加えていますが、下記をベースとしています。

(((1girl, upper body))), beach, lock at viewer, crystal light, lens flare, light brush, masterpiece, best quality, high quality

(((1girl, cowboy shot))), beach, lock at viewer, colorful light,glitter,symbol particles, (((light particles))),light rays,lights, masterpiece, best quality, high quality, beautiful detailed eyes, ultra detailed, 4k, 8k

 

ネガティブ

 

low quality, bad quality, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, worst quality,low quality,normal quality,duplicate,grossproportions,deformed,out of frame, ,ugly,morbid,mutation,death,kaijuu,mutation,no hunmans.monster girl,arthropod girl,arthropod limbs,tentacles,blood,size difference,sketch,blurry,blurry face,blurry background,blurry foreground,disfigured,extra,extra_arms,extra_ears,extra_breasts,extra_legs,extra_penises,extra_mouth,multiple_arms,multiple_legs,mutilated,tranny,trans,trannsexual,out of frame,poorly drawnhands,extra fingers,mutated hands,poorly drawn face,bad anatomy,bad proportions,extralimbs,more than 2 nipples, more than 3 legs

 

サンプリングアルゴリズム

 

Euler a

 

サンプリング回数

 

40

 

CFGスケール

 

11

 

生成画像

 

 

おまけ

 

 他のモデル生成でも生成してみました。書いているコメントは個人的な感想なので、全く見当違いな事もあります。

 

healy's Anime Blend model

 

 少ないプロンプトで、比較的高クオリティーの画像を生成してくれるアニメよりのモデルです。個人的にはかなり使いやすいモデルです。

civitai.com

ミクさん↓

指定なし↓

 

Ellderth's Lucid Mix model

 

 上の「healy's Anime Blend モデル」よりもリアル寄りのモデルです。初音ミクはコスプレっぽくなります

civitai.com

ミクさん↓

指定なし↓


Synthwave Punk model

 

 サイバーパンク風の画像を生成します。某ネトフリアニメ風の画像を生成するには、このモデルが使えるかもしれません。

civitai.com

 

Samdoesarts Ultmerge model

 

 説明が難しい(適当な言葉が出ない)のですが、ディズニー?的な実写よりのモデルとなっています。詳細は下記画像を見て下さい。

civitai.com

 

Elldeth's OG 4060 mix model

 

 説明によれば色々なパターンが得意みたいです。実行してみたところイラスト・実写共に強いですね。

civitai.com

 

Dreamlike Photoreal 2.0 model

 

 名前の通り、実写向けのモデルとなっています。dreamlike.artによって開発されています。実行した感じ、かなりフォトリアルになっています。これは確かに名前を誇るだけありますね。後、ハズレの確立がかなり低く感じました。

 何故か知りませんが、ほぼ全ての生成された画像の背景がぼやけるんですが....何故ですかね?

huggingface.co

 

Analog Diffusion model

 

 名前の通り、アナログ写真風の生成を得意とするモデルです。人物の描画を得意としているみたいです。

huggingface.co

 

Modern Disney model

 

 このモデルは、名前の通りディズニー的な画像生成を得意としています。簡単に生成してみた限りは、ハズレ率が多めな気がします。が...たまに、映画の背景人物に出ててもおかしくない人物を生成します。

huggingface.co

civitai.com

 

Inkpunk Diffusion model

 

 インクパンク風の画像生成を得意とします。ただ、顔の違和感にあります。「顔の修復」を入れてしまうと、リアルの顔を被った仮面風の顔面に成り果ててしまいます。

huggingface.co

civitai.com

 

fantasy-style model

 

 逆に驚く名前ですが、その通りのファンタジー風の画像を得意としています。ですが、生成の仕方が悪いのか「ファンタジーとは?」状態です。でも、雰囲気はかなり良いと思いますし、ハズレ率は結構低い気がします。

civitai.com


プロンプト生成の一つの案

 

 豆知識なのですが、プロンプトに困ったら、ChatGPT君を活用してみて下さい。意外と実用的なプロンプトを提案してくれます。しかも、無料かつ英語と日本語で!!使わない手はないですよね。

openai.com

例えば

 

「女の子が一人でビーチで遊んでいる」のプロンプトを英語と日本語で生成して」

 

とChatGPT君に質問すると、回答が

 

"女の子が一人でビーチで遊んでいる" のプロンプトを英語と日本語で生成します。英語版:A girl is playing at the beach by herself, building sandcastles and collecting shells.
The girl is running along the shoreline, chasing after seagulls and laughing.
The girl is sitting on a towel, reading a book and enjoying the sound of the waves.
The girl is playing in the water, splashing around and feeling the cool ocean breeze on her skin.
The girl is laying on a beach chair, taking a nap and soaking up the sun.
日本語版:女の子が一人で海辺で遊んでいる、砂像を作ったり、貝を集めている。
女の子は海岸線を走っている、カモメを追って笑っている。
女の子はタオルに座っている、本を読んで、波の音を楽しんでいる。
女の子は水中で遊んでいる、たわむれて、海風を感じる。
女の子はビーチチェアーに横になっている、お昼寝をして、太陽を浴びている。

 

 と...こんな感じに、「英語のプロンプト候補」と「それらの日本語訳」を同時に出力してくれたりします。これ、とてもいいですよ!日本語の候補をDeepLで英語訳する手間が省けるのですごい楽です。

 後は単純に、元素法典を使用するのも手っ取り早いですね。現状v2.5まであります。一部プロンプトだけでもかなり参考になります。

docs.qq.com

 

最後に

 

 これは比べないと何とも言えないとは思いますが、自分の記憶が正しければ、WD 1.3と比べるとかなりクオリティが上がっていると思います。

 最近はNAIばかり弄っていたので、WDもいい精度でクオリティが上がってきて嬉しいですね。今後のAIは画像のお手軽生成や音楽生成も盛り上がると思うので楽しみですね。

 

 後、簡単にお試しした感じ、比那名居天子が出てこなくなってます...ㇳㇹㇹ...。 嘘です。WDは名前のみでは上手く出力されないのをすっかり忘れていました。特徴を複数個追加すれば出てきます。NAIは名前だけで普通に出てきていたので、完全に忘れていました。