HnniTns’s blog

　モデル名は「wd-1-4-anime_e1.ckpt」で、場所は「models/Stable-diffusion/」内に突っ込んでください。

　１点注意点なのですが、「wd-1-4-anime_e1.yaml」も同じ場所にダウンロードして下さい。モデルの切り替え時にエラーが発生すると思うので、その解決に必要です。詳細は下記サイトをご覧ください。

bookyakuno.com

　初回の切り替え時に数GBのダウンロードが始まると思いますが、暫く待機した後にきちんと切り替われば成功です。２回目以降は比較的高速に切り替わります。

　また、この時にERRORが出たら「.yaml」の関係で失敗している可能性があります。

紹介

　内容は適当に思いついた「こちらを見ているビーチにいる女性（上半身のみ）」です。色々と弄ってみるのもいいのですが、テストなので問題ありません。

　内容には一切手を加えていません、txt2imgのままで出力しています。なので、若干内容がおかしいとは思いますが、気にしてはいけません。

呪文等

基本プロンプト

調整を加えていますが、下記をベースとしています。

(((1girl, upper body))), beach, lock at viewer, crystal light, lens flare, light brush, masterpiece, best quality, high quality

(((1girl, cowboy shot))), beach, lock at viewer, colorful light,glitter,symbol particles, (((light particles))),light rays,lights, masterpiece, best quality, high quality, beautiful detailed eyes, ultra detailed, 4k, 8k

ネガティブ

low quality, bad quality, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, worst quality,low quality,normal quality,duplicate,grossproportions,deformed,out of frame, ,ugly,morbid,mutation,death,kaijuu,mutation,no hunmans.monster girl,arthropod girl,arthropod limbs,tentacles,blood,size difference,sketch,blurry,blurry face,blurry background,blurry foreground,disfigured,extra,extra_arms,extra_ears,extra_breasts,extra_legs,extra_penises,extra_mouth,multiple_arms,multiple_legs,mutilated,tranny,trans,trannsexual,out of frame,poorly drawnhands,extra fingers,mutated hands,poorly drawn face,bad anatomy,bad proportions,extralimbs,more than 2 nipples, more than 3 legs

サンプリングアルゴリズム

Euler a

サンプリング回数

CFGスケール

生成画像

おまけ

　他のモデル生成でも生成してみました。書いているコメントは個人的な感想なので、全く見当違いな事もあります。

healy's Anime Blend model

　少ないプロンプトで、比較的高クオリティーの画像を生成してくれるアニメよりのモデルです。個人的にはかなり使いやすいモデルです。

ミクさん↓

指定なし↓

Ellderth's Lucid Mix model

　上の「healy's Anime Blend モデル」よりもリアル寄りのモデルです。初音ミクはコスプレっぽくなります

ミクさん↓

指定なし↓

Synthwave Punk model

　サイバーパンク風の画像を生成します。某ネトフリアニメ風の画像を生成するには、このモデルが使えるかもしれません。

Samdoesarts Ultmerge model

　説明が難しい（適当な言葉が出ない）のですが、ディズニー？的な実写よりのモデルとなっています。詳細は下記画像を見て下さい。

Elldeth's OG 4060 mix model

　説明によれば色々なパターンが得意みたいです。実行してみたところイラスト・実写共に強いですね。

Dreamlike Photoreal 2.0 model

　名前の通り、実写向けのモデルとなっています。dreamlike.artによって開発されています。実行した感じ、かなりフォトリアルになっています。これは確かに名前を誇るだけありますね。後、ハズレの確立がかなり低く感じました。

　何故か知りませんが、ほぼ全ての生成された画像の背景がぼやけるんですが....何故ですかね？

Analog Diffusion model

　名前の通り、アナログ写真風の生成を得意とするモデルです。人物の描画を得意としているみたいです。

Modern Disney model

　このモデルは、名前の通りディズニー的な画像生成を得意としています。簡単に生成してみた限りは、ハズレ率が多めな気がします。が...たまに、映画の背景人物に出ててもおかしくない人物を生成します。

Inkpunk Diffusion model

　インクパンク風の画像生成を得意とします。ただ、顔の違和感にあります。「顔の修復」を入れてしまうと、リアルの顔を被った仮面風の顔面に成り果ててしまいます。

fantasy-style model

　逆に驚く名前ですが、その通りのファンタジー風の画像を得意としています。ですが、生成の仕方が悪いのか「ファンタジーとは？」状態です。でも、雰囲気はかなり良いと思いますし、ハズレ率は結構低い気がします。

プロンプト生成の一つの案

　豆知識なのですが、プロンプトに困ったら、ChatGPT君を活用してみて下さい。意外と実用的なプロンプトを提案してくれます。しかも、無料かつ英語と日本語で！！使わない手はないですよね。

openai.com

例えば

「女の子が一人でビーチで遊んでいる」のプロンプトを英語と日本語で生成して」

とChatGPT君に質問すると、回答が

"女の子が一人でビーチで遊んでいる" のプロンプトを英語と日本語で生成します。英語版:A girl is playing at the beach by herself, building sandcastles and collecting shells.
The girl is running along the shoreline, chasing after seagulls and laughing.
The girl is sitting on a towel, reading a book and enjoying the sound of the waves.
The girl is playing in the water, splashing around and feeling the cool ocean breeze on her skin.
The girl is laying on a beach chair, taking a nap and soaking up the sun.
日本語版:女の子が一人で海辺で遊んでいる、砂像を作ったり、貝を集めている。
女の子は海岸線を走っている、カモメを追って笑っている。
女の子はタオルに座っている、本を読んで、波の音を楽しんでいる。
女の子は水中で遊んでいる、たわむれて、海風を感じる。
女の子はビーチチェアーに横になっている、お昼寝をして、太陽を浴びている。

　と...こんな感じに、「英語のプロンプト候補」と「それらの日本語訳」を同時に出力してくれたりします。これ、とてもいいですよ！日本語の候補をDeepLで英語訳する手間が省けるのですごい楽です。

　後は単純に、元素法典を使用するのも手っ取り早いですね。現状v2.5まであります。一部プロンプトだけでもかなり参考になります。

docs.qq.com

最後に

　これは比べないと何とも言えないとは思いますが、自分の記憶が正しければ、WD 1.3と比べるとかなりクオリティが上がっていると思います。

　最近はNAIばかり弄っていたので、WDもいい精度でクオリティが上がってきて嬉しいですね。今後のAIは画像のお手軽生成や音楽生成も盛り上がると思うので楽しみですね。

　後、簡単にお試しした感じ、比那名居天子が出てこなくなってます...ㇳㇹㇹ...。　嘘です。WDは名前のみでは上手く出力されないのをすっかり忘れていました。特徴を複数個追加すれば出てきます。NAIは名前だけで普通に出てきていたので、完全に忘れていました。

2022-11-26

AIに白髪着物天子を書かせてみる

AI 東方

初めに

　NovelAIを使って、比那名居天子を白髪にして、着物を着せてみました。一言で言うと、「白髪着物天子」です。

　なぜ、白髪着物天子なのかって？心にグッと来るものがあったからです。あと、フォルダーの肥やしになるのもあれなので、大量の画像を公開します。

白髪着物天子

　一部青髪になっていますが、気にしないで下さい。

帽子あり

帽子なし

プロンプト

{{{hinanawi tenshi}}}, {{{{intricate kimono}}}}, looking at viewer, from front, [[[from above]]], 1girl, {{full body}}, {{white hair}}, walking, in shrine, in japan, {{sunset}}, happy, masterpiece, best quality, ultra detailed, an extremely delicate and beautiful, extremely detailed cg unity 8k wallpaper

Sampling

DDIM or k_euler_ancestral

最後に

　基本的にはこれだけで、プロンプトは全画像ほぼ同じです。多少、サンプリングは変えている事もありますが、「DDIM」か「k_euler_ancestral」のどちらかです。

　このサイトを覗いているという事は天子好きだと思うので、プロンプトを調整したりして、良い感じの天子絵を生成してみて下さい。

2022-11-08

AIのOutpaintingを試してみた

初めに

　この記事は題名の通り、AI絵生成の機能の１つである「Outpainting mk2」を試してみたというものです。モデルは「Waifu Diffusion v1.3」です。

　やり方としては、「元画像をAIで生成、１方向をOutpaintingで書き足して、おかしい所をInPaintingで補正、補正済みの画像を再びOutpaintingで....」を永遠に繰り返しました。画像が余りにも大きいとVRAM的にも生成時間的にも厳しいので、程々の大きさでやめましたが...。個人的には割と綺麗に出来たつもりです。

元画像

　呪文は忘れましたが、テーマとしては「寝室で寝転んでいる女性」ですかね？この画像を生成するのも色々時間がかかった記憶があります。

拡張開始

１回目

　右方向に拡張します。余計なものが生成されていますが、どの道InPaintingで修正します。

　修正したものが、この画像です。

２回目

　左方向に生成します。

３回目

　下方向に生成します。

　ベッドの端っこを再現したいので、上手い感じの画像が生成されるまでガチャです。

４回目

　今度は上方向です。流石に壁の色がおかしいので変更したり、一部分を修正したりしたものが下図になります。

　ライトだったり、生け花だったり、割といい感じになったと思います。

５回目

　一周回って、再度左方向です。うーん、そのままでは違和感が凄いですね。

　実は、この時点でいったん日付が空いています。バージョンが変わったせいか、若干境目が目立っています。気のせいという事にしておきます。

　ただの壁だと面白くないので、謎のオブジェクトを配置してみました。どうすればいいのか、分からなくなってきました。やっぱり、ガチの絵師さんにはかないませんね...。圧倒的発想力不足...。

６回目

　右方向です。若干、めんどくさくなってきたのは内緒です。

　ベッドの下側を微調整しました。

やってみて分った点

絵師さんは凄いですね。私だとどうしても発想力が無いので、良い雰囲気を構築するのが難しいです。
Outpaintingも結局ガチャです
画像の半分だけ切り取って、別途生成した後に合体する作戦はだめですね
- 例えば、右半分・左半分で分割して生成して、後で合体するといった感じです
- 全体を含んだ場合と分割した場合では、結果がかなり異なります
- 言われてみれば当たり前なのですが、全体を含めないと「画像全体の雰囲気」をちゃんと理解？して生成してくれません。
あと、VRAMが足りねぇ...。3070だときついです。

最後に

　結構、使える機能だとは思いますが、結局はガチャです。今回は１方向づつ生成していまが、全体方向にまとめて生成することも出来ます。ですが、確率がガクンと下がる気がします。

　やっぱ、これはこれで時間がかかるし、難しい～。

2022-10-03

StableDiffusionをローカルで動かしてみた

AI 東方

初めに

　この記事は、本題の通り「StableDiffusionをローカル環境で動かして、画像生成してみた」というものです。ついでに、WaifuDiffusionも実行出来たので、そちらも試してみました。

準備

　といっても、ここで詳しい説明はしません。というのも、下記サイトで詳しく説明されていますし、私も下記サイトと同じ方法でやっているからですね。

　WaifuDiffusionに関しては、下記サイトをご覧ください。

　じゃあ、この欄は何なのかというと、個人的に勘違いした点や、補足説明を入れておきたい点を記述します。

Hugging Faceから学習モデルファイルをダウンロード
- 「stable-diffusion-webgui-mater」直下に置くのではなく、「～master/models」内に置きます
- このせいで、数日放置してました（笑）
GFPGANのダウンロード
- ダウンロードした状態だと「GFPGAN～」となっていると思います
- 名前を「GFPGAN」に変更したうえで、「stable-diffusion-webgui-mater」直下にフォルダーごと配置します
- 正直、これに関しては元の記事が曖昧だったので、正解なのかは分からないですが、とりあえず出来たのでOKです

実行

　後は「webui-user.bat」を実行して、バッチファイル内のURLをChromeにコピペするだけです。これで画像と同じような画面が表示されれば成功です。

　１点注意点があるのですが、実行画面が表示された後にバッチファイルを消さないようにしてください。実行画面自体はあくまでGUIで、本体はバッチファイル側です。つまり、バッチファイルを消してしまうと、一切処理が実行できなくなります。

　ローカルネットワークを使って、バッチファイルとのやり取りをしているわけですね。まあ、詳しくは知りませんが...。

やり方

txt2img

　これは有名ですが、テキスト（prompt）から画像を生成するモードです。

img2img

　インプットした画像を基にして、テキストに沿った画像を生成するモードです。

Extras

　インプットした画像を高解像度化するモード？だと思っています。これについてはよく分かっていません。