シンギュラリティ実験ノート

購入した1000ドルPCで何がどこまでできるのか実験した記録です。

StableDiffusionでイメージ通りの絵を描きたい

StableDiffusionをUM790 Proで動かすことはできたのだが、全く活用できていなかった。イメージ通りの絵が描けないからだ。しかし偶然、あるWebサイトを見つけ、そこでなら自分のイメージに近い絵を描けることが分かった。

 

SDXL-Lightning- Text To Image 2-Stepsで描いてもらいました

描きたかった絵

私が描きたかった絵は「コンピュータを操作する初老のちょっとかっこいいおじさん」である。例えばこのサイトにあるようなこんなイメージだ。

self-development.info

ブログ記事のトップにこんな絵を載せたかったのだ。

あとはレキシカというサイトにあるサイバーパンク風のこんなイメージだ。

StableDiffusionが描いてくれた絵

しかしStableDiffusionに描かせようとしても、なかなかうまくいかない。レキシカにはプロンプト(呪文)も載っているので楽勝だろうと最初は思っていた。しかし描いてくれる絵はこんな感じだった。

 

イメージと全然違う。。。

 

気を取り直して今度は書斎でコンピュータを操作する男性の絵にチャレンジすることにした。こちらはプロンプトを自分で考え、Google翻訳を駆使しながら英単語を並べてやってみた。しかし結果は同じようなものだった。

 


途中、StableDiffusionもやる気を無くしたのかと思うようなこんな絵もあった。


Webサイトでプロンプトの書き方を勉強したり、Bingにプロンプトの書き方を聞いてみたりした。しかし「入力するプロンプトを工夫しなさい」くらいの助言しかもらえないので、ほぼ諦めかけていた。

 

Huggingface Spaces

このサイトは何と紹介したらいいのだろう。AIアプリを動かす環境らしい。Huggingfaceにアクセスしている時に偶然見つけたサイトである。

huggingface.co

 

ずらっとAIアプリがならんでいる。この中にまずStableDiffusionの2.1のデモが動いているのを見つけた。ここにいつも自分が入れていた。プロンプト「An elderly man with white hair is looking at a computer screen in a dark antique study. There is a bookshelf in the background.(白髪の初老の男性が暗いアンティークな書斎でコンピュータの画面を眺めている。背景には書棚がある。)」と入力して出てきた絵が以下であった。

 

(SpacesのStable Diffusion 2.1 Demoで描いてもらいました)


今までよりもずっといい感じである。しかも早い。

さらに「SDXL-Lightning- Text To Image 2-Steps」というサイトでは、本記事の冒頭に載せたような絵を描けることが分かった。SDXLとは StableDiffusion の最新バージョン、StableDiffusion XLのことらしい。SDXLを動かすにはweb UI v1.5.0以降と、VRAM容量が12GB程度のグラボが推奨されている。本日、なんとかUM790 ProでSDXLを動かそうと試してみたがまだ動いていない。しかしWebサイトで描いてもらった方が何倍も早いのでこれで十分ではないかとも思う。特に「SDXL-Lightning- Text To Image 2-Steps」ではほぼ一瞬で絵が出来上がる。

 

レキシカにあるサイバーパンク風の絵も頼んでみた。こちらもほぼイメージ通りで描いてくれる。本当はもう少し若作りしたいのだが、そのテクニックはまだ分かっていない(笑)。

 

(SpacesのSDXL-Lightning- Text To Image 2-Stepsで描いてもらいました)

まとめ

StableDiffusionにイメージ通りの絵を描いてもらうには、最新バージョンのStableDiffusion XLを使ったほうがいいことが分かった。

Spacesで描いてもらった絵はどこまで利用できるのか分からなかったので、ここではサイト紹介のための「引用」という形にさせていただいた。

自分のPCでSDXLを動かせば商用利用も問題ないと思うのだが、その道はまだ長そうである。