話說最近 FB 上出現了這麼一個有趣的比賽,但是作為技術系開發者,當然是要用最原始的 stable diffusion 來產,於是這就是作品:
魔法如下(Positive weight 跟 negative weight)
ANIME GIRL, FEMININE,((PERFECT FACE)),((SEXY FACE)),((DETAILED PUPILS)).(ARTIST),ARTIST,ARTIST,(ARTIST). OIL PAINTING. ((NO BREAST)), SMIRK,LOOK AT VIEWER, (((WHITE HAIR))).(INTRICATE),long hair, asian, (loli), (HIGH DETAIL),SHARP, GREY EYES, 14, ((maid)), cherry blossom, ((sakura)), leaf, (flower), nature, ((blue sky)), white cloud, black cat
((nipple)), ((((ugly)))), (((duplicate))), ((morbid)), ((mutilated)), (((tranny))), (((trans))), (((trannsexual))), (hermaphrodite), [out of frame], extra fingers, mutated hands, ((poorly drawn hands)), ((poorly drawn face)), (((mutation))), (((deformed))), ((ugly)), blurry, ((bad anatomy)), (((bad proportions))), ((extra limbs)), cloned face, (((disfigured))). (((more than 2 nipples))). [[[adult]]], out of frame, ugly, extra limbs, (bad anatomy), gross proportions, (malformed limbs), ((missing arms)), ((missing legs)), (((extra arms))), (((extra legs))), mutated hands, (fused fingers), (too many fingers), (((long neck))), (((background))), ((((big breast)))), (((hand)))
技術細節
可能看到這裡的你會在想,到底 stable diffusion + pre-train model 跟外面的 midjourney 之類的差別在哪?雖然我也不清楚其他系統的做法,但是我猜的是他們也是基於一個 pre-train model 並加入一堆 preset 的 rule / theme 來讓它產出那模型的獨有風格。舉例說,上面的 negative weight 中,除了最後幾個(background)、(hand) 之類用作減少背景雜亂和手部生產錯誤的 negative weight 以外,其他基本上也就是固定的了。因此我猜可能其他的服務也是透過類似的方法來實現。
嘛當然,如果能避免直接出現手部(例如用 hands in pocket、hands out of frame 的 positive weight)的話那效果會更好。
手指與手套
加入黑色手套 (black glove) 不知道為甚麼,有時候好像也能改善手指數目和動作生成的問題(我猜可能只是看不見而已),以下是兩張例子:
色系與背景
特別強調背景的物品或色系看來有時候也會讓整體的繪圖質素有所提升(可能是因為通常背景畫得好的繪師,人物也畫得不錯?),例如說當我特別定義了 blue sky, white cloud, sunlight 等大自然的感覺的字眼之後,整個產出的氣氛也變得特別悠和
加入其他現代化的字眼如 future, glass wall, minimalist 之類的也可以做到類似效果
不過我覺得最特別的是加入了 (((hong kong))) 為背景所產出來的,不知道為甚麼有一種未來城市的感覺(?
大自然與溫室
另一個我很喜歡的 keyword 大概就是 greenhouse, grass field 跟 shadow 了。當這三個組合起來的話就會產出非常有田園感覺的繪圖。
如果把上面藍色系的 keyword 混用,加入 ((flower)) 的話更會產出夏天感覺的繪圖
特別輸出比例
另外也有一點,圖片的 aspect ratio 也會對內容物產生一定程度的影響。例如說我把 aspect ratio 拉得很長很高的話,便會產出像一些角色介紹的動作的繪圖(這裡是四張)
特別風格
一些特別的繪畫風格,例如說 (((pixel art))), (8-bit) 等,也能產出一些滿特別的圖片。只不過不知道為甚麼就唯獨是臉部是不會有這種風格效果(?
題外話:有趣的錯誤
話說在玩 stable diffusion 界面的 img2img 的時候間中會出現一些有趣的小錯誤,例如是下面這一張(不要把你的那個露出來啦www)
總結
本來我只是打算借 AI 幫我 brain storm 一下我夢想中的桌面而已,沒想到居然無意中變成了魔法師(不對)。但是起碼在 AI 產生的圖片中我發現:比起桌面還是窗外的景色比較重要啦(