使用 顯卡外接盒 加上 3080ti進行 stable diffusion產圖效能測試 (3080ti/eGPU/i5 1240p)








前言

前陣子購買了Acer swife 3 1240P的版本,作為一台文書機來說,我覺得沒有甚麼問題,各方面性能都相當夠用,外出時也有大約三個小時的續航力。但當我開始玩世紀帝國4時,我發現我只能開低畫質...所以我便一直在考慮購買外接顯卡盒以及顯卡來提高顯示運算效能以及用於加速神經網路運算。而我運氣也相當不錯,蹲了兩個月,遇到有在附近二手外接顯卡盒和3080Ti要賣,變以相當實惠的價格入手了。

入手的是Zotaz的3080Ti 和 雷蛇的Core X Chroma顯卡外接盒,我知道索泰的卡...不過二手沒得選

https://shope.ee/ddHyqkT2?share_channel_code=6



而在我買完不久之後,Stable diffusion這種架構的圖片生成式AI也開始出現在大眾眼前,而且也有諸位大神提供系統化的web GUI等,逐漸變成一個生態系。Stable diffusion其提供的強大功能已成為不可或缺的工具。然而,Stable diffusion的產圖效能受到許多因素的影響,其中一項重要因素即為顯示卡性能。本文將針對Stable diffusion的在,並外接顯示卡的環境下產圖效能進行測試,並和網路上有提供的benchmark性能比較。


測試環境:
筆電: Acer swife 3 i5 1240P
16GB ram
Core X Chroma
Zotac Gaming 3080ti
使用stable difussion webUI操作,checkpoint為
v1-5-pruned-emaonly  [6ce0161689]

測試一
參考
的測試流程,在他的benchmark下,其相關參數為


Positive Prompt:
postapocalyptic steampunk city, exploration, cinematic, realistic, hyper detailed, photorealistic maximum detail, volumetric light, (((focus))), wide-angle, (((brightly lit))), (((vegetation))), lightning, vines, destruction, devastation, wartorn, ruins

Negative Prompt:
(((blurry))), ((foggy)), (((dark))), ((monochrome)), sun, (((depth of field)))

Steps:
100

Classifier Free Guidance:
15.0

Sampling Algorithm:
Some Euler variant (Ancestral on Automatic 1111, Shark Euler Discrete on AMD)

512 x 512 100 step
未提供checkpoint相關資訊



其測試出來得到的3080Ti,
使用Xformer 速度為17.429 it/s
而沒有使用 Xformer 速度為14.224 it/s





而在我的電腦環境中,一次測試十張(batch count = 10)共五次
使用Xformer平均為10.22 it/s
沒有使用則平均為13.5 it/s
使用Xformer效能只剩下77.45%
沒有使用Xformer效能只剩下71.85%
結果顯示3080ti的效能大概掉到跟3080接近


(未使用Xformer)


(使用Xformer)




測試二、

進行的測試,雖然他沒有測試3080Ti,但仍可作為參考
我這邊測試所使用的環境和Prompt與前面相同,一律使用Xformer
潮玩客測試項目



潮玩客的測試結果

1. 512 x 512      結果在測試一中已經有了故不重複測試,為
13.5 it/s  比3080表現還差一些

2.1280 x 720  重複三次平均為:
3.6 it/s ,略好於3080

3. 1920 x 1080 重複三次平均為:
1.0966 it/s, 好於3080
其測試結果顯示使用外接顯卡的效能和桌機使用3080的效能相當而略好一些,但不及3080ti使用在桌機的表現


而在潮玩客後續的測試中也測試了PCLE帶寬對於運算速度的差異,顯示帶寬對於運算速度差異不大,我想這也是為什麼在外接顯卡盒再進行遊戲跑分通常會掉到60~70%的表現,而在Stable diffustion中卻只有掉20%左右的表現,因為進行遊戲時受到Thunderbolt 4 平寬大約只有PCIe 3.0 ×4的頻寬影響很大,但算圖時相對還好(但仍然掉了不少)。

測試三
參考網路部落格文章
進行的測試,其測試環境為:


使用模型:realdosmix
LORA 模型:koreanDollLikeness
提示詞:
masterpiece,extremely detailed CG unity 8k wallpaper,best quality,original figure painting,upper body,Raise right hand plucking hair , solo,in a gorgeous Chinese palace details,1 girl,Smile,medium breasts,black hair,messy hair,swept bangs,an extremely delicate and beautiful,Beautiful and detailed eye description,short hair,Beautiful and detailed facial depiction,standing,embroidery,blue winter Taoist robe,china dress,Han Chinese Clothing,detailed clothes,Hair accessories,detailed face,Look at the audience,

反向提示詞:
lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, bad feet,ugly,pregnant,vore,duplicate,hermaphrodite,trannsexual,mutilated,morbid,extra fingers,fused fingers,too many fingers,long neck,mutation,poorly drawn face,poorly drawn hands,mutated hands,deformed,blurry,bad anatomy,bad proportions,disfigured,cloned face,extra limbs,malformed limbs,gross proportions,missing arms,missing legs,extra arms,extra legs,

繪圖資訊:
Steps: 40, Sampler: DPM++ SDE Karras, CFG scale: 20, Seed: 149120564, Face restoration: None, Size: 768×512, Model hash: 0d27c62ffa, Model: realdosmix_, Clip skip: 2

測試平台
CPU: Intel Core i9-13900K
CPU Cooler: MSI MEG CORELIQUID S360
RAM: GSKILL DDR4-4000 8GBx2
MB: MSI B760I EDGE WIFI DDR4
VGA: 如下圖
SSD: GIGABYTE AORUS RAID SSD 2TB
PSU: InWin 1065W
OS: Windows 11

(未提供是否使用xformer的資訊)

該文章是使用運算秒速作為結果,但其截圖有包含部分it/s資訊,估仍以 it/s來比較,其3080ti結果為:
3.54 it/s

而在我的電腦環境中則為4.78 it/s,明顯快於他的測試顯示他的測試應該是不包含xformer的
於是我又跑了移除xformer後的結果
運算速度 3.75 it/s 依然比該測試還高,可能是測試時的版本差異導致(本文2023/03/21,該文2023/02/24),又或是在此測試條件下外接顯卡和一般桌機顯卡的表現確實相近。

另外,在所有測試中以及長時間訓練Lora模型(30小時)時,顯卡的溫度都在70度以下,算是散熱蠻好的,但有點吵。



總結:
如果想要接觸Stable difussion,且手邊已經擁有一台中高階文書機筆電了,並且該筆電有雷電3以上的接口,那麼使用顯卡外接盒是可以考慮的方案,其效能大致衰減20%左右,在計算的圖越大的時候衰減越不明顯,但相較於組一台配得上高階GPU的桌不含GPU要價30000左右,全新顯卡外接盒則價格約7000~10000,如果可以買得到二手外接盒搭配顯卡的話會是更實惠的方案。

但仍需注意,高階顯卡可能有塞不下外接顯卡盒的可能,我的3080ti塞入Core X Chroma已經是非常極限,需要拆掉正面的防塵網了。而Stable difussion需要大顯存,所以可能最適合的就是體積較小的306012GB、3080ti 、 3080 12GB 或是 4070ti了。





留言

熱門文章