基于DirectML的StableDiffusion部署分支对AMD显卡的硬件计算加速支持测试

新知榜官方账号

2023-11-18 16:48:27

StableDiffusion的硬件加速计算性能测试

从StableDiffusion这一AI应用出现之后,在极短时间内就迅速走红,成为众多玩家口口相传的“最美小姐姐”生成工具。不过这一AI计算画图工具在StableDiffusion官方推出之初,无论是WEBUI的部署还是模型的训练生成,都基本是基于NVIDIACUDA加速的算法,因此A卡最初并不被StableDiffusion官方支持。不过好在StableDiffusion算是一个开源的产品,在众多社区聚集玩家的支持下,也出现了许多支持A卡GPU加速计算的分支,比如我们今天要测试的基于DirectML的部署,就能实现AMDRadeon显卡的StableDiffusionAI计算硬件加速。如果要自己在本地部署基于DirectML的StableDiffusion话,相比便捷的基于CUDA的WEBUI部署要相对复杂一些,不过现在网上已经有比较成熟的整合包供玩家适用,玩家们只需要下载相应的整合包,就能一键实现在本地的傻瓜式安装部署,可以为大家节省相当多的时间。

我们选择用于测试的这个整合包安装完毕之后,自动进入AMDGPU加速计算模式,在本地开启http://127.0.0.1:7860即可打开本地StableDiffusion的AI画图界面。在本地WEBUI界面上可以自由设置相关的AI艺术图生成参数,点击“生成”即可开始画图。具体请参考线上相关教程,在此我们不赘述。

那么,基于DirectML的StableDiffusion部署分支能不能实现对AMD显卡的硬件计算加速支持呢?它的效率到底如何?在此前A卡玩家经常只能在Linux系统下运行StableDiffusion,通过ROCM(RadeonOpenCompute)模拟CUDA加速,如今在Windows系统下直接实现A卡的AI加速计算,能否达到我们的预期目标呢?为此,我们选择了AMDRadeonRX5000系、RX6000系以及RX7000系的数款显卡,进行了一番详细的体验。

体验平台

显卡:AMDRadeonRX5500XT(8GB)、RX5700(8GB)、RX6500XT4GB、RX6600(8GB)、RX6700XT(12GB)、RX6750XT(12GB)、RX6800(16GB)、RX6900XT(16GB)、RX7900XT(20GB)、RX7900XTX(24GB)

CPU:英特尔酷睿i9-13900K

主板:英特尔Z790

内存:DDR5600016GB×2

SSD:AORUSNVMePCIeSSD2TB

操作系统:Windows11Pro22H2

驱动程序:AMDSoftwareAdrenalinEdition23.4.3

通过测试,我们想知道:AMDRadeon5000系、6000系和7000系之间,在StableDiffusion的AI画图算力上有多大差别?相比传统的CPUAI计算加速,AMDGPU加速性能到底如何?

测试结果

在第一部分的测试中,我们通过关键词生成一个大眼的时尚美女小姐姐,还要有一定的照片感。从整体测试结果来看,AMD从RadeonRX5000系到RX7000系的显卡几乎都很好地实现了StableDiffusion应用的AI计算加速性能,尤其是RadeonRX7000系显卡性能相比RX6000系显卡有了巨大的提升。比如RX6900XT在该设置与模型算法下的图片生成率约为8.87张/秒,而RX7900XT则可以达到15.76张/秒,性能提升接近100%。而相比CPU来说,全系AMD显卡都占有非常明显的优势,RX7900XT的性能达到了酷睿i9-13900K的30倍左右,即使前两代的入门级显卡RX5500XT,性能上也几乎接近酷睿i9-13900K的5倍。

在接下来的测试中,我们用一系列相对复杂的关键词来生成一座位于水边的别墅,同时还伴有阳光、波纹、倒影等效果要求。从整体结果来看,我们认为AMDGPU还有极大的算法优化空间,凭不可靠经验判断,从RX7900XTX到酷睿i9-13900K的性能差距还不足够大。这和我们部署的算法方案以及模型都有一定关系,也希望各社区的程序员们能开发出更多更优秀的针对AMD显卡的计算加速方案。

总结

通过这次体验,我们认为有几点参考意见可以总结给玩家们参考:1.当前AMD显卡已经可以通过开源的部署方案实现在Windows系统下的StableDiffusionAI计算加速,而且网上也有许多的傻瓜式整合包,感兴趣的玩家完全可以一试;2.从测试结果来看,AMD显卡在StableDiffusion的AI图片生成计算中能够发挥出远胜于CPU计算的性能增幅,使用GPU加速计算能带来事倍功半的效果;3.从测试情况来看,测试中当渲染分辨率设置超过512时(如768×768),就会出现爆显存的情况,这与部署方案和模型有一定关系,但也反映了在正常模式下运行时,8GB显存几乎是StableDiffusion的硬性入门要求。如果显存低于8GB,即使在512×512分辨率下渲染,也会出现显存不足的情况,此时就不得不采用--lowvram的低显存运行方案,但会极大地拖累计算速度,如测试中的RX6500XT4GB。所以要想畅玩StableDiffusion,我们建议显卡的显存为8GB或更高为佳;4.不管如何,AMD显卡对StableDiffusion的硬件加速计算性能已经得到了展现,效果也比较明显,对AMD显卡用户来说毫无疑问是利好的福音消息,剩下的就是玩家与AMD需要坚持的继续优化之路了。

本页网址:https://www.xinzhibang.net/article_detail-20447.html

寻求报道,请 点击这里 微信扫码咨询

相关工具

相关文章

相关快讯