新知榜官方账号
2023-11-18 16:48:27
从StableDiffusion这一AI应用出现之后,在极短时间内就迅速走红,成为众多玩家口口相传的“最美小姐姐”生成工具。不过这一AI计算画图工具在StableDiffusion官方推出之初,无论是WEBUI的部署还是模型的训练生成,都基本是基于NVIDIACUDA加速的算法,因此A卡最初并不被StableDiffusion官方支持。不过好在StableDiffusion算是一个开源的产品,在众多社区聚集玩家的支持下,也出现了许多支持A卡GPU加速计算的分支,比如我们今天要测试的基于DirectML的部署,就能实现AMDRadeon显卡的StableDiffusionAI计算硬件加速。如果要自己在本地部署基于DirectML的StableDiffusion话,相比便捷的基于CUDA的WEBUI部署要相对复杂一些,不过现在网上已经有比较成熟的整合包供玩家适用,玩家们只需要下载相应的整合包,就能一键实现在本地的傻瓜式安装部署,可以为大家节省相当多的时间。
我们选择用于测试的这个整合包安装完毕之后,自动进入AMDGPU加速计算模式,在本地开启http://127.0.0.1:7860即可打开本地StableDiffusion的AI画图界面。在本地WEBUI界面上可以自由设置相关的AI艺术图生成参数,点击“生成”即可开始画图。具体请参考线上相关教程,在此我们不赘述。
那么,基于DirectML的StableDiffusion部署分支能不能实现对AMD显卡的硬件计算加速支持呢?它的效率到底如何?在此前A卡玩家经常只能在Linux系统下运行StableDiffusion,通过ROCM(RadeonOpenCompute)模拟CUDA加速,如今在Windows系统下直接实现A卡的AI加速计算,能否达到我们的预期目标呢?为此,我们选择了AMDRadeonRX5000系、RX6000系以及RX7000系的数款显卡,进行了一番详细的体验。
显卡:AMDRadeonRX5500XT(8GB)、RX5700(8GB)、RX6500XT4GB、RX6600(8GB)、RX6700XT(12GB)、RX6750XT(12GB)、RX6800(16GB)、RX6900XT(16GB)、RX7900XT(20GB)、RX7900XTX(24GB)
CPU:英特尔酷睿i9-13900K
主板:英特尔Z790
内存:DDR5600016GB×2
SSD:AORUSNVMePCIeSSD2TB
操作系统:Windows11Pro22H2
驱动程序:AMDSoftwareAdrenalinEdition23.4.3
通过测试,我们想知道:AMDRadeon5000系、6000系和7000系之间,在StableDiffusion的AI画图算力上有多大差别?相比传统的CPUAI计算加速,AMDGPU加速性能到底如何?
在第一部分的测试中,我们通过关键词生成一个大眼的时尚美女小姐姐,还要有一定的照片感。从整体测试结果来看,AMD从RadeonRX5000系到RX7000系的显卡几乎都很好地实现了StableDiffusion应用的AI计算加速性能,尤其是RadeonRX7000系显卡性能相比RX6000系显卡有了巨大的提升。比如RX6900XT在该设置与模型算法下的图片生成率约为8.87张/秒,而RX7900XT则可以达到15.76张/秒,性能提升接近100%。而相比CPU来说,全系AMD显卡都占有非常明显的优势,RX7900XT的性能达到了酷睿i9-13900K的30倍左右,即使前两代的入门级显卡RX5500XT,性能上也几乎接近酷睿i9-13900K的5倍。
在接下来的测试中,我们用一系列相对复杂的关键词来生成一座位于水边的别墅,同时还伴有阳光、波纹、倒影等效果要求。从整体结果来看,我们认为AMDGPU还有极大的算法优化空间,凭不可靠经验判断,从RX7900XTX到酷睿i9-13900K的性能差距还不足够大。这和我们部署的算法方案以及模型都有一定关系,也希望各社区的程序员们能开发出更多更优秀的针对AMD显卡的计算加速方案。
通过这次体验,我们认为有几点参考意见可以总结给玩家们参考:1.当前AMD显卡已经可以通过开源的部署方案实现在Windows系统下的StableDiffusionAI计算加速,而且网上也有许多的傻瓜式整合包,感兴趣的玩家完全可以一试;2.从测试结果来看,AMD显卡在StableDiffusion的AI图片生成计算中能够发挥出远胜于CPU计算的性能增幅,使用GPU加速计算能带来事倍功半的效果;3.从测试情况来看,测试中当渲染分辨率设置超过512时(如768×768),就会出现爆显存的情况,这与部署方案和模型有一定关系,但也反映了在正常模式下运行时,8GB显存几乎是StableDiffusion的硬性入门要求。如果显存低于8GB,即使在512×512分辨率下渲染,也会出现显存不足的情况,此时就不得不采用--lowvram的低显存运行方案,但会极大地拖累计算速度,如测试中的RX6500XT4GB。所以要想畅玩StableDiffusion,我们建议显卡的显存为8GB或更高为佳;4.不管如何,AMD显卡对StableDiffusion的硬件加速计算性能已经得到了展现,效果也比较明显,对AMD显卡用户来说毫无疑问是利好的福音消息,剩下的就是玩家与AMD需要坚持的继续优化之路了。
相关工具
相关文章
相关快讯
推荐
幻舟 AI:动画创作领域的革新力量
2024-12-27 16:06
幻舟 AI:开启纪录片创作新征程
2024-12-27 16:03
幻舟 AI:教育短视频创作的得力助手
2024-12-27 15:59
幻舟 AI:影视创作多领域的创新利器
2024-12-27 15:55
幻舟 AI:影视创作多领域的创新利器
2024-12-27 15:51
幻舟 AI:影视创作的变革引擎
2024-12-27 15:45
中国首款3A游戏上线,《黑神话:悟空》出圈!
2024-08-21 13:46
盘点15款AI配音工具,短视频配音有救了!
2024-08-12 17:11
短视频文案没创意?10大AI写作工具来帮你!
2024-08-05 16:23
Midjourney发布V6.1版本,我已分不清AI和现实了!
2024-08-01 15:03