多模态预训练模型与图像生成技术的结合:让AI更智能、更有文化

新知榜官方账号

2023-06-29 05:04:28

背景介绍

最近AI作画火爆出圈,国内外掀起了一波AI绘画热潮,各种社交媒体上用AI绘画模型生成的各种图片屡见不鲜。

中国人民大学卢志武教授团队将自身研发的多模态预训练模型文澜与最新的图像生成技术进行创新结合,打造了一款最懂中国传统文化的AI绘画生成模型。

多模态预训练模型文澜

文澜模型是中国人民大学高瓴人工智能学院执行院长文继荣教授、卢志武教授、宋睿华长聘副教授等领衔研发的大规模中文多模态预训练模型。文澜模型经过6.5亿弱相关中文图文对的预训练,学习到独特的中文语义理解能力并能很好地将中文语义与视觉信息联系起来,尤其擅长读取中文独有的含蓄语义与图片中的抽象概念。

文澜模型与生成模型的结合

该研究团队通过挖掘文澜模型的潜力,将其与最新的生成技术进行创新性的结合,融合文澜的抽象语义理解能力与生成模型的强大生成能力,确保得到的模型能够出色地解读输入文本的语义并生成具有对应语义的图片。

团队专注于挖掘文澜在中国传统文化上的潜力,并在所搜集的国画数据集上进行训练,得到的模型能根据输入文本生成对应风格的图片。

文澜绘画模型的评测结果

由于文澜模型本身的特点,文澜绘画模型能够根据输入的中国古诗词生成对应的图片。同时,团队还发现文澜绘画模型甚至对晦涩难懂的儒释道思想也有独到的解读,生成的AI绘画作品获得了王阳明心学研究专家姜洋教授的高度认可。

为了更好地展现文澜绘画模型在解读儒释道思想上的特色,团队挑选了国内外最热门的AI绘画模型进行对比分析,包含盗梦师、文心、DiscoDiffusion、Midjourney和StableDiffusion。

总结

文澜团队将近期大火的AI绘画生成技术与中文多模态预训练模型文澜相结合,深度挖掘文澜模型在中国传统文化上的潜力,并通过生成模型以图片的形式展现出来,从而让普通大众对一些深奥的中国传统文化思想有了更直观的了解。

本页网址:https://www.xinzhibang.net/article_detail-2563.html

寻求报道,请 点击这里 微信扫码咨询

关键词

AI作画 多模态预训练模型 文澜模型

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯