达摩院大牛们的视觉AI技术：抠图不再是难题

新知榜官方账号

2023-07-02 16:36:59

达摩院大牛们的视觉AI技术：抠图不再是难题

从达摩院宣布成立起，这个阿里的“神秘机构”就备受外界关注。造福人类，世界第一，高端，神秘……这些标签也让我们对达摩院的技术专家产生了好奇。在外界人眼中，达摩院人才济济，大多是奇人异士，做着神秘且高端的研究。不曾想，这群有如扫地僧一般的神秘专家们竟然做了一个百宝箱——阿里云视觉智能开放平台（vision.aliyun.com），将研究出来的各种人脸识别，图像识别等视觉AI能力都开放了出来！打开百宝箱可以看到他们已经做了人脸识别，文字识别，商品理解，内容安全，图像识别，图像增强，图像分割，目标检测等50余种视觉AI能力，全都可以通过API的形式调用！就拿其中一项来说你会发现大牛们用图像分割的视觉AI能力，把抠图玩转得炉火纯青，而且这一切都朝着不受控制的方向发展了......你看看，万物皆可抠！

达摩院大牛们为什么要开始研究抠图？这要从阿里巴巴智能设计实验室自主研发的一款设计产品鹿班说起。鹿班的初衷是改变传统的设计模式，使商家在短时间内完成大量banner图、海报图和会场图的设计，提高工作效率。-并且通过鹿班制图可以-、传达高质视觉效果，从而提升商品吸引力和买家视觉体验，达到提升商品转化率的目的。而在制图的过程中，-商品抠图是一项不可避免且繁琐的工作，一张人像精细抠图平均需要耗费设计师2h以上的时间，这样无需创意的纯体力工作亟需被AI所取代，所以抠图算法应运而生。近几年图像抠图算法逐渐进入人们的视野，如腾讯（天天P图）、百度（人像抠图、汽车分割）等。而潜藏在其背后的行业：泛文娱，电商行业、垂直行业，诸如在线餐饮、媒体、教育等行业商业价值不容小觑，可以满足各种战报、在线课程教师抠图、视频封面制作等不同形式的图片制作需求拓展。市面上的一些抠图算法效果在人像发丝细节处理均不是很好，且对一些通用场景（电商等）支持也不是很好。达摩院大牛们针对这两个问题一方面设计更具有泛化能力的系统、一方面深化发丝和高度镂空相关算法，均有更好的效果。

遇到的难题和解决方案最开始在上手鹿班“批量抠图”需求时，达摩院大牛们发现用户上传的图像质量、来源、内容五花八门，想用一个模型实现业务效果达到一劳永逸很难。在经过对场景和数据的大量分析后，定制整体框架如下：主要涵盖了过滤、分类、检测、分割四个模块：过滤：滤掉差图（过暗、过曝、模糊、遮挡等），主要用到分类模型和一些基础图像算法；分类：瓶饮美妆等品类商品连通性比较好，3C、日用、玩具等品类则反之，另外场景（如人头、人像、动物）需求也是各具差异，故而设计不同的分割模型提升效果；检测：在鹿班场景用户数据多来自于商品图，很多是经过高度设计的图像，一图多商品、多品类、主体占比小，也不乏文案、修饰、logo等冗余信息，增加一步检测裁剪再做分割效果更精准；分割：先进行一层粗分割得到大致mask，再进行精细分割得到精确mask，这样一方面可以提速，一方面也可以精确到发丝级；如何让效果更精准？目前分类、检测模型相对比较成熟，而评估模型则需要根据不同场景做一些定制（电商设计图、天然摄影图等），分割精度不足，是所有模块中最薄弱的一个环节，因此成为了达摩院大牛们的主战场。

阿里云视觉智能开放平台

达摩院通过阿里云视觉智能开放平台将研究出来的各种人脸识别、图像识别等视觉AI能力都开放出来，其中也不乏像支付宝，天猫，淘宝这样的巨星级应用的精品视觉AI能力。技术与应用相互作用，最后沉淀更替，集合在这一小小宝箱中。为了让这些视觉AI能力更多得到应用，创造生活中更多的”小确幸“阿里云视觉智能开放平台&阿里云异构计算&阿里云开放平台&NVIDIA联合举办第二届AI挑战赛。你也可以免费试用这项技术随意进行开发。参赛获胜者有机会加入阿里云与NVIDIA企业加速计划、并获得大疆无人机等丰厚奖品。进入企业加速计划的获胜者或免费入驻阿里云创新中心并享受相关创业资源、与投资人面对面交流、进入NVIDIA初创企业扶持计划。

本页网址：https://www.xinzhibang.net/article_detail-4555.html

寻求报道，请

关键词

分享至微信：

相关工具

Dora AI

AI在线生成精美3D动画的网站

稿定AI

一站式AI创意工具集合，AI绘图、场景生成，商品合成

Appicons AI

AI生成精美App图标

AIDesign

腾讯推出的免费AI Logo在线设计工具

羚珑

京东推出的商品图智能设计小工具

Logomaster.ai

AI Logo生成工具

美团发布设计效能工具MasterGo，重点布局设计效能工具的建设和优化迭代

美团发布设计效能工具MasterGo，重点布局设计效能工具的建设和优化迭代近日，美团设计委员会在北京综合指挥中心举办了“美团设计效能工具发布会”，面向公司所有产研设团队发布了包括MasterGo在内的多款设计效能工具和能力。据了解，美团设计委员会于去年4月宣布加入“MasterGo国产设计软件共创计

分类标签美团MasterGo设计效能工具国产设计软件共创计划

12-08 16:14

免费视频翻译工具MyHeyGen的使用方法

简介近期，一款名为“视频翻译”的工具引起了广泛关注。这不是一个简单的网页应用，而是一个可以免费部署在个人电脑或服务器上的实用程序。它的强大之处在于能够翻译任意时长的视频内容。所谓的视频翻译，实际上是指同声传译。虽然这类工具并非近期才问世，市场上已有多款成熟产品，例如我之前提到的Heygen和rask

分类标签视频翻译Heygen免费工具

12-03 22:23

PikaLabs发布能编辑动画、2D动漫、卡通等多种画风的AI视频生成工具Pika1.0

PikaLabs发布能编辑动画、2D动漫、卡通等多种画风的AI视频生成工具Pika1.011月，AI视频生成领域卷到极致了！PikaLabs发布了一款能编辑动画、2D动漫、卡通等多种画风的AI视频生成工具Pika1.0，支持文本生成视频、A视频⇋B视频不同的风格转换、扩展视频画布、更改、延长视频等多

分类标签 PikaLabsAI视频生成动画2D动漫卡通

11-30 22:15

Pika1.0：AI视频拍摄会为生活带来哪些改变？

Pika1.0：AI视频拍摄会为生活带来哪些改变？随着Pika1.0的正式发布，AI视频领域再度掀起了一场震撼的浪潮。这家仅成立六个月的初创公司以其创新性和高效率引起了广泛关注，不仅获得了5500万美元的融资，估值达到近2亿美元，而且投资人名单更是硅谷半壁江山的鼎盛阵容，包括前GithubCEONa

分类标签 Pika1.0AI视频技术突破

11-30 22:14

世界首部人工智能电影《Cassandra》即将上映

世界首部人工智能电影《Cassandra》即将上映《Cassandra》是一部以人工智能故事为主线的电影，由ScuolaHolden和RaiCinema制作，将于11月27日在意大利都灵上映，并将在RaiPlay上播放。故事主要内容为：主角阿加莎是霍尔顿学校的一名年轻学生，被选中训练人工智能系统Ca

分类标签人工智能电影Cassandra意大利

11-26 16:17

人社部：1至9月全国城镇新增就业1022万人，完成全年目标任务的85%

就业形势总体改善，城镇新增就业1022万人对于当前的就业形势，王晓萍表示，“今年以来，我国就业形势总体改善，保持基本稳定。”1—9月，我国城镇新增就业1022万人，完成全年目标任务的85%。高校毕业生等青年就业基本稳定、持续好转，农村劳动力外出务工规模继续增加，3297万脱贫人口实现务工增收。今年各

分类标签就业城镇新增就业人才供需

11-18 18:16

MasterGo2.0发布会：AI时代的企业级产品设计平台

MasterGo2.0发布会：AI时代的企业级产品设计平台备受关注的“MasterGo2.0发布会”成功举办，来自各行业头部企业的300多位设计负责人、研发负责人共同见证了MasterGo2.0的发布。MasterGo在此次2.0版本的发布中，重磅推出了设计工程化、企业级解决方案，以及MasterG

分类标签 MasterGo2.0设计工程化企业级解决方案

11-13 02:19

MasterGo发布全新升级的2.0版本，正式开启MasterGoAI内测

MasterGo发布全新升级的2.0版本，正式开启MasterGoAI内测昨日，一站式产品设计协作平台MasterGo发布了全新升级的2.0版本，推出了设计工程化、企业级解决方案，并宣布正式开启MasterGoAI的内测。同时，MasterGo也正式公布了中文品牌名——“莫高设计”。MasterGo

分类标签 MasterGo产品设计协作平台设计工程化企业级解决方案AI

11-13 02:18

MasterGo2.0正式发布

MasterGo2.0正式发布MasterGo2.0是一款定位于AI时代的企业级产品设计平台，经过2年的迭代，已经服务了20个行业数百家企业。MasterGo2.0推出的三大核心功能分别是：MasterGo设计工程化MasterGo设计工程化是一项将设计团队和研发团队同频提效的功能。通过Master

分类标签 AI时代企业级产品设计平台设计团队

11-05 16:17

MasterGo发布基于人工智能技术的2.0版本，并推出中文品牌名“莫高设计”

MasterGo发布基于人工智能技术的2.0版本，并推出中文品牌名“莫高设计”11月2日下午，MasterGo对外发布了基于人工智能（AI）技术的MasterGo2.0版本，包括该版本的设计工程化、AI和本土企业级解决方案，以及发布了MasterGo中文品牌名“莫高设计”。MasterGo创始人、C

分类标签 MasterGo人工智能设计工程化

11-05 16:16