AI助益与多智能体学习:博弈论、可解释性与落地

新知榜官方账号

2023-08-22 01:32:50

AI助益与多智能体学习:博弈论、可解释性与落地

本文介绍了卡内基梅隆大学计算机学院软件研究所方飞教授的研究方向,主要涉及AI助益和多智能体学习,包括博弈论、可解释性和落地等方面。同时,还讨论了与公益组织合作的经历,以及如何发现社会公益上的痛点和问题。

研究方向

方教授的研究基本围绕多智能体交互(Multi-agent Interaction)展开,具体有三个分支:

  1. 计算博弈论:考虑多智能体之间的博弈,比如计算均衡策略;学习智能体在博弈过程中的反推,学习多智能体之间未知的内容,比如每个智能体的效用函数。
  2. 多智能体学习(Multi-agent Learning):包括多智能体强化学习,以及如何提升多智能体强化学习的效率和提升策略的可解释性的工作。
  3. AI助益(AI for Social Good):主要解决的是多个决策者之间互动协作的问题。比如动物保护,食品安全和交通相关的工作。

这三个方向都属于AI,包括博弈论和AI的结合。方教授认为,计算博弈论的顶会有AAAI、IJCAI、AAMAS等,计算博弈论与CV或者NLP这类普遍认为的AI结合,其实很常见。对于多智能体学习和博弈论的结合,也有很多实际应用,比如外交游戏的论文,其中用很多LLM嵌入文本数据。

落地与合作

方教授的研究成果在AI助益方面得到了很好的落地和实际应用。其中涉及与公益组织合作的经历,也深刻体现了落地过程中的挑战。

方教授介绍了他们在动物保护和食品救助方面的工作,包括设计巡护员的巡护路线以及给管理人员做新闻搜集整理等。这些工作能够落地,产生影响,就是他们成就感和驱动力的来源。

同时,方教授也提到了公益组织和学术界合作的困难,包括合作双方关注点不同,签署数据共享协议耗费时间等。他们在落地过程中也遇到了很多挑战,例如在食品救助方面,推出的算法并不是直接使用,而是被融合到对方系统中去。

计算资源

方教授的研究方向对计算资源的需求并不是很大,因为他们更多是通过设计算法提升计算效率,而不是依靠多卡。他们也在探索如何更好地找到计算的资源。未来的研究肯定需要卡,他们也在考虑如何获取更多的资源。

本页网址:https://www.xinzhibang.net/article_detail-10176.html

寻求报道,请 点击这里 微信扫码咨询

关键词

AI助益 多智能体学习 博弈论 可解释性 落地

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯