内容

曾一锋教授:不确定环境下智能体序贯决策;潘颖慧博士:Towards Data-driven Multiagent Decision Making Using I-DIDs

阅读数:267    发布:2018-08-01 08:45    

标题:不确定环境下智能体序贯决策

时间、地点:2018年8月6日,938会议室

报告人:曾一锋

摘要:影响图是一种利用有向图构造决策问题的概率模型和数量计算框架的贝叶斯决策技术,可以有效地解决单个智能体的行为选择问题。影响图的概念最早由HowardMatheson1984年提出,它由决策节点、机会节点和值节点组成,为解决影响图不能对动态决策问题进行建模以及动态贝叶斯网络难以有效处理智能体决策、行为交互和协调等问题,TatmanShachter1990年在动态贝叶斯网和影响图的基础上首先提出了动态影响图,引入并利用超级节点技术以累加不同时序上影响图的期望值函数,可以用来求解不确定环境下的单个智能体动态决策问题。动态影响图是目前国际上研究智能体序贯决策的经典方法,是部分可观测马尔可夫决策的图形表达。着重介绍了如何从贝叶斯网络-部分可观测马尔可夫决策-动态影响图的演化过程。

报告人简介:曾一锋,工学博士,2012年就职于厦门大学自动化系教授。2002-2005年博士毕业于新加坡国立大学。长期从事人工智能研究,主要研究贡献集中在多智能体系统和机器学习等研究领域,迄今发表近100篇高水平学术论文,其中近一半研究论文出现在人工智能国际顶级期刊和会议。担任数十个国际顶级会议和期刊程序委员会委员和审稿者,并主持多个国际学术会议。


标题:Towards Data-driven Multiagent Decision Making Using I-DIDs

时间、地点:201886日,938会议室

报告人:潘颖慧

摘要:交互式动态影响图是从个体决策者的角度研究不确定性多智能体序贯决策问题的一种普遍适用的建模方法,克服了传统的博弈论方法求解多智能体决策问题的局限性。求解交互式动态影响图模型的主要困难在于复杂的智能体相互建模过程。基于目前大量的交互式动态影响图研究工作,总结归纳了模型的具体表达方式和求解方法,提出了数据驱动的交互式动态影响图求解方法。

报告人简介:潘颖慧,工学博士,2002年就职于江西财经大学信息管理学院。2006-2012年硕博连读毕业于厦门大学自动化系。主要从事多智能体系统、不确定性人工智能等方向研究工作,现主持国家自然基金2项,江西省自然基金1项。


深圳大学计算机与软件学院 2009-2016