计算机软件新技术国家重点实验室
摘
要:
基于强化学习技术,人工智能系统已在围棋、视频游戏等领域展示出了可超越人类的决策能力。然而在大量的实际应用中,如此强大的决策能力仍然难以获得,其主要瓶颈之一在于,目前强化学习的训练过程需要大量试错,而在实际应用环境中直接试错将造成难以承受的代价,甚至发生灾难。针对这一瓶颈,我们在近期的研究中发展了"环境虚拟—强化学习—模型重用"的途径,对于有历史数据积累的应用领域,实现了0试错代价的决策学习。本次报告将汇报我们在这一途径上的探索进展和在应用场景中取得的效果。
报告人简介:
俞扬,博士,南京大学教授。主要研究领域为机器学习、强化学习。分别于2004年和2011年获得南京大学计算机科学与技术系学士学位和博士学位,获2013年全国优秀博士学位论文奖、2011年CCF优秀博士学位论文奖。发表论文40余篇,包括多篇Artificial Intelligence、IJCAI、AAAI、NIPS、KDD等,获得4项国际论文奖励和2项国际算法竞赛冠军,入选2018年IEEE Intelligent Systems杂志评选的“国际人工智能10大新星”,获2018亚太数据挖掘"青年成就奖”,受邀在IJCAI’18作关于强化学习的"青年亮点"报告。
时间:3月26日(星期二) 12:20
地点:计算机科学技术楼111室
|