讲座题目:多智能体沙盒模拟引擎AgentSims的介绍及使用指南
主讲人:赵浩然 北京航空航天大学
地点:半岛平台210
讲座信息:2023年11月21日10:00
讲座内容摘要:
AgentSims是一款专门设计用于评估语言模型(LLM)的多智能体沙盒模拟引擎。传统的LLM评估方法常受限于能力评估范围、测评正当性和评价标准的透明度等问题,AgentSims旨在通过复杂任务模拟的方式,有效提升评估的广度和深度。AgentSims以仿真社区为平台,要求AI智能体完成设计者预设的任务,证实其在特定方面的能力。得益于Smallville——斯坦福小镇的初步构想,AgentSims在此基础上进一步扩展,克服了Smallville固定地图和角色限制的短板,为模拟更大规模社会互动提供可能。AgentSims强化了用户自定义实验的能力,包括灵活的地图、物品,以及人物数量设定。尤其重要的是,AgentSims在经济系统模拟方面的努力,包括价格设定、存款管理和工资支付等经济参数,构建了一个初步的经济模拟框架。为确保各学科研究人员能简单地地使用AgentSims,它设有简洁的GUI界面和高度抽象的代码结构,使得初学者能轻松地修改或添加新模块,即使无代码经验的用户也能够便捷地定制自己的模拟社区。AgentSims致力于实现一个开放、多元的学术社区,通过跨学科合作推进LLM在多领域中的应用和评估,并期待搭建一个支撑科研共荣的基础设施平台。本报告将介绍AgentSims框架的基本原理,并致力于教学用户进行二次开发,搭建自己感兴趣的模拟任务。
主讲人简介:
赵浩然,北京航空航天大学博士,研究兴趣为人工智能和多智能体系统。发表SCI论文2篇,会议及预印本论文数篇。代表作AgentSims及AeroAgent被多家媒体转发报道,其中AgentSims Github 获超过550 Stars,浏览量逾1200。