10月27日15时,计算机技术与工程学院特邀同济大学的饶卫雄教授在杨浦校区实训楼70103多功能厅开展专业讲座,分享多智能体系统与强化学习的前沿研究成果,覆盖交通、机器人、历史模拟等多场景应用。
饶教授开场表示,多智能体系统广泛应用于自动驾驶、智能制造、机器人协作等领域,具有显著的协同工作优势。然而,如何实现多智能体之间的高效协作、确保系统的稳定性和实时性,仍然是技术发展的关键挑战。
饶卫雄:同济大学计算机科学与技术学院教授
•研究方向:数据科学以及机器学习应用
•曾获2021年全国高校计算机专业优秀教师奖励计划
•2018年度华为杰出合作成就奖等荣誉
在多智能体强化学习路径规划的研究中,饶教授关注了三个关键问题:首先,连续空间下的机器人动态路径规划与优化,通过强化学习使机器人能够在动态环境中实时调整路径,应对障碍物和变化的条件。
其次,大规模交通道路网络下的异步路径规划,利用分布式强化学习算法,使多个自动驾驶车辆能够独立决策,有效应对复杂的交通流动;最后,多智能体协同探测的状态估计学习优化,通过多智能体协作和共享感知信息,优化状态估计,提高系统在复杂环境中的探测精度和鲁棒性。这些研究推动了智能交通与机器人系统的自适应和协同能力。
在多智能体与大语言模型结合的规划推理研究中,饶教授主要探讨了四个核心主题:
首先,交通信号灯控制通过大语言模型的推理能力和多智能体的协作,优化交通信号的动态调度,有效减少交通拥堵和提高道路通行效率;其次,空间路径规划能力结合大语言模型的高效推理与多智能体协作,支持复杂的环境中机器人或无人驾驶系统的路径规划,提升路径优化和决策的准确性。
接着,历史事件仿真验证利用大语言模型的强大推理和信息处理能力,模拟并验证历史事件或复杂场景中的决策过程,为未来的预测和策略提供依据。
最后,微观战场动态仿真通过多智能体协作与大语言模型的结合,模拟并优化战场上的动态变化,提升战术决策和应变能力。结合这些技术,可以大幅度提升系统在复杂和动态环境中的规划与推理能力。
未来工作将聚焦于大语言模型(LLM)在多个领域的创新应用。首先,LLM将进一步增强时空感知能力,提升智能系统在复杂环境中的实时感知和决策能力;同时,通过优化长程规划能力,帮助系统在长期任务中制定更加精准的策略和路径。随着LLM微调技术的发展,模型将能够更好地适应特定场景需求,提供定制化的解决方案。此外,LLM还将在产品设计中扮演多重角色,作为设计师、分析工程师和试验工程师,协同推动产品开发过程的自动化和创新。通过这些技术的融合应用,未来的智能系统将具备更强的自主性、灵活性和高效性,推动各行业的技术进步和应用创新。
讲座结束后,现场进入互动交流环节,气氛热烈活跃。在场师生踊跃提问,围绕多智能体系统的实际应用、大语言模型在仿真中的具体实现、以及未来技术发展趋势等方面与饶教授进行了深入探讨。饶教授耐心细致地一一解答,并结合实际案例进一步阐释了相关技术的核心思想与应用前景。
互动环节不仅加深了师生对前沿技术的理解,也激发了大家对智能系统研究与创新的浓厚兴趣,此次多功能体技术学习分享活动在校师生积极报名参加,彰显了我院对计算机网络领域的发展与未来趋势发展的高度重视,利用丰富多元的知识为学生们开阔眼界,拔高站位。
