自 盘 会Al 技术赋能的主动配电网智能调控——协同、安全、抗差、 LLM 增强的多智能体强化学习吴文传教授IEEE/CSEE/IET Fellow清华大学电机工程与应用电子技术系EMS②Smart Grid抗差强化学习LLM 增强强化学习协同强化学习安全强化学习研 究 背 景EMS②Smart Grid2我国分布式新能源目前总装机容量已突破 3.7 亿千瓦,预计到 2030 年将达 5 亿千瓦,在中东部四省 ( 鲁苏浙豫 ) 已成为仅次火电的第 2 大电源。40000200000总装机容量20142015201620172018201920202021202220232024中东部四省分布式光伏已成为第 2 大电源分布式光伏装机容量 / 万干瓦分布式新能源已成中东部四省主力电源分布式新能源占新能源 51%, 分布式光伏占分布式新能源98%分布式新能源■ : 分布式光伏 集中式光伏■集中式风电■核电■其它分布式新能源全国分布式光伏快速增长 / 万千瓦山 东江苏浙江河南河北广东广西海南贵州云南………………… ……………351%98%60005000400030002000100001 研究背景网33104网 437422%21%国 南6%2%从“基于模型”到“强化学习”基于模型的优化调控技术遇到的挑战:■ 建模和模型辨识成本昂贵■ 模型很多时候对控制是无效的■ 运行状态和模型持续变化■ 不同利益主体,信息隐私扰动建模 w%精确非线性模型控制器执行优化外部扰动 W物理系统状态变量 X研究背景输出变量 y控制变量U5从“基于模型”到“强化学习”基于强化学习的控制框架:电力系统 /仿真模型可控设备 控制指令action根据优化指标计算电力系统 状态信息节点注入、节点电压、 储能状态等通常从数据学习策略比学习模型容易StateObervation策略网络state transition EnvironmentrewardAgent研究背景PolicyValueNetNet值网络6边界模糊VS安全需求十 安全稳定 +误差干扰精准控制鲁棒抗差强化学习在主动配电网运行中的挑战二 协同、安全、抗差、 LLM 增强的多智能体强化学习研究背景海量主体 VS即插即用调度规程 VS智能解析高效协同LLM 增强十●7协 同 强 化 学 习8● 如何构建工程可行的调度架构● 如何保护协同过程中隐私信息● 如何实现海量智能体高效协同● 如何协调多时间尺度异构设备调控对象增加3 个数量级数干传统机组百万分布式资源协同强化学习主动配电网调控对象数量急剧增长?9{o₁,a,o, 片T.Q,Q,ππ iOu ao 叫 a a²个π 0a10.oa个t △ △t 2T,调度中心协同学习本地控制( 本地量测 )集群 ...