9月18日下午,理学院在1号楼806会议室举办本年度第四场“研之有理”学术论坛。论坛邀请天津市青年拔尖人才、南开大学数学科学学院柏立华教授作“基于扩散模型的最优分红问题的强化学习方法”的主题报告。会议由统计系教师第二党支部书记任晓艳主持,学院教师和研究生70余人参加。
柏立华教授的报告聚焦于连续时间扩散模型下的最优分红问题,特别是分红率受限于[0,a]区间且模型参数未知的情况。为了逼近最优策略,柏老师巧妙地引入强化学习概念,通过解决熵正则化探索控制问题来实现策略的随机化与优化探索之间的平衡。在报告中,她不仅深入剖析了熵正则化控制问题的理论内涵,还利用策略改进论点和先进的评估工具,构建了一系列逼近最优策略的有效方法。报告结束后,柏立华与在座师生围绕扩散模型、未知参数估计等方面的问题展开热烈讨论。
此次论坛为师生们提供了一个宝贵的学术交流平台,也进一步展现了理学院在学科发展与科研平台建设方面的高度重视和持续努力。今后理学院将继续以高质量的学术活动为契机,不断激发师生科研创新活力,推动学术研究的深入发展。