管理学院管理学与经济学系列前沿讲座之五三三讲
主题
扩散过程随机控制的自适应分割和学习
活动时间
-
活动地址
广州校区南校园管理学院善思堂M101室
主讲人
金含清副教授,牛津大学数学研究所
主持人
夏俐教授,中山大学管理学院
主办单位
中山大学管理学院管理科学教研室

嘉宾简介:

金含清博士现任牛津大学数学研究所副教授。他于2001 年获得南开大学数学硕士学位,2004 年取得香港中文大学金融工程博士学位。毕业后留校从事两年博士后研究工作,随后任职于新加坡国立大学数学系,担任助理教授一职。2008 年 1 月,他正式入职牛津大学。其研究方向涵盖金融数学、运筹学与随机分析,近期研究领域已拓展至数字经济学及去中心化金融领域。

讲座简介:

本讲座研究带控制的扩散过程的强化学习问题,该类问题具有无界连续状态空间、有界连续动作空间及多项式增长奖励函数—— 此类设定在金融、经济学及运筹学中具有天然适用性。为克服连续高维领域的挑战,本研究提出一种基于模型的自适应划分算法,对联合状态 - 动作空间进行动态划分。算法在每个子区域内维护漂移项、波动率及奖励函数的估计量,当估计偏差超出统计置信区间时自动细化离散化粒度。该自适应机制平衡了探索与逼近性能,实现无界域下的高效学习。理论分析表明,算法的遗憾界(regret bounds)依赖于问题时域长度、状态维度、奖励增长阶数,以及为无界扩散过程量身定义的新缩放维度(zooming dimension) 概念。该界在有界场景下可退化为现有结果,同时将理论保证拓展至更广泛的扩散型问题类。

扫描此二维码分享