管理学院管理学与经济学系列前沿讲座之五二七讲
主题
多阶段随机规划与马氏决策过程的集成框架
活动时间
-
活动地址
腾讯会议,ID:304-254-994
主讲人
陈志平教授,西安交通大学数学与统计学院
主持人
夏俐教授,中山大学管理学院
主办单位
中山大学管理管理科学教研室

嘉宾简介:

陈志平,国家天元数学西北中心副主任,西安交通大学二级教授、博士生导师;长期从事随机优化理论及其应用、分布鲁棒优化、强化学习、金融风险度量、保险精算等领域的学术研究,在SIAM J. Optim., Math. Oper. Res., Math. Program., Eur. J. Oper. Res., J. Bank. Finance, J. Econ. Dyn. Control, Insur. Math. Econ.等运筹学、经济与金融领域学术期刊发表SCI(SSCI)检索论文120余篇;先后主持国家自然科学基金项目及横向项目20余项,现主持国家重点研发计划重点专项“强化学习的数学理论与随机优化的自学习方法”;现任OR Spectrum、Big Data and Information Analytics、Mathematics、《西安交通大学学报》《工程数学学报》等国内外期刊的编委;现任中国运筹学会常务理事,中国优选法统筹法与经济数学研究会量化金融与保险分会常务理事,中国管理科学与工程学会金融计量与风险管理研究会理事,中国管理科学与工程学会理事,中国工业与应用学学会竞赛工作委员会委员等。

讲座简介:

该讲座将介绍研究者提出的一种集成MSP-MDP 框架,该框架融合了马尔可夫决策过程(MDP)与多阶段随机规划(MSP)的核心特征。这一集成框架可用于研究动态决策过程,该过程涉及系统状态转移与随机环境的动态变化,二者分别受潜在的内生不确定性和外生不确定性影响。通过多个示例,研究者阐明了所提模型的通用性。在推导问题的嵌套重构形式后,探讨了阶段最优值函数的连续性、利普希茨连续性及凸性。随后,研究者围绕内生不确定性和外生不确定性的概率分布扰动,从最优值与最优解集两个维度,对模型开展定量稳定性分析。具体而言,研究者基于两类不确定性各自概率分布的Kantorovich 度量与Fortet-Mourier度量,通过推导误差界,量化了两种不确定性的扰动对最优值和最优解集的影响。这些结果与现有基于滤子距离或嵌套距离建立的稳定性结果存在差异。

扫描此二维码分享