数据+进化算法 等于数据驱动的进化优化?
副问题[/!--empirenews.page--]
【资讯】数据驱动的进化优化是什么,仅仅就是数据 + 优化算法吗?数据驱动的进化优化合用于哪些应用场景?传统的数学优化要领是否迎来了新一轮的挑衅。本文将为您深入浅出的解答以上题目。文末我们还附上了相干资料与参考文献的大礼包,这些资料并非一个简朴的书单,是颠末本文两位作者多年的研究履历和进修过程全心挑选清算的,有顶级期刊的优质论文,也有科普公共的普通教材。 我们会网络相干的数据驱动优化经典文献和进化计较相干的课程 PPT 等资料做成网盘链接放到后边。 先说一说 数据驱动进化优化的 Motivation 简朴来说,数据驱动的进化优化(Data-driven evolutionary computation)就是借助数据和进化算法求解优化题目。起首为什么用进化算法呢?举几个例子,一些优化题目很难获取其数学优化模子的,如仿真尝试软件,可以当作是黑箱的优化题目。还有一些题目,固然知道数学表达式,可是表达式存在非凸,不行导,不行微等性子。这些题目很难用基于梯度的传统数学优化要领求解的,这时,智能优化算法就谨慎上场了,如遗传算法,粒子群算法,差分算法等。 那为什么还要借助数据呢?我们知道,智能优化算法都是基于种群迭代的优化算法的,种群包括几十个乃至几百个的个别(每个个别就是一个解),而且必要迭代几百代才气找出较量好的解,这种环境下优化题目就必要举办许多次评估(计较解的函数值)。好比说对付种群是 100,迭代次数 100 代的智能优化算法,优化题目就必要评估 10000 次!然而,有些优化题目评估价钱是很高的,好比风洞尝试评估一次就必要好几个小时;又好比制药工程,一次试药进程必要话费昂贵的价钱(一次试药就相关到小白鼠的生命)。对付智能优化算必要上千次及上万次的评估,优化题目是无法遭受的,这种环境下,学者们就想出了操作优化题目的汗青数据来帮助优化进程,以镌汰优化题目的评估次数,从而低落优化题目评估的价钱。 数据驱动进化优化算法 那么,数据驱动的进化优化是奈何举办的呢?进程如图 1 所示(来自文献 [1])。先用优化进程优化题目(图中的 Exact function evaluation,以下称为真实优化题目)发生的数据成立个模子,这个模子称为署理模子(Surrogate),以是早年数据驱动的进化优化算法也叫署理模子帮助的进化优化算法(Surrogate-Assisted Evolutionary Algorithm,SAEA)。署理模子的目标就是迫近真实题目。 在优化进程中,这个署理模子和真实题目彼此相助评估个别,这个彼此相助就是所谓的模子打点(Surrogate Management)。署理模子和真实优化题目彼此相助有两个方面的缘故起因,一方面是署理模子由真实题目的数据实习获得,和真实题目有着相似性,用署理模子取代优化题目对解举办评估,预选出真实题目的较量好的解,以镌汰真实题目的评估次数。另一方面是署理模子和真实题目存在毛病,用真实题目对解举办评估以防备署理模子误导解偏离真实题目,将真实题目评估的解插手实习数据集(就是图中的虚线那块)批改署理模子。那么署理模子是怎么成立的?模子打点是什么呢? 图 1. 数据驱动的进化优化算法流程(来自文献 1) 一样平常来说,呆板进修的那些建模要领都可以拿来实习署理模子,如高斯进程,神经收集,SVM,RBF 尚有各类集成模子。不外用的较量多的是高斯进程(讲到后头模子打点就知道了)。 模子打点常用的要领在学术上称为基于代和个另外殽杂要领。意思就是算法先以署理模子为优化题目举办优化多少代,然后从最后一代中选取一部门个别从头送给真实题目从头评估。 这里的重点和难点(也是 SAEA 题目)是从署理模子中选择出哪些解可以或许快速帮助真实题目的收敛,也就是前面提到的奈何预选出好的解。怎样从署理模子中选择真实题目评估解的计策在 SAEA 中有个专业名词叫 Infill Sampling Criteria. 一个设法是选择署理模子最好的一部门解给真实题目从头评估,在这种环境下,假如署理模子足够精确,也是就署理模子和真实优化题目很近似,那么选择出的这些解更有助于真实题目的收敛。如图 2 所示。 图 2. 选择署理模子的最优解 可是实习足够精确的署理模子是不太实际的,出格是在 SAEA 中网络到的小数据。因此,另一种选择从头评估解的要领就是选择署理模子以为不确定的解(简朴的领略是离其余个别较量远的那些个别),如图 3 所示(来自文献 2)。这时就能浮现出高斯进程的上风了,既能直接给出解的评估值还能给出评估值简直定性(一个讲授高斯进程的网址http://www.ppvke.com/Blog/archives/24049)。选择这些不确定的解有两方面甜头:这些个别地址的地区还很少被搜刮(图 3a),转达给真实题目可以或许进步真实题目的试探手段。另一个甜头是因为这些个别漫衍在稀少的地区,用真实题目评估事后插手实习集进步了实习集的多样性,从而在在署理模子批改进程能很洪流平进步署理模子的精确度(图 3b)。 图 3. 选择署理模子最不确定的解(来自文献 2) 最后一种要领,也是最常用的要领是选择那些分身上述两种环境的个别。如高斯进程模子常用的 LCB 指标,ExI 指标如公式(1)和(2)。 对付其余不能给出解禁绝确度的模子,SAEA 研究规模提出了各类百般的计策。好比说成立局部署理模子,选择局部署理模子的最优解;对付集成模子,用各个子模子评估的差别性代表个别评估的精确性等。 最后真实题目的最优解(集)就从实习集内里选出(真实题目评估过的解)。以上所述就是数据驱动进化优化算法的简朴进程。具体的先容保举综述 [3] 和挑衅[4]。 进化算法 VS 数学优化(以下的接头均基于单方针优化题目) 上面的章节对数据驱动的进化优化给出了一个简朴先容,看到这里各人也许想问一下进化算法和数学优化(假如不认识数学优化是什么可以参考这篇文章https://zhuanlan.zhihu.com/p/25579864)各自的上风和不敷是什么。现实上做进化算法和数学优化都是为了办理优化题目,可是出发的角度是有很大差异的,我们常常接见到以下景象。 Round1 求解结果 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |