进修!呆板进修算法优弱点综述
副问题[/!--empirenews.page--]
¼ 正则化算法(Regularization Algorithms) 集成算法(Ensemble Algorithms) 决定树算法(Decision Tree Algorithm) 回归(Regression) 人工神经收集(Artificial Neural Network) 深度进修(Deep Learning) 支持向量机(Support Vector Machine) 降维算法(Dimensionality Reduction Algorithms) 聚类算法(Clustering Algorithms) 基于实例的算法(Instance-based Algorithms) 贝叶斯算法(Bayesian Algorithms) 关联法则进修算法(Association Rule Learning Algorithms) 图模子(Graphical Models) 正则化算法(Regularization Algorithms) 它是另一种要领(凡是是回归要领)的拓展,这种要了解基于模子伟大性对其举办处罚,它喜痪?对简朴可以或许更好的泛化的模子。 例子: 岭回归(Ridge Regression) 最小绝对紧缩与选择算子(LASSO) GLASSO 弹性收集(Elastic Net) 最小角回归(Least-Angle Regression) 利益: 其处罚会镌汰过拟合 总会有办理要领 弱点: 处罚会造成欠拟合 很难校准 集成算法(Ensemble algorithms) 集成要领是由多个较弱的模子集成模子组,个中的模子可以单独举办实习,而且它们的猜测能以某种方法团结起往复做出一个总体猜测。 该算法首要的题目是要找出哪些较弱的模子可以团结起来,以及团结的要领。这是一个很是强盛的技能集,因此广受接待。 Boosting Bootstrapped Aggregation(Bagging) AdaBoost 层叠泛化(Stacked Generalization)(blending) 梯度推进机(Gradient Boosting Machines,GBM) 梯度晋升回归树(Gradient Boosted Regression Trees,GBRT) 随机丛林(Random Forest) 利益: 当先最先辈的猜测险些都行使了算法集成。它比行使单个模子猜测出来的功效要准确的多 弱点: 必要大量的维护事变 决定树算法(Decision Tree Algorithm) 决定树进修行使一个决定树作为一个猜测模子,它将对一个 item(表征在分支上)调查所得映射成关于该 item 的方针值的结论(表征在叶子中)。 示范子中的方针是可变的,可以采一组有限值,被称为分类树;在这些树布局中,叶子暗示类标签,分支暗示表征这些类标签的毗连的特性。 例子: 分类和回归树(Classification and Regression Tree,CART) Iterative Dichotomiser 3(ID3) C4.5 和 C5.0(一种强概略领的两个差异版本) 利益: 轻易表明 非参数型 弱点: 趋向过拟合 也许或陷于局部最小值中 没有在线进修 回归(Regression)算法 回归是用于预计两种变量之间相关的统计进程。当用于说明因变量和一个 多个自变量之间的相关时,该算法能提供许多建模和说明多个变量的能力。详细一点说,回归说明可以辅佐我们领略当恣意一个自变量变革,另一个自变量稳固时,因变量变革的典范值。最常见的是,回归说明能在给定自变量的前提下预计出因变量的前提祈望。 回归算法是统计学中的首要算法,它已被纳入统计呆板进修。 例子: 平凡最小二乘回归(Ordinary Least Squares Regression,OLSR) 线性回归(Linear Regression) 逻辑回归(Logistic Regression) 慢慢回归(Stepwise Regression) 多元自顺应回归样条(Multivariate Adaptive Regression Splines,MARS) 当地散点滑腻预计(Locally Estimated Scatterplot Smoothing,LOESS) 利益: 直接、快速 知名度高 弱点: 要求严酷的假设 必要处理赏罚非常值 人工神经收集 人工神经收集是受生物神经收集开导而构建的算法模子。 它是一种模式匹配,常被用于回归和分类题目,但拥有复杂的子域,由数百种算法和种种题目的变体构成。 例子: 感知器 反向撒播 Hopfield 收集 径向基函数收集(Radial Basis Function Network,RBFN) 利益: 在语音、语义、视觉、种种游戏(如围棋)的使命中示意极好。 算法可以快速调解,顺应新的题目。 弱点: 必要大量数据举办实习 实习要求很高的硬件设置 模子处于黑箱状态,难以领略内部机制 元参数(Metaparameter)与收集拓扑选择坚苦。 深度进修(Deep Learning) 深度进修是人工神经收集的最新分支,它受益于今世硬件的快速成长。 浩瀚研究者今朝的偏向首要齐集于构建更大、更伟大的神经收集,今朝有很多要领正在聚焦半监视进修题目,其顶用于实习的大数据集只包括很少的标志。 例子: (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |