华乐网
当前位置: 首页 >头条 >科技 >正文

机器学习算法分为三类:有监督学习、无监督学习、增强

2018-03-29 00:05    

机器学习算法分为三类:有监督学习、无监督学习、增强学习。有监督学习需要标识数据(用于训练,即有正例又有负例),无监督学习不需要标识数据,增强学习介于两者之间(有部分标识数据)。常见的机器学习算法有以下几种:

01

决策树

决策树是一个决策支持工具,它使用树形图或决策模型以及序列可能性。包括各种偶然事件的后果、资源成本、功效。决策树可以用来回答Yes和No问题,它通过树形结构将各种情况组合都表示出来,每个分支表示一次选择(选择Yes还是No),直到所有选择都进行完毕,最终给出正确答案。

02

随机森林

顾名思义,随机森林是用随机的方式建立一个森林,森林里面有很多的决策树组成,随机森林的每一棵决策树之间是没有关联的。在得到森林之后,当有一个新的输入样本进入的时候,就让森林中的每一棵决策树分别进行一下判断,看看这个样本应该属于哪一类(对于分类算法),然后看看哪一类被选择最多,就预测这个样本为那一类。

随机深林算法的优势在于能够处理大规模数据集,以及大量看似不相关的数据,可以用于风险评估和客户信息分析。

03

支持向量机(SVM)

支持向量机(SVM)是二元分类算法。给定一组两种类型的N维的地方点,SVM产生一个(N - 1)维超平面到这些点分成两组。假设有两种类型的点,且它们是线性可分的。 SVM将找到一条直线将这些点分成两种类型,并且这条直线会尽可能地远离所有的点。

在规模上,目前使用SVM(在适当修改的情况下)解决的最大的问题包括显示广告、人类剪接位点识别、基于图像的性别检测和大规模的图像分类等等。

04

逻辑回归

逻辑回归模型是一个二分类模型,它选取不同的特征与权重来对样本进行概率分类,用一各log函数计算样本属于某一类的概率。即一个样本会有一定的概率属于一个类,会有一定的概率属于另一类,概率大的类即为样本所属类。

具体应用有:车流分析、信用评级、营销活动成功概率、产品销售预测、预测地震等。

05

朴素贝叶斯

朴素贝叶斯分类是一种十分简单的分类算法,方程 P(A|B)是后验概率,P(B|A)是可能性,P(A)是类先验概率,而P(B)是预测先验概率。朴素贝叶斯的思想基础是这样的:对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类别。朴素贝叶斯分类器基于贝叶斯理论及其假设(即特征之间是独立的,是不相互影响的)。具体应用有:垃圾邮件检测、文章分类、情感分类、人脸识别等。

06

马尔可夫

可观察的马尔科夫决策过程是确定性的——一个给定的状态总是遵循另一个给定的状态。例如交通信号灯的模式。隐马尔科夫模型通过分析可观察的数据来计算隐藏状态的概率,然后通过分析隐藏状态来估计未来可能观察到的模式。比如,通过分析高气压(或低气压)的概率来预测天气是晴天,雨天或多云的可能性。

07

K最近邻

给一个新的数据时,离它最近的k个点中,哪个类别多,这个数据就属于哪一类。例如,要区分猫和狗,通过claws和sound两个feature来判断的话,圆形和三角形是已知分类的了,那么这个 star 代表的是哪一类呢?

k=3时,这三条线链接的点就是最近的三个点,那么圆形多一些,所以这个star就是属于猫。

08

K均值

想要将一组数据,分为三类,粉色数值大,黄色数值小。最开心先初始化,这里面选了最简单的 3,2,1 作为各类的初始值。剩下的数据里,每个都与三个初始值计算距离,然后归类到离它最近的初始值所在类别。

分好类后,计算每一类的平均值,作为新一轮的中心点。

几轮之后,分组不再变化了,就可以停止了。

09

人工神经网络

人工神经网络算法模拟生物神经网络,是一类模式匹配算法。通常用于解决分类和回归问题。人工神经网络是机器学习的一个庞大的分支,有几百种不同的算法,深度学习就是其中的一类算法。重要的人工神经网络算法包括:感知器神经网络(Perceptron Neural Network)、反向传递(Back Propagation)、Hopfield 网络、自组织映射(Self-Organizing Map, SOM)、学习矢量量化(Learning Vector Quantization,LVQ)。

10

深度学习

深度学习算法是对人工神经网络的发展。在计算能力变得日益廉价的今天,深度学习试图建立大得多也复杂得多的神经网络。很多深度学习的算法是半监督式学习算法,用来处理存在少量未标识数据的大数据集。常见的深度学习算法包括:受限波尔兹曼机(Restricted Boltzmann Machine, RBN)、 Deep Belief Networks(DBN)、卷积网络(Convolutional Network)、堆栈式自动编码器(Stacked Auto-encoders)。

除了以上算法,机器学习的算法还有很多种,具体需要用哪种,很大程度上取决于手头的数据及其特征、训练目标,以及使用场景。

免责声明:转载自网络 不用于商业宣传 版权归原作者所有 侵权删

品牌、内容合作请点这里: 寻求合作 ››

榜单

今日推荐