机器学习程序分为 3 种类型,如下所示。
监督
无监督
强化学习
2.1 监督学习
监督学习发生在监督者在场的情况下,就像小孩在老师的帮助下进行的学习一样。当孩子在老师的监督下接受训练以识别水果、颜色和数字时,这种方法就是监督学习。
在这种方法中,孩子的每一步都由老师检查,孩子从他必须产生的输出中学习。
监督学习如何运作?
在有监督的 ML 算法中,输出是已知的。输入与输出之间存在映射。因此,为了创建一个模型,机器被输入了大量的训练输入数据(输入和相应的输出已知)。
训练数据有助于为创建的数据模型实现一定程度的准确性。构建的模型现在已准备好接受新的输入数据并预测结果。
什么是标签数据集?
对于给定输入,具有已知输出的数据集称为标记数据集。例如,水果的图像连同水果的名称是已知的。因此,当显示新的水果图像时,它会与训练集进行比较以预测答案。
2.2 无监督学习
无监督学习在没有监督者的帮助下发生,就像鱼学会自己游泳一样。这是一个独立的学习过程。
在此模型中,由于没有与输入映射的输出,因此目标值是未知/未标记的。系统需要自己从输入的数据中学习并检测隐藏的模式。
什么是无标签数据集?
对于所有输入值具有未知输出值的数据集称为未标记数据集。
无监督学习如何工作?
由于没有已知的输出值可用于在输入和输出之间建立逻辑模型,因此使用一些技术来挖掘数据规则、模式和具有相似类型的数据组。这些组帮助最终用户更好地理解数据并找到有意义的输出。
馈入的输入不像训练数据那样采用适当的结构形式(在监督学习中)。它可能包含异常值、噪声数据等。这些输入一起馈送到系统。在训练模型时,输入被组织形成集群。
无监督算法的类型
聚类算法:寻找相同形状、大小、颜色、价格等数据项之间的相似性,并将它们分组形成一个聚类的方法就是聚类分析。
异常值检测:在这种方法中,数据集是对数据中任何类型的差异和异常的搜索。例如,系统检测到信用卡上的高额交易以进行欺诈检测。
关联规则挖掘:在这种类型的挖掘中,它找出最频繁出现的项集或元素之间的关联。诸如“经常一起购买的产品”等关联。
自动编码器:输入被压缩成编码形式并被重新创建以去除噪声数据。该技术用于改善图像和视频质量。
2.3 强化学习
在这种类型的学习中,算法通过反馈机制和过去的经验来学习。总是希望采取算法中的每一步来达到一个目标。
因此,无论何时要采取下一步,它都会收到上一步的反馈,以及从经验中学习来预测下一个最佳步骤。这个过程也称为达到目标的试错过程。
强化学习是一个长期的迭代过程。反馈的数量越多,系统就越准确。基本强化学习也称为马尔可夫决策过程。
强化学习的例子
强化学习的一个例子是视频游戏,玩家完成游戏的某些级别并获得奖励积分。游戏通过奖励动作向玩家提供反馈,以提高他/她的表现。
强化学习用于训练机器人、自动驾驶汽车、库存自动管理等。
以上讲解了什么是机器学习以及机器学习是如何工作的,还有机器学习的类型分为监督学习、无监督学习、强化学习等。