监督学习 - 知识百科

监督学习

更新时间：2024-01-22 17:59

监督学习是利用一组已知类别的样本调整分类器的参数，使其达到所要求性能的过程，也称为监督训练或有教师学习。

定义

监督学习，也被称为监督机器学习，是机器学习和人工智能的一个子类。它的定义是使用标记数据集来训练算法，以便对数据进行分类或准确预测结果。当输入数据被输入到模型中时，它会调整其权重，直到模型被适当地拟合，这是交叉验证过程的一部分。监督式学习可以帮助组织大规模地解决各种现实世界的问题，例如对收件箱中单独文件夹中的垃圾邮件进行分类。

原理

监督学习使用一个训练集来教模型产生期望的输出。这个训练数据集包括输入和正确的输出，这使得模型可以随着时间的推移而学习。该算法通过损失函数测量其精度，调整直到误差被充分最小化。

当数据挖掘-分类和回归时，监督学习可以分为两类问题:

分类使用一种算法将测试数据准确地分配到特定的类别中。它识别数据集中的特定实体，并试图得出关于如何标记或定义这些实体的一些结论。常见的分类算法有线性分类器、支持向量机(SVM)、决策树、k近邻和随机森林，下面将对它们进行更详细的描述。

回归是用来理解因变量和自变量之间的关系。它通常用于预测，例如预测给定业务的销售收入。线性回归、逻辑回归和多项式回归是常用的回归算法。

特点

1、偏置方差权衡

第一个问题就是偏置和方差之间的权衡。假设有几种不同的,但同样好的演算数据集。一种学习算法是基于一个未知数的输入，在经过这些数据集的计算时,系统会无误的预测到并将正确的未知数输出。一个学习算法在不同的演算集演算时如果预测到不同的输出值会对特定的输入有较高的方差。一个预测误差学习分类器是与学习算法中的偏差和方差有关的。一般来说,偏差和方差之间有一个权衡。较低的学习算法偏差必须“灵活”,这样就可以很好的匹配数据。但如果学习算法过于灵活,它将匹配每个不同的训练数据集,因此有很高的方差。许多监督学习方法的一个关键方面是他们能够调整这个偏差和方差之间的权衡(通过提供一个偏见/方差参数,用户可以调整)。

免责声明

隐私政策

用户协议

目录 22

0{{catalogNumber[index]}}. {{item.title}}