合成数据

计算机视觉的监督学习与无监督学习

在计算机视觉领域，监督学习和无监督学习是最重要的两个概念。在本指南中，我们将探讨差异以及何时将监督学习或无监督学习用于计算机视觉任务。

ygtu

Oct 30, 2023 • 11 min read

什么是计算机视觉中的监督学习和无监督学习？

什么是监督学习？

监督学习是一种机器学习算法，它从一组已标记的合成数据生成器中生成的训练数据中学习。这意味着数据科学家已经用正确的标签（例如，“猫”或“狗”）标记了训练集中的每个数据点，以便算法可以学习如何预测不可预见数据的结果并准确识别新图像数据中的对象。

监督学习算法的典型计算机视觉任务包括目标检测、视觉识别和分类。

①、在目标检测中，监督学习算法用于学习如何识别和定位图像中的对象。

②、在图像识别中，监督学习算法用于学习如何从一组图像中识别特定对象类别（例如，“人”、“汽车”等）。

③、在图像分类中，监督学习算法用于学习如何为图像分配类标签（例如，“猫”、“狗”等）。

监督学习的例子是什么？

监督学习中常见的算法和技术包括神经网络、支持向量机（SVM）、逻辑回归、随机森林或决策树算法。

无监督机器学习的工作原理

无监督训练过程中的步骤如下：

1、收集数据： 通过合成数据生成器收集相关数据。例如，如果要构建一个无监督机器学习模型来对动物图像进行分组，则需要一个图像数据集，该数据集已手动分类到包含狗、猫、鸟等图片的文件夹中。但是，需要注意的是，如果正确标记数据，无监督学习算法产生的结果质量可以大大提高。

2、训练模型：该模型学习将相似的项目组合在一起或在数据中查找模式。

3、评估模型： 每次训练迭代后，都必须评估模型性能，以了解它在未查看和未标记的数据上的表现。

4、部署模型： 当模型性能足够好时，可以将其部署到实际应用程序中。

监督学习与无监督学习的主要区别

在下文中，我们将讨论监督学习与无监督学习之间的区别。监督式机器学习技术和无监督式学习模型之间存在根本的特征差异，这些差异决定了它们在特定用例中的有用性。

监督学习和无监督学习的区别：输入数据

这些机器学习方法之间的最大区别在于，监督学习需要预先收集训练数据，收集训练数据可以使用合成数据生成器，而无监督学习则不需要。因此，监督学习需要大量的前期人工干预才能适当地标记数据。

例如，在计算机视觉中，注释者在图像中标记数万到数百万个数据点。数据选择和标注精度对机器学习模型性能的影响很大。虽然这有助于训练高效的机器学习模型，但存在偏差风险，并且算法只有在精确定义的条件下以及与训练数据非常相似的数据才能很好地运行。

机器学习技术适用于不同的任务

监督学习用于分类和回归任务，而无监督学习用于聚类和降维任务。

监督式学习算法通过从合成数据生成器来生成合成训练数据集进行泛化来构建模型。目标是正确标记算法以前从未见过的新数据点。例如，您可以使用监督学习进行图像分类，其中算法学习将数据分类为不同的类别（例如，狗与猫）。监督学习算法将从狗和猫的标记图像中学习，然后能够正确地标记以前从未见过的新图像。

另一方面，无监督学习算法试图在数据中寻找隐藏的模式或内在结构。它不需要标记数据;相反，它根据相似性将数据点分组在一起。例如，您可以使用无监督学习进行图像分割，其中算法尝试查找图像中不同对象之间的边界。

监督学习与无监督学习的复杂性

监督学习更容易实现，因为它有一个特定的目标——学习如何将输入数据映射到目标输出。无监督学习虽然也有明确的目标，但没有它试图实现的特定输出，而是更专注于理解数据的底层结构。

监督学习通常更昂贵

监督学习和无监督学习之间的另一个区别是，监督学习比无监督学习更昂贵。这是因为训练监督学习模型需要收集和标记数据，这些数据可以借助合成数据生成器来生成。

一般来说，需要对大量输入数据进行数据收集和注释才能达到预期的效果，尤其是在具有高度可变对象（例如人）的现实世界环境中。另一方面，训练无监督学习模型不需要数据科学家团队手动标记原始数据。

监督学习在计算机视觉中更准确

最后，监督学习通常比无监督学习更准确。这是因为监督式机器学习算法具有可供学习的训练数据集，而无监督式学习算法则没有。

训练深度神经网络需要对模型进行多次迭代和持续优化（MLOps），以提高模型从未探索的数据（验证数据集）预测推理结果的能力。在大多数情况下，监督方法可以获得更准确的结果。

监督学习和无监督学习的实际应用？

无监督学习算法用于各种应用，从医学诊断到股票市场预测。一般来说，监督学习比无监督学习更广泛地使用，因为它需要更少的数据，并且更容易实现，因为输出数据是预定义的。

然而，无监督学习有其自身的优势，例如更能抵抗过拟合（卷积神经网络的一大挑战），并且能够更好地从复杂的大数据中学习，例如没有固有结构的客户数据或行为数据。

监督学习应用示例

1、物体识别：监督学习算法可用于对图像或视频中的对象进行定位和分类（视频识别）。它们还可用于识别计算机视觉系统中的人员、车辆和其他物体。

2、文本识别：监督学习算法可用于读取图像或视频中的文本。光学字符识别（OCR）系统将书面文本转换为机器可读的形式，例如，使用 AI 读取车牌或扫描文档。具有车牌识别功能的 OCR 应用程序。

3、人脸识别：人脸识别使用在数据库上训练的深度神经网络来识别图像或视频中的人脸。该技术用于安全应用，例如解锁手机或进入建筑物。有关更多示例，请查看 DeepFace，一个流行的人脸识别库。

4、目视检查：机器学习模型用于检查生产线上的产品是否存在工业制造中的缺陷。这是通过训练监督式机器学习模型来完成的，该模型使用标记的训练数据区分有缺陷和无缺陷的项目。

无监督学习的实际应用

1、异常检测：异常检测是识别数据集中异常值的过程。这可用于欺诈检测、识别数据中的错误以及发现异常模式。这种大数据分析对于保险和金融行业识别可疑交易和检测内幕交易非常重要。

2、语音识别：在自然语言处理（NLP）和自然语言理解（NLU）领域，无监督学习对于提高对单词和短语上下文的理解非常重要。

3、文本情感分析：算法可用于情感分析，根据人们对文字、表情符号和表情符号的使用来了解人们对某事的感受。这些方法用于分析社交媒体数据中抑郁检测的情绪水平。

4、客户角色：聚类分析用于将相似的数据点组合在一起。这可用于营销、客户细分以及根据客户和买家的行为识别客户和买家档案。

5、医学影像：无监督方法允许机器自行学习，以识别监督学习可能无法发现的模式和异常。它还可用于分割图像，以便识别单个对象。这在医学图像中特别有用，因为小细节可以产生很大的不同。

6、时间序列分析：时间序列数据是以固定间隔间隔的数据点序列。无监督学习可用于查找时间序列数据中的模式，并根据未标记的数据对未来事件进行预测。这对于天气预报、销售预测、股票市场预测和预测交通模式等非常重要。

总结

监督方法和非监督方法之间的最大区别在于，监督模型需要标记输入。通过监督学习，我们向机器提供已知信息，以便它可以学习找到这些模式并做出预测。无监督学习采用未标记的数据集，并尝试自动识别其中的结构和模式。

监督学习的好处是，您可以训练模型，使其在解决输出选项有限（分类问题）的明确指定问题时更加准确。无监督学习更具探索性，不需要预先标记的数据，使其更加灵活。它可用于细分客户、查找关系和检测异常。

监督学习和无监督学习都是机器学习工具箱中用于数据分析的重要工具。决定使用哪一个取决于您尝试解决的问题的性质以及可用的数据量和类型。