揭开机器学习的神秘面纱

本文旨在让您熟悉机器学习的本质、基本概念和高级机器学习过程。

揭开机器学习的神秘面纱
推荐:使用NSDT场景编辑器快速搭建3D应用场景

传统与转型:回顾与展望

传统上,计算机过去常常遵循一组明确的指令。例如,如果你想让计算机执行一个简单的任务,即把两个数字相加,你必须拼出每一个步骤。然而,随着我们的数据变得越来越复杂,这种为每种情况提供指令的手动方法变得不够用。

这就是机器学习成为游戏规则改变者的地方。我们希望计算机从例子中学习,就像我们从经验中学习一样。想象一下,教一个孩子如何骑自行车,展示几次,然后让他摔倒,弄清楚,自己学习。这就是机器学习背后的理念。这种创新不仅改变了行业,而且已成为当今世界不可或缺的必需品。

学习基础知识

现在我们对术语“机器学习”有了基本的了解,让我们熟悉一些基本术语:

数据

数据是机器学习的命脉。它指的是计算机用来学习的信息。这些信息可以是数字、图片或计算机可以理解的任何其他信息。这进一步分为两类:

  • 训练数据:这些数据是指我们用来教授计算机的示例。
  • 测试数据:学习后,我们使用一些新的、看不见的数据(称为测试数据)来测试计算机的性能。

标签和功能

想象一下,你正在教一个孩子如何区分不同的动物。动物(狗、猫等)的名称将是标签,而这些动物的特征(腿的数量、皮毛等)可以帮助您识别它们。

模型

这是机器学习过程的结果。它是数据中模式和关系的数学表示。这就像在探索一个新地方后制作地图一样。

机器学习的类型

机器学习主要有四种类型:

监督式机器学习

它也被称为引导式学习。我们将标记的数据集提供给我们的机器学习算法,其中已经知道正确的输出。基于这些示例,它可以学习数据中的隐藏模式,并可以预测或正确分类新数据。监督学习中的常见类别是:

  • 分类:将事物分类为单独的不同类别,例如将图片分类为猫或狗,将电子邮件分类为垃圾邮件或非垃圾邮件等。
  • 回归:它涉及根据某些特征预测数值,例如房屋价格、您的 GPA 或销售数量。

无监督机器学习

在这里,计算机在没有事先提示的情况下提供未标记的数据,并自行探索隐藏的模式。只要考虑一下,你被递给一盒没有图片的拼图,你的任务是将相似的图片分组以形成一张完整的图片。聚类是最常见的无监督学习类型,其中相似的数据点被分组到一个组中。例如,我们可以采用聚类来对类似类型的社交媒体帖子进行分组,用户可以关注他们感兴趣的子主题。

半监督机器学习

半监督学习包含标记和未标记数据集的混合,其中标记数据集充当识别数据模式的指导点。例如,您向厨师提供了要使用的主要成分清单,但没有提供完整的食谱。因此,尽管他们没有食谱,但一些提示可能会帮助他们入门。

强化学习

强化学习也称为边做边学。它与环境互动并获得奖励作为对其行为的惩罚。随着时间的推移,它学会了最大化奖励并表现出色。想象一下,您正在训练一只小狗,当他表现良好时,您会通过奖励他来提供积极的反馈,并以扣留奖励的形式提供负面反馈。随着时间的推移,小狗会学习导致奖励的行为以及不会获得奖励的行为

高级机器学习过程

机器学习,就像烹饪艺术一样,拥有将原始、不同的元素转化为深刻见解的神奇能力。就像一个熟练的厨师熟练地将各种食材组合在一起,制作出一道美味的菜肴。以下是用于执行机器学习任务的 6 个基本步骤:

Demystifying Machine Learning


图片来源:作者

1. 数据收集

数据是一种重要的资源,其质量非常重要。多样化、更相关的数据会产生更好的结果。您可以将其视为厨师从不同市场收集各种食材。

2. 数据预处理

我们的大多数数据都不是所需的形式。就像烹饪前清洗、切碎和准备食材一样,数据预处理涉及清理和组织学习过程的数据。您可能面临的一些常见问题是缺少数据、异常值、格式不正确等。

3. 选择算法

与为特定菜肴选择食谱类似,您可以根据要解决的问题选择算法。此选择也可能受您拥有的数据类型的影响。

4. 训练模型

把它想象成烹饪过程,除非味道融合在一起,否则我们会等待。同样,我们让模型从训练数据中学习。学习率的一个重要概念在这里也起作用,它决定了模型在每次训练迭代中采取多大的步骤。如果你一次加入太多的盐或香料,这道菜可能会变得过于强烈。相反,如果添加得太少,味道可能无法完全发展。学习率为逐渐增强风味找到了完美的平衡。

5. 测试与评估

学习过程结束后,我们使用特殊的测试数据对其进行测试,就像品尝一道菜并在与他人分享之前检查其外观一样。常见的评估指标包括准确性、精度、召回率和 F1 分数,具体取决于手头的问题。

6. 调整和迭代

调整调味料或成分以完善菜肴,您可以通过引入更多变量、选择不同的学习算法以及调整参数或学习率来微调模型。

总结

当我们结束对机器学习基础知识的探索时,请记住,这一切都是为了授权计算机以最少的人为干预来学习和做出决策。保持好奇心并留意我们的下一篇文章,我们将更深入地探讨各种类型的机器学习算法。

3D建模学习工作室 整理翻译,转载请注明出处!

NSDT场景编辑器 | NSDT 数字孪生 | GLTF在线编辑器 | 3D模型在线转换 | UnrealSynth虚幻合成数据生成器 | 3D模型自动纹理化工具
2023 power by nsdt©鄂ICP备2023000829号