什么是预训练 AI 模型?

预训练的 AI 模型是一种深度学习模型,它在大型数据集上训练以完成特定任务,可以按原样使用或自定义以满足多个行业的应用程序要求。

推荐:将NSDT场景编辑器加入你的3D工具链
3D工具集:NSDT简石数字孪生

什么是预训练 AI 模型?

想象一下,试图教一个蹒跚学步的孩子什么是独角兽。一个好的起点可能是向孩子展示该生物的图像并描述其独特特征。

现在想象一下,试图教一台人工智能机器什么是独角兽。甚至会从哪里开始?

预训练的 AI 模型提供了一种解决方案。

预训练的AI模型是一种深度学习模型 - 一种类似大脑的神经算法的表达,可以根据数据查找模式或进行预测 - 在大型数据集上进行训练以完成特定任务。它可以按原样使用,也可以进一步微调以满足应用程序的特定需求。

为什么使用预训练的 AI 模型?

开发人员可以使用预训练模型并对其进行自定义以满足其要求,而不是从头开始构建 AI 模型。

要构建AI应用程序,开发人员首先需要一个可以完成特定任务的AI模型,无论是识别神话中的马,检测自动驾驶汽车的安全隐患还是基于医学成像诊断癌症。该模型需要大量具有代表性的数据来学习。

这个学习过程需要经历几层传入的数据,并在每一层强调与目标相关的特征。

例如,要创建一个可以识别独角兽的模型,可以首先向它提供独角兽、马、猫、老虎和其他动物的图像。这是传入的数据。

然后,构建具有代表性的数据特征层,从简单的(如线条和颜色)开始,然后发展到复杂的结构特征。通过计算概率为这些特征分配不同程度的相关性。

例如,与猫或老虎相反,生物看起来越像马,它成为独角兽的可能性就越大。这样的概率值存储在AI模型中的每个神经网络层中,随着层的添加,它对表示的理解会提高。

为了从头开始创建这样的模型,开发人员需要庞大的数据集,通常包含数十亿行数据。这些可能很昂贵且难以获得,但对数据妥协可能会导致模型性能不佳。

预先计算的概率表示(称为权重)可以节省时间、金钱和精力。已经使用这些权重构建和训练了预训练模型。

使用具有大量准确代表性权重的高质量预训练模型可以提高 AI 部署的成功机会。可以修改权重,并且可以将更多数据添加到模型中以进一步自定义或微调它。

基于预训练模型构建的开发人员可以更快地创建 AI 应用程序,而不必担心处理大量输入数据或计算密集层的概率。

换句话说,使用预先训练的AI模型就像买一件衣服或衬衫,然后根据自己的需求进行定制,而不是从面料,线和针开始。

预训练的 AI 模型通常用于迁移学习,并且可以基于多种模型架构类型。一种流行的架构类型是转换器模型,这是一种神经网络,通过跟踪顺序数据中的关系来学习上下文和含义。

根据人工智能公司Clarifai平台高级副总裁Alfredo Ramos的说法,预训练模型可以将AI应用程序开发时间缩短长达一年,并节省数十万美元的成本。

预训练模型如何推进 AI?

由于预训练模型简化并加快了 AI 开发,因此许多开发人员和公司使用它们来加速各种 AI 用例。

预训练模型推进 AI 的主要领域包括:

  • 自然语言处理。预训练模型用于翻译、聊天机器人和其他自然语言处理应用程序。大型语言模型通常基于转换器模型体系结构,是预训练模型的扩展。预训练LLM的一个例子是NVIDIA NeMo Megatron,这是世界上最大的AI模型之一。
  • 语音人工智能。 预训练模型可以帮助语音 AI 应用程序跨不同语言即插即用。用例包括呼叫中心自动化、人工智能助手和语音识别技术。
  • 计算机视觉。 就像上面的独角兽示例一样,预训练模型可以帮助AI快速识别生物或物体,地点和人。通过这种方式,预训练模型加速计算机视觉,为体育、智能城市等领域的应用程序提供类似人类的视觉功能。
  • 医疗。 对于医疗保健应用,像 MegaMolBART 这样的预训练人工智能模型——NVIDIA BioNeMo 服务和框架的一部分——可以理解化学语言并学习现实世界分子中原子之间的关系,为科学界提供了加快药物发现的强大工具。
  • 网络安全。 预训练模型为实施基于 AI 的网络安全解决方案提供了一个起点,并扩展了人类安全分析师的能力,以更快地检测威胁。示例包括人类和机器的数字指纹识别,以及异常、敏感信息和网络钓鱼的检测。
  • 艺术和创意工作流程。 为了支持最近的人工智能艺术浪潮,预训练模型可以通过 GauGAN 和 NVIDIA Canvas 等工具帮助加速创意工作流程。

预训练的AI模型可以应用于这些以外的行业,因为它们的定制和微调可以为用例带来无限的可能性。

在哪里可以找到预训练的 AI 模型

谷歌、Meta、Microsoft和英伟达等公司正在发明尖端的模型架构和框架来构建人工智能模型。

这些有时在模型中心或开源发布,使开发人员能够微调预训练的 AI 模型,提高其准确性并扩展模型存储库。

3D建模学习工作室 翻译整理,转载请注明出处!

NSDT场景编辑器 | NSDT 数字孪生 | GLTF在线编辑器 | 3D模型在线转换 | UnrealSynth虚幻合成数据生成器 | 3D模型自动纹理化工具
2023 power by nsdt©鄂ICP备2023000829号