ygtu

AI人工智能

语音 AI 聚焦:钟摆如何在线抓取有害叙事

全球超过 55% 的人口使用社交媒体,只需单击一下即可轻松分享在线内容。在与他人联系和消费娱乐内容的同时,您还可以发现构成现实生活威胁的有害叙事。 这就是为什么Pendulum的工程副总裁Ammar Haris希望他的公司的人工智能能够帮助客户更深入地了解网上生成的关于他们的有害内容。这些谎言经常像快速移动的野火一样在社交媒体平台上的视频、音频和文本中传播。
9 min read
AI人工智能

探索文本到语音技术的独特应用

当你与虚拟助理互动时,你会发出命令并得到口头回应。为这种生成的语音响应提供动力的技术被称为文本到语音( TTS )。 TTS 应用程序非常有用,因为它们为使用辅助设备的用户提供了更大的内容可访问性。使用最新的 TTS 技术,您只需几分钟的音频数据就可以生成合成语音——这非常适合那些失声且录音有限的人。
8 min read
在 PyTorch 中构建卷积神经网络
AI人工智能

在 PyTorch 中构建卷积神经网络

神经网络由相互连接的层构建而成。有许多不同类型的层。对于与图像相关的应用程序,您始终可以找到卷积层。它是一个参数很少的层,但应用于大尺寸输入。它之所以强大,是因为它可以保留图像的空间结构。因此,它被用于在计算机视觉神经网络上产生最先进的结果。在这篇文章中,您将了解卷积层及其构建的网络。
14 min read
AI人工智能

在 PyTorch 中使用单层神经网络构建图像分类器

在本教程中,您将使用 CIFAR-10 数据集。它是一个用于图像分类的数据集,由 60 个类的 000,32 张 32×10 像素的彩色图像组成,每类 6,000 张图像。有 50,000 张训练图像和 10,000 张测试图像。这些课程包括飞机、汽车、鸟类、猫、鹿、狗、青蛙、马、轮船和卡车。CIFAR-10是机器学习和计算机视觉研究的流行数据集,因为它相对较小且简单,但具有挑战性,需要使用深度学习方法。此数据集可以轻松导入到 PyTorch 库中。
12 min read
AI人工智能

PyTorch 中具有交叉熵损失的训练逻辑回归

在 PyTorch 系列的上一节中,我们演示了当使用均方误差 (MSE) 损失时,初始化权重会如何影响分类模型的准确性。我们注意到模型在训练过程中没有收敛,其准确性也显着降低。 在下文中,您将看到如果随机初始化权重并使用交叉熵作为模型训练的损失函数会发生什么。此损失函数更适合逻辑回归和其他分类分类问题。因此,交叉熵损失用于当今的大多数分类问题。
8 min read
使用卓越的 AI 系列和 NVIDIA TAO 工具包创建高质量的计算机视觉应用程序
AI人工智能

使用卓越的 AI 系列和 NVIDIA TAO 工具包创建高质量的计算机视觉应用程序

数据标签和模型训练一直被认为是团队在构建 AI/ML 基础架构时面临的最重要挑战。两者都是 ML 应用程序开发过程中的一个重要步骤,如果操作不当,可能会导致不准确的结果和性能下降。有关详细信息,请参阅 AI 基础设施联盟的 2022 年 AI 基础设施生态系统报告。 数据标签对于完全标记整个数据集的任何形式的地图学习都至关重要。它还是准地图学习的关键因素,它结合了一组小部分标记数据,这些算法旨在以编程方式自动标记其余数据集。标签对于机器学习最发达的领域之一的计算机视觉至关重要。尽管标签很重要,但标签速度很慢,因为需要扩大分散的员工队伍。
15 min read
NSDT场景编辑器 | NSDT 数字孪生 | GLTF在线编辑器 | 3D模型在线转换 | UnrealSynth虚幻合成数据生成器 | 3D模型自动纹理化工具
2023 power by nsdt©鄂ICP备2023000829号