Nvidia 首席执行官黄仁勋推出了一项 AI 蓝图,旨在改进各行各业的视频分析。这项创新由 Nvidia 的 Metropolis 平台和先进的 AI 技术提供支持,解决了随着全球视频制作量激增而对自动化视频洞察日益增长的需求。
视频分析挑战
全球有超过 15 亿台企业级摄像头,每年产生约 7 万亿小时的视频——但其中只有不到 1% 的视频得到分析,导致在检测关键事件方面错失良机。对于制造业等行业,这种差距每年可能因忽视缺陷或效率低下而导致数万亿美元的损失。Nvidia 的新 AI 蓝图通过启用能够实时视频分析和生成洞察的代理,提供了一个解决方案。

Nvidia 推出 AI 蓝图,革新视频分析
Nvidia AI 蓝图
新发布的蓝图整合了 Nvidia 的尖端技术,包括:
- Nvidia Cosmos Nemotron 视觉语言模型 (VLM):用于视觉内容理解。
- Nvidia Llama Nemotron 大型语言模型 (LLM):用于高级数据解释。
- Nvidia NeMo Retriever:用于高效搜索和检索上下文信息。
该工具包基于 Nvidia AI Enterprise 软件平台构建,融合了 Nvidia NIM 微服务和检索增强生成框架,用于视频处理。凭借比实时处理视频快 30 倍的能力,该蓝图使开发者能够创建能够高效分析视频流的 AI 代理。

AI 蓝图
代理式 AI 的特点
Nvidia 的 AI 蓝图包括代理式功能,例如思维链推理、任务规划和工具集成。这些功能简化了具有各种技能(包括视频分析)的 AI 代理的开发。企业可以将这些代理部署到云端或边缘平台,提供灵活性和可扩展性。
在工业运营中的应用
视频分析 AI 代理为工业环境带来了诸多好处,例如:
- 提高生产力:确保遵守操作标准并优化流程。
- 增强资产管理:通过 3D 体积估算优化仓库存储。
- 提高安全性:生成详细的事件报告并监控个人防护设备合规性。
- 降低风险:检测异常活动以防止事故和运营中断。
- 从档案中学习:搜索历史视频档案以获取洞察和流程改进。

AI 蓝图示例
革新体育和娱乐
价值超过 5000 亿美元的体育产业是另一个有望受益的领域。AI 视频分析代理可以协助玩家表现分析、伤病预防和粉丝互动。在主题演讲中,黄仁勋展示了一个分析快速球投掷的 AI 代理,并根据专业比较提供了改进建议。
在价值 3 万亿美元的媒体和娱乐产业中,Nvidia 的 Media2 计划利用这些 AI 代理创建个性化、自适应内容,增强玩家体验。
全球采纳和可用性
Nvidia 的蓝图已经吸引了埃森哲、印孚瑟斯和塔塔咨询服务等合作伙伴,将这些工具整合到他们的工作流程中。这种全球采纳凸显了 AI 驱动视频分析的广泛潜力。
Nvidia 用于 AI 视频分析的新蓝图代表了利用视频数据获取可操作洞察的重大飞跃。通过将尖端 AI 技术与实际应用相结合,它为从制造业到体育和娱乐等行业提供了解决方案。随着全球组织开始采用这些工具,提高生产力、安全性和创新的潜力是巨大的。
来源:GamesBeat






