Nvidia 執行長 Jensen Huang 發表了旨在提升各產業影片分析能力的 AI 藍圖。這項創新技術由 Nvidia 的 Metropolis 平台與先進 AI 技術驅動,旨在應對全球影片製作量激增下,對自動化影片洞察日益增長的需求。
影片分析的挑戰
全球有超過 15 億台企業級攝影機,每年產生約 7 兆小時的影片內容,但其中僅不到 1% 的影片得到分析,導致錯失偵測關鍵事件的機會。對於製造業等產業而言,這種差距可能因忽略的缺陷或效率低下而導致每年數兆美元的損失。Nvidia 的新 AI 藍圖透過賦予代理程式即時影片分析與洞察生成能力,提供了解決方案。

Nvidia 發布 AI 藍圖以革新影片分析
Nvidia AI 藍圖
此次發布的藍圖整合了 Nvidia 的尖端技術,包括:
- Nvidia Cosmos Nemotron Vision Language Models (VLMs):用於視覺內容理解。
- Nvidia Llama Nemotron Large Language Models (LLMs):用於進階資料詮釋。
- Nvidia NeMo Retriever:用於有效搜尋和擷取上下文資訊。
這個工具組建立在 Nvidia AI Enterprise 軟體平台之上,整合了 Nvidia NIM 微服務和用於影片處理的檢索增強生成框架。該藍圖具備比即時速度快 30 倍的影片處理能力,使開發者能夠創建高效分析影片串流的 AI 代理程式。

AI 藍圖
代理式 AI 的特色
Nvidia 的 AI 藍圖包含代理式功能,如思維鏈推理、任務規劃和工具整合。這些功能簡化了具備多樣化技能集的 AI 代理程式的開發,包括影片分析。企業可以將這些代理程式部署在雲端或 邊緣平台 上,提供彈性和擴展性。
工業營運的應用
影片分析 AI 代理程式為工業環境帶來了諸多好處,例如:
- 提升生產力:確保符合營運標準並優化流程。
- 加強資產管理:透過 3D 體積估算優化倉庫儲存。
- 改善安全性:生成詳細的事件報告並監控個人防護裝備的合規性。
- 減輕風險:偵測異常活動以防止事故和營運中斷。
- 從歷史資料學習:搜尋歷史影片檔案以獲取洞察和流程改進。

AI 藍圖範例
革新體育與娛樂
價值超過 5000 億美元的體育產業是另一個即將受益的領域。AI 影片分析代理程式可以協助進行選手表現分析、傷病預防和粉絲互動。在主題演講中,黃仁勳展示了一個分析快速球投球的 AI 代理程式,並根據專業選手的比較提供了改進建議。
在價值 3 兆美元的媒體與娛樂產業中,Nvidia 的 Media2 計畫利用這些 AI 代理程式來創建個人化、適應性的內容,提升觀眾體驗。
全球採用與可用性
Nvidia 的藍圖已吸引了 Accenture、Infosys 和 TATA Consultancy Services 等合作夥伴,將這些工具整合到他們的workflows 中。這種全球採用突顯了 AI 驅動影片分析的廣泛潛力。
Nvidia 全新的 AI 影片分析藍圖代表了利用影片數據獲取可執行洞察力的重大飛躍。透過將尖端 AI 技術與實際應用相結合,它為從製造業到體育和娛樂等各行各業提供了解決方案。隨著全球組織開始採用這些工具,提升生產力、安全性與創新的潛力是巨大的。
來源:GamesBeat






