CEO Jensen Huang của Nvidia đã giới thiệu một sơ đồ AI nhằm nâng cao khả năng phân tích video trên nhiều ngành công nghiệp. Sự đổi mới này, được cung cấp bởi nền tảng Nvidia Metropolis và các công nghệ AI tiên tiến, giải quyết nhu cầu ngày càng tăng về thông tin chi tiết tự động từ video khi sản xuất video toàn cầu đang tăng vọt.
Thách thức phân tích video
Trên toàn cầu, hơn 1,5 tỷ camera cấp doanh nghiệp tạo ra khoảng 7 nghìn tỷ giờ video hàng năm - nhưng chưa đến 1% số video này được phân tích, dẫn đến bỏ lỡ các cơ hội trong việc phát hiện các sự cố quan trọng. Đối với các ngành công nghiệp như sản xuất, khoảng cách này có thể dẫn đến thua lỗ hàng nghìn tỷ đô la mỗi năm do các lỗi hoặc sự kém hiệu quả bị bỏ qua. Sơ đồ AI mới của Nvidia đưa ra một giải pháp bằng cách cho phép các tác nhân có khả năng phân tích video theo thời gian thực và tạo thông tin chi tiết.

Nvidia Ra Mắt Sơ Đồ AI Chuyển Đổi Phân Tích Video
Sơ đồ AI của Nvidia
Sơ đồ mới được công bố tích hợp các công nghệ tiên tiến của Nvidia, bao gồm:
- Mô hình Ngôn ngữ Thị giác (VLM) Nvidia Cosmos Nemotron: Để hiểu nội dung hình ảnh.
- Mô hình Ngôn ngữ Lớn (LLM) Nvidia Llama Nemotron: Để diễn giải dữ liệu nâng cao.
- Nvidia NeMo Retriever: Để tìm kiếm và truy xuất thông tin theo ngữ cảnh một cách hiệu quả.
Bộ công cụ này được xây dựng trên nền tảng phần mềm Nvidia AI Enterprise, kết hợp các dịch vụ siêu nhỏ Nvidia NIM và các framework tạo sinh tăng cường truy xuất để xử lý video. Với khả năng xử lý video nhanh hơn 30 lần so với thời gian thực, sơ đồ này trao quyền cho các nhà phát triển tạo ra các tác nhân AI có thể phân tích luồng video một cách hiệu quả.

Sơ đồ AI
Tính năng của AI Tác nhân
Sơ đồ AI của Nvidia bao gồm các tính năng tác nhân như suy luận theo chuỗi tư duy, lập kế hoạch nhiệm vụ và tích hợp công cụ. Các tính năng này hợp lý hóa việc phát triển các tác nhân AI với các bộ kỹ năng đa dạng, bao gồm cả phân tích video. Các doanh nghiệp có thể triển khai các tác nhân này trên các nền tảng đám mây hoặc nền tảng biên, mang lại sự linh hoạt và khả năng mở rộng.
Ứng dụng trong hoạt động công nghiệp
Các tác nhân AI phân tích video mang lại nhiều lợi ích cho môi trường công nghiệp, chẳng hạn như:
- Tăng năng suất: Đảm bảo tuân thủ các tiêu chuẩn hoạt động và tối ưu hóa quy trình.
- Nâng cao quản lý tài sản: Tối ưu hóa lưu trữ kho với ước tính thể tích 3D.
- Cải thiện an toàn: Tạo báo cáo sự cố chi tiết và giám sát việc tuân thủ thiết bị bảo hộ cá nhân.
- Giảm thiểu rủi ro: Phát hiện hoạt động bất thường để ngăn ngừa tai nạn và gián đoạn hoạt động.
- Học hỏi từ kho lưu trữ: Tìm kiếm kho lưu trữ video lịch sử để thu thập thông tin chi tiết và cải tiến quy trình.

Mẫu Sơ đồ AI
Chuyển đổi thể thao và giải trí
Ngành công nghiệp thể thao, có giá trị hơn 500 tỷ đô la, là một lĩnh vực khác được hưởng lợi. Các tác nhân phân tích video AI có thể hỗ trợ phân tích hiệu suất của vận động viên, phòng ngừa chấn thương và tương tác với người hâm mộ. Trong bài phát biểu quan trọng, Huang đã giới thiệu một tác nhân AI phân tích một cú ném bóng nhanh, đưa ra các đề xuất cải thiện dựa trên so sánh chuyên nghiệp.
Trong ngành truyền thông và giải trí trị giá 3 nghìn tỷ đô la, sáng kiến Media2 của Nvidia tận dụng các tác nhân AI này để tạo nội dung cá nhân hóa, thích ứng, nâng cao trải nghiệm của người xem.
Áp dụng và sẵn có trên toàn cầu
Sơ đồ của Nvidia đã thu hút các đối tác như Accenture, Infosys và TATA Consultancy Services, tích hợp các công cụ này vào quy trình làm việc của họ. Việc áp dụng trên toàn cầu này nhấn mạnh tiềm năng lan rộng của phân tích video do AI thúc đẩy.
Sơ đồ mới của Nvidia cho phân tích video AI đại diện cho một bước nhảy vọt đáng kể trong việc tận dụng dữ liệu video để thu thập thông tin chi tiết có thể hành động. Bằng cách kết hợp các công nghệ AI tiên tiến với các ứng dụng thực tế, nó cung cấp các giải pháp cho các ngành công nghiệp từ sản xuất đến thể thao và giải trí. Khi các tổ chức trên toàn thế giới bắt đầu áp dụng các công cụ này, tiềm năng cải thiện năng suất, an toàn và đổi mới là rất lớn.
Nguồn: GamesBeat





