CEO Nvidia, Jensen Huang, vừa giới thiệu một AI blueprint nhằm nâng cao khả năng phân tích video trên nhiều lĩnh vực. Đổi mới này, được vận hành bởi nền tảng Metropolis của Nvidia và các công nghệ AI tiên tiến, giải quyết nhu cầu ngày càng tăng về thông tin chi tiết từ video tự động khi sản lượng video toàn cầu đang tăng vọt.
Thách thức trong phân tích video
Trên toàn cầu, hơn 1,5 tỷ camera cấp doanh nghiệp tạo ra khoảng 7 nghìn tỷ giờ video mỗi năm, tuy nhiên chưa đến 1% nhận được bất kỳ sự phân tích có ý nghĩa nào. Khoảng cách khổng lồ này đồng nghĩa với việc các sự cố nghiêm trọng không được phát hiện trên nhiều lĩnh vực. Riêng ngành sản xuất phải đối mặt với tổn thất hàng nghìn tỷ mỗi năm do các lỗi bị bỏ sót và sự kém hiệu quả trong vận hành. AI blueprint mới của Nvidia giải quyết vấn đề này trực diện bằng cách cho phép các tác nhân (agents) thực hiện phân tích video theo thời gian thực và tạo ra những thông tin chi tiết có thể hành động.

Nvidia Unveils AI Blueprint to Transform Video Analysis

Tiết kiệm hơn khi mua game.
Nhận ưu đãi giảm giá lên đến 80%
Nvidia AI Blueprint
Blueprint này kết hợp một số công nghệ tiên tiến nhất của Nvidia:
- Nvidia Cosmos Nemotron Vision Language Models (VLMs): Để hiểu nội dung hình ảnh.
- Nvidia Llama Nemotron Large Language Models (LLMs): Để diễn giải dữ liệu phức tạp.
- Nvidia NeMo Retriever: Để tìm kiếm và truy xuất theo ngữ cảnh hiệu quả.
Được xây dựng trên nền tảng phần mềm Nvidia AI Enterprise, bộ công cụ này tích hợp các microservices Nvidia NIM và các khung làm việc retrieval-augmented generation được thiết kế đặc biệt cho xử lý video. Hệ thống xử lý video nhanh hơn 30 lần so với thời gian thực, cung cấp cho các nhà phát triển công cụ để xây dựng các AI agents phân tích luồng video với hiệu suất chưa từng có.

AI Blueprint
Các tính năng của Agentic AI
Blueprint bao gồm các khả năng agentic như suy luận theo chuỗi tư duy (chain-of-thought reasoning), lập kế hoạch tác vụ và tích hợp công cụ. Những tính năng này đơn giản hóa việc phát triển các AI agents với bộ kỹ năng chuyên biệt cho phân tích video. Các doanh nghiệp có thể triển khai những agents này trên nền tảng đám mây hoặc edge platforms, mang lại cả sự linh hoạt và khả năng mở rộng cho các nhu cầu vận hành khác nhau.
Ứng dụng trong vận hành công nghiệp
Các AI agents phân tích video mang lại lợi ích cụ thể trong môi trường công nghiệp:
- Thúc đẩy năng suất: Thực thi các tiêu chuẩn vận hành và hợp lý hóa quy trình.
- Nâng cao quản lý tài sản: Sử dụng ước tính khối lượng 3D để tối ưu hóa bố cục lưu trữ trong kho.
- Cải thiện an toàn: Tự động tạo báo cáo sự cố và giám sát việc tuân thủ thiết bị bảo hộ cá nhân.
- Giảm thiểu rủi ro: Xác định các mô hình hoạt động bất thường để ngăn ngừa tai nạn và lỗi vận hành.
- Học hỏi từ kho lưu trữ: Khai thác dữ liệu video lịch sử để cải tiến quy trình và đào tạo chuyên sâu.

AI Blueprint Samples
Chuyển đổi thể thao và giải trí
Ngành công nghiệp thể thao, trị giá hơn $500 tỷ trên toàn cầu, sẽ đạt được lợi ích đáng kể từ công nghệ này. Các AI agents phân tích video có thể đánh giá hiệu suất của cầu thủ, giúp ngăn ngừa chấn thương và tạo ra các cơ hội tương tác mới với người hâm mộ. Huang đã trình diễn một AI agent phân tích cú ném bóng chày trong bài phát biểu chính, cho thấy cách nó có thể gợi ý các cải tiến kỹ thuật bằng cách so sánh cú ném với các tiêu chuẩn chuyên nghiệp.
Ngành truyền thông và giải trí trị giá $3 nghìn tỷ cũng được hưởng lợi thông qua sáng kiến Media2 của Nvidia, sử dụng các AI agents này để tạo ra nội dung cá nhân hóa, thích ứng, phản hồi theo sở thích của từng người xem.
Sự chấp nhận và tính sẵn có toàn cầu
Các công ty tư vấn và công nghệ lớn bao gồm Accenture, Infosys và TATA Consultancy Services đã bắt đầu tích hợp blueprint này vào quy trình làm việc của họ. Việc áp dụng sớm này báo hiệu khả năng ứng dụng rộng rãi của phân tích video dựa trên AI trên các thị trường toàn cầu.
Blueprint của Nvidia cho phân tích video AI đại diện cho một bước tiến lớn trong việc khai thác giá trị từ dữ liệu video. Bằng cách kết hợp các công nghệ AI tiên tiến với các ứng dụng công nghiệp thực tế, nó cung cấp các giải pháp cho nhiều lĩnh vực từ sàn sản xuất đến các đấu trường thể thao và studio giải trí. Các tổ chức triển khai những công cụ này có thể kỳ vọng vào những lợi ích đo lường được về năng suất, giao thức an toàn và năng lực đổi mới.







