NVIDIA は CES 2025 の基調講演において、動画を解析する「 NVIDIA AI Blueprint 」の早期アクセスを発表しました。このブループリントは、ビデオや画像の分析だけでなく、推論やツール呼び出し、タスク計画などのエージェント機能を統合しており、未解析のままになっている大量の動画を保有している企業や開発者から注目を集めています。
この新しいブループリントは、 NVIDIA Metropolis プラットフォームを基盤とし、大量のビデオや画像コンテンツを分析して重要な情報を抽出・要約できます。これにより、製造業や物流業界における業務効率の向上や安全性の強化が期待されています。さらに、テキストや画像のプロンプトを理解し、複数の項目を同時に検索できるマルチモーダル対応や、 Omniverse プラットフォームを活用した 3D 可視化機能も備えています。
さらに、このブループリントには、複雑な問題解決のための推論能力、外部 API やツールの呼び出し、複数ステップにわたるタスクの計画と実行を可能にするエージェント機能が含まれています。これらの機能は、 NVIDIA NeMo や NVIDIA NIM マイクロサービスといった既存の主要技術を統合し、加えて、今回発表された NVIDIA 独自の大規模言語モデルや視覚言語モデルを活用しています。
このブループリントの応用例としては、製造業における品質管理や欠陥の早期発見、小売業での AI ショッピングアシスタント、スポーツ選手のパフォーマンス分析、メディア・エンターテインメント分野で視聴者の好みに合わせたコンテンツ作成などが挙げられます。
NVIDIA は、 Accenture 、 Deloitte 、 Infosys などのパートナーと協力して、このブループリントを開発者向けに提供しています。正式リリースはまだですが、開発者は早期アクセスプログラムを通じて、この新しい技術を試すことができます。
この AI ブループリントは、 AI エージェントの開発を大幅に簡素化し、企業が独自の AI ソリューションを迅速に構築・展開できるようにします。手作業の自動化による業務効率の向上、高度な分析によるエラー削減、自然言語対応による柔軟なカスタマイズ性などの利点により、企業は AI 技術を容易に活用し、競争力を強化できると期待されています。
筆者の視点: NVIDIA によると、現在世界には 15 億台以上の監視カメラが設置され、年間 7 兆時間の動画が記録されているとのこと。そして、そのうち、実際に視聴されているのは 1 %にも満たない、とのことです。確かに筆者の知る限りでも監視カメラを設置することに満足して、それを十分にいかせているか、というと疑問に思える企業現場は数多くあります。今回のブループリントを活用し、そうした動画を効率的に解析することができるようになるのであれば、画期的な進化と言えます。国家による過剰監視社会、などのデメリットも頭に浮かびますが、企業が有効に活用することで、それを上回るメリットが考えられるのではないでしょうか。