NVIDIA Rilis Agen AI Fisik Baru untuk Riset Mobil Otonom, Robot, dan Visi Komputer di CVPR 2026

Penulis: Faisal Zuber  •  Kamis, 04 Juni 2026 | 01:54:31 WIB
NVIDIA meluncurkan agen AI fisik terbaru untuk riset mobil otonom dan visi komputer di CVPR 2026.

Bagi peneliti kendaraan otonom (AV), masalah terbesar adalah "ekor panjang" — interaksi langka, geometri jalan tidak biasa, atau perubahan pencahayaan yang sulit direkam berulang kali. NVIDIA menjawabnya dengan keterampilan Neural Reconstruction yang mampu mengubah data armada menjadi adegan 3D yang bisa diedit untuk simulasi.

Teknologi seperti Omniverse NuRec dan InstantNuRec memungkinkan rekonstruksi pemandangan jalan raya 3D dari gambar tanpa perlu optimasi per adegan. Hasilnya, peneliti bisa memvariasikan kondisi, membandingkan respons sistem, dan menemukan mode kegagalan di luar apa yang bisa ditangkap data dunia nyata.

Untuk memperkuat riset, NVIDIA juga merilis Alpamayo 2 Super, model open-source dengan 32 miliar parameter yang mampu bernalar, merencanakan, dan bertindak dalam satu tumpukan penggerak penuh. Model ini diklaim sebagai fondasi penggerak terbuka paling kuat untuk pengembangan level 4 yang lebih aman dan terukur.

Mengisi Kekosongan Data untuk Inspeksi Visual dan Robot

Di ranah visi komputer, hambatannya adalah menciptakan cukup contoh terkontrol — seperti cacat produksi yang langka atau perubahan objek seiring waktu. Keterampilan Defect Image Generation dari Metropolis memungkinkan agen AI menghasilkan gambar anomali sintetis di berbagai permukaan menggunakan citra asli.

Alur kerja ini menggabungkan Isaac Sim untuk simulasi, Cosmos 3, dan OSMO untuk orkestrasi. Hasilnya, peneliti bisa membuat kasus visual langka dan langsung menguji apakah model merespons dengan benar — tanpa harus mengumpulkan ribuan contoh cacat di pabrik.

Untuk robotika, NVIDIA memperkenalkan keterampilan mobilitas Isaac yang mengotomatiskan navigasi, mulai dari pencarian adegan hingga evaluasi kebijakan. Isaac Sim 6.0 kini menyertakan konektor ramah agen yang membantu peneliti meluncurkan sesi simulasi, mengarang adegan, hingga menangkap data hanya dengan perintah agen AI.

Cosmos 3: Fondasi Dunia Fisik yang Terbuka

Semua keterampilan baru ini dipasangkan dengan Cosmos 3, model fondasi dunia fisik terbuka yang disebut NVIDIA sebagai "omnimodel" pertama yang menyatukan penalaran visi, generasi dunia, dan aksi. Model ini memimpin papan peringkat publik untuk riset AI fisik dan menjadi inti dari alur kerja ujung-ke-ujung yang terukur.

Untuk riset robotika kesehatan, Cosmos-H-Surgical-Simulator bahkan mampu menghasilkan data bedah realistis untuk pelatihan kebijakan otonom, belajar langsung dari data operasi nyata alih-alih model fisika buatan tangan. Ini secara signifikan mengurangi kesenjangan antara simulasi dan dunia nyata.

Ketersediaan dan Dampak bagi Riset Global

Semua alat dan keterampilan agen AI fisik NVIDIA kini tersedia secara terbuka di GitHub. Untuk pengujian instan, peneliti bisa mengakses Neural Reconstruction, Video Augmentation, dan Defect Image Generation melalui NVIDIA Brev sebagai "Physical AI Launchables" — lingkungan prakonfigurasi yang berjalan di GPU H100 dengan kredit uji coba gratis.

Di CVPR 2026, NVIDIA juga meluncurkan tiga tantangan riset terbuka: AI City Challenge untuk aplikasi kota pintar, PAI-AV Reasoning Challenge untuk mengevaluasi penjelasan keputusan model VLA, dan AlpaSim Closed-Loop End-to-End Driving Challenge. Dengan lebih dari 15 juta unduhan dataset AI fisik di Hugging Face, NVIDIA jelas sedang membangun infrastruktur yang memungkinkan peneliti mana pun — termasuk di Indonesia — untuk ikut serta dalam revolusi AI fisik tanpa harus memulai dari nol.

Reporter: Faisal Zuber
Sumber: blogs.nvidia.com This article was automatically rewritten by AI based on the source above without altering the facts of the original article.
Back to top