Google DeepMind mengumumkan kehadiran agen bermain video game terbaru bernama SIMA 2 (Scalable Instructable Multiworld Agent atau Agen Multi-Dunia yang Dapat Diinstruksikan dan Diskalakan) pada 13 November 20251. Agen berbasis Gemini ini mampu menavigasi serta menyelesaikan masalah dalam berbagai dunia virtual 3D, termasuk game komedi chaos Goat Simulator 3. Joe Marino, ilmuwan riset di Google DeepMind, menjelaskan bahwa "bahkan aksi sederhana dalam game, seperti menyalakan lentera, dapat melibatkan banyak langkah"1.
Evolusi dari SIMA ke SIMA 2
SIMA pertama kali didemonstrasikan tahun lalu sebagai agen eksperimental. Namun SIMA 2 dibangun di atas model bahasa besar (large language model) unggulan Google, yaitu Gemini2. Integrasi tersebut memberikan lonjakan kemampuan signifikan pada agen.
Tidak seperti pendahulunya seperti AlphaZero (yang mengalahkan grandmaster Go pada 2016) atau AlphaStar (mengalahkan 99,8% pemain kompetisi StarCraft 2 pada 2019), SIMA dirancang untuk bermain game open-ended (terbuka) tanpa tujuan yang telah ditentukan1. Agen ini belajar menjalankan instruksi yang diberikan manusia melalui chat teks, perintah suara, atau gambar di layar game.
Pelatihan Multi-Game
SIMA 2 dilatih menggunakan rekaman manusia bermain delapan game komersial, di antaranya No Man's Sky dan Goat Simulator 3, ditambah tiga dunia virtual buatan perusahaan1. Agen mempelajari korespondensi antara input keyboard dan mouse dengan aksi dalam game. Game seperti Goat Simulator 3 yang dirilis 17 November 2022 menawarkan sandbox besar dengan interaksi fisika, misi, aktivitas, dan lokasi yang bizare3.
| Aspek 🎯 | SIMA (2024) | SIMA 2 (2025) |
|---|---|---|
| Model Dasar | Tanpa LLM Gemini | Berbasis Gemini |
| Kemampuan Instruksi | Instruksi sederhana | Instruksi kompleks, bertanya, update progres |
| Kontrol Pengguna | Terbatas | Teks, suara, gambar layar |
| Pembelajaran Mandiri | Tidak ada | Trial-and-error dengan feedback Gemini |
| Navigasi Lingkungan Baru | Terbatas | Dapat beradaptasi di lingkungan belum pernah dilihat |
| Memori | Lebih panjang | Hanya interaksi terbaru (untuk responsivitas) |
| Kompleksitas Tugas | Tugas dasar | Tugas multi-langkah (masih berkembang) |
Kemampuan Reasoning dan Self-Improvement
Terhubung dengan Gemini, SIMA 2 jauh lebih baik dalam mengikuti instruksi—bertanya dan memberikan update selama prosesnya—serta memahami cara melakukan tugas kompleks tertentu secara mandiri1. Google DeepMind menguji agen di lingkungan yang belum pernah dilihat sebelumnya.
Kolaborasi dengan Genie 3
Dalam serangkaian eksperimen, peneliti meminta Genie 3 (versi terbaru world model perusahaan) untuk menghasilkan lingkungan dari awal dan menempatkan SIMA 2 di dalamnya1. Hasilnya? Agen dapat menavigasi dan menjalankan instruksi di sana. Tim juga menggunakan Gemini untuk menghasilkan tugas baru bagi SIMA 2. Jika gagal, Gemini menghasilkan tips yang digunakan SIMA 2 saat mencoba lagi. Mengulangi tugas berkali-kali dengan cara ini sering memungkinkan SIMA 2 untuk meningkat melalui trial and error hingga berhasil, kata Marino1.
Jalan Menuju Robot Dunia Nyata
Tujuan akhirnya adalah mengembangkan agen next-generation (generasi berikutnya) yang mampu mengikuti instruksi dan menjalankan tugas open-ended di lingkungan lebih kompleks dari web browser1. Dalam jangka panjang, Google DeepMind ingin menggunakan agen semacam itu untuk menggerakkan robot dunia nyata. Marino mengklaim bahwa keterampilan yang dipelajari SIMA 2—seperti menavigasi lingkungan, menggunakan alat, dan berkolaborasi dengan manusia untuk memecahkan masalah—adalah blok bangunan esensial untuk pendamping robot masa depan4.
Julian Togelius, peneliti AI di New York University yang bekerja pada kreativitas dan video game, menganggap ini hasil yang menarik. Upaya sebelumnya untuk melatih satu sistem bermain banyak game tidak berjalan terlalu baik, katanya1. Khususnya, ia menyebut GATO, sistem sebelumnya dari Google DeepMind yang—meskipun di-hype saat itu—tidak dapat mentransfer keterampilan di sejumlah besar lingkungan virtual.
Skeptisisme dan Tantangan
Matthew Guzdial, peneliti AI di University of Alberta, tidak terlalu terkejut SIMA 2 bisa bermain banyak game berbeda. Ia mencatat bahwa sebagian besar game memiliki kontrol keyboard dan mouse yang sangat mirip: Pelajari satu dan Anda mempelajari semuanya1. Guzdial juga mempertanyakan seberapa banyak yang dipelajari SIMA 2 benar-benar dapat ditransfer ke robot. "Jauh lebih sulit memahami visual dari kamera di dunia nyata dibandingkan game, yang dirancang dengan visual yang mudah diurai untuk pemain manusia," katanya1.
SIMA 2 masih eksperimen. Agen berjuang dengan tugas kompleks yang memerlukan banyak langkah dan lebih banyak waktu untuk diselesaikan1. Ia juga hanya mengingat interaksi terbarunya (untuk membuat SIMA 2 lebih responsif, tim memotong memori jangka panjangnya). Masih jauh dari sebaik manusia dalam menggunakan mouse dan keyboard untuk berinteraksi dengan dunia virtual.
Kesimpulan
SIMA 2 menandai langkah besar menuju agen AI yang lebih umum dengan kemampuan reasoning, perencanaan, dan pembelajaran lintas-dunia yang lebih kuat5. Marino dan koleganya berharap melanjutkan kerja dengan Genie 3 untuk memungkinkan agen meningkat dalam semacam dojo pelatihan virtual tanpa akhir, di mana Genie menghasilkan dunia untuk SIMA belajar melalui trial and error yang dipandu feedback Gemini. "Kami baru saja menggores permukaan dari apa yang mungkin," katanya dalam konferensi pers1.
Daftar Pustaka
- Heaven, W. D. (2025, November 13). Google DeepMind is using Gemini to train agents inside Goat Simulator 3. MIT Technology Review. https://www.technologyreview.com/2025/11/13/1127921/google-deepmind-is-using-gemini-to-train-agents-inside-goat-simulator-3/
- Google's SIMA 2 agent uses Gemini to reason and act in virtual worlds. (2025, November 13). TechCrunch. https://techcrunch.com/2025/11/13/googles-sima-2-agent-uses-gemini-to-reason-and-act-in-virtual-worlds/
- Goat Simulator 3 - Release Date, System requirements, gameplay & more. (2022, November 15). Sportskeeda. https://www.sportskeeda.com/esports/goat-simulator-3-release-date-system-requirements-gameplay-and-more
- Google's SIMA 2 Self-Improving Brain: Robotics May Change Faster Than You Think. (2025, November 17). Geeky Gadgets. https://www.geeky-gadgets.com/sima-2-robotics-task-planning/
- Google DeepMind unveils SIMA 2, an AI agent built to think, plan and learn across virtual worlds. (2025, November 15). Moneycontrol. https://www.moneycontrol.com/technology/google-deepmind-unveils-sima-2-an-ai-agent-built-to-think-plan-and-learn-across-virtual-worlds-article-13678649.html

