Google mengumumkan peluncuran Gemini 3 pada 18 November 2025, peningkatan besar untuk model multimodal (multimoda) andalannya.1 Model baru ini diklaim lebih baik dalam penalaran, memiliki kemampuan multimoda yang lebih lancar—bisa bekerja dengan suara, teks, atau gambar—dan bahkan berfungsi seperti agen.
Antarmuka Generatif yang Memilih Sendiri
Model sebelumnya, Gemini 2.5, mendukung input multimoda. Pengguna bisa memasukkan gambar, tulisan tangan, atau suara. Tapi biasanya butuh instruksi eksplisit tentang format output yang diinginkan.1 Defaultnya selalu teks biasa. Gemini 3 memperkenalkan apa yang Google sebut "generative interfaces" (antarmuka generatif)—model membuat pilihan sendiri tentang jenis output yang paling cocok untuk permintaan.
Minta rekomendasi perjalanan? Model bisa membuat antarmuka mirip situs web di dalam aplikasi, lengkap dengan modul, gambar, dan pertanyaan lanjutan seperti "Berapa hari Anda bepergian?" atau "Aktivitas apa yang Anda nikmati?"1 Opsi yang bisa diklik juga disajikan berdasarkan apa yang mungkin Anda inginkan selanjutnya.
| Fitur 🎯 | Gemini 2.5 | Gemini 3 ✨ |
|---|---|---|
| Input Multimoda | Ya (gambar, suara, teks) | Ya (gambar, suara, teks) |
| Output Default | Teks biasa | Antarmuka adaptif |
| Layout Visual | Perlu instruksi eksplisit | Otomatis dihasilkan |
| Diagram/Animasi | Atas permintaan | Otomatis jika diperlukan |
| Agen Multistep | Tidak tersedia | Gemini Agent (eksperimental) |
| Integrasi Layanan | Terbatas | Calendar, Gmail, Reminders |
| Platform Developer 💻 | AI Studio | Google Antigravity |
Ketika diminta menjelaskan konsep, Gemini 3 bisa membuat sketsa diagram atau animasi sederhana sendiri jika yakin visual lebih efektif.1 "Layout visual menghasilkan tampilan gaya majalah yang imersif lengkap dengan foto dan modul," kata Josh Woodward, VP Google Labs, Gemini, dan AI Studio. "Elemen-elemen ini tidak hanya terlihat bagus tetapi mengundang input Anda untuk lebih menyesuaikan hasil."
Gemini Agent untuk Tugas Multistep
Google juga memperkenalkan Gemini Agent, fitur eksperimental untuk menangani tugas multistep langsung di dalam aplikasi.1 Agen ini bisa terhubung ke layanan seperti Google Calendar, Gmail, dan Reminders. Setelah diberi akses, ia bisa menjalankan tugas seperti mengatur inbox atau mengelola jadwal.
Mirip agen lain, ia memecah tugas menjadi langkah-langkah terpisah, menampilkan progres secara real time (waktu nyata), dan berhenti untuk persetujuan pengguna sebelum melanjutkan.1 Google menyebutnya langkah menuju "agen generalis sejati". Fitur ini tersedia di web untuk pelanggan Google AI Ultra di AS mulai 18 November.
Pendekatan Vibe Coding
Keseluruhan pendekatan bisa terlihat seperti "vibe coding" (pengodean vibe)—pengguna menjelaskan tujuan akhir dengan bahasa natural dan membiarkan model merakit antarmuka atau kode yang dibutuhkan.1 Untuk developer, Google memperkenalkan Google Antigravity, platform pengembangan yang bertindak sebagai ruang all-in-one (serba-ada) tempat kode, alat, dan alur kerja bisa dibuat dan dikelola dari satu prompt.
Integrasi Mendalam dengan Produk Google
Pembaruan ini mengikat Gemini lebih dalam ke produk Google yang ada.1 Di Search, kelompok terbatas pelanggan Google AI Pro dan Ultra kini bisa beralih ke Gemini 3 Pro—variasi penalaran model baru—untuk menerima ringkasan yang lebih dalam dan menyeluruh yang mengandalkan penalaran model daripada AI Mode yang ada.
Untuk belanja, Gemini sekarang menarik dari Shopping Graph Google—yang perusahaan katakan berisi lebih dari 50 miliar daftar produk—untuk menghasilkan panduan rekomendasinya sendiri.1 Pengguna cukup mengajukan pertanyaan terkait belanja atau mencari frasa terkait belanja, dan model merakit bagian rekomendasi produk interaktif gaya Wirecutter, lengkap dengan harga dan detail produk, tanpa mengalihkan ke situs eksternal.
Tanggapan Developer
Derek Nee, CEO Flowith—aplikasi AI agentik—mengatakan kepada MIT Technology Review bahwa Gemini 3 Pro mengatasi beberapa kesenjangan di model sebelumnya.1 Peningkatan mencakup pemahaman visual yang lebih kuat, generasi kode yang lebih baik, dan performa lebih baik pada tugas panjang—fitur yang ia lihat sebagai esensial untuk pengembang aplikasi dan agen AI. "Mengingat keunggulan kecepatan dan biayanya, kami mengintegrasikan model baru ke produk kami," katanya. "Kami optimis tentang potensinya, tapi kami perlu pengujian lebih mendalam untuk memahami seberapa jauh ia bisa pergi."
Kesimpulan
Gemini 3 menandai evolusi signifikan dalam AI multimoda dengan antarmuka generatif yang adaptif dan kemampuan agen. Model ini memungkinkan interaksi lebih natural—tidak lagi terbatas pada teks statis. Integrasi dengan ekosistem Google dan platform Antigravity untuk developer menunjukkan ambisi Google memimpin era AI generatif. Meski masih eksperimental, Gemini Agent menjanjikan otomasi tugas yang lebih kompleks dengan pengawasan manusia.
Daftar Pustaka
- Chen, Caiwei. "Google's new Gemini 3 'vibe-codes' responses and comes with its own agent." MIT Technology Review, 18 November 2025. https://www.technologyreview.com/2025/11/18/1128065/googles-gemini-3/

