Google menunjukkan arah baru untuk Gemini di mobil: asisten AI itu kini bisa menjawab pertanyaan tentang apa yang terlihat di depan kendaraan. Dalam demo terbaru, Gemini tidak hanya menerima perintah suara, tetapi juga memanfaatkan kamera depan mobil untuk memahami lingkungan nyata di sekitar pengemudi.
Fitur ini masih bersifat eksperimental, namun sudah memperlihatkan potensi yang terasa langsung berguna. Alih-alih sekadar mengandalkan peta dan navigasi, Gemini mulai diposisikan sebagai asisten yang bisa membaca situasi visual saat pengguna berkendara.
Kamera mobil menjadi sumber penglihatan Gemini
Demonstrasi itu diperlihatkan oleh Presiden Android Google, Sameer Samat, dalam percakapan dengan Logan Kilpatrick, Product Lead untuk Google AI Studio. Demo dilakukan di dalam Volvo EX60 yang menjalankan platform Google built-in dengan Gemini.
Konsepnya mirip dengan Gemini Live di ponsel Android, tetapi dengan satu perbedaan penting: pengguna tidak perlu mengarahkan perangkat ke objek tertentu. Kamera depan mobil yang menjadi “mata” bagi AI, lalu Gemini memproses visual tersebut untuk menjawab pertanyaan pengguna.
Menurut Samat, Google ingin melihat apa yang terjadi jika Gemini bisa memahami dunia di sekitar saat mobil melaju. Dari sana, AI dapat memberikan jawaban yang lebih kontekstual karena merujuk pada apa yang benar-benar berada di depan kendaraan pada momen itu.
Privasi dibatasi hanya saat pengguna memanggilnya
Isu privasi langsung menjadi perhatian dalam fitur seperti ini, dan Google tampaknya menyiapkan pembatasan yang cukup ketat. Samat menjelaskan bahwa Gemini tidak terus-menerus memantau kondisi sekitar mobil.
Akses kamera hanya aktif setelah pengguna secara eksplisit memanggil Gemini dan mengajukan pertanyaan. Setelah itu, kamera mengirim umpan visual, Gemini memprosesnya, lalu akses visual kembali berhenti.
Pola ini membuat fitur tersebut berbeda dari sistem yang mengamati lingkungan sepanjang waktu. Google terlihat berusaha menjaga agar penggunaan kamera tetap hanya terjadi saat benar-benar diminta pengguna.
Demo menunjukkan pemahaman visual yang cukup kuat
Walau terlihat ada jeda saat kamera terhubung ke Gemini, hasil demonstrasi tetap menarik perhatian. Layar infotainment mobil tidak menampilkan viewfinder langsung, sehingga pengguna hanya mendengar jawaban suara setelah sistem selesai memproses gambar.
Dalam demo itu, Samat meminta Gemini mengidentifikasi tengara di sekitar kampus Google di Mountain View. AI tersebut disebut berhasil mengenali beberapa lokasi penting dengan tepat, termasuk The Orb, Gradient Canopy, dan Shoreline Amphitheater.
Gemini juga tidak berhenti pada pengenalan objek semata. Sistem itu ikut memberi penjelasan tambahan, seperti detail instalasi seni publik The Orb, keterangan bahwa Gradient Canopy adalah atap surya, dan sejarah arsitektur Shoreline Amphitheater.
| Objek yang Diidentifikasi | Hasil yang Disebutkan | Keterangan |
|---|---|---|
| The Orb | Dikenali dengan benar | Gemini juga menjelaskan detail instalasi seni publik tersebut |
| Gradient Canopy | Dikenali dengan benar | Diuraikan sebagai atap surya |
| Shoreline Amphitheater | Dikenali dengan benar | Gemini memaparkan sejarah arsitekturnya |
Kemampuan seperti itu menunjukkan Gemini bisa memberi konteks yang lebih kaya ketimbang sekadar menyebut nama lokasi. Bagi pengguna, ini berpotensi berguna ketika melintas di area baru dan ingin tahu apa yang sedang terlihat di luar kendaraan.
Google bahkan mencontohkan manfaat yang lebih praktis untuk perjalanan harian, seperti membantu memahami rambu jalan yang ditulis dalam bahasa asing. Dalam skenario seperti ini, asisten bisa menjadi alat bantu yang cepat saat informasi visual di jalan tidak langsung dipahami pengemudi.
Baru satu mobil yang mendukung untuk saat ini
Volvo EX60 yang dipakai dalam demo juga belum mulai dikirim ke konsumen. Untuk saat ini, kendaraan tersebut tampaknya menjadi satu-satunya mobil yang mendukung kemampuan baru Gemini ini.
Google belum menjelaskan kapan fitur tersebut akan diperluas ke model lain. Bahkan, perusahaan juga belum memastikan apakah dukungan itu nantinya akan hadir di kendaraan lain yang memakai Google built-in.
Meski begitu, demo ini memberi sinyal jelas bahwa Google sedang memperluas Gemini dari ponsel ke kendaraan. Mobil tidak lagi hanya menjadi ruang untuk navigasi dan aplikasi, tetapi juga perangkat yang bisa memahami situasi visual di sekitar pengemudi.
Di akhir demonstrasi, Samat mengatakan Google masih mencari cara terbaik untuk menghadirkan kemampuan ini ke kendaraan. Pernyataan itu menandakan fitur tersebut masih dalam tahap eksplorasi, meski arah pengembangannya sudah terlihat semakin nyata.
