Gemini 3.5 Bukan Lagi Chatbot Biasa, Google Dorong AI Ini Menuntaskan Tugas Sendiri

Add on Google

Gemini 3.5 kini diposisikan Google bukan lagi sebagai chatbot biasa, melainkan sistem AI yang mampu menjalankan alur kerja secara mandiri. Arah ini menjadi salah satu sorotan utama saat Google memperkenalkannya di ajang Google I/O 2026.

Perubahan tersebut menandai pergeseran besar dalam pendekatan Google terhadap AI. Gemini 3.5 diarahkan untuk menangani tugas yang rumit, panjang, dan memerlukan banyak langkah, termasuk pekerjaan yang biasanya bergantung pada alat eksternal dan konteks yang berkelanjutan.

Agentic coding jadi fokus utama

Salah satu kemampuan yang paling ditekankan adalah coding berbasis agen. Dalam pendekatan ini, Gemini 3.5 dirancang untuk memecah pekerjaan kompleks menjadi rencana bertahap, menugaskan sub-agen, memakai konteks sebelumnya, lalu menyelesaikan tugas dengan bantuan alat yang tersedia.

Model seperti ini membuat Gemini 3.5 berbeda dari chatbot tradisional yang umumnya hanya menjawab perintah satu per satu. Untuk pengembangan perangkat lunak, pola kerja tersebut lebih dekat dengan cara tim teknis menyusun dan mengeksekusi pekerjaan di dunia nyata.

Google juga menyiapkan platform pengembangan bernama Antigravity untuk mendukung pendekatan tersebut. Platform ini mencakup aplikasi desktop, SDK, CLI, serta dukungan suara untuk prototyping langsung, penanganan tugas kompleks, dan orkestrasi alur kerja multi-agen.

Kapasitas konteks panjang menjadi nilai penting

Gemini 3.5 mendukung context window hingga 1 juta token dan output hingga 65.000 token. Kapasitas itu ditujukan untuk menjaga percakapan panjang, codebase besar, dan dokumen berukuran masif tetap berada dalam jangkauan penalaran model.

Bagi pengembang dan pengguna enterprise, kemampuan ini penting karena banyak model AI mulai kehilangan detail saat input terlalu panjang. Dengan ruang konteks sebesar itu, Gemini 3.5 diarahkan untuk lebih siap dipakai dalam kebutuhan produksi.

Google juga menyebut penggunaan model thinking atau reasoning dengan beberapa tingkat kemampuan berpikir, dari minimal hingga tinggi. Setiap tingkat memiliki biaya tersendiri, sehingga pengguna bisa menyesuaikan kualitas respons dan efisiensi biaya sesuai kebutuhan.

Multimodal dan integrasi diperluas

Di sisi multimodal, Gemini 3.5 dilatih untuk memahami teks, gambar, video, audio, grafik, dan format lain dalam satu kerangka penalaran. Pendekatan ini menjadikan multimodal sebagai fondasi utama, bukan sekadar fitur pelengkap.

Google mengklaim kemampuan itu didukung oleh hasil benchmark yang kuat. Gemini 3.5 mencetak 84,2 persen pada CharXiv untuk penalaran dan interpretasi, serta 83,6 persen pada MMMU-Pro untuk pemahaman multimodal tingkat lanjut.

Di luar kemampuan dasar itu, Google juga memperluas konektivitas Gemini 3.5 ke berbagai alat. Integrasinya mencakup Google Search grounding, Google Maps, eksekusi kode, dan URL context agar respons yang dihasilkan lebih lengkap dan akurat.

Platform pihak ketiga seperti Shopify, Box, dan Databricks juga ikut didukung. Konektivitas ini membuka peluang otomasi yang lebih luas untuk kebutuhan bisnis dan enterprise, terutama pada alur kerja yang melibatkan data, dokumen, toko online, dan analitik.

Gemini 3.5 Flash dan kemampuan lain yang ikut dipamerkan

Google turut menyoroti Gemini 3.5 Flash sebagai opsi yang menawarkan kecerdasan mendekati versi Pro, tetapi dengan biaya yang jauh lebih rendah. Meski lebih efisien, model ini tetap membawa kemampuan multimodal, kesadaran konteks, dan integrasi platform.

Efisiensi tersebut menjadi penting untuk penggunaan skala besar, terutama ketika AI ditanamkan di aplikasi yang menuntut respons cepat. Kombinasi performa dan biaya yang lebih rendah memberi ruang bagi adopsi yang lebih luas di lingkungan bisnis.

Di luar pengembangan perangkat lunak dan kebutuhan enterprise, Google juga memamerkan terjemahan suara langsung secara real time dalam lebih dari 70 bahasa. Dalam demonstrasinya di I/O 2026, sistem ini disebut berupaya mempertahankan nada, tempo, dan pitch pembicara secara natural.

Google juga memperkenalkan model pembuatan video bernama Omni di dalam ekosistem Gemini 3.5. Model ini diklaim mampu mengubah prompt sederhana maupun kompleks menjadi keluaran video bergaya sinematik.

Dengan rangkaian kemampuan tersebut, Gemini 3.5 ditampilkan sebagai paket AI yang menonjolkan otonomi kerja, konteks panjang, dan pemahaman multimodal dalam satu lini produk. Google menyatakan daftar fitur ini masih akan terus bertambah seiring pengumuman lanjutan.