Google mulai menata ulang cara kuota Gemini dipakai agar tidak cepat habis saat menangani tugas berat. Perubahan ini langsung terasa bagi pengguna yang sebelumnya mengeluh karena satu permintaan kompleks bisa memangkas jatah penggunaan terlalu besar.
Langkah tersebut muncul setelah sistem kuota baru yang diterapkan pasca I/O 2026 dianggap terlalu agresif. Gemini kini memakai batas lima jam dan batas mingguan, menggantikan sistem lama yang berbasis jumlah prompt, sehingga beban komputasi menjadi patokan yang lebih relevan untuk pekerjaan berat.
Salah satu perubahan terpenting ada pada cara satu prompt dihitung. Google menegaskan bahwa satu permintaan tidak akan lagi menyedot porsi kuota terlalu besar, dan perusahaan juga mulai membatasi seberapa banyak kuota yang bisa dikuras oleh satu prompt.
Dampaknya cukup besar bagi pengguna yang bekerja dengan prompt besar atau file berukuran besar di Gemini 3.1 Pro. Untuk jenis tugas seperti itu, kebutuhan komputasi memang jauh lebih tinggi dibanding permintaan teks biasa, sehingga kuota lama terasa cepat habis.
Google juga memperbaiki perlakuan terhadap error yang muncul saat penggunaan berlangsung. Jika Gemini menampilkan error, percobaan itu tidak lagi dihitung ke kuota, dan hanya penyelesaian yang berhasil yang akan mengurangi batas penggunaan.
Perubahan ini menutup salah satu sumber frustrasi yang paling sering dikeluhkan pengguna. Sebelumnya, percobaan yang gagal tetap bisa memakan jatah, terutama ketika pengguna sedang menjalankan permintaan yang berat dan berulang.
Josh Woodward, Vice President of Google AI Studio, Gemini, dan Google Labs di Google, juga menyebut adanya perbaikan bug terkait Omni di X. Bug itu sebelumnya membuat kuota Gemini sebagian pengguna terkuras terlalu besar secara tidak semestinya.
Masalah tersebut paling terasa pada fitur pembuatan video. Satu prompt pembuatan video disebut dapat menghabiskan 100 persen dari batas lima jam, sehingga Google berupaya mencegah kondisi serupa terulang.
Di sisi lain, Google juga menyiapkan tampilan penggunaan yang lebih rinci. Langkah ini penting karena fitur seperti Deep Research dan tugas berat lain menghabiskan token dan komputasi lebih besar dibanding prompt teks biasa.
Dengan rincian pemakaian yang lebih jelas dan notifikasi yang lebih tegas, pengguna diharapkan bisa melihat apa yang benar-benar menguras kuota lima jam maupun kuota mingguan. Hal ini menjawab keluhan banyak pengguna yang merasa jatah mereka habis tanpa penjelasan yang cukup jelas.
Ada juga perubahan yang memberi ruang lebih longgar bagi pengguna model tertentu. Menurut Josh Woodward, prompt yang dijalankan di Gemini 3.1 Flash-Lite tidak akan dihitung terhadap batas penggunaan.
Artinya, Flash-Lite bisa menjadi jalur cadangan saat kuota model lain sudah terbatas atau menunggu reset. Kebijakan ini membuat pengguna tetap punya opsi untuk tugas yang tidak membutuhkan model yang lebih berat.
Aplikasi Gemini sendiri ikut dibenahi supaya lebih nyaman dipakai harian. Setelah pengguna memilih model tertentu, aplikasi kini akan mengingat pilihan itu dan menjadikannya default untuk sesi berikutnya.
Perpindahan model juga dibuat lebih konsisten. Model baru akan dipakai saat batas penggunaan tercapai, lalu Gemini beralih ke model yang lebih ringan, sehingga pengalaman terasa lebih rapi dan tidak sering berubah tanpa alasan yang jelas.
Penyesuaian kuota ini menunjukkan Google masih terus mengkalibrasi sistem berbasis komputasi yang baru diperkenalkannya. Setelah sistem tersebut hadir, Google tercatat sudah dua kali melipatgandakan batas penggunaan hingga totalnya naik tiga kali lipat pada masing-masing putaran penyesuaian.
Bagi pengguna aktif, yang berubah bukan hanya angka kuota. Cara kuota dikurangi, perlakuan terhadap error, batas konsumsi per prompt, akses gratis ke Flash-Lite, dan visibilitas penggunaan untuk tugas berat kini ikut dibenahi agar Gemini lebih masuk akal saat dipakai dalam beban kerja yang besar.
Source: www.androidpolice.com






