MiMo-V2.5-Pro UltraSpeed Melaju 1.000 Token per Detik, Xiaomi Kejar Pasar AI Supercepat

Xiaomi menempatkan MiMo-V2.5-Pro UltraSpeed sebagai salah satu langkah paling agresif dalam persaingan AI generatif saat ini. Mode baru ini diklaim mampu menghasilkan lebih dari 1.000 token per detik, jauh melampaui generasi sebelumnya dan menyasar kebutuhan respons yang benar-benar cepat.

Pencapaian tersebut membuat perhatian tidak lagi hanya tertuju pada ukuran model, tetapi juga pada efisiensi inferensi. Dalam pengumumannya, Xiaomi menegaskan bahwa kecepatan tinggi itu dipadukan dengan upaya menjaga model tetap bisa berjalan pada GPU serbaguna, bukan hanya pada infrastruktur yang sangat khusus.

Model 1 triliun parameter yang dipacu lewat co-design

MiMo-V2.5-Pro UltraSpeed dibangun di atas model berukuran 1 triliun parameter. Xiaomi menyebut peningkatan performanya tidak hanya berasal dari skala model, tetapi juga dari integrasi mendalam antara arsitektur model dan sistem inferensi yang mendasarinya.

Perusahaan menjelaskan bahwa pendekatan tersebut dilakukan bersama TileRT. Xiaomi menggambarkannya sebagai salah satu implementasi co-design paling mutakhir di platform AI mereka, dengan tujuan menjaga respons tetap cepat tanpa harus bergantung pada infrastruktur yang terlalu spesifik.

Lompatan besar dari versi sebelumnya

Kecepatan lebih dari 1.000 token per detik menjadi peningkatan yang sangat mencolok dibanding MiMo-V2-Flash. Model yang diperkenalkan pada Desember 2025 itu disebut mampu menghasilkan sekitar 150 token per detik.

Xiaomi bahkan menyebut capaian itu setara dengan sekitar 110 kata per detik. Dengan UltraSpeed, perusahaan mengklaim pengalaman output bisa mencapai 10 kali lebih cepat dibanding layanan API standar MiMo-V2.5-Pro.

Tarif lebih mahal dan akses masih terbatas

Di balik lonjakan performa, Xiaomi menetapkan tarif akses UltraSpeed yang sekitar tiga kali lebih mahal daripada versi reguler. Untuk layanan standar MiMo-V2.5-Pro, biaya yang disebutkan adalah 0,025 yuan per juta token untuk cache hit, 3 yuan per juta token untuk input cache miss, dan 6 yuan per juta token untuk output.

Mode UltraSpeed belum membuka fitur Token Package karena statusnya masih uji coba API. Xiaomi menilai biaya yang lebih tinggi itu sepadan bagi pengguna yang membutuhkan output sangat cepat untuk kebutuhan nyata.

Uji coba dua minggu untuk perusahaan dan pengembang

Karena sumber daya inferensi berkecepatan tinggi masih terbatas, Xiaomi membuka program uji coba pada 9 Juni hingga 23 Juni 2026. Pendaftaran dilakukan lewat sistem aplikasi, dan tidak semua pendaftar dijamin diterima.

Prioritas diberikan kepada perusahaan serta pengembang profesional yang memiliki kebutuhan bisnis nyata terhadap layanan AI berkecepatan tinggi. Peserta yang lolos akan mendapat akses gratis selama dua minggu untuk mencoba MiMo UltraSpeed.

Aturan Uji CobaKetentuan
Batas entri antrian per hari10 entri
Durasi sesi30 menit
Batas tanpa aktivitas5 menit sebelum sumber daya dilepas otomatis

Selama masa uji coba, Xiaomi menerapkan pembatasan untuk menjaga ketersediaan sumber daya. Setiap akun hanya memperoleh maksimal 10 entri antrian per hari, durasi sesi dibatasi 30 menit, dan sumber daya akan dilepas otomatis bila tidak ada aktivitas lebih dari 5 menit.

MiMo-V2.5-Pro pertama kali diperkenalkan pada April 2026 sebagai bagian dari ekspansi besar Xiaomi di bidang kecerdasan buatan. Kini, keluarga MiMo telah berkembang ke pemrosesan teks, suara, hingga kemampuan multimodal.

Dengan mode UltraSpeed, Xiaomi menunjukkan ambisi yang lebih serius untuk bersaing di pasar model AI generatif global. Jika klaim kecepatannya terbukti dalam penggunaan nyata, layanan ini berpotensi menjadi salah satu pilihan paling menarik bagi pengembangan aplikasi dan layanan berbasis kecerdasan buatan.

Berita Terkait