MiMo Xiaomi Tembus Lebih dari 1.000 Token per Detik, Jauh Menyalip ChatGPT dan Claude

Author: Redaksi Android62 Rabu, 10 Juni 2026 | 9:11 pm

Xiaomi kembali mencuri perhatian lewat model AI terbarunya, MiMo-V2.5-Pro-UltraSpeed, yang diklaim mampu melesat hingga lebih dari 1.000 token per detik. Dalam pengujian yang dikutip Decrypt, kecepatannya bahkan sempat mendekati 1.200 token per detik.

Angka itu membuat MiMo langsung dipandang sebagai salah satu sistem AI tercepat yang pernah dipublikasikan untuk pasar pengembang. Performa tersebut juga memperlebar jarak dengan chatbot AI populer yang selama ini dikenal publik.

Jaraknya jauh dari model populer

Token adalah potongan teks yang diproses AI saat membaca atau menyusun jawaban. Semakin banyak token yang diproses setiap detik, semakin singkat waktu respons yang dirasakan pengguna.

Data Artificial Analysis memperlihatkan selisih yang sangat lebar. GPT-5.5 yang digunakan banyak pengguna ChatGPT berada di kisaran 68 token per detik, Claude Opus 4.6 sekitar 71 token per detik, sedangkan Gemini Flash mencapai kurang lebih 192 token per detik.

Dengan perbandingan itu, klaim Xiaomi menonjol bukan hanya karena angka mentahnya, tetapi juga karena lonjakannya terhadap model AI komersial yang sudah luas dipakai. MiMo-V2.5-Pro-UltraSpeed pun cepat menjadi bahan pembicaraan di komunitas teknologi.

Efisiensi software, bukan chip khusus

Yang membuat pencapaian ini makin menarik adalah pendekatan yang dipilih Xiaomi. Perusahaan itu tidak bergantung pada perangkat keras khusus yang mahal, melainkan hanya satu server standar berisi delapan GPU.

Strategi tersebut berbeda dari perusahaan seperti Cerebras dan Groq yang mengandalkan chip khusus untuk mengejar kecepatan AI. Xiaomi justru memaksimalkan efisiensi lewat optimasi perangkat lunak, termasuk sistem TileRT dan sejumlah teknik kompresi data.

Salah satu teknik yang dipakai adalah FP4 Quantization. Metode ini mengecilkan sebagian data model agar kebutuhan memori turun dan proses berjalan lebih cepat tanpa menurunkan kualitas jawaban secara signifikan.

Model besar tetap dipacu cepat

Xiaomi juga memanfaatkan teknologi DFlash untuk mempercepat pembuatan respons. Teknologi ini memungkinkan AI memprediksi dan memproses beberapa kata sekaligus dalam satu langkah, sehingga jawaban bisa disusun lebih singkat.

Kombinasi teknologi itu disebut membuat model AI berukuran lebih dari satu triliun parameter tetap berjalan sangat cepat. Parameter sendiri adalah angka internal yang membantu AI mengenali pola dan menghasilkan respons, dan jumlah yang besar biasanya berkaitan dengan kemampuan model yang lebih canggih.

Menariknya, MiMo-V2.5-Pro disebut bukan versi yang diperkecil demi mengejar kecepatan. Model ini tetap diklaim setara model AI kelas atas dan disebut mampu bersaing dengan Claude Opus dalam berbagai pengujian coding.

Uji coba terbuka untuk pengembang

Untuk saat ini, Xiaomi telah membuka program uji coba API MiMo-V2.5-Pro-UltraSpeed bagi pengembang dan perusahaan. Sebagian teknologi yang dipakai juga sudah dirilis secara open source, sehingga komunitas pengembang di berbagai negara bisa ikut menguji dan mempelajarinya.

Kecepatan seperti ini membuka peluang penggunaan yang lebih luas di berbagai bidang. Laporan tersebut menyebut kemungkinan penerapannya pada analisis data real-time, deteksi penipuan, sistem perdagangan otomatis, hingga agen AI yang bisa berpikir dan bertindak lebih cepat.

Langkah ini menunjukkan Xiaomi tidak hanya ingin bersaing lewat perangkat konsumen. Perusahaan asal Tiongkok itu kini juga mulai membangun posisi di arena AI yang semakin kompetitif, dengan MiMo-V2.5-Pro-UltraSpeed sebagai salah satu model yang paling diperhatikan saat ini.