GLM-5.2 Salip Claude Fable 5, Harga Murah dan Open-Weights Ini Mengguncang Tim Developer

Author: Redaksi Android62

GLM-5.2 dari Zhipu AI kini memimpin salah satu tolok ukur desain web berbasis penilaian manusia, sekaligus menyalip Claude Fable 5 di leaderboard HTML single-round untuk kategori non-agent. Pencapaian ini menarik perhatian karena bukan hanya soal peringkat, tetapi juga karena model tersebut tampil unggul pada hasil desain yang benar-benar dinilai oleh manusia.

Design Arena mengumumkan pada 19 Juni bahwa GLM-5.2 berada di posisi nomor satu pada leaderboard tersebut. Model ini disebut mengungguli Claude Fable 5, serta melampaui Opus 4.6 dan 4.7 dalam peringkat yang sama.

Hasil yang terlihat langsung pada desain

Keunggulan GLM-5.2 tampak pada cara model ini membangun halaman web. Hasil desainnya dinilai memiliki tata letak bersih, penggunaan gambar dari CDN, tipografi yang rapi, hierarki visual yang jelas, dan animasi halus yang membuat situs terasa lebih hidup.

Design Arena juga mencatat bahwa model ini kuat dalam penggunaan pustaka front-end populer. Dua library yang menonjol adalah Chart.js dan Three.js, yang kerap dipakai untuk visualisasi data dan elemen interaktif.

Dalam putaran terbaru, tingkat kemenangan GLM-5.2 dilaporkan naik sekitar 6 poin persentase. Model ini juga mencatat skor Elo sekitar 1360 di arena kategori kode, naik lima peringkat dibanding GLM-5.1.

Metode penilaian yang mengutamakan pilihan manusia

Posisi GLM-5.2 menjadi lebih relevan karena Design Arena memakai penilaian buta dari para pengguna. Platform itu menyusun leaderboard dari voting anonim terhadap desain yang dibuat model AI, sehingga fokusnya ada pada tampilan, kegunaan, dan kualitas hasil akhir.

Pendekatan ini berbeda dari pengujian sintetis yang hanya mengandalkan metrik otomatis. Dalam desain web, penilaian manusia dianggap lebih mampu menangkap rasa visual, keterbacaan, penataan elemen, dan kenyamanan penggunaan.

Design Arena menyebut telah mengumpulkan jutaan suara dari para kreator. Skala penilaian tersebut membuat hasil leaderboard ini dipandang cukup dekat dengan kebutuhan dunia nyata di bidang creative coding.

Biaya rendah dan sifat terbuka ikut memperkuat daya tarik

Selain performa, GLM-5.2 juga menonjol karena biaya pemakaiannya rendah. API model ini disebut dibanderol sekitar $1.40 per satu juta token input dan $4.40 untuk output.

Angka itu jauh di bawah Fable 5, yang disebut berada di kisaran $10 untuk input dan $50 untuk output. Selisih biaya ini bisa menjadi pertimbangan besar bagi tim yang menjalankan iterasi desain dalam jumlah tinggi atau beban kerja besar.

GLM-5.2 hadir sebagai model open-weights dengan lisensi MIT. Dengan status itu, tim dapat menjalankannya secara lokal tanpa harus sepenuhnya bergantung pada layanan tertutup.

Model ini juga membawa context window 1 juta token. Kapasitas konteks sebesar itu memberi ruang lebih luas untuk proyek panjang, instruksi besar, dan alur kerja yang lebih kompleks dalam satu sesi.

Tekanan baru bagi tim developer

Kombinasi performa, biaya, dan sifat terbuka membuat GLM-5.2 menjadi opsi yang sulit diabaikan. Bagi banyak tim developer, perpaduan itu bisa lebih menarik dibanding model yang lebih mahal tetapi tidak menawarkan fleksibilitas serupa.

Dalam konteks industri AI, capaian ini juga menunjukkan bahwa laboratorium AI China bergerak cepat di area kreatif yang semakin spesifik. Persaingan kini tidak hanya terjadi pada chatbot umum, tetapi juga pada model yang mampu menghasilkan antarmuka siap pakai, efisien, dan menarik secara visual.

Claude Fable 5 tetap berada di jajaran model kuat untuk kategori ini. Namun dengan hasil leaderboard yang menguntungkan GLM-5.2, biaya yang lebih rendah, dan dukungan open-weights, pilihan tim pengembang web kini terasa semakin terbuka.

Source: www.gizmochina.com
Berita Terbaru