Opus 4.7 Makin Patuh Pada Arahan, Prompt Lama dan Biaya Token Bisa Berubah

Add on Google

Perpindahan ke Claude Opus 4.7 tidak bisa diperlakukan sebagai sekadar pembaruan versi. Model ini membawa perilaku yang lebih patuh pada instruksi, tetapi perubahan itu juga dapat mengganggu prompt lama yang selama ini sudah terasa stabil di Opus 4.6.

Dampaknya tidak hanya soal gaya jawab yang berbeda. Bagi workflow yang sudah matang, penyesuaian ini bisa membuat hasil keluaran berubah, sementara penggunaan token juga berpotensi lebih besar dari sebelumnya.

Prompt lama tidak selalu aman dipakai ulang

Salah satu hal yang paling menonjol dari Opus 4.7 adalah cara model membaca arahan. Dibanding versi sebelumnya, model ini cenderung lebih literal, lebih disiplin, dan lebih mudah diprediksi dalam mengikuti instruksi yang tertulis jelas.

Sifat itu memang membantu saat dibutuhkan kontrol yang lebih ketat. Namun, prompt yang dulu masih terasa fleksibel di Opus 4.6 bisa kehilangan ruang interpretasi ketika dijalankan di Opus 4.7.

Itu berarti template internal, otomasi, dan pipeline kerja yang bergantung pada pola jawaban tertentu tidak bisa langsung diasumsikan tetap cocok. Bahkan perubahan kecil dalam pemahaman instruksi dapat berdampak ke banyak bagian alur kerja.

Migrasi memerlukan pengetesan ulang

Karena perilaku model berubah, penyesuaian prompt menjadi langkah yang sulit dihindari. Pengguna perlu menguji ulang instruksi, memeriksa format keluaran, lalu memastikan hasilnya masih sesuai dengan kebutuhan yang dituju.

Untuk penggunaan individu, proses ini biasanya berarti lebih banyak percobaan sebelum model dipakai penuh. Untuk organisasi, dampaknya bisa lebih besar karena ada banyak komponen yang saling terhubung, mulai dari template hingga proses kerja yang sudah berjalan.

Jika workflow sebelumnya dibangun dengan asumsi bahwa model akan memberi interpretasi yang longgar, maka perubahan pada Opus 4.7 bisa menggeser beberapa tahap sekaligus. Karena itu, sekadar mengganti versi model belum cukup tanpa evaluasi ulang terhadap prompt dan ekspektasi hasil.

Token berisiko membengkak

Selain soal kompatibilitas prompt, penggunaan token juga menjadi perhatian. Opus 4.7 memakai tokenizer baru yang disebut dapat meningkatkan pemakaian token sekitar 1 hingga 1,35 kali, tergantung jenis kontennya.

Bagi penggunaan skala besar, kenaikan ini tentu signifikan. Interaksi yang panjang, pekerjaan yang berulang, atau proyek dengan batas anggaran ketat bisa lebih cepat menghabiskan kuota dan menaikkan biaya pemrosesan.

Artikel referensi juga menyoroti level effort bawaan “extra high” di Cloud Code yang dapat menambah kebutuhan pemrosesan. Artinya, peningkatan performa tidak selalu datang tanpa konsekuensi, karena beban operasional bisa ikut naik dalam skenario tertentu.

Kondisi ini membuat prompt lama yang sebelumnya hemat token belum tentu tetap efisien. Hasil akhirnya mungkin tetap baik, tetapi biaya untuk mencapainya bisa berbeda cukup terasa setelah migrasi.

Ada peningkatan yang memang relevan

Di sisi kemampuan, Anthropic mendorong Opus 4.7 untuk pekerjaan coding agentic yang panjang dan kompleks. Model ini juga disebut lebih kuat dalam menangani penalaran bertahap, sehingga cocok untuk alur kerja yang membutuhkan konteks berkelanjutan.

Kemampuan multimodalnya juga diperkuat, termasuk pada gambar beresolusi tinggi. Hal ini membuka ruang penggunaan yang lebih luas untuk analisis visual dan pemrosesan yang memadukan teks dengan gambar.

Selain itu, Opus 4.7 membawa peningkatan pada document reasoning dan sistem memori berbasis file. Untuk proyek dengan dokumen besar atau dataset berukuran besar, fitur tersebut bisa membantu pekerjaan iteratif yang perlu menjaga konteks panjang.

Fitur baru belum tentu langsung mulus dipakai

Anthropic juga menambahkan dukungan gambar resolusi tinggi, Task Budgeting versi beta, dan Ultra Review untuk pengembang. Ketiganya ditujukan untuk memperluas manfaat model, terutama pada tugas panjang dan peninjauan kode yang lebih dalam.

Task Budgeting dirancang untuk membantu pengelolaan alokasi token dalam tugas berdurasi panjang. Namun karena masih berstatus beta, fiturnya tetap perlu diuji lebih luas sebelum dianggap siap untuk semua skenario kerja.

Ultra Review menawarkan pemeriksaan kode yang lebih detail dan membantu deteksi bug. Meski menarik, manfaatnya tetap bergantung pada seberapa jauh workflow tim sudah disesuaikan dengan karakter Opus 4.7.

Keputusan migrasi perlu dilihat per kebutuhan

Secara internal, Opus 4.7 disebut unggul atas Opus 4.6 dalam benchmark yang dimiliki Anthropic. Namun evaluasi eksternal memberi gambaran yang lebih beragam, termasuk adanya model lain yang dinilai lebih kuat pada aspek siber.

Karena itu, keputusan pindah versi sebaiknya tidak hanya bertumpu pada klaim performa umum. Kecocokan model perlu dilihat dari jenis tugas, ketergantungan pada prompt lama, dan dampak token terhadap biaya operasional.

Peluncuran Opus 4.7 juga disebut berlangsung dengan detail yang masih terbatas pada awal rilis. Dalam situasi seperti ini, pengujian bertahap menjadi cara yang lebih aman sebelum migrasi penuh, terutama bagi organisasi yang sensitif terhadap perubahan output dan lonjakan biaya.