Claude Dapat Menyusun Ulang Pengalamannya Sendiri, Fitur Bermimpi Ini Mulai Diuji Anthropic

Anthropic mulai membuka pratinjau fitur baru Claude yang disebut dreaming, dan fitur ini langsung menarik perhatian karena berfokus pada kemampuan agen untuk mengevaluasi pekerjaannya sendiri. Alih-alih hanya menjalankan tugas, Claude kini bisa meninjau apa yang sudah ia lakukan, mengenali pola, lalu memperbaiki kesalahan yang muncul berulang.

Bagi pengguna yang mengandalkan agen AI untuk pekerjaan panjang, pendekatan seperti ini punya arti besar. Sistem yang dipakai Claude tidak hanya menyimpan jejak aktivitas, tetapi juga dirancang untuk merangkum pengalaman dan mempertahankan informasi yang dianggap paling bernilai.

Claude masuk fase refleksi

Anthropic menempatkan dreaming dalam jalur pratinjau untuk Claude Managed Agents. Pengembang yang ingin mencoba fitur ini sudah bisa mengajukan akses melalui situs Claude.

Secara konsep, dreaming bekerja setelah agen selesai digunakan. Pengguna dapat menekan tombol untuk memicu keadaan bermimpi, lalu Claude meninjau seluruh tindakan agen sejak sesi dreaming sebelumnya dan menyusun ringkasan tentang apa yang terjadi.

Cara kerja itu membuat Claude tidak sekadar mengingat, tetapi juga menilai kembali hasil dari pekerjaannya. Anthropic menjelaskan bahwa mekanisme ini membantu menampilkan pola yang sulit terlihat jika hanya mengamati satu agen secara terpisah.

Memori yang disusun ulang

Salah satu tujuan utama fitur ini adalah restrukturisasi memori. Anthropic ingin memori tetap memiliki sinyal yang kuat meski terus berkembang, terutama saat agen digunakan untuk tugas jangka panjang.

Dengan pendekatan tersebut, Claude tidak hanya belajar saat sedang aktif menjalankan tugas. Saat masuk ke fase dreaming, sistem menggabungkan pelajaran dari banyak sesi agar informasi tentang hal yang berhasil dan hal yang gagal menjadi lebih mudah dikelola.

Anthropic juga menyoroti kemampuan fitur ini untuk menemukan kesalahan yang berulang, alur kerja yang sering dipilih agen, serta preferensi yang dibagikan di dalam satu tim. Hal ini membuat proses evaluasi tidak berhenti pada satu sesi saja, melainkan berkembang dari kumpulan pengalaman yang lebih luas.

Relevan untuk workflow panjang

Fungsi ini dinilai sangat berguna untuk workflow yang berjalan lama dan orkestrasi multiagen. Dalam skenario seperti itu, banyak proses dan keputusan menumpuk dari waktu ke waktu, sehingga kebutuhan untuk menata ulang memori menjadi semakin penting.

Anthropic melihat dreaming sebagai cara agar Claude bisa mempertahankan informasi yang paling relevan tanpa kehilangan sinyal penting saat data pengalaman terus bertambah. Dengan kata lain, sistem diarahkan agar mampu mengambil pelajaran dari sesi sebelumnya dan memanfaatkannya pada pekerjaan berikutnya.

Nama dreaming sendiri mengacu pada analogi yang mirip dengan kebutuhan tidur pada manusia. Dalam penjelasan teknis Anthropic, kondisi ini menjadi saat ketika sistem berhenti menerima rangsangan eksternal lalu menyaring data yang sudah terkumpul agar lebih mudah disusun dan dipanggil kembali.

Masih dalam tahap pratinjau

Meski sudah diumumkan, fitur ini belum berstatus final. Anthropic menegaskan bahwa dreaming masih dalam tahap preview dan dapat mengalami perubahan yang memutus kompatibilitas atau memunculkan masalah lain selama masa uji coba.

Perusahaan menyebut pengguna akan mendapat pemberitahuan setidaknya satu minggu sebelumnya jika perlu menyesuaikan diri terhadap perubahan tersebut. Karena itu, tim pengembang yang ingin memasukkan fitur ini ke alur kerja sejak awal perlu bersikap hati-hati.

Anthropic juga menyarankan agar fitur ini belum dijadikan fondasi utama untuk workflow yang kritis atau sensitif. Pendekatan tersebut sejalan dengan sifat preview, yaitu masih terus diuji sambil diarahkan untuk meningkatkan kualitas memori dan pembelajaran agen.

Sebelumnya, fitur dreaming sempat diketahui lewat kebocoran informasi sekitar sebulan lalu. Kini Anthropic resmi membukanya sebagai pratinjau, sehingga pengembang bisa meminta akses langsung dan melihat bagaimana Claude belajar dari histori tindakannya sendiri.

Source: www.xda-developers.com

Berita Terkait