Rekaman Digital Pemerintah Makin Rapuh, Data Bisa Hilang Sebelum Sempat Dibaca

Rekaman digital pemerintah kini menghadapi persoalan yang jauh lebih besar daripada sekadar kapasitas penyimpanan. Data bisa tersimpan, tetapi belum tentu tetap utuh, mudah dibaca, atau dapat diakses ketika publik membutuhkannya.

Masalah itu muncul karena catatan resmi lahir dalam berbagai format yang sangat cepat berubah, mulai dari email, dokumen cloud, hingga obrolan di aplikasi pesan. Di tengah arus data yang terus membesar, preservasi arsip digital pemerintah menjadi perlombaan melawan waktu dan perubahan teknologi.

Volume data terus menekan lembaga arsip

Mike Quinn, CEO Preservica, menilai dunia kini menciptakan catatan digital dengan kecepatan yang tidak pernah diantisipasi organisasi mana pun. National Archives menambahkan 463 terabyte arsip elektronik ke koleksi permanennya hanya pada 2024, angka yang menunjukkan betapa besar beban pelestarian arsip saat ini.

Rekaman yang harus dijaga juga tidak lagi lahir di satu tempat yang mudah dikendalikan. Banyak catatan kini muncul di Signal, WhatsApp, Google Docs, atau sistem lain yang hidupnya bergantung pada siklus produk, bukan pada kebutuhan arsip jangka panjang.

Mengambil file digital saja sudah rumit

Thorsten Ries dari University of Texas at Austin menjelaskan bahwa file dari hard drive atau USB harus diambil tanpa mengubah isi maupun metadata seperti stempel waktu. Proses itu rumit karena perbedaan versi perangkat lunak dan jenis media penyimpanan dapat menghasilkan fragmen file dan cadangan otomatis yang berbeda.

Fragmen tersebut penting karena bisa memperlihatkan bagaimana sebuah dokumen disusun dan bagaimana pembuatnya berpikir. Namun, mengekstrak dan menafsirkannya membutuhkan keahlian khusus yang menurut Ries masih sangat langka.

Masalah yang mirip juga terjadi di cloud. Ries mengatakan sistem seperti Google Docs dapat menyimpan riwayat file yang sangat rinci, tetapi mengaksesnya tanpa kata sandi asli dan autentikasi dua faktor tetap menjadi tantangan tersendiri.

File yang terselamatkan pun belum aman

Survival data baru langkah awal, karena konten digital tidak menua seperti kertas. Quinn menegaskan bahwa format bisa usang dan membuat file tidak lagi terbaca jika arsip tidak rutin dipindahkan ke format yang lebih baru.

Arsip karena itu harus terus memigrasikan dokumen pengolah kata, spreadsheet, dan file desain, sambil mencatat setiap perubahan dengan teliti. Christopher J. Prom dari University of Illinois Urbana-Champaign library memperingatkan bahwa konversi yang ceroboh dapat mendistorsi isi asli, seperti yang tampak pada email terkait Jeffrey Epstein yang dirilis Departemen Kehakiman dan bermasalah karena rendering error.

TantanganContohDampak
Format usangDokumen pengolah kata, spreadsheet, file desainFile bisa tidak terbaca
Konversi cerobohEmail terkait Jeffrey EpsteinIsi asli bisa terdistorsi
Akses cloudGoogle DocsRiwayat file sulit diambil tanpa autentikasi

Akses publik tetap tidak sederhana

Lise Jaillant dari Loughborough University mengatakan arsip digital bisa berisi materi berhak cipta bersama korespondensi sensitif, pesan pribadi, dan tagihan medis dalam kotak masuk atau folder yang sama. Kondisi itu membuat institusi berhati-hati membuka koleksi secara luas.

Walau file digital secara teori bisa diakses dari mana saja, arsip masih sering mewajibkan kunjungan langsung ke lokasi, jika akses diberikan sama sekali. Bagi peneliti, itu berarti biaya perjalanan, penyesuaian jadwal, dan pencarian di sistem yang mungkin asing dalam waktu yang terbatas.

Permintaan publik ikut melambat

Jason R. Baron dari University of Maryland dan mantan direktur litigasi di National Archives and Records Administration mengatakan volume besar material digital dari lembaga pemerintah telah memperlambat pemrosesan permintaan Freedom of Information Act. Lembaga harus menemukan file yang mungkin relevan, biasanya lewat pencarian kata kunci, lalu menyaring atau menghapus informasi yang rahasia, sensitif, atau dikecualikan dari pembukaan.

Baron mengatakan tidak jarang pemohon menunggu bertahun-tahun, bahkan lebih dari satu dekade, untuk menerima respons lengkap. Otomatisasi memang bisa membantu jika tetap diawasi manusia, termasuk dengan AI untuk menandai paragraf yang mungkin masuk pengecualian, mendeteksi nomor Jaminan Sosial, serta mengekstrak teks dari dokumen pindaian atau video arsip.

Namun AI belum menggantikan pembacaan manusia. Jaillant menilai peneliti tetap harus kembali ke dokumen asli untuk memahami konteks tiap email atau berkas, apalagi ketika data pelatihan yang tersedia untuk sistem AI masih terbatas dan sering bergantung pada kumpulan email Enron yang sudah berumur puluhan tahun.

Pada akhirnya, preservasi arsip digital pemerintah harus menahan empat tekanan sekaligus, yaitu format yang rapuh, volume yang terus membengkak, akses yang terbatas, dan kebutuhan menjaga konteks. Selama pesan dapat hilang dari thread, file bisa terperangkap dalam format mati, dan sistem berubah sebelum arsip sempat dipindahkan, pekerjaan pelestarian akan tetap menjadi perlombaan yang sulit dimenangkan.

Berita Terkait