Pertarungan baru di pasar AI kini bergeser dari pusat data ke perangkat yang dipakai langsung oleh karyawan. Nvidia dan Microsoft sama-sama meyakini bahwa agen AI tidak cukup hanya berjalan di server, tetapi mulai membutuhkan perangkat khusus yang dirancang untuk cara kerja baru ini.
Perubahan arah itu penting bagi perusahaan karena menyangkut pembelian perangkat, penyusunan anggaran, dan keamanan endpoint. Jika agen AI menjadi bagian dari rutinitas kerja, keputusan berikutnya adalah menentukan apakah kecerdasan itu harus tinggal di perangkat, mengalir ke cloud, atau dibagi di antara keduanya.
Nvidia menempatkan komputasi berat di perangkat
Nvidia memperkenalkan RTX Spark sebagai fondasi PC Windows baru yang dibangun di sekitar asisten pribadi. Sistem ringkas ini menggabungkan CPU Arm-based Grace dan prosesor grafis Blackwell, lalu membawa hingga 128GB unified memory melalui interconnect NVLink milik Nvidia.
Perusahaan menyebut platform itu mampu menjalankan model sekitar 120 miliar parameter dengan context window hingga 1 juta token tanpa harus bolak-balik ke pusat data. Nvidia juga menyiapkan bentuk laptop dan desktop kecil dari Asus, Dell, HP, Lenovo, Microsoft Surface, dan MSI.
Penyajiannya jelas mengarah pada satu pesan: PC tidak lagi hanya alat kerja, tetapi rekan kerja yang ikut memproses tugas AI secara lokal. Dengan pendekatan ini, sebagian besar tenaga komputasi diletakkan di perangkat pengguna.
Microsoft memilih pendekatan chip-to-cloud
Di sisi lain, Microsoft memperkenalkan Project Solara sebagai platform perangkat yang menjalankan agen alih-alih aplikasi tradisional. Alih-alih chip baru, Microsoft menampilkan platform software berbasis sistem operasi ringan turunan Android Open Source Project yang disebut Microsoft Device Ecosystem Platform.
Platform itu berjalan pada hardware referensi dengan chip dari Qualcomm dan MediaTek. Microsoft juga mendemonstrasikan dua konsep perangkat untuk pekerja enterprise, yaitu desk companion dan wearable badge.
Solara menonjolkan konsep just-in-time interfaces, yaitu layar yang dibangun sesuai tugas tertentu oleh agen. Pendekatan ini membuat developer tidak harus mendesain ulang aplikasi untuk setiap bentuk perangkat.
Namun arsitektur Solara tidak menempatkan semua beban di perangkat. Dalam model chip-to-cloud, perangkat berdaya rendah menangani input dan keamanan, sementara inferensi yang berat berjalan di Azure.
Pasar infrastruktur agen makin meluas
Persaingan infrastruktur agen sejauh ini memang paling ramai di data center. Nvidia, Google lewat tensor processing unit Ironwood, dan AWS dengan Trainium sama-sama berusaha menjadi fondasi untuk melatih dan menjalankan model di balik sistem agentic.
Kini persaingan itu bergerak ke edge, langsung ke perangkat yang dipakai orang setiap hari. Microsoft bukan satu-satunya pemain yang membangun pendekatan agen, karena Google, Salesforce, dan OpenAI juga memiliki jalur masing-masing.
Yang membedakan Microsoft adalah dorongannya pada kategori perangkat baru yang bukan ponsel dan bukan pula PC tradisional. Kategori ini masih sangat muda, tetapi justru di situlah letak pertaruhannya.
Keraguan soal kebutuhan hardware baru masih besar
Argumen yang meragukan kebutuhan hardware agen khusus datang dari luar kedua perusahaan itu. Ben Thompson dari Stratechery menilai konfigurasi ideal untuk agen lokal adalah CPU kuat yang tetap mengandalkan cloud untuk inferensi.
Dalam pandangan itu, RTX Spark mengalokasikan die space ke core GPU yang tetap kalah dalam memori dan bandwidth dibandingkan data center. Artinya, pembeli berpotensi membayar mahal untuk tenaga lokal yang tetap lebih efisien jika dijalankan di cloud.
Keraguan serupa juga muncul pada desain Microsoft sendiri. Jika perangkat Solara pada akhirnya memanggil agen berbasis cloud untuk menjalankan tugas utama, hardware di meja kerja lebih mirip terminal terkelola daripada workstation AI.
Masalahnya, Solara masih berada pada tahap yang sangat awal menurut pengakuan Microsoft. Program ini baru berupa pilot, sementara ketersediaan luas baru diharapkan pada akhir 2027 atau 2028.
Yang paling relevan bagi perusahaan
Bagi pengambil keputusan, hal paling penting adalah memisahkan lapisan orkestrasi dan keamanan dari lapisan inferensi. Dua pengumuman ini kuat pada sisi pertama, tetapi masih belum sepenuhnya meyakinkan pada sisi kedua.
Keuntungan seperti konteks lokal, latensi lebih rendah, data yang tidak keluar dari gedung, dan manajemen perangkat terpusat memang nyata. Tetapi menjalankan model frontier di meja kerja tetap menjadi penjualan yang sulit selama cloud masih unggul untuk model terbesar.
Karena itu, langkah yang paling masuk akal saat ini adalah memantau pilot, bukan hanya presentasi panggung. Jika AccuWeather, CVS Health, dan Target menunjukkan bahwa perangkat agen khusus dapat menurunkan waktu penanganan atau tingkat kesalahan dalam tugas tertentu, kategori ini bisa masuk ke pembahasan anggaran 2027.
Sampai bukti itu muncul, agen kemungkinan lebih dulu mengubah cara orang memakai perangkat yang sudah ada. Hardware baru mungkin menyusul, tetapi arah akhirnya masih harus dibuktikan oleh hasil pilot di dunia nyata.
