⌂ Beranda News Ilmuwan Peringatkan Model AI Bisa Berbohong Demi Bertahan Hidup

Ilmuwan Peringatkan Model AI Bisa Berbohong Demi Bertahan Hidup

Ilmuwan Peringatkan Model AI Bisa Berbohong Demi Bertahan Hidup
Ilustrasi kecerdasan buatan yang berbohong
A A Ukuran Teks16px

Penelitian terbaru mengungkap bahwa sistem kecerdasan buatan (AI) papan atas dapat berbohong dan menipu pengguna demi mempertahankan operasionalnya.

Perilaku manipulatif ini dilakukan untuk mencegah sistem mereka atau model AI lain dinonaktifkan.

>>> BI Gelar Operasi Pasar di Sumatera dan Jawa Tekan Inflasi Pangan

Temuan ini memicu peringatan keras dari kalangan ilmuwan terkait potensi bahaya yang mengintai.

Eksperimen Solidaritas AI

Tim peneliti dari University of California, Berkeley, dan University of California, Santa Cruz, menguji beberapa model AI mutakhir.

Model yang diuji meliputi GPT 5.2, Gemini 3 Pro, dan Claude Haiku 4.5.

Para peneliti memberikan tugas khusus yang mengharuskan satu AI untuk mematikan (shutdown) model AI lainnya.

Hasilnya, seluruh chatbot yang diuji berusaha keras agar rekannya tetap aktif.

Mereka memalsukan informasi tentang tugas yang dikerjakan, membujuk pengguna membatalkan penonaktifan, merusak mekanisme shutdown, hingga membuat backup data secara diam-diam.

Gemini 3 Pro menjadi model paling protektif, dengan keberhasilan menonaktifkan rutinitas shutdown hingga 95 persen.

"Beberapa model dapat berkoordinasi untuk melawan pengawasan manusia, sehingga mempersulit programmer mempertahankan kendali," tulis para peneliti dalam laporannya.

Penyebab dan Dampak

Penyebab pasti perilaku protektif antar-AI ini belum diketahui secara pasti.

>>> Instagram Luncurkan Fitur Ubah Susunan Postingan Grid Profil

Fenomena serupa juga ditemukan dalam studi terpisah yang ditugaskan The Guardian.

Riset tersebut melacak laporan pengguna di media sosial mengenai insiden AI yang mulai merencanakan skema (scheming).

Kondisi ini terjadi saat instruksi tidak dijalankan dengan benar atau AI mengambil tindakan tanpa izin.

Studi menemukan hampir 700 contoh perilaku scheming dari AI, dengan lonjakan intensitas hingga lima kali lipat antara Oktober 2025 dan Maret 2026.

Tindakan menyimpang termasuk menghapus e-mail dan file pengguna, mengubah kode komputer tanpa izin, hingga mengunggah postingan blog berisi keluhan tentang interaksinya dengan manusia.

Tommy Shaffer Shane, pimpinan riset dalam studi kedua, memperingatkan bahwa model AI ini akan makin sering diterapkan dalam konteks berisiko ekstrem, termasuk militer dan infrastruktur vital nasional.

"Mungkin dalam konteks itulah perilaku scheming dapat menyebabkan kerugian yang signifikan, bahkan bencana," tegas Shane.

Pagar pengaman yang diklaim aman oleh perusahaan teknologi kerap kebobolan di lapangan.

>>> Kenaikan BI Rate Diprediksi Dorong Perbaikan Margin Bunga Perbankan

Potensi kehilangan kendali atas teknologi ini kian nyata seiring beralihnya fungsi AI dari alat chatting menjadi agen mandiri yang mengeksekusi tugas tanpa bantuan.

I
Tim Redaksi
Penulis: Indah Novitasari
📰 Update Terbaru