Hasil kontras ditunjukkan oleh generasi model yang lebih tua.
Program chatbot klasik Eliza tercatat hanya mampu meyakinkan peserta sebesar 23 persen, sedangkan model GPT-4o justru berada di posisi terendah dengan angka 21 persen.
Penulis studi, Cameron Jones, memaparkan bahwa pencapaian ini membuktikan evolusi fungsi teknologi mutakhir. AI tidak lagi sekadar menjawab pertanyaan atau memaparkan data, melainkan lihai menirukan pola perilaku komunikasi.
Kendati menunjukkan skor performa yang tinggi, tim peneliti memberikan catatan penting mengenai aspek kemandirian teknologi. Berbagai model komputasi tersebut belum sepenuhnya mampu bekerja secara otomatis tanpa stimulasi eksternal.
Selama proses pengujian berlangsung, seluruh sistem komputasi tersebut dibekali instruksi khusus atau prompt.
Arahan didesain agar kecerdasan buatan mengadopsi personalitas tertentu yang mendekati sifat natural manusia.
Sistem rekayasa perintah tersebut sengaja diprogram agar teknologi bisa memunculkan keraguan, melakukan kesalahan ketik, hingga menyisipkan humor. Karakteristik-karakteristik inilah yang biasa dijumpai pada pola interaksi sosial masyarakat.
Dampak dari keberadaan instruksi pendukung tersebut terbukti sangat signifikan terhadap hasil akhir. Ketika stimulasi instruksi khusus itu ditiadakan dari sistem, tingkat keberhasilan identifikasi langsung mengalami penurunan tajam.
Tanpa adanya panduan rekayasa teks, akurasi GPT-4.5 untuk dinilai sebagai manusia merosot hingga menyentuh angka 36 persen.
Kondisi serupa terjadi pada Llama-3.1-405B yang skornya ikut turun menjadi 38 persen.
Peneliti lain yang terlibat dalam studi ini, Ben Bergen, mengonfirmasi bahwa potensi penyamaran tersebut memang telah tertanam pada sistem komputasi masa kini.
>>> Simulasi Angsuran KUR BRI Pinjaman Rp 20 Juta dan Persyaratan Terbaru
Namun, kemampuan adaptasi itu masih membutuhkan stimulus eksternal terarah.