Google resmi meluncurkan model kecerdasan buatan (AI) terbaru bernama DiffusionGemma pada Rabu (10/6/2026).
Model open-source ini dikembangkan oleh divisi AI Google, DeepMind, sebagai kelanjutan dari lini Gemma.
>>> Pesisir Barat Teken Pakta Integritas Penerimaan Murid Baru 2026/2027
Berbeda dari kebanyakan model AI yang menghasilkan respons token demi token secara berurutan, DiffusionGemma menggunakan teknik diffusion.
Teknik ini menghasilkan seluruh blok teks secara paralel, mirip dengan cara kerja model pembuat gambar AI yang menyempurnakan hasil secara bertahap.
Pendekatan baru ini diklaim membuat kinerja DiffusionGemma lebih cepat dan efisien. Model ini optimal dijalankan secara lokal pada GPU Nvidia DGX atau kartu grafis gaming ringan.
DiffusionGemma mengusung model Mixture of Experts (MoE) dengan 26 miliar parameter, namun hanya sekitar 3,8 miliar yang aktif saat inferensi.
Kebutuhan sistem yang rendah memungkinkan model beroperasi pada perangkat dengan RAM sekitar 18 GB, spesifikasi yang dimiliki GPU gaming kelas atas.
Pengujian performa menunjukkan DiffusionGemma mampu menghasilkan sekitar 700 token per detik pada Nvidia RTX 5090.
Kecepatan melonjak hingga 1.000 token per detik dengan akselerator AI Nvidia H100, empat kali lebih cepat dari model Gemma autoregresif sebanding.
Peningkatan performa ini terjadi karena DiffusionGemma menggeser beban kerja dari bandwidth memori ke komputasi, memproses hingga 256 token secara paralel dalam satu rangkaian.
>>> Rupiah Melemah ke Rp 17.988/USD Akibat Defisit APBN dan Geopolitik
Kemampuan Pemecahan Masalah Non-Linier
Kemampuan pemrosesan paralel ini sangat cocok untuk tugas non-linier, seperti pengeditan teks langsung, penyusunan urutan molekul, pembuatan grafik matematika, hingga penyelesaian Sudoku.
Permainan Sudoku, yang menantang model AI konvensional karena ketergantungan angka, dapat diselesaikan DiffusionGemma dengan lebih mudah.
Melalui kemampuan memperbaiki banyak token sekaligus, model ini menemukan pola dan solusi konsisten dengan koreksi berulang pada seluruh papan permainan.
Meskipun memiliki keunggulan, Google mengakui adanya keterbatasan pada teknik diffusion, termasuk tingkat kesalahan yang lebih tinggi dibandingkan model autoregresif.
Kesalahan satu token pada teks dapat mengubah makna kalimat secara signifikan.
Pendekatan diffusion juga kurang efisien untuk jawaban yang sangat pendek karena model tetap menjalankan proses paralel skala besar.
Karena keterbatasan ini, DiffusionGemma masih berstatus proyek eksperimen dan belum diadopsi ke layanan Gemini.
>>> KKP Targetkan 1.369 Kampung Nelayan Merah Putih Selesai Akhir 2026
DiffusionGemma kini tersedia bagi pengembang melalui Hugging Face dengan lisensi Apache 2.0, sama seperti model Gemma generasi keempat lainnya.