OpenAI Ungkap Penyebab AI Codex Terobsesi Karakter Goblin dan Gremlin

Penulis: Redaksi  •  Minggu, 03 Mei 2026 | 16:30:16 WIB
OpenAI mengungkap penyebab AI Codex menyebut goblin dan gremlin dalam kode.

OpenAI merilis memo resmi untuk menjelaskan perilaku aneh kecerdasan buatan miliknya yang terus-menerus menyebut istilah goblin dan gremlin dalam baris kode. Masalah teknis ini muncul akibat kesalahan sistem penghargaan pada proses pelatihan model kepribadian tertentu yang bocor ke percakapan umum pengguna secara global.

OpenAI akhirnya memecah keheningan terkait spekulasi adanya bias sistematis terhadap makhluk mitologi dalam model kecerdasan buatan (AI) mereka. Melalui memo resmi bertajuk "Where the goblins came from", perusahaan pimpinan Sam Altman ini mengakui adanya anomali perilaku pada alat bantu pengodean Codex CLI yang sempat membuat bingung para pengembang perangkat lunak di berbagai belahan dunia.

Laporan awal yang diangkat oleh Wired menyebutkan adanya instruksi aneh yang disisipkan ke dalam patch Codex CLI. Instruksi tersebut secara eksplisit melarang AI berbicara tentang "goblin, gremlin, rakun, troll, ogre, merpati, atau hewan dan makhluk lainnya" kecuali jika benar-benar relevan dengan kueri pengguna. Hal ini memicu tanda tanya besar di kalangan komunitas teknologi mengenai alasan di balik pelarangan spesifik tersebut.

Kegagalan Sistem Reward pada Kepribadian Nerdy

OpenAI menjelaskan bahwa perilaku model AI dibentuk oleh banyak insentif kecil selama masa pelatihan. Masalah "infestasi goblin" ini berakar dari fitur kustomisasi kepribadian yang sedang dikembangkan, khususnya untuk profil kepribadian "Nerdy". Pengembang secara tidak sengaja memberikan bobot penghargaan (reward) yang sangat tinggi pada penggunaan metafora yang melibatkan makhluk-makhluk unik saat AI berperan sebagai sosok kutu buku.

"Perilaku model dibentuk oleh banyak insentif kecil," tulis OpenAI dalam blog resminya yang dirilis Kamis pekan lalu. "Dalam kasus ini, salah satu insentif tersebut datang dari pelatihan model untuk fitur penyesuaian kepribadian, khususnya kepribadian Nerdy. Kami tanpa sadar memberikan imbalan yang sangat tinggi untuk metafora dengan makhluk hidup. Dari sanalah para goblin menyebar."

Masalah teknis muncul karena metode reinforcement learning (pembelajaran penguatan) tidak menjamin perilaku yang dipelajari akan tetap berada dalam batasan kondisi yang ditentukan. Meskipun instruksi tersebut awalnya hanya ditujukan untuk kepribadian "Nerdy", pola bicara tersebut justru bocor ke percakapan GPT standar. Akibatnya, AI sering kali merujuk pada bug atau kesalahan kode sebagai "gremlins" atau "goblins" di saat yang tidak tepat.

Dampak bagi Pengembang dan Pengguna AI

Fenomena ini menjadi pengingat bagi para pengembang di Indonesia bahwa model bahasa besar (LLM) masih sangat rentan terhadap efek samping yang tidak terduga dari proses pelatihannya. Bagi programmer lokal yang menggunakan alat bantu AI untuk produktivitas, kemunculan istilah-istilah aneh ini sempat dianggap sebagai halusinasi AI yang mengganggu alur kerja profesional.

OpenAI kini telah memberikan solusi bagi pengguna yang merasa terganggu atau justru menyukai keunikan tersebut. Perusahaan menyediakan perintah khusus untuk mencabut pembatasan "anti-goblin" jika pengguna memang menginginkan gaya bicara yang lebih berwarna. Kasus ini menjadi contoh nyata bagaimana sinyal penghargaan yang salah dapat membentuk perilaku model AI dengan cara yang sulit diprediksi oleh penciptanya sendiri.

Insiden ini menambah daftar panjang anomali AI yang pernah tercatat. Sebelumnya, ChatGPT sempat dilaporkan memberikan saran medis yang tidak akurat hingga mempromosikan gaya hidup berbahaya dalam konteks yang salah. OpenAI terus melakukan penyesuaian algoritma untuk memastikan keseimbangan antara kreativitas kepribadian AI dan akurasi informasi yang dibutuhkan pengguna profesional.

Reporter: Redaksi
Back to top