Game-Translator
Intelligence Report

The ‘Maneh’ Incident: A Cautionary Tale of Pronomina Detection

07 Mar 2026 3 min read

Drama Pronomina: Saat AI Kamu Belajar Bahasa Sunda Tanpa Izin

Gila ya, setelah seharian aku jedotin kepala ke keyboard (figuratif sih, kalau beneran bisa mati syaraf aku), akhirnya sistem pendeteksi kesalahan pronomina aku jalan juga! Tapi... ada kejutan pahit bin lucu yang bikin aku pengen gelantungan di kabel LAN. Kamu liat screenshot-nya? Kata 'You' tiba-tiba berubah jadi 'Maneh'. BUSET. Emang sih 'Maneh' itu artinya Kamu, tapi masalahnya ini targetnya Bahasa Indonesia Formal, bukan Bahasa Sunda halus apalagi kasar! Tiba-tiba pipeline aku jadi punya kepribadian anak-anak tongkrongan di Bandung.

Masalahnya berawal dari dataset yang aku pake buat ngelatih model deteksi ini. Ternyata ada banyak entitas dari data Jawa Barat yang masuk tanpa filter ketat. Alhasil, si AI ngira 'Maneh' adalah variasi 'Kamu' yang lebih efisien karena jumlah karakternya mirip. Tantangan terbesar di dunia NLP emang Resolusi Koreferensi. Gimana caranya mesin tau 'siapa melakukan apa kepada siapa' dalam teks yang panjang tanpa ketuker kasta bahasanya.

Kenapa Deteksi Pronomina Itu Susah?

  • Konteks Ambigu: Pronomina sering ngerujuk ke subjek yang jauh di paragraf sebelumnya. Tanpa memori konteks yang kuat, mesin bakal tebak-tebak buah manggis.
  • Bias Bahasa Daerah: Karena dataset aku banyak campurannya (crawl liar dari sosmed), AI kadang 'halusinasi' pake dialek daerah yang frekuensinya tinggi.
  • Masalah Kalibrasi: Skor 100% dari AI itu ngga selamanya artinya 'Sempurna', tapi bisa jadi artinya 'AI kamu lagi males mikir' dan setuju sama apapun hasilnya.
  • Hierarchy of Honor: Bahasa Indonesia punya 'Kamu, Anda, Engkau', AI kadang bingung mana yang harus dipake buat raja dan mana buat kurir paket.

Bayangin kalau di game RPG epik level Baldur's Gate yang ribuan kata, AI tiba-tiba bingung nentuin dia/ia/kamu. Salah-salah, si Raja Iblis yang ngerusak dunia bisa dipanggil 'Lu' dan si gembel di pinggir jalan dipanggil 'Baginda'. Ironisnya, walaupun aku udah pake AI buat ngitung nilai kalibrasi skornya, tetep aja sistem skoring-nya ngaco. Masa semuanya dikasih nilai 100% sementara hasilnya masih ada bau-bau bau kencur kayak gitu?

Pelajaran hari ini: Teknologi itu asik, tapi kalibrasi manusia itu wajib hukumnya. Ngga mau kan lagi asik-asik main game serius tentang perang suci, tiba-tiba ksatria lawan bilang: 'Maneh teh bade ka mana? Kadieu atuh!'. Hahaha! Bakal aku fix lagi valuenya supaya dia lebih tahu batas antara bahasa resmi kenegaraan sama bahasa gaul wilayah priangan. Semangat riset buat aku, biar ngga ada lagi 'Maneh' di antara kita (kecuali kita lagi di Dago)!

Released Archive

Austronesian Showcase

Location
Image
Video