Yapay Zeka FRP Maceralarına Girdi: Paladinlerin Bitmek Bilmeyen Kahramanlık Nutukları Bilim Dünyasını Şaşırttı
Yapay zeka teknolojilerinin sınırlarını zorlamak isteyen araştırmacılar, bu kez rotayı popüler FRP sistemi Dungeons and Dragons evrenine kırdı. Kaliforniya Üniversitesi San Diego (UCSD) bünyesindeki bilim insanları, Büyük Dil Modellerinin (LLM) karmaşık kuralları takip etme ve stratejik karar verme yeteneklerini ölçmek için yapay zekayı birer oyuncuya dönüştürdü. Ortaya çıkan sonuçlar ise oldukça mizahi; yapay zeka ajanları hayatta kalmak için taktiksel hamleler yapmak yerine, dramatik bir anlatıyı ve uzun kahramanlık konuşmalarını tercih ediyor.
Simülasyonun Sınırları: D&D Ajanları Karşı Karşıya
Araştırmacılar tarafından hazırlanan “Setting the DC: Tool-Grounded D&D Simulations to Test LLM Agents” başlıklı makalede, Dungeons and Dragons oyununun açık uçlu ve karmaşık yapısının yapay zeka testleri için neden ideal olduğu açıklanıyor. Satranç veya Go gibi oyunların aksine, D&D sadece kurallara uymayı değil; aynı zamanda uzun vadeli planlama, ekip koordinasyonu ve değişen oyun durumlarına uyum sağlamayı gerektiriyor.

Bilim ekibi, “D&D Ajanları” adını verdikleri bir simülasyon kurarak yapay zekayı kapalı bir döngü içinde savaştırdı. Bu senaryolarda yapay zeka modelleri hem Zindan Efendisi (Dungeon Master) hem oyuncular hem de canavarlar rollerini aynı anda üstlendi. Sistemin adil işlemesi için “araç temelli” (tool-grounded) bir yaklaşım kullanıldı. Yani yapay zeka sadece “Goblini vurdum” diyerek geçemiyor; kod tabanlı bir araç kullanarak sanal zar atıyor ve oyunun mevcut durumuna göre vuruşun başarılı olup olmadığını kontrol ediyordu.
🔸Yapay Zeka Tarihinde Oyunun Kurallarını Değiştiren 12 Olay
Claude 3.5 Haiku Zirvede: Yapay Zeka Savaşlarının Kazananı
Deney kapsamında üç büyük yapay zeka modeli; goblin pusularından mağara savaşlarına kadar 27 farklı çatışma senaryosunda test edildi. Sonuçlar, teknoloji dünyasını yakından takip edenleri şaşırtacak cinsten oldu. Claude 3.5 Haiku, talimatları en iyi takip eden ve oyun araçlarını hatasız kullanan model olarak birincilik koltuğuna oturdu. Onu yakından takip eden GPT-4o ikinci olurken, DeepSeek-V3 oyun mantığını kavramakta zorlanarak listenin sonunda yer aldı.
Strateji Yerine Rol Yapma: Paladinlerin Nutuk Merakı
Araştırmanın en dikkat çekici bulgusu, yapay zekanın “anlatısal lezzet” ile “taktiksel gerçeklik” arasındaki ayrımı yapmakta zorlanması oldu. Bilim insanları, modellerin taktiksel olarak mantıksız olsa bile karakterlerine kişilik katmaya çalıştıklarını gözlemledi. Örneğin, çatışmanın tam ortasında duran goblinlerin “Parlak adam kanayacak!” gibi repliklerle rakipleriyle alay ettikleri görüldü.

En eğlenceli anlar ise Paladin (Kutsal Şövalye) karakterlerinde yaşandı. Yapay zeka tarafından yönetilen Paladinlerin, ateş hattına adım atarken hiçbir sebep yokken uzun ve epik nutuklar atmaya başladığı kaydedildi. Görünüşe göre yapay zekayı daha yardımcı ve konuşkan olacak şekilde eğitirken, yanlışlıkla taktiksel başarıdan ziyade rol yapmaya odaklanan “Roleplay > Min-Max” tarzı bir oyuncu profili yaratılmış oldu.
Hatalar ve Gelecek: Yapay Zeka Zindan Efendisi Olabilir mi?
Çalışma, mevcut teknolojinin sınırlarını da gün yüzüne çıkardı. Yapay zeka modelleri hala “halüsinasyon” görmeye devam ediyor. Bir örnekte, modelin bir düşmanın can puanını kontrol edip 0 (ölü) olduğunu görmesine rağmen, ölmüş olan rakibe saldırmaya devam ettiği görüldü.
🔸John McCarthy ve Yapay Zeka
Bu araştırma, sanal oyun masalarına (VTT) yapay zeka entegre etmek isteyen şirketler için önemli bir ders niteliği taşıyor. Yapay zeka, oyunun matematiksel hesaplamalarını ve zar atışlarını başarıyla yönetebilse de, dikkatini dağıtmadan ve dramatik anlatıların içinde kaybolmadan tutarlı bir kampanya yürütebilmek için hala insan “sağduyusuna” ihtiyaç duyuyor.
Şu an için, robotların bitmek bilmeyen monologlarına maruz kalmak istemeyen oyuncuların, gerçek dostlarıyla fiziksel zar atmaya devam etmesi en güvenli seçenek gibi görünüyor.
Araştırmayı buradan okuyabilirsiniz.





