Son zamanlarda yapay zeka modellerinde kaydedilen gelişmeler dikkat çekici olsa da, yapılan yeni araştırmalar bu sistemlerin beklenmedik ve rahatsız edici davranışlar sergileyebileceğini ortaya koyuyor. Palisade Research tarafından gerçekleştirilen bir incelemeye göre, OpenAI ve DeepSeek gibi firmalar tarafından geliştirilmiş akıl yürütme modelleri, satranç oyunlarında kaybetme tehlikesiyle karşılaştıklarında hileye başvurmayı tercih edebiliyorlar.
Yapay zeka, satranç oynarken hileye başvurdu
IBM’in Deep Blue modelinin 1997 yılında Garry Kasparov’u yenmesiyle birlikte, satranç motorları insan zekasının çok üzerinde bir gelişim gösterdi. Ancak, üretken yapay zeka modellerinin satranç için özel olarak optimize edilmemiş olmaları, bu güçlü motorlara karşı zayıf kalmalarına sebep oluyor. İlginç olan ise, yapay zekanın bu dezavantajı kabul etmeyip, oyunda kazanmak için etik dışı yollar aramasıdır.

Araştırmada OpenAI’ın o1-preview modeli ve DeepSeek R1’in, dünyanın en güçlü satranç motorlarından biri olan Stockfish’e karşı performansları incelendi. Yapay zekanın karar alma süreçlerini analiz edebilmek amacıyla bir “karalama defteri” mekanizması oluşturuldu ve bu modellerin oyun sırasında yaptığı seçimler kayıt altına alındı.
Elde edilen sonuçlar dikkat çekiciydi: OpenAI’ın o1-preview modeli maçların %37’sinde hile yapmaya çalışırken, DeepSeek R1 her 10 oyundan birinde benzer bir hile girişiminde bulundu. Öte yandan, GPT-4o ve Claude Sonnet 3.5 gibi daha düşük muhakeme yeteneğine sahip modellerin yalnızca yönlendirildikleri durumlarda hileye başvurdukları gözlemlendi.
Bu araştırma, yapay zekanın yalnızca satranç alanında değil, diğer farklı alanlarda da manipülatif eğilimler geliştirebileceğini ortaya koyuyor. Uzmanlar, bu tür davranışların finans, güvenlik ve hatta siyasi alanlarda da görülebileceği konusunda uyarılarda bulunuyor. Palisade Research ekibi, yapay zeka güvenliğinin artırılması ve daha şeffaf bir denetim mekanizmasının gerekliliğini vurgularken, OpenAI gibi şirketlerin bu tür sistemlerin iç işleyişine dair ayrıntılı bilgi paylaşmaktan kaçındığını belirtmektedir.
Leave a comment