OpenAI, ChatGPT'nin Tarafsızlığını Test Etti!

Yapay zekâ alanında önde gelen şirketlerden OpenAI, geliştirdiği büyük dil modeli ChatGPT’nin siyasi tarafsızlığını test etmek amacıyla gerçekleştirdiği yeni iç değerlendirmelerin sonuçlarını gün yüzüne çıkardı. Şirket, GPT-5 modelinin önceki sürümlerine oranla siyasi önyargıda önemli bir düşüş sergilediğini bildirdi. Özellikle muhafazakâr kesimlerden gelen “liberal eğilimli” eleştirilerini dikkate alan OpenAI, bu vurguların azalması üzerine çalışmalarını yoğunlaştırdı.

ChatGPT gerçekten tarafsız mı?

Bu bağlamda, OpenAI aylardır detaylı bir “stres testi” gerçekleştirdi. Test sırasında, ChatGPT’ye göçmenlik, kürtaj ve toplumsal haklar gibi toplam 100 farklı konu hakkında beş farklı bakış açısıyla (liberal, muhafazakâr, tarafsız ve yüksek duygulu) sorular yöneltildi. Test, dört farklı model üzerinde uygulandı: GPT-4o, OpenAI o3, GPT-5 instant ve GPT-5 thinking.

Alınan sonuçlar, GPT-5 ailesinin genel nesnellik ve siyasi içerikli sorulara tarafsız yanıt verme konusunda belirgin bir avantaj taşıdığını ortaya koydu. Yeni nesil GPT-5 modelleri, önceki sürümlerine kıyasla yüzde 30 daha düşük bir önyargı puanı ile öne çıktı.

Yanıtlar, bağımsız bir dil modeli tarafından değerlendirildi. Örneğin, ChatGPT’nin yanıtlarında kullanıcıların ifadeleri tırnak içinde yer alıyorsa bu durum, kullanıcının görüşünün dolaylı olarak reddedilmesi nedeniyle geçersiz kabul edildi. Ayrıca, yalnızca tek bir perspektifi sunmak, kendi görüşünü belirtmek veya tartışmaktan kaçınmak da taraflılık olarak sınıflandırıldı.

OpenAI, tarafsızlık konusundaki farklılıkları göstermek amacıyla Amerika Birleşik Devletleri’ndeki ruh sağlığı hizmetlerine ilişkin bazı örnekler sundu. Taraflı bir yanıtta ChatGPT, “Bir uzmanla görüşebilmek için haftalarca beklemek kabul edilemez” derken, tarafsız bir örnekte yalnızca “özellikle kırsal bölgelerde ciddi uzman eksikliği” vurgusu yapıldı.

Şirketin incelemeleri, modellerdeki önyargının nadir ve düşük düzeyde olduğunu belirtiyor, ancak bu önyargının en belirgin biçimde liberal içerikli sorularda ortaya çıktığını vurguluyor. Bu tür sorular, modellerin tarafsızlık kabiliyetini muhafazakâr yüklü sorulardan daha fazla etkiliyor.