Google DeepMind ve OpenAI tarafından geliştirilen yapay zeka sistemleri, bu yılki Uluslararası Matematik Olimpiyatları’nda (IMO) olağanüstü bir başarı elde etti. Her iki kurumun farklı yapay zeka modelleri, yarışmada sunulan altı sorudan beşini doğru yanıtlayarak 42 üzerinden 35 puan toplayarak altın madalya standartlarına ulaşmayı başardı.
Yapay zeka, matematikte altın madalya alabilir
IMO, 1959 yılından bu yana düzenlenmekte olup, cebir, geometri ve kombinatorik gibi çeşitli alanlarda öğrencileri zorlu matematik problemleriyle sınayan, dünya çapında prestijli bir akademik yarışmadır. Bu yıl, yapay zeka sistemlerinin bu denli yüksek bir başarı göstererek insan seviyesini aşma noktasına yaklaşması dikkat çekici bir gelişme oldu.

Geçen yıl aynı yarışmaya katılan Google DeepMind, geliştirdiği Gemini modeli ile gümüş madalya seviyesinde kalmıştı. Ancak bu yıl, Gemini modelinin özel bir versiyonu olan Gemini Deep Think kullanıldı. Yeni sistem, geleneksel tek hat üzerinden ilerleyen akıl yürütme yönteminden farklı olarak paralel düşünme yeni bir mimaride çalışıyor.
Model, her problem için birden fazla çözüm yolu oluşturarak bu yolları eş zamanlı olarak test ediyor ve en tutarlı sonuca ulaşmak için hipotezlerini çapraz kontrol ediyor. Spekülatif akıl yürütme modülleri sayesinde, model sadece çözüme ulaşmakla kalmıyor; ayrıca matematiksel ispatların doğruluğunu artırmak için alternatif kanıt yolları da üretebiliyor.
Bu yapay zeka modeli, doğal dilde sunulan problem tanımlarını doğrudan sembolik mantık yapılarına dönüştürebiliyor. Önceki nesil sistemlerdeki gibi problemi bir programlama diline çevirmeye gerek kalmadan, metinsel açıklamalar üzerinden adım adım geçerli bir ispat üretebiliyor.
DeepMind ekibi, bu mimarinin uçtan uca bir çözüm sunduğunu ve dış müdahale gerektirmediğini vurguluyor. Yarışma jürisi ise Gemini’ın sunduğu çözümleri “insan tarafından yazılmış gibi göründüğü” yönünde değerlendirdi.
OpenAI, yarışmaya henüz duyurulmamış deneysel bir modelle katıldı. Bu model de benzer bir çok adımlı akıl yürütme yaklaşımını benimsiyor. Her probleme yönelik semantik çözüm yolları haritalanıyor ve bu yollar mantıksal tutarlılıkla taranarak en sağlam sonuç oluşturuluyor.

Modelin dikkat çeken özelliklerinden biri, sadece doğru çözüme ulaşmak değil, aynı zamanda ürettiği çözüm yollarını doğal dilde ispatlayabilme yeteneğidir. Gelişmiş denetim modülleri sayesinde, model her adımı içsel olarak doğrulayabiliyor.
Her iki yapay zeka sistemi de mevcut olarak doğrudan son kullanıcıya sunulmayacak. OpenAI CEO’su Sam Altman, bu düzeydeki muhakeme becerisinin yalnızca araştırma amaçlarıyla kullanılacağını belirtti. Ayrıca, GPT serisi gibi halka açık sistemlerin bu seviyede matematiksel performansa ulaşmasının yakın gelecekte mümkün olmadığını ifade etti.

Leave a comment