30 matematikçiden gizli toplantı: “Yapay zeka beşinci seviyeye geçiyor” – Son Dakika Teknoloji Haberleri
Mayıs ayının ortasında ABD’nin Kaliforniya eyaletinde kapalı kapılar ardında bir matematik zirvesi düzenlendi. Aralarında Avrupalıların da olduğu dünyaca ünlü 30 matematikçi, özel olarak geliştirilen yapay zekalı bir “akıl yürütme” modeliyle karşı karşıya geldi.
Amaç, insan zekasına meydan okuyacak kadar karmaşık sorularla bu yapay zekanın matematik yeteneklerini test etmekti. İki gün boyunca profesör düzeyinde sorular sorulan yapay zeka, katılımcıları şaşkına çevirdi: Çünkü o4-mini isimli sohbet botu, dünyanın en zorlu problemlerinden bazılarını doğru çözebildi.
Zirveye liderlik eden ve aynı zamanda jüri üyeliği yapan Virginia Üniversitesi’nden matematikçi Ken Ono, “Bazı meslektaşlarım bu modellerin neredeyse matematik dehası seviyesine yaklaştığını söylüyor” dedi.
O4-MİNİ NEDİR?
Test edilen yapay zeka, OpenAI tarafından geliştirilen o4-mini adlı yeni nesil bir akıl yürütme modeliydi. Standart dil modelleri (LLM), genelde veriye dayalı tahmin yapıyor. Ama karmaşık bir problemde insan gibi adım adım mantık yürütme, çıkarım yapma veya ispat geliştirme yetenekleri sınırlı oluyor.
Akıl yürütme (reasoning) özelliği ise LLM’in yalnızca ezberden cevap vermek yerine bir mantık zinciri kurarak sorunu çözmesini sağlıyor. Özellikle matematikte, bilimde veya çok aşamalı planlama gerektiren sorularda akıl yürütme kritik bir fark.
Google’ın benzer modeli Gemini 2.5 Flash da benzer yeteneklere sahip. ChatGPT’nin önceki sürümlerini çalıştıran LLM’ler gibi o4-mini de kelime tahmini üzerine eğitiliyor. Ancak o4-mini, daha küçük ve çevik bir model olarak, özel veri setleri ve insan destekli geri bildirimlerle daha derin akıl yürütme yetenekleri kazanıyor. Bu sayede geleneksel LLM’lerin sınırlarını aşarak karmaşık matematik problemlerine dalabiliyor.
GİZLİLİK SÖZLEŞMESİ İMZALADILAR
OpenAI, o4-mini’nin gelişimini izlemek için kar amacı gütmeyen Epoch AI adlı kuruluşla işbirliği yaptı. Matematikçileri bir araya getiren toplantı da Epoch AI’ın araştırması için gerçekleşti.
Kurum ilk olarak, daha önce hiçbir yerde yayınlanmamış, yani yapay zekanın önceden erişemeyeceği 300 matematik sorusu hazırladı. Geleneksel LLM’ler karmaşık soruları kısmen yanıtlayabilse de bu yeni soruların yüzde 2’den azını çözebildi. Bu, önceki modellerin derin akıl yürütmede yetersiz kaldığını kanıtladı. Ancak o4-mini çok farklı bir tablo çiziyordu.
Epoch AI, “FrontierMath” adlı bu yeni kıyaslama projesi için yakın zamanda doktora derecesini tamamlayan Elliot Glazer’ı ekibe kattı. Projede lisans, yüksek lisans ve araştırma düzeyinde olmak üzere dört farklı zorluk seviyesi içeren yeni sorular toplandı. Nisan 2025’e gelindiğinde Glazer, o4-mini’nin soruların yaklaşık yüzde20’sini çözebildiğini gördü.
Ardından “dördüncü seviye” başlatıldı: Bu seviye, akademik düzeyde bile ancak az sayıda uzmanın geliştirebileceği ve çözebileceği sorulardan oluşuyordu. Katılımcılar, gizlilik sözleşmesi imzalayarak sadece Signal üzerinden iletişim kurmak zorundaydı. E-posta gibi yöntemler, LLM’ler tarafından taranıp eğitimi etkileyebileceği için yasaktı.
O4-mini’nin çözemediği her soru, onu hazırlayan matematikçiye 7 bin 500 dolar ödül kazandıracaktı. Ancak yeterince zor soru bulmak hiç de kolay olmadı. Bunu hızlandırmak için Epoch AI, 17-18 Mayıs’ta yüz yüze bir oturum düzenledi. 30 akademisyen altışarlı gruplara ayrılarak iki gün boyunca yapay zekayı zorlayacak sorular geliştirmeye çalıştı.
“YAPAY ZEKA MUCİZESİ”
Ken Ono, o hafta sonu yaşadıklarını şöyle anlatıyor:
“Alanımdaki uzmanların bile açık soru olarak bildiği, iyi bir doktora düzeyi soru hazırladım. Botu denemek için sordum. On dakika içinde gerçek zamanlı olarak çözümü ekranımda yazmaya başladı.”
Scientific American dergisine konuşan Ono’nun aktarımına göre bot önce ilgili literatürü taradı, ardından sorunun basitleştirilmiş bir versiyonunu çözerek ilerledi. Kısa süre sonra asıl soruyu da doğru şekilde çözdü. Üstelik cevabının sonuna şunu ekledi: “Atıf gerekmez çünkü gizemli sayıyı ben hesapladım!”
Ono, ertesi sabah Signal üzerinden diğer katılımcılara “Böyle bir LLM ile karşı karşıya kalacağımı hiç düşünmemiştim” mesajını gönderdi:
“Bir bilim insanının yaptığı gibi akıl yürütüyordu. Bu gerçekten ürkütücü.”
Grup sonunda botu alt edebilecek 10 soru bulmayı başardı. Ancak katılımcılar, yapay zekanın bir yılda geldiği nokta karşısında şaşırdıklarını ifade ediyor.
O4-mini, bir matematikçinin haftalarca sürecek hesaplarını dakikalar içinde tamamlayabiliyor. Ancak bu hız, bilim insanlarını kaygılandırıyor. Araştırmacılar aynı zamanda sonuçlara körü körüne güvenilmemesi gerektiğini vurguluyor.
“BEŞİNCİ SEVİYE KAPIDA”
Toplantının sonunda gözler, henüz kimsenin çözemediği sorulara, yani “beşinci seviye”ye çevrildi. Çünkü bilim insanları son toplantıda yönelttikleri soruların cevaplarını zaten biliyordu.
Beşinci seviyeye gelindiğinde, matematikçilerin rolü kökten değişebilir. Sadece soru soran ve akıl yürüten yapay zekAyı yönlendiren bir danışmana dönüşebilirler. Ono’ya göre, bu durum üniversitelerde yaratıcılığı teşvik etmenin önemini artıracak.
Ono, “Bu sadece bir bilgisayar değil. Panik yaratmak istemem ama bu LLM’ler, şimdiden dünyanın en iyi doktora öğrencilerinin çoğunu geride bırakıyor” dedi.