POPÜLER KONULAR

NAMAZ VAKİTLERİ

Adana Adıyaman Afyon Ağrı Aksaray Amasya Ankara Antalya Ardahan Artvin Aydın Balıkesir Bartın Batman Bayburt Bilecik Bingöl Bitlis Bolu Burdur Bursa Çanakkale Çankırı Çorum Denizli Diyarbakır Düzce Edirne Elazığ Erzincan Erzurum Eskişehir Gaziantep Giresun Gümüşhane Hakkari Hatay Iğdır Isparta İstanbul İzmir K.Maraş Karabük Karaman Kars Kastamonu Kayseri Kırıkkale Kırklareli Kırşehir Kilis Kocaeli Konya Kütahya Malatya Manisa Mardin Mersin Muğla Muş Nevşehir Niğde Ordu Osmaniye Rize Sakarya Samsun Siirt Sinop Sivas Şanlıurfa Şırnak Tekirdağ Tokat Trabzon Tunceli Uşak Van Yalova Yozgat Zonguldak Lefkoşa

Lefkoşa

İMSAK 07:37

GÜNEŞ 12:40

ÖĞLE 15:11

İKİNDİ 17:34

AKŞAM 18:57

YATSI 155

HAVA DURUMU

Lefkoşa

Az Bulutlu

29°C

30 matematikçiden gizli toplantı: “Yapay zeka beşinci seviyeye geçiyor” – Son Dakika Teknoloji Haberleri

0
179
A⁺
A^-

Mayıs ayının ortasında ABD’nin Kaliforniya eyaletinde kapalı kapılar ardında bir matematik zirvesi düzenlendi. Aralarında Avrupalıların da olduğu dünyaca ünlü 30 matematikçi, özel olarak geliştirilen yapay zekalı bir “akıl yürütme” modeliyle karşı karşıya geldi.

Amaç, insan zekasına meydan okuyacak kadar karmaşık sorularla bu yapay zekanın matematik yeteneklerini test etmekti. İki gün boyunca profesör düzeyinde sorular sorulan yapay zeka, katılımcıları şaşkına çevirdi: Çünkü o4-mini isimli sohbet botu, dünyanın en zorlu problemlerinden bazılarını doğru çözebildi.

Zirveye liderlik eden ve aynı zamanda jüri üyeliği yapan Virginia Üniversitesi’nden matematikçi Ken Ono, “Bazı meslektaşlarım bu modellerin neredeyse matematik dehası seviyesine yaklaştığını söylüyor” dedi.

O4-MİNİ NEDİR?

Test edilen yapay zeka, OpenAI tarafından geliştirilen o4-mini adlı yeni nesil bir akıl yürütme modeliydi. Standart dil modelleri (LLM), genelde veriye dayalı tahmin yapıyor. Ama karmaşık bir problemde insan gibi adım adım mantık yürütme, çıkarım yapma veya ispat geliştirme yetenekleri sınırlı oluyor.

Akıl yürütme (reasoning) özelliği ise LLM’in yalnızca ezberden cevap vermek yerine bir mantık zinciri kurarak sorunu çözmesini sağlıyor. Özellikle matematikte, bilimde veya çok aşamalı planlama gerektiren sorularda akıl yürütme kritik bir fark.

Google’ın benzer modeli Gemini 2.5 Flash da benzer yeteneklere sahip. ChatGPT’nin önceki sürümlerini çalıştıran LLM’ler gibi o4-mini de kelime tahmini üzerine eğitiliyor. Ancak o4-mini, daha küçük ve çevik bir model olarak, özel veri setleri ve insan destekli geri bildirimlerle daha derin akıl yürütme yetenekleri kazanıyor. Bu sayede geleneksel LLM’lerin sınırlarını aşarak karmaşık matematik problemlerine dalabiliyor.

GİZLİLİK SÖZLEŞMESİ İMZALADILAR

OpenAI, o4-mini’nin gelişimini izlemek için kar amacı gütmeyen Epoch AI adlı kuruluşla işbirliği yaptı. Matematikçileri bir araya getiren toplantı da Epoch AI’ın araştırması için gerçekleşti.

Kurum ilk olarak, daha önce hiçbir yerde yayınlanmamış, yani yapay zekanın önceden erişemeyeceği 300 matematik sorusu hazırladı. Geleneksel LLM’ler karmaşık soruları kısmen yanıtlayabilse de bu yeni soruların yüzde 2’den azını çözebildi. Bu, önceki modellerin derin akıl yürütmede yetersiz kaldığını kanıtladı. Ancak o4-mini çok farklı bir tablo çiziyordu.

Epoch AI, “FrontierMath” adlı bu yeni kıyaslama projesi için yakın zamanda doktora derecesini tamamlayan Elliot Glazer’ı ekibe kattı. Projede lisans, yüksek lisans ve araştırma düzeyinde olmak üzere dört farklı zorluk seviyesi içeren yeni sorular toplandı. Nisan 2025’e gelindiğinde Glazer, o4-mini’nin soruların yaklaşık yüzde20’sini çözebildiğini gördü.

Ardından “dördüncü seviye” başlatıldı: Bu seviye, akademik düzeyde bile ancak az sayıda uzmanın geliştirebileceği ve çözebileceği sorulardan oluşuyordu. Katılımcılar, gizlilik sözleşmesi imzalayarak sadece Signal üzerinden iletişim kurmak zorundaydı. E-posta gibi yöntemler, LLM’ler tarafından taranıp eğitimi etkileyebileceği için yasaktı.

O4-mini’nin çözemediği her soru, onu hazırlayan matematikçiye 7 bin 500 dolar ödül kazandıracaktı. Ancak yeterince zor soru bulmak hiç de kolay olmadı. Bunu hızlandırmak için Epoch AI, 17-18 Mayıs’ta yüz yüze bir oturum düzenledi. 30 akademisyen altışarlı gruplara ayrılarak iki gün boyunca yapay zekayı zorlayacak sorular geliştirmeye çalıştı.

“YAPAY ZEKA MUCİZESİ”

Ken Ono, o hafta sonu yaşadıklarını şöyle anlatıyor:

“Alanımdaki uzmanların bile açık soru olarak bildiği, iyi bir doktora düzeyi soru hazırladım. Botu denemek için sordum. On dakika içinde gerçek zamanlı olarak çözümü ekranımda yazmaya başladı.”

Scientific American dergisine konuşan Ono’nun aktarımına göre bot önce ilgili literatürü taradı, ardından sorunun basitleştirilmiş bir versiyonunu çözerek ilerledi. Kısa süre sonra asıl soruyu da doğru şekilde çözdü. Üstelik cevabının sonuna şunu ekledi: “Atıf gerekmez çünkü gizemli sayıyı ben hesapladım!”

Ono, ertesi sabah Signal üzerinden diğer katılımcılara “Böyle bir LLM ile karşı karşıya kalacağımı hiç düşünmemiştim” mesajını gönderdi:

“Bir bilim insanının yaptığı gibi akıl yürütüyordu. Bu gerçekten ürkütücü.”

Grup sonunda botu alt edebilecek 10 soru bulmayı başardı. Ancak katılımcılar, yapay zekanın bir yılda geldiği nokta karşısında şaşırdıklarını ifade ediyor.

O4-mini, bir matematikçinin haftalarca sürecek hesaplarını dakikalar içinde tamamlayabiliyor. Ancak bu hız, bilim insanlarını kaygılandırıyor. Araştırmacılar aynı zamanda sonuçlara körü körüne güvenilmemesi gerektiğini vurguluyor.

“BEŞİNCİ SEVİYE KAPIDA”

Toplantının sonunda gözler, henüz kimsenin çözemediği sorulara, yani “beşinci seviye”ye çevrildi. Çünkü bilim insanları son toplantıda yönelttikleri soruların cevaplarını zaten biliyordu.

Beşinci seviyeye gelindiğinde, matematikçilerin rolü kökten değişebilir. Sadece soru soran ve akıl yürüten yapay zekAyı yönlendiren bir danışmana dönüşebilirler. Ono’ya göre, bu durum üniversitelerde yaratıcılığı teşvik etmenin önemini artıracak.

Ono, “Bu sadece bir bilgisayar değil. Panik yaratmak istemem ama bu LLM’ler, şimdiden dünyanın en iyi doktora öğrencilerinin çoğunu geride bırakıyor” dedi.

BU KONUYU SOSYAL MEDYA HESAPLARINDA PAYLAŞ