Google’ın yapay zekası, insanlarla aynı kurallarda yarıştı ve kazandı

Google DeepMind’ın yapay zeka modeli Gemini Deep Think, Memleketler arası Matematik Olimpiyatları’nda (IMO) altın madalya kazandı. Pekala bu muvaffakiyet nasıl mümkün oldu?

Google’ın yapay zekası, insanlarla aynı kurallarda yarıştı ve kazandı
Yayınlama: 22.07.2025
3
A+
A-

Her yıl dünyanın en zeki gençlerini bir ortaya getiren Milletlerarası Matematik Olimpiyatları (IMO), bu yıl bir unsur sahne oldu. Google DeepMind’ın geliştirdiği yapay zekâ modeli Gemini Deep Think, müsabakaya insan iştirakçilerle birebir kurallar altında katıldı ve altın madalya kazandı. Bu başarıyı, OpenAI üzere firmaların daha esnek kıymetlendirme teknikleriyle değil, IMO’nun resmi kurallarına sadık kalarak elde etti.

Yeni jenerasyon yapay zeka: Deep Think

Geçtiğimiz yıl AlphaProof ve AlphaGeometry 2 ile müsabakaya katılan DeepMind, bu yıl yeni bir modelle geldi: Gemini Deep Think. Bu model, klasik doğrusal niyet sistemleri yerine, tıpkı anda birden fazla akıl yürütme yolunu tahlil edip, en mantıklı olanı seçebilen paralel niyet düzeneğiyle dikkat çekiyor.

DeepMind takımına nazaran bu, evvelki kuşak modellere nazaran büyük bir paradigma değişimi. Artık bir uzmanın soruyu özel matematiksel lisana çevirmesine gerek kalmadan, model doğal lisanla verilen sorunu anlayıp çözebiliyor.

Matematiksel düşünmede yeni bir seviye

Geçmişte LLM’lerin (büyük dil modellerinin) matematikte başarılı olabilmesi için çoklukla yalnızca hakikat karşılığa ulaşmaları kafiydi. Lakin IMO üzere yarışlarda kıymetli olan sırf sonuç değil, o sonuca nasıl ulaşıldığını adım adım göstermek. Google, bu zorluğu aşmak için modelini uzun, açıklamalı tahliller üretmeye odaklı yeni pekiştirmeli öğrenme teknikleriyle eğitti.

DeepMind kıdemli bilim insanı Thang Luong, bu usulle sağlam ve dengeli düşünme yolları geliştirdiklerini vurguluyor.

Yarışma gerçek kurallar altında gerçekleşti

Deep Think, tıpkı insan yarışmacılar üzere, sorunları doğal lisanda aldı ve tahlilleri yeniden doğal lisanla sundu. Üstelik, her yarışmacıya tanınan 4,5 saatlik mühlet içinde çalıştı. Bu istikametiyle, daha evvel Gemini uygulamasında gördüğümüz süratli ancak yüzeysel karşılıkların tersine, çok daha derinlikli bir tahlil süreci işletildi.

İleri eğitim ve akıllı çözümler

DeepMind araştırmacılarının dikkat çektiği bir başka nokta ise, modelin sadece gerçek karşılığı bulması değil, tahlil sürecinde gösterdiği “zekice yaklaşımlar.” Örneğin, iştirakçilerin birden fazla bir soruda ileri seviye bir matematik teoremini kullanırken, Deep Think birebir sonuca temel sayı teorisiyle ulaşmayı başardı. Brown Üniversitesi’nden araştırmacı Junehyuk Jung’a nazaran, bu müşahede modelin derin içgörü yeteneğini ortaya koyuyor.

Tek yanlış, en güç soru

Deep Think yalnızca bir soruda başarısız oldu. Bu soruda model yanlış bir varsayımla yola çıktı ve tahlil yolu baştan yanılgılı oldu. Fakat bu soruyu tüm yarışmacılar ortasında sadece beş kişi hakikat yanıtladı. Yani model, en şiddetli soruda bile rekabetçi bir seviyedeydi.

Değerlendirme gerçek IMO kurallarına nazaran yapıldı

Google, Deep Think’in değerlendirmesinin IMO tertibi tarafından, resmi prosedürlere uygun biçimde yapıldığını belirtiyor. Bu, OpenAI’nin yaklaşımından farklı. OpenAI ise değerlendirmeyi eski IMO iştirakçilerinden oluşan bir heyetle gerçekleştirmişti. Google’a nazaran bu, sonucu direkt etkileyebilir.

Gelecekte ne var?

Şu an Deep Think’in özel sürümü, emniyetli test uzmanları tarafından deneniyor. Modelin, aylık 250 dolar ödeyen Google AI Ultra abonelerine sunulması planlanıyor. DeepMind ise önümüzdeki yıl daha da gelişmiş bir sürümle yarışa dönmeyi ve tam puan hedeflemeyi amaçlıyor.

Bir Yorum Yazın

Ziyaretçi Yorumları - 0 Yorum

Henüz yorum yapılmamış.