Google’ın yapay zekası, insanlarla aynı kurallarda yarıştı ve kazandı

Google DeepMind’ın yapay zeka modeli Gemini Deep Think, Memleketler arası Matematik Olimpiyatları’nda (IMO) altın madalya kazandı. Pekala bu muvaffakiyet nasıl mümkün oldu?

H B

Yayınlama: 22.07.2025

A⁺

A^-

Her yıl dünyanın en zeki gençlerini bir ortaya getiren Milletlerarası Matematik Olimpiyatları (IMO), bu yıl bir unsur sahne oldu. Google DeepMind’ın geliştirdiği yapay zekâ modeli Gemini Deep Think, müsabakaya insan iştirakçilerle birebir kurallar altında katıldı ve altın madalya kazandı. Bu başarıyı, OpenAI üzere firmaların daha esnek kıymetlendirme teknikleriyle değil, IMO’nun resmi kurallarına sadık kalarak elde etti.

Yeni jenerasyon yapay zeka: Deep Think

Geçtiğimiz yıl AlphaProof ve AlphaGeometry 2 ile müsabakaya katılan DeepMind, bu yıl yeni bir modelle geldi: Gemini Deep Think. Bu model, klasik doğrusal niyet sistemleri yerine, tıpkı anda birden fazla akıl yürütme yolunu tahlil edip, en mantıklı olanı seçebilen paralel niyet düzeneğiyle dikkat çekiyor.

DeepMind takımına nazaran bu, evvelki kuşak modellere nazaran büyük bir paradigma değişimi. Artık bir uzmanın soruyu özel matematiksel lisana çevirmesine gerek kalmadan, model doğal lisanla verilen sorunu anlayıp çözebiliyor.

Matematiksel düşünmede yeni bir seviye

Geçmişte LLM’lerin (büyük dil modellerinin) matematikte başarılı olabilmesi için çoklukla yalnızca hakikat karşılığa ulaşmaları kafiydi. Lakin IMO üzere yarışlarda kıymetli olan sırf sonuç değil, o sonuca nasıl ulaşıldığını adım adım göstermek. Google, bu zorluğu aşmak için modelini uzun, açıklamalı tahliller üretmeye odaklı yeni pekiştirmeli öğrenme teknikleriyle eğitti.

DeepMind kıdemli bilim insanı Thang Luong, bu usulle sağlam ve dengeli düşünme yolları geliştirdiklerini vurguluyor.

Yarışma gerçek kurallar altında gerçekleşti

Deep Think, tıpkı insan yarışmacılar üzere, sorunları doğal lisanda aldı ve tahlilleri yeniden doğal lisanla sundu. Üstelik, her yarışmacıya tanınan 4,5 saatlik mühlet içinde çalıştı. Bu istikametiyle, daha evvel Gemini uygulamasında gördüğümüz süratli ancak yüzeysel karşılıkların tersine, çok daha derinlikli bir tahlil süreci işletildi.

İleri eğitim ve akıllı çözümler

DeepMind araştırmacılarının dikkat çektiği bir başka nokta ise, modelin sadece gerçek karşılığı bulması değil, tahlil sürecinde gösterdiği “zekice yaklaşımlar.” Örneğin, iştirakçilerin birden fazla bir soruda ileri seviye bir matematik teoremini kullanırken, Deep Think birebir sonuca temel sayı teorisiyle ulaşmayı başardı. Brown Üniversitesi’nden araştırmacı Junehyuk Jung’a nazaran, bu müşahede modelin derin içgörü yeteneğini ortaya koyuyor.

Tek yanlış, en güç soru

Deep Think yalnızca bir soruda başarısız oldu. Bu soruda model yanlış bir varsayımla yola çıktı ve tahlil yolu baştan yanılgılı oldu. Fakat bu soruyu tüm yarışmacılar ortasında sadece beş kişi hakikat yanıtladı. Yani model, en şiddetli soruda bile rekabetçi bir seviyedeydi.

Değerlendirme gerçek IMO kurallarına nazaran yapıldı

Google, Deep Think’in değerlendirmesinin IMO tertibi tarafından, resmi prosedürlere uygun biçimde yapıldığını belirtiyor. Bu, OpenAI’nin yaklaşımından farklı. OpenAI ise değerlendirmeyi eski IMO iştirakçilerinden oluşan bir heyetle gerçekleştirmişti. Google’a nazaran bu, sonucu direkt etkileyebilir.

Gelecekte ne var?

Şu an Deep Think’in özel sürümü, emniyetli test uzmanları tarafından deneniyor. Modelin, aylık 250 dolar ödeyen Google AI Ultra abonelerine sunulması planlanıyor. DeepMind ise önümüzdeki yıl daha da gelişmiş bir sürümle yarışa dönmeyi ve tam puan hedeflemeyi amaçlıyor.

Deep, Imo, Model, Soru, Yarışma

H B

Benzer Konular

İki otomobil devi birleşiyor. Nissan ve Honda dünyanın 3. büyük şirketi olacak..

Japon otomobil üreticileri Honda ve Nissan, elektrikli araç sektöründeki rekabet karşısında dünyanın en büyük üçüncü otomobil üreticisini oluşturmak için birleşiyor. İki şirketin birleşme yoluyla 191,4 milyar dolarlık pazar payı hedeflediği, bu adımla faaliyet karının ise 19 milyar dolar üzerine çıkmasının beklendiği açıklandı.

23.12.2024

1582’nin Ekim ayı, telefonunuzun takviminde neden 10 gün eksik görünüyor?

Telefonunuzun takviminde 1582 yılına kadar geri gedip Ekim ayına göz atarsanız, günlerin 4 Ekim'den 15 Ekim'e atladığını göreceksiniz. Hayır, bu bir yanılgı değil. Pekala lakin buhar olup uçan bu 10 günün başına ne geldi?

03.07.2024

133

Apple, 2024 yılının en çok indirilen App Store uygulamalarını ve oyunlarını açıkladı

Apple, her yıl olduğu üzere, 2024 yılı için de en çok indirilen App Store uygulamalarını ve oyunlarını açıkladı. İşte kategorilere bölünmüş biçimde 2024 yılının en çok indirilen App Store oyun ve uygulamaları.

17.12.2024

Microsoft’tan açıklama geldi: ‘Küresel kesintinin temel nedeni giderildi’

Microsoft, CrowdStrike yazılım güncellemesinden kaynaklanan küresel IT kesintisinin temel nedeninin 'düzeltildiğini' açıkladı. Ancak bazı Microsoft 365 uygulamaları ve hizmetlerinde sorunlar hâlâ devam ediyor.

19.07.2024

Google, Android ve ChromeOS’u birleştirmeye hazırlanıyor

Google, Android ve ChromeOS'u tek bir platformda birleştirerek kullanıcı deneyimini daha uyumlu hale getirmeyi hedefliyor. Şirket, uzun süredir zeminini hazırladığı bu değişimi nihayet hayata geçirme aşamasında.

14.07.2025

Güneş’ten 100 bin kat daha sıcak: Yapay olarak üretilen sıcaklık rekoru kırıldı!

CERN’de gerçekleştirilen deneyde, yaklaşık 5 trilyon derece sıcaklığa ulaşarak insanlık tarihinde yapay olarak elde edilen en yüksek sıcaklık kaydedildi. Deney, evrenin ilk anlarına dair fiziksel koşulları anlamaya yönelik önemli ipuçları sunuyor.

25.06.2025

Bir Yorum Yazın

[ Yoruma cevap yazmaktan vazgeç ]

Ziyaretçi Yorumları - 0 Yorum

Henüz yorum yapılmamış.