OpenAI, 12 gün süren tanıtım etkinliklerinin son gününde yeni yapay zeka modeli OpenAI o3 ve o3-mini'yi duyurdu.
 
Bu yeni modeller, yapay zekâ teknolojisinde önemli bir dönüm noktası olarak kabul ediliyor.
 
OpenAI o3, önceki sürüm olan o1’in geliştirilmiş bir versiyonu olarak, özellikle karmaşık matematik, bilim ve kodlama gibi alanlarda üç kat daha iyi performans sergiliyor.
 
Model, ARC-AGI gibi yapay zekâların mantıksal çıkarım yeteneklerini test eden benchmarklarda üstün başarı sağladı.

OpenAI, o3’ün problem çözme kabiliyetinin adım adım düşünme metoduyla önemli ölçüde geliştirildiğini belirtti.
 
Yeni modelin "o2" yerine "o3" olarak adlandırılmasının arkasında, İngiltere merkezli telekom şirketi O2 ile yaşanabilecek ticari marka ihtilafının önüne geçme isteği bulunuyor. Bu nedenle OpenAI, ismi doğrudan o3 olarak belirledi.
 
OpenAI’nin açıklamasına göre, o3 modeli yapay genel zekâ (AGI) alanında insan seviyesine yakın bir performans sergiliyor.
 
ARC-AGI testlerinde yüzde 87,5 başarı oranı elde eden o3, insan düzeyine (yüzde 85) ulaşan ilk yapay zeka modeli oldu. Bu başarı, yapay zekâ alanında bugüne kadarki en büyük sıçramalardan biri olarak değerlendiriliyor.
 
o3 modeli, çeşitli kıyaslamalarda da üstün performans sergiledi: AIME 2024: Yüzde 96,7 başarı oranı ile yalnızca bir soru kaçırdı. GPQA Diamond: Yüzde 87,7 başarı elde etti. EpochAI's Frontier Math: Problemlerin %,2’sini çözerek bu testteki önceki modellerin çok üzerinde bir performans gösterdi. Bu sonuçlar, o3’ün karmaşık matematiksel problemleri çözme kapasitesinde büyük bir ilerleme sağladığını gösteriyor.
 
OpenAI, o3 modeliyle birlikte "deliberative alignment" adı verilen yeni bir güvenlik yaklaşımı geliştirdi. Bu yöntem, yapay zekanın bir soruya yanıt vermeden önce güvenlikle ilgili bir dizi adımı takip etmesini sağlıyor. Amaç, yasa dışı faaliyetlere yardım gibi olumsuz senaryoların önüne geçmek.
 
OpenAI CEO’su Sam Altman, o3-mini modelinin Ocak 2025'te, tam sürüm olan o3'ün ise hemen ardından piyasaya sürüleceğini açıkladı. İlk aşamada, model ChatGPT Plus ve Pro abonelerine sunulacak. OpenAI o3, daha önce hiç ulaşılamayan başarı oranları ve geliştirilmiş mantıksal akıl yürütme yetenekleriyle yapay zekâda bir dönüm noktası olarak kabul ediliyor. Yeni modelin, bilim, teknoloji ve günlük yaşamda insanlara çok daha fazla fayda sağlayacağı öngörülüyor.