OpenAI, Ağırlıklı Modellerini Paylaştı: Yapay Zeka Gerçekten Eşitlik Mi Sağlıyor?

OpenAI'den Yeni Açık Ağırlıklı Dil Modelleri
OpenAI, Apache 2.0 lisansı altında iki yeni açık ağırlıklı (open-weight) dil modelini duyurdu.
"Açık ağırlıklı" kavramı, yapay zeka alanında bir modelin ağırlıklarının, yani eğitim sürecinde öğrenilen parametrelerin kamuya açık şekilde paylaşılmasını ifade eder. Böylece kullanıcılar, bu modelleri kendi bilgisayarlarına kurarak yerel ortamda çalıştırabilir, pahalı hizmetler için ek ücret ödemeden sistemlerine entegre edip özelleştirebilirler.
Şirketin ifadesine göre yeni yayımlanan modeller, yüksek performans sunarken, tüketici düzeyindeki donanımlarda bile verimli bir şekilde çalışabilmek üzere tasarlanmıştır.
Özellikle dikkat çeken bir model, sadece 16 GB GPU’ya sahip bir dizüstü bilgisayarda bile işlevsellik gösteriyor. Grafik işlemci (GPU), yüksek hızda matematiksel hesaplamaları gerçekleştirebilen bir elektronik devredir ve günümüzde yapay zeka uygulamalarının en kritik bileşenlerinden biridir.
YENİ MODELLERİN TEKNİK ÖZELLİKLERİ
Şirketin açık ağırlıklı olarak sunduğu modellerin özellikleri şu şekildedir:
- gpt-oss-120b (117 milyar parametre):
OpenAI’nın o4-mini modeliyle benzer bir akıl yürütme performansı sunmakta ve yalnızca 80 GB GPU ile çalışabilmektedir.
- gpt-oss-20b (21 milyar parametre):
o3-mini seviyesinde bir performans göstermekte ve sadece 16 GB GPU ile etkili bir şekilde çalışabilmektedir. Bu parametreler, bir yapay zeka modelinin büyüklüğü ve karmaşıklığı hakkında teknik bir gösterim sağlamaktadır. Parametreler, modelin karar verirken odaklanacağı unsurları ve yorumlama şekillerini belirlemektedir.
Örneğin, bir kelimenin tanınması ya da cümledeki anlam ilişkilerinin çözülmesinde bu parametreler kullanılmaktadır. Ne kadar çok parametre mevcutsa, model o kadar fazla bilgiyi temsil edebilir ve daha karmaşık bağlantıları anlayabilir.
Bu nedenle, OpenAI tarafından yayınlanan son açık ağırlıklı modeller, geliştiricilerin maliyetli sunucu altyapılarına ihtiyaç duymadan etkili yapay zeka uygulamaları geliştirme sürecini kolaylaştırabilir.
AKIL YÜRÜTMEDE DAHA İYİ
OpenAI’ın açıklamasına göre yeni modeller, benzer boyuttaki diğer açık kaynaklı modellerden daha iyi akıl yürütme ve araç kullanımı performansına sahiptir.
Modellerin, internette arama yapma ve Python yazılım kodlarını çalıştırma gibi araç kullanma gereksinimi olan görevlerde başarılı oldukları, ayrıca talimatlara uyma ve görevin karmaşıklığına göre akıl yürütme düzeylerini ayarlama yetisine sahip oldukları vurgulanmaktadır.
OpenAI, modellerin yazılımcıların kod paylaşımı yaptığı Hugging Face, GitHub, vLLM, Ollama ve llama.cpp gibi platformlarla sorunsuz bir şekilde entegre edilebilmesi amacıyla rehberler de yayımlamıştır.
GÜVENLİK VE ŞEFFAFLIK ÖNLEMLERİ
OpenAI, bu açık ağırlıklı modelleri tasarlarken güvenliği en öncelikli konu olarak belirlediğini ifade ediyor. Yapılan testlerde, kötü niyetli bir ince ayarla bile modellerin biyolojik, kimyasal ya da siber risk alanlarında tehlike seviyelerine ulaşmadığı tespit edildi.
Diğer yandan, şirket, modellerin düşünme süreçlerini şeffaf bir biçimde izlemek için “düşünce zinciri” (yapay zeka modellerinin bir soruya yanıt vermeden önce adım adım düşünmesini sağlayan bir teknik) çıktılarında herhangi bir filtre uygulamamıştır. Bu durum, modellerin bazen gerçeklikten uzak ya da "halüsinatif" içerikler üretmesine yol açabilir.
Şirketin açıklamalarında, “Düşünce zincirlerini bastırmak, modellerin zararlı düşüncelerini gizlemesine neden olabilir. Bu nedenle baskı uygulamaktan kaçındık. Geliştiricilerin bu çıktıları takip ederek modellerin davranışlarını gözlemleyebilmesi hedeflenmektedir” denilmektedir.
TESTLER NE GÖSTERİYOR?
Yapılan kıyaslamalar, bu yeni modellerin halüsinasyon konusundaki performansının o4-mini kadar etkili olmadığını göstermektedir. OpenAI, bunun model boyutlarının daha küçük olmasından kaynaklandığı görüşündedir.
Ancak gerçek dünya uygulamalarında, örneğin web'den bilgi çekme (RAG) veya veritabanı sorgulama gibi durumlarda halüsinasyonların daha az yaşanması beklenmektedir.
AÇIK KAYNAK VE AÇIK AĞIRLIK
OpenAI’ın bu hamlesi, güçlü yapay zeka modellerini daha erişilebilir bir hale getirerek geliştiricilere yeni uygulama alanları tanıtma amacını gütmektedir.
Özellikle düşük donanımda çalışabilen bu modeller, yapay zekanın “demokratikleşmesi” açısından önemli bir adım olarak değerlendirilmektedir. Son dönemlerde şeffaflık konusundaki artan çabalar çerçevesinde şirketler, geliştirdikleri uygulamaların kodlarını herkesin erişimine açmaya yönelik adımlar atmaktadır. Buna “açık kaynaklı kod” denilmektedir.
Öte yandan, OpenAI’ın yayımladığı modellerin açık ağırlıklı olması, açık kaynak kodlu olduğu anlamına gelmemektedir. Çünkü açık ağırlık yalnızca modelin parametrelerinin ve mimarisinin açık olduğu anlamına gelirken, açık kaynak demek modelin eğitim verileri, kodları ve her şeyinin erişilebilir olması demektir.