Damla Cesur

Yapay Zekanın Yeni Yüzü: Google, Nano Banana ile İnterneti Sarsıyor!

Yapay Zekanın Yeni Yüzü: Google, Nano Banana ile İnterneti Sarsıyor!

Google DeepMind'in Yeni Yapay Zeka Modeli: Nano Banana

Google DeepMind'in Yeni Yapay Zeka Modeli: Nano Banana

Kısa bir süre önce “Nano Banana” ismiyle bilinen ve yapay zeka kıyaslama platformu LMArena’da öne çıkan yeni yapay zeka modelinin Google DeepMind tarafından geliştirildiği öğrenildi.

Google, bu yeniliğin Gemini uygulamasına entegre edildiğini kamuoyuna duyurdu.

Nano Banana’yı deneyimleyen kullanıcılar, modelin görsel düzenlemede bir devrim yaratabileceğini belirtiyor. Bazı kullanıcılar ise bu yapay zeka uygulamalarının Photoshop gibi fotoğraf düzenleme yazılımlarının yerini alabileceği görüşünde.

TUTARLI VE GERÇEKÇİ DÜZENLEMELER

Google, yılın başlarında Gemini uygulamasına temel görsel düzenleme özellikleri eklemişti. Ancak daha önceki sistemlerde her düzenleme sırasında görüntünün beklenmedik şekilde değişmesi sık karşılaşılan bir sorun olarak öne çıkıyordu. Kullanıcıların istedikleri düzenlemeyi yapabilmeleri için çok sayıda deneme ve komut girmeleri gerekiyordu.

Yeni model, Gemini 2.5 Flash Image olarak adlandırılıyor ve bu sorunu büyük ölçüde çözüyor. Google’a göre bu model, yapılan düzenlemelerde benzersiz bir tutarlılık sunuyor ve değişiklikler esnasında orijinal görüntünün detaylarını hatırlayabiliyor.

Bu özellik sayesinde kullanıcılar, örneğin bir kişinin fotoğrafını yükleyip kıyafetini değiştirebiliyor ya da farklı stillerde yeniden hayal edebiliyor. Birden fazla düzenleme uygulansa bile, sonuçlar hâlâ orijinal fotoğraftaki kişiye benziyor.

KOLAJ YETENEĞİ
Yeni model, yalnızca tek bir görsel üzerinde değişiklik yapmakla sınırlı kalmıyor. Kullanıcılar, birden fazla fotoğrafı birleştirerek yeni kompozit görüntüler oluşturabiliyor. Google’ın verdiği örnekler arasında, ayrı ayrı yüklenen bir kadın ve bir köpek fotoğrafının, köpeğin kucaklandığı yeni bir sahneye dönüştürülmesi bulunuyor.
Ayrıca model, daha soyut kombinasyonlar yaparak kullanıcıların yönlendirmeleri doğrultusunda özgün görüntüler üretebiliyor.
Google, yeni düzenleme aracının salı günü itibarıyla tüm Gemini kullanıcılarına sunulduğunu bildirdi. Model yakın zamanda Gemini API, AI Studio ve Vertex AI üzerinden geliştiricilere de açılacak.
Google DeepMind ürün sorumlularından Nicole Brichtova, modelin özellikle tüketici kullanım senaryoları için tasarlandığını belirtti. Bu kapsamda ev ve bahçe projelerini görselleştirme, birden fazla referansı (örneğin bir kanepe, oturma odası fotoğrafı ve renk paleti) tek bir tasarımda birleştirmeyi içeriyor.
Brichtova, “Bu güncelleme düzenlemeleri çok daha sorunsuz hâle getiriyor ve çıktılar, istediğiniz her şey için kullanılabilir” ifadelerini kullandı.
NASIL KULLANILIR?
Gemini 2.5 Flash Image, kullanıcılara ücretli olarak sunuluyor.
Geliştiriciler, API üzerinden token bazlı ödeme yaparken (görsel başına 0,039 dolar), bireysel kullanıcılar ise bu modele erişimi sağlayan Google AI Pro gibi abonelik planları aracılığıyla ödeme yapıyor.
Google AI Pro planını kullanan aboneler, aylık yaklaşık 20 dolar ödüyor. Bu plan, bazı gelişmiş modellere ve özelliklere erişim sunuyor.
Ancak önemli bir not: Gemini uygulamasında Flash Image’ın bireysel kullanıcılar için ayrı bir fiyatlandırması yok. Modelin dahil olduğu plan kapsamında erişim sağlanabiliyor.
Yeni modeli denemek isteyenler, Google Play Store veya App Store’dan “Gemini” uygulamasını indirebilir. Daha sonra menüden veya ayarlardan Gemini Advanced / AI Pro yükseltmesine giderek abone olmaları mümkündür.
Web sürümüne de “gemini.google” adresinden ulaşılmaktadır. Sol altta veya profil kısmında “Gemini Advanced’e yükselt” seçeneğinden abonelik başlatılabilir.
Uygulamanın akışı, diğer yapay zeka araçlarıyla benzer bir deneyim sunuyor. Kullanıcılar “görsel yükle” seçeneğini seçtikten sonra düzenleme için komutlar verebiliyor. Örneğin, “Bu kişinin kıyafetini 90’lar tarzına çevir” veya “Arka planı sil ve yerine kumsal ekle” gibi direktifler vermek mümkün.
REKABET KIZIŞIYOR
Google’ın bu hamlesi, OpenAI’nin mart ayında GPT-4o ile tanıttığı görsel üretim özelliklerinin ardından gelmesi dikkat çekti. Söz konusu dönemde ChatGPT’nin kullanımında önemli bir artış yaşanmış, sosyal medyada “Studio Ghibli” tarzında üretilen görseller büyük etki yaratmıştı.
Meta da geçen hafta Midjourney’den görsel modelleri alacağını duyurmuştu. Almanya merkezli Black Forest Labs’ın FLUX modelleri, sektördeki en yüksek performanslı çözümler arasında öne çıkıyor.
Google, Gemini’nin geliştirilmiş görsel düzenleme yeteneklerinin, OpenAI karşısındaki kullanıcı farkını kapatmasına yardımcı olabileceğini düşünüyor. Şu anda ChatGPT haftalık 700 milyon kullanıcıya ulaşırken, Google CEO’su Sundar Pichai, Temmuz’daki kazanç çağrısında Gemini’nin aylık 450 milyon kullanıcıya sahip olduğunu açıklamıştı.
DEEPFAKE RİSKİNE KARŞI ÖNLEMLER
Google’ın diğer yapay zeka görüntü modellerinde olduğu gibi, Gemini 2.5 Flash Image ile üretilen her görselin köşesinde “AI” ibaresi yer alıyor. Ayrıca görsellerde, düzenlense bile arka planda tespit edilebilen görünmez bir SynthID dijital filigranı bulunmaktadır.
Google, bu yöntemle deepfake tehdidine karşı önlem almak istediğini belirtirken, sosyal medyada hızla yayılan ve dezenformasyon için kullanılan görsellerde bu tür işaretlerin gözden kaçabileceğini de kabul ediyor.
Geçmişte Gemini’ın görüntü üretimindeki sorunlar gündeme gelmişti. Şirket, özellikle tarihsel olarak hatalı insan görselleri (örneğin Elon Musk’ı siyahi olarak göstermesi) nedeniyle özür dileyip sistemi geri çekmek zorunda kalmıştı. Şirket şu anda daha dengeli bir yaklaşım geliştirdiğini ifade ediyor.
Google’ın kullanım şartları, izinsiz mahrem içerik üretimini kesin bir şekilde yasaklıyor. Bu noktada Google, rakiplerinden ayrışıyor. Örneğin Elon Musk’ın xAI şirketinin geliştirdiği Grok, ünlülere benzer cinsel içerikli yapay görsellerin üretilmesine izin vermişti.