OpenAI, GPT-4o modeline şimdiye kadar geliştirdiği en ileri seviye görüntü oluşturma teknolojisini entegre etti. Şirket, bu yeni özelliğin sadece estetik olarak etkileyici değil, aynı zamanda grafikler, afişler ve şemalar gibi pratik ve işlevsel görseller üretmede de başarılı olduğunu belirtiyor.
Yazıları Doğru Yerleştiriyor, Komutları Eksiksiz Uyguluyor
Yeni model görsellerde metinleri doğru şekilde yerleştirme konusunda büyük bir iyileştirme sunuyor. Ayrıca, kullanıcının verdiği komutları eksiksiz yerine getirerek daha isabetli sonuçlar üretebiliyor.
Örneğin, bir video oyunu karakteri oluşturulduğunda, kullanıcı ne kadar değişiklik yaparsa yapsın, karakterin temel görünümü ve özellikleri korunuyor. Böylece her düzenlemede tamamen farklı bir görsel yerine, tutarlı ve uyumlu bir tasarım ortaya çıkıyor.
Aynı Anda 10-20 Nesne İşleyebiliyor
Yeni model, tek bir görselde 10-20 farklı nesneyi işleyebiliyor. Ayrıca, kullanıcıların yüklediği görselleri analiz ederek gelecekteki üretimlerde bu bilgileri dikkate alıyor.
Ancak, bu gelişmiş özelliklerin bir bedeli var. OpenAI, daha detaylı görseller üretildiği için işlem süresinin yaklaşık bir dakikaya kadar uzayabileceğini belirtiyor.
Bazı Sınırlamalar Hâlâ Mevcut
Her ne kadar gelişmiş bir sistem olsa da OpenAI, modelin bazı sınırlamaları olduğuna dikkat çekiyor:
-
Uzun ve dar görseller bazen hatalı kırpılabiliyor.
-
Periyodik Tablo gibi aşırı karmaşık görsellerde bazı detaylar yanlış görselleştirilebiliyor.
-
Latin alfabesi dışındaki harfleri işlerken hata yapma olasılığı bulunuyor.
Herkese Açık ve Ücretsiz Kullanım
Yeni görüntü oluşturma özelliği Sora ve ChatGPT kullanıcıları için ücretsiz olarak sunulacak. OpenAI’nin DALL-E tabanlı görsel üretim aracı ise ayrı bir platform üzerinden erişilebilir olmaya devam edecek.