Bilim MANŞET

OpenAl’den yeni model: Sora

OpenAl, 15 Şubatta “Sora” isimli yeni bir model yayınladı. Yazıdan video üreten bu model 1 dakikadan uzun videolar üretebiliyor.

OpenAl’in görüntü tabanlı modeli, DALL-E gibi difizyon modeli olarak bilinen bir modelle çalışan Sora’nın, hızlı metin istemlerinden “gerçekçi” ve “yaratıcı” 60 saniyelik videolar oluşturabileceği iddia edildi.

OpenAI, yapay zeka modellerini “insanların gerçek dünya etkileşimi gerektiren sorunları çözmelerine yardımcı olabilmek” için eğitmeyi planladığını söyledi. Sora, görüntü ve video oluşumu sağlayan diğer yapay zekalardan daha gelişmiş bir model.

“Video verileri üzerinde üretken modellerin büyük ölçekli eğitimini araştırıyoruz” diyen OpenAl, metin koşullu difizyon modellerini değişken süreçlere, çözünürlüklere ve en boy oranlarına sahip videolar ve görüntüler üzerinde ortakça bir eğitim veriyorlar.

Yayınlanan teknik rapora göre; Video ve görüntü gizli kodlarının uzay-zaman yamaları üzerinde çalışan bir transformatör mimarisinden yararlanılıyor. Fiziksel dünyanın genel amaçlı similatörlerini oluşturmaya yönelik bir yolculuk başlatılıyor.

Sonbaharda bir kadının yakın çekim portre çekimi, aşırı ayrıntı, sığ alan derinliği

Video üretimi için ölçekleme trasformatörleri

Sora, bir difizyon modeli ile sağlanmış olup giriş gürültü yapalarını ve metin istemlerini göz önüne alarak orijinal yamaları temin etmek için eğitilmiştir. Genel bir görsel modeli olarak yüksek çözünürlü videolar ve görüntüler oluşturabilir. OpenAl raporunda, oluşturulan gizli öğreleri piksel alanına geri eşleyen ilgili bir kod çözücü modelinide eğittiklerini belirtti. Videolarda DALL-E’de tanıtılan altyazı tekniği uygulanıyor. Daha uzun ayrıntılı yazılara dönüştürmek için GPT’den yararlanılıyor.

“Hayal edip yazıya dökmek yeterli”

Sora’yı iki giriş videosu arasında kademeli olarak enterpolasyon yapmak için de kullanabilir; tamamen farklı konulara ve sahne kompozisyonlarına sahip videolar arasında sorunsuz geçişler oluşturabilir.

Güvenlik önlemlerinin alındığını iddia eden şirket Sora ile üretilen her videoya C2PA standartlarında meta ekleneceğini vurguladı.

Muhabir: Gökçe BAYDAR