Google, Veo 2 ve Imagen 3 adlı video ve görüntü üretim modellerinin güncellenmiş sürümlerini ve Whisk adlı yeni bir aracı yayınladı.
Google‘dan Aäron van den Oord ve Elias Roman duyuru gönderisinde “Bu yılın başlarında, video oluşturma modelimiz Veo’yu ve en son görüntü oluşturma modelimiz Imagen 3’ü tanıttık,” diye yazıyor. “Bugün, her ikisi de son teknoloji sonuçları elde eden yeni bir video modeli olan Veo 2’yi ve Imagen 3’ün en son sürümünü tanıtıyoruz. Bu modeller artık VideoFX, ImageFX ve en yeni Labs deneyimiz Whisk’te mevcut.”
Google, Veo’yu Imagen 3 ile birlikte Mayıs ayında duyurmuştu, ancak bu video oluşturma modelini Aralık ayının başına kadar yayınlamadı ve o zaman da yalnızca özel önizlemede yayınladı. Veo, bir görüntüyü komut olarak kullanarak yüksek çözünürlüklü videolar oluşturur ve 60 saniyeye kadar uzunluktaki videolarda çok çeşitli görsel stiller sağlar. Veo 2, gerçek dünya fiziğinin daha iyi anlaşılmasını ve genel olarak daha fazla gerçekçilik sunan bu modelin güncellenmiş bir sürümüdür.
Google, tür, lens ve sinematik efektler belirleyebileceğinizi ve Veo’nun 4K kaliteye kadar ve birkaç dakikaya kadar uzunlukta videolar üreteceğini söylüyor. Hala önizleme aşamasında, ancak Google kullanılabilirliği daha fazla kullanıcıya genişletiyor ve aracı Google Labs video oluşturma aracı VideoFX aracılığıyla kullanılabilir hale getiriyor. Google Labs sitesinde bekleme listesine kaydolabilirsiniz.
Imagen 3, Google‘ın en yüksek kaliteli metinden görüntüye modeli olarak adlandırdığı şeydir. Önceki modellere göre çok daha az dikkat dağıtan görsel eserle fotogerçekçi, gerçekçi görüntüler üretebileceğini söylüyor. Mayıs ayından beri bir Google Labs aracı olan ImageFX’te seçili önizlemede ve daha yakın zamanda bir bekleme listesiyle Vertex AI geliştirici aracında yer aldı.
Google, bu haftanın güncellemesiyle Imagen 3’ün artık daha çeşitli sanat stilleri ve daha yüksek doğrulukla daha parlak, daha iyi oluşturulmuş görüntüler ürettiğini iddia ediyor. Daha da iyisi, çok daha yaygın olarak ve 100’den fazla ülkede mevcut.
Ve sonra Whisk var. Bu, birden fazla resim oluşturmanıza veya girmenize ve ardından bunları benzersiz bir şeye yeniden düzenlemenize olanak tanıyan yeni bir Google Labs aracıdır. Örneğin, bir kişinin fotoğrafını ve doldurulmuş bir hayvanın resmini girerek o kişinin eğlenceli, çizgi film benzeri bir versiyonunu oluşturabilirsiniz. Whisk, arka planda Gemini’nin resim-metne dönüştürme yeteneklerini kullanarak bir istem oluşturur ve ardından bunu Imagen 3’e aktarır ve “konularınızı, sahnelerinizi ve stillerinizi eğlenceli, yeni yollarla kolayca yeniden düzenlemenize” olanak tanır.
Veo 2 ve Imagen 3 teknik ve profesyonellere yönelik görünürken, Whisk bana daha çok bir tüketici teklifi gibi görünüyor ve hissettiriyor. Bugünden itibaren yalnızca ABD’de mevcut. Daha fazla bilgiyi The Keyword blog’da bulabilirsiniz.
Google’ın yapay zeka konusunda “geride” olduğunu düşündüğümüz zamanı hatırlıyor musunuz? Evet, ben de öyle düşünmüyorum.