Google araştırmacıları, bu yeni teknolojiyi "Vlogger" olarak adlandırıyor. Araştırmacılar, yapay zekanın tek bir girdi görüntüsünden nasıl bir ses dosyası ile eşleştirilecek hem yüz hem de vücut hareketlerini nasıl ürettiğini gösteren çeşitli örnekler sundu.Bu teknoloji, video düzenleme ve özellikle de bir video öznesinin yüz ifadelerini düzenleme gibi birçok alanda kullanılabilecek potansiyele sahip. Araştırmacılar, kameraya konuşan bir sunucunun yanı sıra ağızı kapalı veya gözleri kapalı sunucunun çeşitli versiyonlarını da gösteriyorlar.Teknoloji, stokastik bir insandan 3 boyutlu harekete difüzyon modeli ve metinden görüntüye modelleri gibi yeni bir difüzyon tabanlı mimari ile çalışıyor. Bu yaklaşım, insan yüzlerinin ve vücutlarının üst düzey temsilleri aracılığıyla değişken uzunlukta yüksek kaliteli videoların oluşturulmasını sağlıyor.Ancak, teknolojinin mükemmel olmadığını belirtmek gerekir. Bazı örneklerde, ağız hareketlerinin doğallığından emin olunamıyor, bu da yapay zeka kullanıldığını işaret ediyor. Ancak, Google'ın modele daha fazla materyal ekledikçe bu durumun düzeleceği öngörülüyor.
Yapay Zeka
Yayınlanma: 23 Mart 2024 - 16:35
Google yeni yapay zeka Vlogger'ı tanıttı
Google, fotoğrafları canlandıran yeni bir yapay zeka olan "Vlogger"ı tanıttı. Google yapay zeka araştırmacıları, tek bir statik görüntüden insanların video görüntülerini oluşturmanın yolunu bulduklarını duyurdu. Bu teknoloji, metinden konuşan birinin videosunu oluşturmayı veya bir kişinin ağız hareketlerini değiştirerek farklı bir dildeki sesle eşleştirmeyi mümkün kılıyor.
Yapay Zeka
23 Mart 2024 - 16:35