Teknoloji devi Microsoft, bir kişinin yüzünün hareketsiz bir görüntüsünü, konuştuğu ve hatta şarkı söylediği animasyonlu bir videoya dönüştüren yeni bir dudak senkronizasyonu sağlayan VASA-1 yapay zeka aracını tanıttı. İşte detaylar
VASA-1 ile fotoğraflar videoya dönüştürülebiliyor
Microsoft, araştırma duyuru sayfasındaki bir gönderide, dudak hareketlerini ses ile senkronize edebilen ve aynı zamanda geniş yüz nüansları ve doğal kafa hareketlerini yakalayabilen yeni AI modelini duyurdu. VASA-1 adı verilen bu yapay zeka aracının, gerçekçi yüz ve kafa dinamikleri ile yüksek video kalitesinde içerik sunabildiği iddia ediliyor. Model, 40 fps’ye kadar 512 x 512 videoları destekliyor ve 1 dakikaya kadar videolar oluşturulabiliyor.
Aynı zamanda AI modeli; kullanıcılara ana göz bakış yönü, kafa mesafesi ve daha fazlası gibi videoların farklı özelliklerini ayarlamalarına olanak sağlamak için ayrıntılı kontrol sunuyor. Çözük görünüm, 3D kafa pozu ve yüz dinamikleri üzerindeki bu kontroller, daha efektif sonuçlar elde etmenizi mümkün kılıyor.
VASA-1, farklı türde fotoğraf ve ses girişlerini işleme yeteneğine de sahip. Örneğin; sanatsal fotoğrafları, şarkı seslerini ve İngilizce dışındaki konuşmaları da işleyebiliyor. Ancak Microsoft, VASA-1’in herkese açık olmayacağını duyurdu ve bu bağlamda teknolojiyi bağımsız bir ürün veya API olarak yayınlamak yerine gerçekçi sanal karakterler oluşturmak için kullanacağını belirtti. Bu karar, Microsoft’un etik yapay zeka uygulamalarına ziyadesiyle önem vermesinden dolayı kaynaklanıyor.
Peki, siz bu konu hakkında ne düşünüyorsunuz? Görüşlerinizi bizimle yorumlar kısmından paylaşabilirsiniz.