Yeni Çin'li yapay zeka : Omnihuman

Sefa Akbudak

Asistan
Yönetici
Süper Moderatör
Katılım
12 Aralık 2024
Mesajlar
207
Reaksiyon puanı
26
Puanları
28
Yaş
23
Omnihuman nedir ?

OmniHuman, tek bir insan görüntüsü ve hareket sinyalleri (ses, video veya ikisinin kombinasyonu) kullanarak insan videoları üretebilen bir yapay zeka.İnsan hareketlerini tarar ve buna göre fotografı bir animasyona dönüştürüyor. Bu, önceki uçtan uca yaklaşımların yüksek kaliteli veri kıtlığı sorununu aşar. OmniHuman, özellikle ses gibi zayıf sinyal girdilerine dayalı son derece gerçekçi insan videoları üreterek mevcut yöntemleri önemli ölçüde geride bırakmakta. Portre, yarım vücut veya tam vücut görüntüleri gibi herhangi bir en boy oranına sahip görüntü girişini destekler ve çeşitli senaryolarda daha gerçekçi ve yüksek kaliteli sonuçlar sunar.


overall.png




Neler yapabiliyor ?

1. Tek Bir Fotoğraftan Video Üretimi:
OmniHuman, sadece bir fotoğraftan yola çıkarak bir insanın videosunu oluşturabilir. Bu, statik bir görüntüden dinamik ve hareketli bir video elde etmek anlamına geliyor.

2. Çoklu Modalite Desteği: Model, farklı türde hareket sinyallerini girdi olarak alabilir. Örneğin, sadece bir ses kaydı kullanarak, o sese uygun mimikler ve vücut hareketleri olan bir video oluşturabilir. Aynı şekilde, bir video ve bir ses kaydını birleştirerek, daha zengin ve uyumlu bir video üretebilir.

3. Gerçekçi Sonuçlar: OmniHuman, ürettiği videoların gerçekçiliğiyle dikkat çekiyor. İnsanların doğal hareketlerini, mimiklerini ve vücut dilini doğru bir şekilde taklit edebilir. Özellikle ses girdisiyle uyumlu dudak hareketleri ve ifadeler konusunda oldukça başarılı.

4. Farklı Görüntü Formatlarını Destekleme: Model, farklı en boy oranlarına sahip insan fotoğraflarını (portre, yarım vücut, tam vücut vb.) girdi olarak alabilir. Bu, farklı çekim türlerinde ve pozisyonlarda fotoğraflardan video üretme esnekliği sağlıyor.

5. Zayıf Sinyal Girdileriyle Çalışabilme: OmniHuman, özellikle ses gibi zayıf sinyal girdilerinden bile anlamlı ve gerçekçi videolar üretebilir. Bu, modelin çeşitli senaryolarda ve farklı kalitedeki girdilerle başarılı bir şekilde çalışabileceğini gösterir.

6. Yüksek Kaliteli Video Üretimi: Model, yüksek kalitede ve detaylı insan videoları üretebilir. Bu, videoların daha gerçekçi ve etkileyici görünmesini sağlar.

Omnihuman neler yaptı ?

https://omnihuman-lab.github.io/video/main1.mp4


 
Üst