"Mona Lisa" nın esrarengiz, boyalı gülümsemesi dünya çapında biliniyor, ancak bu ünlü yüz son zamanlarda yapay zekanın (AI) nezaketiyle şaşırtıcı yeni ifadeler yelpazesi sergiledi.
21 Mayıs'ta YouTube'da paylaşılan bir videoda, üç video klip dudaklarını hareket ettirip başını döndürürken Mona Lisa'nın rahatsız edici örneklerini gösteriyor. O, evrimsel bir sinir ağı tarafından yaratıldı - bir insan beyninin yaptığı gibi görüntüleri işleyen, görüntüleri analiz eden ve işleyen bir AI türü.
Araştırmacılar, yüz özelliklerinin genel şekillerini ve birbirlerine göre nasıl davrandıklarını anlamak ve daha sonra bu bilgileri hareketsiz görüntülere uygulamak için algoritmayı eğitti. Sonuç, tek bir kareden yeni yüz ifadelerinin gerçekçi bir video dizisidir.
Mona Lisa videoları için AI, üç insan deneğin veri kümelerinden yüz hareketini "öğrendi" ve üç farklı animasyon üretti. Üç klibin her biri hala Mona Lisa olarak tanınabilirken, eğitim modellerinin görünüm ve davranışlarındaki değişiklikler, "yaşayan portreler" e, Skolkovo Bilim ve Teknoloji Enstitüsü mühendisi Egor Zakharov'a farklı "kişilikler" kazandırdı ve Samsung AI Center (her ikisi de Moskova'da bulunuyor) videoda açıkladı.
Zakharov ve meslektaşları ayrıca Albert Einstein, Marilyn Monroe ve Salvador Dali gibi 20. yüzyıl kültürel simgelerinin fotoğraflarından animasyonlar üretti. Araştırmacılar, hakemli olmayan bulgularını 20 Mayıs'ta arXiv ön baskı dergisinde çevrimiçi yayınlanan bir çalışmada açıkladı.
Deepfakes olarak bilinen bu tür orijinal videolar üretmek kolay değildir. İnsan kafaları geometrik olarak karmaşık ve oldukça dinamiktir; Yazarların 3D modellerinde "on milyonlarca parametre" var.
Dahası, insan görme sistemi, 3D modelli insan kafalarındaki "küçük hataları bile" tanımlamada çok iyidir. Neredeyse insan gibi görünen bir şey görmek - ama tam olarak değil - tekinsiz vadi etkisi olarak bilinen derin bir rahatsızlık hissini tetikler.
AI daha önce inandırıcı deepfakes üretmenin mümkün olduğunu gösterdi, ancak istenen konunun çoklu açılarını gerektirdi. Yeni çalışma için, mühendisler yapay zekayı insan yüzlerini hareket halinde gösteren çok büyük bir referans video veri kümesine tanıttı. Bilim adamları, sinir ağına yüzlerin genel olarak nasıl davrandığını öğretmek için herhangi bir yüze uygulanacak yüz görülecek yerler kurdular.
Daha sonra, yapay zekanın kaynağının özelliklerinin hareketini haritalamak için referans ifadeleri kullanmak üzere eğitildiler. Araştırmacılar, bu, yapay zekanın çalışmak için sadece bir resmi olsa bile derin bir ayna oluşturmasını sağladı.
Ve daha fazla kaynak görüntü, son animasyonda daha da ayrıntılı bir sonuç verdi. Bilim adamları, sadece bir görüntüden ziyade 32 görüntüden oluşturulan videoların bir kullanıcı çalışmasında "mükemmel gerçekçilik" elde ettiğini yazdı.