AI çok güzel kedi fotoğrafları yapma berbat, açıkça Internet tüm noktasını özlüyor

Pin
Send
Share
Send

Yapay zeka (AI) son zamanlarda sıfırdan kedi fotoğrafları oluşturmaya çalıştı ve sonuçlar kedi astrofikti.

Bu özel sinir ağı (insan beyninin çalışmasından sonra modellenen bir AI türü), insan yüzlerinin şaşırtıcı derecede gerçekçi orijinal fotoğrafları üretebilir. Aslında, yapay makyaj programcıları arXiv Aralık öncesi yayın dergisine yayınlanan bir çalışmada, bu uydurma insanların görüntülerinin insan izleyicilerin gerçek insanların fotoğraflarından ayırt edilmesi neredeyse imkansızdı.

Bununla birlikte, kedigiller başka bir hikaye olduğunu kanıtladı. Kusursuz insan yüzlerini yaratan aynı algoritma, şekilsiz başlı kediler yarattı; yanlış sayıda göz ve bacak; ve çok uzun, çok kısa, alışılmadık şekilde çürümüş veya dikdörtgen şekilli ve tuhaf açılarda bükülmüş gövdeler.

Ürpertici kedi fotoğraflarını üreten AI motoru, "üretken çekişmeli ağlar için stil tabanlı bir jeneratör mimarisi" veya StyleGAN olarak bilinen şeydir. Çalışma, iki ağın aynı anda çalıştığı için bu tür ağların "düşmanca" olduğunu gösteriyor: Biri görüntüler üretiyor ve diğeri, bir eğitim veri kümesindeki fotoğraflara karşı sonuçları değerlendiriyor, böylece ağ hatalarından öğreniyor ve performansını geliştiriyor.

Yapay zekanın gerçekçi insan imajları üretmesi için, öncelikle insan yüzlerinin mevcut fotoğraflardan nasıl göründüğünü "öğrenmesi" gerekiyordu. Algoritma yüzleri kafa pozisyonu gibi bir stil özellikleri kontrol listesine girdi; Cinsiyet; ten rengi; saç dokusu ve stili; Araştırmacılar, gözlerin, burunların ve ağızların şeklini bildirdi.

StyleGAN, tüm bu unsurları - insan gözetimi olmadan - tanıyabildiğinde, yepyeni, foto-gerçekçi bir insan yüzü oluşturmak için onları bağımsız olarak birleştirmeyi öğrendi. Araştırmacılar bir röportaj isteğini reddetti, ancak süreçlerini 12 Aralık 2018'de Youtube'da yayınlanan bir videoda açıkladılar.

Peki, neden StyleGAN çok gerçekçi kedi fotoğrafları oluşturamadı? Sinir ağlarını eğiten, ancak sinir ağlarını eğiten bir araştırmacı olan Janelle Shane, algoritma, çalışmak zorunda olduğu şeyle elinden geleni yaptı - ve kediler söz konusu olduğunda, kullandığı binlerce referans görüntünün idealden daha az olduğunu söyledi. çalışma, Canlı Bilim anlattı.

Shane, 7 Şubat'taki AI Weirdness adlı blogunda tuhaf kediler hakkında yazdı. StyleGAN'ın, bedenlerin ve arka planların kırpıldığı ve kafa pozisyonlarının birbirine benzediği insan yüzlerinin fotoğraf veri setinden farklı olarak, veri setindeki kedi görüntüleri çılgınca değişiyordu. Koleksiyon, çeşitli ortamlarda ve farklı arka planlarda kedilerin yakın çekimlerini ve geniş çekimlerini içerir. Bazı fotoğraflarda bir kedi, bazılarında birden fazla kedi, diğerlerinde de insanlar vardı.

"Baş aşağı kediler var; bir topun içinde kıvrılmış kediler var; gözleri açık; gözleri kapalı. Kesinlikle giriş verilerinin biraz gürültülü olduğunu söyleyebilirsin - ve gürültülü, yani orada bir şeyler var bu sadece bir kedinin resmi değil, "dedi Shane.

Bu yüzden, NightGan kedileri için korkunç olan hayvanat bahçesi nedeniyle StyleGan'da çok zor olmayın.

"Algoritmanın öğrenmesi gereken çok daha fazlası var," diye ekledi Shane.

StyleGAN'ın fotogerçekçi insanları kusursuzken, sinir ağı kedigillerin toplanmasıyla mücadele etti. (İmaj kredisi: Nvidia)

Çelişkili görsel ipuçları, StyleGAN'ın gerçek bir kedinin neye benzemesi gerektiğini öğrenmesini zorlaştırdı. Sinir ağları, kendilerine verilen bilgiler için gerçek dünya bağlamına sahip değildir; tek bildikleri veri setlerinde ne var. StyleGAN, bir kedinin kürkü veya kedi kulağı şekli gibi küçük ölçekli ayrıntıları ve dokuları doğru bir şekilde üretmek için referans fotoğraflardan yeterince öğrendi. Ancak program açıkça tüm kediyi bir araya getirmekte zorlandı, dedi Shane.

“Sinir ağı kedilerin nasıl çalıştığını anlamıyor. Kaç bacağına sahip olduklarını anlamıyor. Kaç göze sahip oldukları veya tüm anatomilerinin nereye gittiğine dair net değil” dedi Live Science.

StyleGAN'ın rahatsız edici kedi fotoğraflarının, mükemmele yakın insan görüntülerinin ve diğer proje dosyalarının GitHub'daki daha fazlasını görün.

Pin
Send
Share
Send