Yapay zeka artık fotoğrafları konuşturabiliyor, çok tehlikeli bir noktaya geldik

Microsoft, yapay zeka teknolojisi sayesinde sabit fotoğraflardan kişilerin konuştuğu veya şarkı söylediği gerçekçi videolar yaratma imkanı sunuyor. Bu yenilik, dijital içerik üretimini nasıl dönüştürebileceğine dair heyecan verici örnekler arasında.

Yapay zeka artık fotoğrafları konuşturabiliyor, çok tehlikeli bir noktaya geldik

Microsoft Research Asia tarafından geliştirilen VASA-1 isimli yeni bir yapay zeka aracı tanıtıldı. Bu araç, bir kişinin fotoğrafını ya da çizimini alarak ve mevcut bir ses dosyasını kullanarak, gerçek zamanlı olarak gerçekçi bir konuşan yüz oluşturabiliyor. Araç, mevcut bir fotoğraf için yüz ifadeleri ve baş hareketleri üretebiliyor ve bir konuşma veya şarkıyla uyumlu dudak hareketlerini senkronize edebiliyor. Araştırmacılar, projenin sayfasında birçok örnek yayınladı ve sonuçlar o kadar başarılı ki insanları gerçek olduklarına inandırabilir.

Ancak, örneklerdeki dudak ve baş hareketleri yakından incelendiğinde biraz robotik ve senkronizasyon dışı görünebilir. Bununla birlikte, teknolojinin kötüye kullanılabileceği açıkça görülüyor; özellikle de gerçek kişilerin deepfake videolarını kolayca ve hızlı bir şekilde oluşturmak için kullanılabilir. Araştırmacılar bu potansiyelin farkındalar ve teknolojilerinin "sorumlu bir şekilde ve uygun düzenlemelere uygun olarak kullanılacağından" emin olana kadar "çevrimiçi bir demo, API, ürün, ek uygulama detayları veya ilgili herhangi bir teklifi" yayınlamama kararı aldılar. Kötü niyetli kişilerin bu teknolojiyi kötü amaçlar için, örneğin deepfake pornografi veya yanıltıcı bilgi kampanyaları oluşturmak için kullanmalarını önlemek için belirli güvenlik önlemlerini uygulayıp uygulamayacaklarını ise belirtmediler.

Yapay zeka artık fotoğrafları konuşturabiliyor, çok tehlikeli bir noktaya geldik

Araştırmacılar, teknolojinin kötüye kullanım potansiyeline rağmen birçok faydası olduğuna inanıyorlar. Teknolojinin, eğitimde eşitliği artırma ve iletişim zorlukları çeken kişilere yardımcı olma potansiyeline sahip olduğunu, hatta bu kişilere kendileri için konuşabilecek bir avatar sağlayarak erişilebilirliği iyileştirebileceğini belirtiyorlar. Ayrıca, ihtiyacı olan kişilere arkadaşlık ve terapötik destek sağlama imkanı da sunuyorlar. VASA-1'in, insanlarla konuşabilecek yapay zeka karakterlerine erişim sunan programlarda kullanılabileceği ima ediliyor.

Announcement ile birlikte yayınlanan makaleye göre, VASA-1, YouTube videolarından çıkarılan "6,112 ünlü için 1 milyondan fazla söylem" içeren VoxCeleb2 Veri Seti üzerinde eğitildi. Araç gerçek yüzler üzerinde eğitilmiş olmasına rağmen sanatsal fotoğraflarda da işe yarar; araştırmacılar bunu, Anne Hathaway'in viral Lil Wayne şarkısı "Paparazzi" yorumu ile birleştirilmiş Mona Lisa'nın fotoğrafı üzerinde eğlenceli bir şekilde gösterdi. Bu, teknolojinin olumlu yönlerine şüpheyle yaklaşanlar için bile izlenmeye değer.