Google I/O 2026'da Gemini Omni Flash tanıtıldı

Google, I/O 2026 konferansında metin, görsel, ses ve videoyu girdi olarak kabul eden çok modlu yapay zeka modeli Gemini Omni Flash'ı tanıttı; model video oluşturmanın yanı sıra doğal dil komutlarıyla düzenleme de yapabiliyor.

Google, Google I/O 2026 geliştirici konferansında yeni nesil çok modlu yapay zeka modeli Gemini Omni Flash'ı tanıttı. Şirketin "her şeyden her şey üret" vizyonuyla geliştirdiği model, metin, görsel, ses ve video girdilerini aynı anda işleyerek yüksek kaliteli video çıktısı üretiyor. Model bugün itibarıyla Gemini uygulaması, YouTube Shorts ve yaratıcı stüdyo platformu Flow üzerinden kullanıma açıldı.

Google CEO'su Sundar Pichai, modeli yapay zekanın metin tahmini aşamasından gerçekliği simüle etme aşamasına geçişinin bir sonraki adımı olarak nitelendirdi. Google DeepMind Baş Teknoloji Sorumlusu Koray Kavukcuoglu, bir medya brifinginde verdiği örnekte, sisteme yalnızca "protein kıvrımlanmasını anlatan kil animasyonu" şeklinde kısa bir komut verildiğinde modelin kendi seslendirmesiyle eksiksiz bir stop-motion açıklama videosu ürettiğini aktardı. Google DeepMind ürün yönetimi direktörü Nicole Brichtova ise yeni modelin mevcut video üretici Veo'nun bir güncellemesi değil, Gemini'nin zekasıyla medya modellerinin render kapasitesini birleştiren bambaşka bir adım olduğunu belirtti.

Video düzenleme artık konuşma diliyle mümkün

Gemini Omni Flash, video üretimini tek seferlik bir işlem olmaktan çıkarıyor. Kullanıcılar, sahne oluşturduktan sonra sıradan cümlelerle düzenleme talimatı verebiliyor; her yeni komut bir öncekinin üzerine inşa ediliyor ve karakterler ile sahnedeki öğeler tutarlı kalıyor. Model, bir sahnenin ortamını, kamera açısını, aksiyonunu ya da stilini değiştirebildiği gibi durağan görüntülere hareket de katabiliyor. Google, modelin yerçekimi, kinetik enerji ve akışkan dinamiği gibi fizik kurallarını daha doğru yorumladığını ve bu sayede yapay zeka videolarındaki yapay görünümün azaldığını vurguluyor. İlk aşamada 10 saniyelik video üretimi destekleniyor; Brichtova bunun teknik bir kısıt değil, kullanıcı alışkanlıklarına dayalı bilinçli bir tercih olduğunu, daha uzun sürelerin yakın vadede geleceğini ifade etti.

Modelin dikkat çeken bir diğer özelliği, kişisel dijital avatar oluşturma. Personal Avatars adıyla duyurulan program kapsamında kullanıcılar, Flow hesap ayarları üzerinden bir QR kod okutarak kayıt sürecini başlatıyor; belirli sayı dizilerini yüksek sesle okuyup başlarını farklı açılara çevirerek sistem hem yüzlerini hem seslerini çok açılı biçimde analiz ediyor ve bir dijital kopya oluşturuyor. Bu kopya, yapay zeka videolarına yerleştirilebiliyor. Şu aşamada yalnızca kişinin kendi avatarını oluşturmasına izin verilen sistem, başka kişilerin kopyalarını üretmeye kapalı tutuluyor.

Güvenlik önlemleri ve erişim koşulları

Google, kötüye kullanım riskine karşı Gemini Omni ile üretilen tüm videolara SynthID dijital filigranını otomatik olarak ekliyor. Şirket ayrıca C2PA içerik doğrulama standartlarını genişlettiğini ve yalnızca Google modellerini değil farklı yapay zeka platformlarından gelen içerikleri de tarayabilen yeni bir AI Content Detection API geliştirdiğini duyurdu. Ses ve konuşma düzenlemeleri ise sorumlu kullanım süreçleri tamamlanana kadar genel kullanıma açılmıyor.

Gemini Omni Flash şu an yalnızca Google'ın ücretli abonelik planlarına sahip kullanıcılara açık; Google AI Plus aylık 20 dolardan, yeni duyurulan AI Ultra paketi ise 100 dolardan başlıyor. Geliştiriciler için Gemini API, Google AI Studio ve Vertex AI üzerinden erişim ise önümüzdeki haftalarda açılacak; bu kanallardaki fiyatlandırma henüz açıklanmadı. Modelin şu an için Türkçe komutları desteklemediği de not düşülmesi gereken bir ayrıntı.