Yapay zekayla görsel oluşturma konusunda Google'ın pek iyi bir geçmişi yok. Yeni bir skandal çıktı Gemini'de yerleşik olarak insanların görüntülerini yanlış bir şekilde oluşturan ve ırklarını karıştıran bir görüntü oluşturucu nedeniyle. Pek çok şikayetin ardından teknoloji devi, yüz oluşturma fonksiyonunu kaldırdı ve "onarıma" gönderdi. Biz beklerken şirket, Vertex AI geliştirici platformunun bir parçası olarak gelişmiş bir görüntüleme aracı olan Imagen 2'yi piyasaya sürdü. Ancak bir nüans var; araç hâlâ işe odaklanıyor.

Imagen 2, DALL-E ve Midjourney'e benzer şekilde metin istemleriyle görseller oluşturabilir ve düzenleyebilir. Araç, metinleri, amblemleri ve logoları birden fazla dilde görüntüleyebilir ve isteğe bağlı olarak bu öğeleri kartvizit, giysi ve ürünler gibi mevcut görsellerin üzerine yerleştirebilir.

Önizleme modunda ilk kez başlatıldıktan sonra Imagen 2 ile görüntü düzenleme artık Vertex AI'de iki yeni özellik ile birlikte mevcut: boyama ve renklendirme. DALL-E dahil olmak üzere diğer popüler görüntü oluşturucular tarafından uzun süredir sunulan boyama ve renklendirme işlevleri, görüntünün istenmeyen kısımlarını kaldırmak, yeni bileşenler eklemek ve daha geniş bir görüntü alanı oluşturmak için görüntünün sınırlarını genişletmek için kullanılabilir. görüş.

Ancak Imagen 2'nin gerçek yükseltmesi şudur: Google "metnin canlı görüntülere dönüştürülmesi" olarak adlandırıyor. Araç artık yapay zeka destekli klip oluşturuculara benzer şekilde metin istemlerinden 4 saniyelik videolar oluşturabiliyor. Modelin kurumsal odağına uygun olarak Google, pazarlamacılar ve yaratıcılar için bir araç olarak, Imagen 2'nin mükemmel bir şekilde eğitildiği konular olan doğayı, yiyecekleri ve hayvanları sergileyen reklamcılık için bir GIF oluşturucu gibi canlı görüntüler sunuyor.

Google canlı görüntülerin "tutarlılığı korurken" "çeşitli açıları ve hareketleri" yakalayabileceğini iddia ediyor. Ancak şimdilik düşük bir çözünürlüğe sahipler: 360×640 ve şirket bunun gelecekte gelişeceğine söz verdi.

Google, deepfake olasılığına ilişkin endişeleri azaltmak için Imagen 2'nin, canlı görüntülere görünmez kriptografik filigranlar uygulamak için Google DeepMind tarafından geliştirilen özel SynthID teknolojisini kullanacağını söyledi. Sıkıştırma, filtreler ve renk tonu ayarlamaları da dahil olmak üzere düzenlemeye dayanıklıdırlar ancak bunları algılamak için ayrı bir araç gerekir.

Також Google canlı görüntülerin oluşturulmasının "güvenlik amacıyla test edileceğini" vurguluyor. “Vertex AI'deki Imagen 2 modeli, Gemini uygulamasıyla aynı sorunları yaşamadı. Şirket temsilcileri, müşterilerimizi aktif olarak test etmeye ve onlarla etkileşime girmeye devam ediyoruz" dedi.

Ayrıca okuyun:

Dzherelotechcrunch

Üye olmak

0 Yorumlar

Gömülü İncelemeler

Tüm yorumları görüntüle

Diğer makaleler

Google'ın AI aracı Imagen 2 artık 4 saniyelik videolar oluşturabiliyor

Son Yorumlar