Root NationHaberlerBT haberleriMicrosoft insan düzeyinde yapay zekaya giden yolu açan çok modlu bir yaklaşım sundu

Microsoft insan düzeyinde yapay zekaya giden yolu açan çok modlu bir yaklaşım sundu

-

Bu haftanın başında araştırmacılar Microsoft İçerik için görüntüleri analiz edebilen, görsel bulmacaları çözebilen, görsel metin tanıma gerçekleştirebilen, görsel IQ testleri yapabilen ve doğal dil talimatlarını anlayabilen çok modlu bir yapay zeka modeli olan Kosmos-1'i sundu. Araştırmacılara göre bu tür yapay zeka modelleri, insan düzeyinde ortak görevleri yerine getirebilecek bir yapay genel zeka (AI) yaratmaya yönelik ilk adımdır. Yani bu teknoloji herhangi bir entelektüel görevde kişinin yerini alabilecektir. Ve bu, önemli bir iş ortağı olan OpenAI'nin belirtilen hedefidir. Microsoft yapay zeka alanında.

Kozmos-1

Bu durumda Kosmos-1 şirketin tamamen kişisel bir gelişimidir Microsoft. Araştırmacılar, yaratımlarını "çok modlu geniş dil modeli" (MLLM) olarak adlandırıyor çünkü bunun kökleri, ChatGPT gibi LLM gibi salt metinden oluşan doğal dil işlemede yatıyor. Modelin girdi görüntülerini kabul edebilmesi için, araştırmacıların öncelikle görüntüleri LLM'nin anlayabileceği özel bir dizi simgeye (çoğunlukla metin) dönüştürmesi gerekir.

Kozmos-1

Kosmos-1, The Pile (800 GB İngilizce metin kaynağı) ve Common Crawl'dan alıntılar da dahil olmak üzere İnternet'ten alınan bir veritabanı üzerinde eğitildi. Model daha sonra konuşmayı anlama, konuşma oluşturma, optik karakter tanıma olmadan metin sınıflandırma, görüntü altyazılama, görsel soru yanıtlama, web sayfası soru yanıtlama ve yerelleştirme ile görüntü sınıflandırma için çeşitli testlerle test edildi. Buna göre MicrosoftKosmos-1, bu testlerin çoğunda mevcut modellerden daha iyi performans gösterdi.

Kozmos-1

Bir dizi şekil sunarak ve deneğin diziyi tamamlamasını isteyerek görsel IQ'yu ölçen Raven's Progressive Reasoning testi özellikle ilginçti. Kosmos-1, vakaların %22'sinde doğru cevabı verebildi.

Kozmos-1

Gelecekteki optimizasyonla birlikte daha da önemli sonuçlar verebilecek olan bu erken adımlar, yapay zeka modellerinin her tür medyayı algılamasına ve etkilemesine izin vererek yapay asistanların yeteneklerini büyük ölçüde genişletebilir.

Ayrıca okuyun:

DzhereloArstechnica
Üye olmak
hakkında bilgilendir
konuk

0 Yorumlar
Gömülü İncelemeler
Tüm yorumları görüntüle