Root NationHaberlerBT haberleriFigure AI, insansı AI robotunun yeni becerilerini gösterdi

Figure AI, insansı AI robotunun yeni becerilerini gösterdi

-

İnsansı robotların gelişimi son yirmi yılın büyük bölümünde yavaş bir hızda ilerledi ancak son zamanlarda bu alanda giderek daha fazla atılım görüyoruz. Geçtiğimiz günlerde yazdığımız gibi MWC 2024'te yapay zekalı bir robot tanıtıldı Amerikave bir başka gelişme, Ünite Ağacı H1, insansı robotlar arasında hız rekorunu kırdı. Ve şimdi de Figure AI ve OpenAI şirketleri arasındaki işbirliğinin muhteşem bir sonucu internette ortaya çıktı: artık insanlarla konuşabilen insansı bir robotun çarpıcı videosu.

Şekil Yapay Zeka ve OpenAI, yapay zekaya sahip yeni bir insansı robotu tanıttı

Startup Figure AI, Şekil 01 robotunun yeni Görsel Dil Modeli (VLM) ile çalıştığını gösteren bir video yayınladı. Resim 01, üzerinde bir tabak, bir elma ve bir fincan bulunan bir masanın başında durmaktadır. Sol tarafta bir kurutucu var. Ve bir kişinin robotun önünde ne gördüğü sorusuna masanın üzerinde yatan her şeyi detaylı bir şekilde anlatarak cevap veriyor.

Sonra adam bir şeyler yiyip yiyemeyeceğini soruyor ve robot cevap veriyor: "Elbette" ve sonra ustaca yumuşak bir hareketle elmayı alıp adama veriyor. Bundan sonra başka bir çarpıcı gösteri geliyor: Bir adam, Şekil 01'in önündeki sepetten buruşuk çöp döküyor ve robottan bunu neden yaptığını açıklamasını istiyor ve aynı zamanda çöpü sepette topluyor. Ve kağıdı çöpe geri koyarken "düşüncesini" açıklıyor. Robot, "Ben de sana bir elma verdim çünkü bu, sana masadan verebileceğim tek yenilebilir öğeydi" dedi.

Şirket temsilcileri, Şekil 01'in önceden eğitilmiş çok modlu bir model kullandığını açıkladı OpenAIGörüntüleri ve metinleri anlamak için VLM ve yanıtlarını oluşturmak için sesli komutlara güvenir. Bu, örneğin yazılı yönlendirmelere odaklanan OpenAI'nin GPT-4'ünden farklıdır.

Ayrıca şirketin "öğrenilmiş düşük seviyeli iki elle yapılan manipülasyonlar" olarak adlandırdığı şeyi de kullanıyor. Sistem, hareket kontrolü için sinir ağıyla hassas görüntü kalibrasyonunu (piksel seviyesine kadar) koordine eder. Figure AI yaptığı açıklamada, "Bu ağlar görüntüleri 10 Hz'de alıyor ve 24 Hz'de 200 DOF hareketleri (bilek pozları ve parmak eklem açıları) üretiyor" dedi.

Şirket, videodaki her davranışın sistem öğrenimine dayandığını, dolayısıyla sahne arkasındaki hiç kimsenin Şekil 01'in iplerini elinde tutmadığını iddia ediyor. Elbette bir nüans var - robotun bu prosedürden kaç kez geçtiği bilinmiyor. Belki yüzüncü kezdi bu da onun kesin hareketlerini açıklıyor. Ancak her durumda, bu başarı muhteşem ve biraz da fantastik görünüyor.

Ayrıca okuyun:

DzhereloTechRadar
Üye olmak
hakkında bilgilendir
konuk

0 Yorumlar
Gömülü İncelemeler
Tüm yorumları görüntüle