Google şimdiye kadarki en güçlü yapay zeka modelini piyasaya sürdü İkizler burcu. O nedir ve ne yapabilir? Makalemizdeki her şey hakkında.
Google yıllardır kendi yapay zeka araçlarını geliştiriyor. OpenAI'den ChatGPT-3'ün halka açık olarak piyasaya sürülmesiyle birlikte, dünyanın en popüler arama motorunu çalıştıran şirket de benzer bir araç olan Bard'ı yarattı. Ancak bu araç yine de Google'ın izin veremeyeceği rakiplere yenildi. Dolayısıyla sunum sırasında öğrendiğimiz, Google'ın yeni dil modeli Gemini'yi dünyanın yakın zamanda görmesi şaşırtıcı değil.
Sadece devin önceki LLM'sini (Büyük Dil Modeli) geliştirmek için değil, aynı zamanda metin işleme, grafik ve ses alanında tamamen yeni olanaklar sunmak için tasarlandı.
O halde gelin yeni Google Gemini dil modeline daha yakından bakalım.
Ayrıca ilginç: OpenAI Projesi S*: nedir ve proje neden endişe verici?
Bu, Google'ın yalnızca metni değil aynı zamanda görselleri, videoları ve sesleri de anlayabilen yeni ve güçlü bir yapay zeka modelidir. Bu çok modlu model, matematik, fizik ve diğer alanlardaki karmaşık görevleri gerçekleştirebilmenin yanı sıra çeşitli programlama dillerinde yüksek kaliteli kodları anlayıp üretebilme yeteneği olarak tanımlanıyor.
Gemini şu anda Google Bard ve Google Pixel 8 ile entegrasyon yoluyla sunulmaktadır ve yavaş yavaş diğer Google hizmetlerine dahil edilecektir.
"Gemini, Google Araştırma'daki meslektaşlarımız da dahil olmak üzere Google ekipleri arasındaki büyük işbirlikçi çabanın sonucudur" — dedi Google DeepMind'ın CEO'su ve kurucu ortağı Dennis Hassabis. "Sıfırdan çok modlu olacak şekilde inşa edildi; bu, metin, kod, ses, görüntü ve video dahil olmak üzere farklı bilgi türlerini genelleştirebileceği ve kusursuz bir şekilde anlayabileceği, üzerinde çalışabileceği ve birleştirebileceği anlamına geliyor."
Ayrıca ilginç: AI dediğimiz her şey aslında yapay zeka değildir. İşte bilmeniz gerekenler
Muhtemelen zaten tahmin ettiğiniz gibi Gemini, Google ve Google'ın ana şirketi Alphabet tarafından oluşturuldu ve şirketin bugüne kadarki en gelişmiş yapay zeka modelidir. Google'ın DeepMind bölümü de gelişimine önemli katkılarda bulundu. Geliştirmeye kaç çalışanın katıldığı ve bunun için hangi fonların tahsis edildiği henüz bilinmiyor, ancak Google'ın yeteneklerini bildiğimiz için çok büyük bir miktar olduğundan emin olabiliriz.
Ayrıca ilginç: Windows 12: Yeni işletim sistemi ne olacak
Yukarıda belirttiğim gibi multimodal bir modeldir; yani metin, kod, ses, görüntü ve video dahil olmak üzere farklı veri türlerini anlayabilir, üzerinde çalışabilir ve birleştirebilir. Önceki yapay zeka sistemlerine göre daha iyi anlama, düşünme ve kodlama becerileri sağlar.
Modelin ana yetenekleri şunlardır:
Gördüğünüz gibi yetenekleri diğer modellere göre üstün.
Dil anlama, matematiksel düşünme ve kodlama testlerinde Gemini Ultra, GPT-4 gibi modellerden daha iyi performans gösterdi. Özellikle, Massive Multitask Language Understanding (MMLU) testinde insan düzeyindeki performansı geride bırakan ve %90'ın üzerinde doğruluk elde eden ilk modeldir.
Geniş bir dil modeli çalışmasının 32 akademik testinde Gemini, GPT-4'ten daha iyi performans gösterdi. 30 durumda Google'ın yeni dil modeli rakibinden daha iyiydi. Bu, modelin dili tam olarak anlama yeteneğini gösterir.
Ayrıca okuyun: İnsan Beyni Projesi: İnsan beynini taklit etme girişimi
Google, bu yapay zekayı Google veri merkezlerinden mobil cihazlara kadar her cihazda çalışabilecek esnek bir model olarak tanımlıyor. Bu ölçeklenebilirliğe ulaşmak için Gemini'nin üç versiyonu mevcuttur: Nano, Pro ve Ultra.
Gemini'nin farklı versiyonlarından daha detaylı bahsedelim.
Ayrıca ilginç: Google Bard AI: Bilmeniz gereken her şey
Yapay zekanın Nano ve Pro sürümleri artık sırasıyla Google Pixel 8 akıllı telefonlar ve Bard chatbot gibi Google ürünlerinde mevcut. Google, sonunda bunu arama motoruna, reklamlarına, Gmail e-posta hizmetine, Chrome tarayıcısına ve diğer hizmetlerine entegre etmeyi planlıyor.
Geliştiriciler ve kurumsal müşteriler, 13 Aralık 2023'ten itibaren Google AI Studio ve Google Cloud Vertex AI'deki Gemini API aracılığıyla Pro'ya erişebilecek. Geliştiriciler Android AICore aracılığıyla Nano versiyon modeline erken ön izlemede erişebilecek.
Ayrıca okuyun: Samsung Galaxy Flip5 vs Motorola Razr 40 Ultra: İki Yokozun'un Savaşı
Sunum sırasında verilen bilgilere göre model, Google Bard'ın daha karmaşık sorunları daha iyi ele almasına olanak tanıyacak:
“Gemini'yi, model doğal olarak çok modlu olacak ve başlangıçtan itibaren birden fazla modalite üzerinde önceden eğitilmiş olacak şekilde tasarladık. Daha sonra performansı artırmak için daha fazla çok modlu veri ekleyerek onu geliştirdik. Sonuç olarak Gemini, önceki multimodal modellerden çok daha iyi bir şekilde anlar ve çıkarımlarda bulunur ve neredeyse tüm alanlarda en son teknolojiye sahip yeteneklere sahiptir.
Gemini'nin olağanüstü çok modlu yetenekleri, karmaşık metinsel ve görsel bilgileri anlamanıza yardımcı olur. Büyük veri kümelerinden belirli bilgilerin çıkarılması söz konusu olduğunda özellikle faydalıdırlar. Bu modelin yüz binlerce belgeyi okuyarak, filtreleyerek ve analiz ederek bilginin özünü çıkarma konusundaki olağanüstü yeteneği, şüphesiz bilimden finansa kadar çeşitli alanlarda yeni, ışık hızında keşiflere katkıda bulunacaktır."
Sunumda, bazılarının yeni verilere göre güncellenmesi gereken 200 binden fazla kayıt içeren karmaşık bir çalışmanın örneği gösterildi. Tahmin edebileceğiniz gibi, bunu manuel olarak yapmak çok zaman alıcı olurdu, bu nedenle çalışmanın yazarları girdiyi alan ve gerekli güncellemeleri yapan kodu hazırlamak için Gemini'yi kullandılar. Daha gerçek dünyaya ait bir başka örnek ise matematik veya fizik problemlerini açıklamak için Google'ın dil modelini kullanmaktır.
Buradaki girdi verileri, bir okul dersindeki bir ödevin fotoğrafı/taranmasıydı. Sistem, orada saklanan grafikleri ve metni işleyerek ödevin hangi bölümlerinin doğru yapıldığını ve hangilerinin daha fazla dikkat gerektirdiğini gösterebildi. Sunum, bir kullanıcının Gemini'den tekrar tekrar bir görevi açıklamasını isteyebileceğini ve sonraki her denemenin daha basit bir dille açıklanması gerektiğini gösterdi. Gemini'nin ne kadar doğru ve doğru olacağı elbette ilgilenenler tarafından kontrol edilecektir, ancak doğrudan fotoğraflardan metin okuma ve işleme yeteneği etkileyicidir. Sunum sırasında eklendiği üzere:
"Gemini'ye metinleri, görüntüleri, sesleri ve daha fazlasını aynı anda tanıması ve anlaması öğretildi. Bu sayede bilginin nüanslarını daha iyi anlıyor ve karmaşık soruları yanıtlayabiliyor. Özellikle matematik ve fizikle ilgili konuların açıklanmasında etkilidir, dolayısıyla kişisel ev ödevi yardımcısı olarak hizmet edebilir.".
Google ayrıca Gemini'nin yeni TPUv5 yonga setleri hakkında "öğrendiği" ile övündü ve devin konuşma modelinin tüketici sürümünün yeni bir sürümü olan Bard Advanced'i kullanacak Gemini Ultra'yı 2024'ün başlarında tanıtmayı planlıyor. Gemini Ultra şu anda test aşamasındadır ve halihazırda seçkin güvenlik uzmanlarının kullanımına açıktır.
Son önemli bilgi ise Gemini'nin Google Pixel 8 akıllı telefonlara tanıtılması, diğer şeylerin yanı sıra mesajlaşma programlarındaki Gboard uygulaması aracılığıyla hızlı yanıtlar oluşturulmasına da olanak sağlayacak. Bunlardan ilki WhatsApp ama önümüzdeki yıl iletişimle ilgili diğer uygulamalarda da bu tür çözümler karşımıza çıkacak. Ancak Google, Pixel 8 akıllı telefonlar için birçok yeni AI aracını duyurduğundan bu yalnızca bir başlangıç ve bunlar gelecekte diğer bazı cihazlarda da kullanılabilecek. Android. Ancak bunlar daha ileri planlardır ve şu anda herhangi bir ayrıntı verilmemiştir.
Google'ın yeni Gemini modeli bugüne kadarki en büyük ve en gelişmiş yapay zeka modellerinden biri gibi görünüyor, ancak Ultra modelinin piyasaya sürülmesi bunu kesin olarak belirleyecek. Şu anda AI sohbet robotlarını kullanan diğer popüler modellerle karşılaştırıldığında Gemini, kendi multimodal özelliğiyle öne çıkarken, GPT-4 gibi diğer modeller, gerçekten multimodal olmak için eklentilere ve entegrasyona güveniyor.
Gemini, yapay zeka yeteneklerinin geliştirilmesinde ileriye doğru büyük bir adım olmasına rağmen, diğer büyük dil modelleriyle aynı eksikliklere sahiptir. Her şeyden önce bu, yanlış bilgi yaratma olasılığıdır. Önyargılar aynı zamanda yeni dil modelinde mevcut olan eğitim verilerine de dayanmaktadır. Gerçek dünyanın sınırlı anlayışından da bahsetmeye değer. Google, yeni Gemini modelinin hata yapabileceğini, kanıtlara dayanmayan gerçekleri sunabileceğini ve sağduyuyla çelişebileceğini kabul ediyor.
Özellikle henüz tam olarak keşfedilmemiş yeni yeteneklere sahip olan Gemini Ultra için daha fazla teste ihtiyaç var. Google, olası zararı en aza indirmek için Gemini'yi dikkatli bir şekilde değerlendirmeye kararlıdır.
Ayrıca ilginç: Hakkında her şey Microsoft Yardımcı pilot: gelecek mi yoksa yanlış yol mu?
Gemini'nin Google tarafından piyasaya sürülmesi, yapay zeka geliştirmede yeni bir çağ başlattı. Önceki modellere ve insan temellerine kıyasla en iyi performansıyla Gemini, yapay zekanın gelecekteki olanaklarına işaret ediyor ancak bazı eksikliklerin giderilmesi için hâlâ daha fazla araştırmaya ihtiyaç var.
Gelecekte Gemini'nin Google ürünlerinde daha kullanışlı ve akıllı özellikler sunmasını bekleyebilirsiniz. Şirket ileriye dönük olarak Gemini'yi İngilizcenin ötesine genişletmeye ve temel model metodolojisini geliştirmeye devam etmeyi planlıyor.
Yalnızca izleyebilir ve Google'ın ne yaptığını bilmesini umabiliriz.
Ayrıca okuyun:
Yorum bırak