İkizler Nedir: Google'ın yeni yapay zeka modeli hakkında her şey

08/02/2024 22:28

Google şimdiye kadarki en güçlü yapay zeka modelini piyasaya sürdü İkizler burcu. O nedir ve ne yapabilir? Makalemizdeki her şey hakkında.

Google yıllardır kendi yapay zeka araçlarını geliştiriyor. OpenAI'den ChatGPT-3'ün halka açık olarak piyasaya sürülmesiyle birlikte, dünyanın en popüler arama motorunu çalıştıran şirket de benzer bir araç olan Bard'ı yarattı. Ancak bu araç yine de Google'ın izin veremeyeceği rakiplere yenildi. Dolayısıyla sunum sırasında öğrendiğimiz, Google'ın yeni dil modeli Gemini'yi dünyanın yakın zamanda görmesi şaşırtıcı değil.

Sadece devin önceki LLM'sini (Büyük Dil Modeli) geliştirmek için değil, aynı zamanda metin işleme, grafik ve ses alanında tamamen yeni olanaklar sunmak için tasarlandı.

O halde gelin yeni Google Gemini dil modeline daha yakından bakalım.

Ayrıca ilginç: OpenAI Projesi S*: nedir ve proje neden endişe verici?

ZMİST

1. Google Gemini nedir?

2. Modeli kim yarattı?

3. Fırsatlar

4. Farklı versiyonları var mı?

5. Gemini'ye nasıl erişilir?

6. Gemini Google Bard'da: Ne değişecek?

7. Google Pixel akıllı telefonlarda Gemini

8. Gemini'nin GPT-4 gibi diğer yapay zeka modellerinden farkı nedir?

9. Doğruluk ve tarafsızlığa ilişkin endişeler

10 Gelecek İkizler'de

Google Gemini nedir?

Bu, Google'ın yalnızca metni değil aynı zamanda görselleri, videoları ve sesleri de anlayabilen yeni ve güçlü bir yapay zeka modelidir. Bu çok modlu model, matematik, fizik ve diğer alanlardaki karmaşık görevleri gerçekleştirebilmenin yanı sıra çeşitli programlama dillerinde yüksek kaliteli kodları anlayıp üretebilme yeteneği olarak tanımlanıyor.

Gemini şu anda Google Bard ve Google Pixel 8 ile entegrasyon yoluyla sunulmaktadır ve yavaş yavaş diğer Google hizmetlerine dahil edilecektir.

"Gemini, Google Araştırma'daki meslektaşlarımız da dahil olmak üzere Google ekipleri arasındaki büyük işbirlikçi çabanın sonucudur" — dedi Google DeepMind'ın CEO'su ve kurucu ortağı Dennis Hassabis. "Sıfırdan çok modlu olacak şekilde inşa edildi; bu, metin, kod, ses, görüntü ve video dahil olmak üzere farklı bilgi türlerini genelleştirebileceği ve kusursuz bir şekilde anlayabileceği, üzerinde çalışabileceği ve birleştirebileceği anlamına geliyor."

Ayrıca ilginç: AI dediğimiz her şey aslında yapay zeka değildir. İşte bilmeniz gerekenler

Modeli kim yarattı?

Muhtemelen zaten tahmin ettiğiniz gibi Gemini, Google ve Google'ın ana şirketi Alphabet tarafından oluşturuldu ve şirketin bugüne kadarki en gelişmiş yapay zeka modelidir. Google'ın DeepMind bölümü de gelişimine önemli katkılarda bulundu. Geliştirmeye kaç çalışanın katıldığı ve bunun için hangi fonların tahsis edildiği henüz bilinmiyor, ancak Google'ın yeteneklerini bildiğimiz için çok büyük bir miktar olduğundan emin olabiliriz.

Ayrıca ilginç: Windows 12: Yeni işletim sistemi ne olacak

Fırsatlar

Yukarıda belirttiğim gibi multimodal bir modeldir; yani metin, kod, ses, görüntü ve video dahil olmak üzere farklı veri türlerini anlayabilir, üzerinde çalışabilir ve birleştirebilir. Önceki yapay zeka sistemlerine göre daha iyi anlama, düşünme ve kodlama becerileri sağlar.

Modelin ana yetenekleri şunlardır:

Çeviri, özetleme ve diyalog gibi görevler için doğal dil işleme
Matematiksel düşünme ve problem çözme
Kod ve dokümantasyon oluşturma yeteneği
Görüntüleri, sesleri ve videoları anlama
Farklı alanlarda çoklu görev

Gördüğünüz gibi yetenekleri diğer modellere göre üstün.

Dil anlama, matematiksel düşünme ve kodlama testlerinde Gemini Ultra, GPT-4 gibi modellerden daha iyi performans gösterdi. Özellikle, Massive Multitask Language Understanding (MMLU) testinde insan düzeyindeki performansı geride bırakan ve %90'ın üzerinde doğruluk elde eden ilk modeldir.

Geniş bir dil modeli çalışmasının 32 akademik testinde Gemini, GPT-4'ten daha iyi performans gösterdi. 30 durumda Google'ın yeni dil modeli rakibinden daha iyiydi. Bu, modelin dili tam olarak anlama yeteneğini gösterir.

Ayrıca okuyun: İnsan Beyni Projesi: İnsan beynini taklit etme girişimi

Farklı versiyonları var mı?

Google, bu yapay zekayı Google veri merkezlerinden mobil cihazlara kadar her cihazda çalışabilecek esnek bir model olarak tanımlıyor. Bu ölçeklenebilirliğe ulaşmak için Gemini'nin üç versiyonu mevcuttur: Nano, Pro ve Ultra.

Gemini'nin farklı versiyonlarından daha detaylı bahsedelim.

İkizler Cüce: Akıllı telefonlarda, özellikle de Google Pixel 8'de çalışacak şekilde tasarlanmıştır. Sohbet programlarında yanıt önermek veya metin özetlemek gibi, harici sunuculara bağlanmadan yapay zeka tarafından verimli bir şekilde işlenmesini gerektiren görevleri gerçekleştirmek üzere tasarlanmıştır. Bu kompakt cihaz modelinde yaklaşık 6 milyar parametre bulunmaktadır.
İkizler Uzmanı: Google veri merkezlerinde çalışır. Pro, Bard AI sohbet robotunun en son sürümüyle çalışacak şekilde tasarlanmıştır. Hızlı yanıt süreleri sağlayabilir ve karmaşık sorguları anlayabilir. Orta boyutlu bir model yaklaşık 100 milyar parametreye sahiptir ve Bard'ın konuşmaya dayalı yapay zekasının temelini oluşturur. Pro, Google Cloud aracılığıyla satışa sunulacak.
İkizler Ultra: Ultra sürümü henüz yaygın olarak mevcut olmasa da Google, onu en iyi performans gösteren model olarak tanımlıyor ve "büyük dil modeli (LLM) araştırmasında kullanılan 30 yaygın olarak kullanılan akademik testin 32'u için mevcut en son teknolojiyi aşıyor." " En büyük ve en güçlü versiyon olan Ultra, 1 trilyondan fazla parametre alacak. Veri merkezlerinde yer alacaktır. Ultra kurumsal kullanıma uyarlanmıştır. Sürüm çok karmaşık görevleri gerçekleştirmek için tasarlanmıştır. Google, mevcut test aşamasının bitiminden sonra bunu yayınlamayı planlıyor. Yani en güçlü sürüm henüz kullanıcılara sunulmamıştır.

Ayrıca ilginç: Google Bard AI: Bilmeniz gereken her şey

Gemini'ye nasıl erişilir?

Yapay zekanın Nano ve Pro sürümleri artık sırasıyla Google Pixel 8 akıllı telefonlar ve Bard chatbot gibi Google ürünlerinde mevcut. Google, sonunda bunu arama motoruna, reklamlarına, Gmail e-posta hizmetine, Chrome tarayıcısına ve diğer hizmetlerine entegre etmeyi planlıyor.

Geliştiriciler ve kurumsal müşteriler, 13 Aralık 2023'ten itibaren Google AI Studio ve Google Cloud Vertex AI'deki Gemini API aracılığıyla Pro'ya erişebilecek. Geliştiriciler Android AICore aracılığıyla Nano versiyon modeline erken ön izlemede erişebilecek.

Ayrıca okuyun: Samsung Galaxy Flip5 vs Motorola Razr 40 Ultra: İki Yokozun'un Savaşı

Gemini Google Bard'da: Ne değişecek?

Sunum sırasında verilen bilgilere göre model, Google Bard'ın daha karmaşık sorunları daha iyi ele almasına olanak tanıyacak:

“Gemini'yi, model doğal olarak çok modlu olacak ve başlangıçtan itibaren birden fazla modalite üzerinde önceden eğitilmiş olacak şekilde tasarladık. Daha sonra performansı artırmak için daha fazla çok modlu veri ekleyerek onu geliştirdik. Sonuç olarak Gemini, önceki multimodal modellerden çok daha iyi bir şekilde anlar ve çıkarımlarda bulunur ve neredeyse tüm alanlarda en son teknolojiye sahip yeteneklere sahiptir.

Gemini'nin olağanüstü çok modlu yetenekleri, karmaşık metinsel ve görsel bilgileri anlamanıza yardımcı olur. Büyük veri kümelerinden belirli bilgilerin çıkarılması söz konusu olduğunda özellikle faydalıdırlar. Bu modelin yüz binlerce belgeyi okuyarak, filtreleyerek ve analiz ederek bilginin özünü çıkarma konusundaki olağanüstü yeteneği, şüphesiz bilimden finansa kadar çeşitli alanlarda yeni, ışık hızında keşiflere katkıda bulunacaktır."

Sunumda, bazılarının yeni verilere göre güncellenmesi gereken 200 binden fazla kayıt içeren karmaşık bir çalışmanın örneği gösterildi. Tahmin edebileceğiniz gibi, bunu manuel olarak yapmak çok zaman alıcı olurdu, bu nedenle çalışmanın yazarları girdiyi alan ve gerekli güncellemeleri yapan kodu hazırlamak için Gemini'yi kullandılar. Daha gerçek dünyaya ait bir başka örnek ise matematik veya fizik problemlerini açıklamak için Google'ın dil modelini kullanmaktır.

Buradaki girdi verileri, bir okul dersindeki bir ödevin fotoğrafı/taranmasıydı. Sistem, orada saklanan grafikleri ve metni işleyerek ödevin hangi bölümlerinin doğru yapıldığını ve hangilerinin daha fazla dikkat gerektirdiğini gösterebildi. Sunum, bir kullanıcının Gemini'den tekrar tekrar bir görevi açıklamasını isteyebileceğini ve sonraki her denemenin daha basit bir dille açıklanması gerektiğini gösterdi. Gemini'nin ne kadar doğru ve doğru olacağı elbette ilgilenenler tarafından kontrol edilecektir, ancak doğrudan fotoğraflardan metin okuma ve işleme yeteneği etkileyicidir. Sunum sırasında eklendiği üzere:

"Gemini'ye metinleri, görüntüleri, sesleri ve daha fazlasını aynı anda tanıması ve anlaması öğretildi. Bu sayede bilginin nüanslarını daha iyi anlıyor ve karmaşık soruları yanıtlayabiliyor. Özellikle matematik ve fizikle ilgili konuların açıklanmasında etkilidir, dolayısıyla kişisel ev ödevi yardımcısı olarak hizmet edebilir.".

Google Pixel akıllı telefonlarda Gemini

Google ayrıca Gemini'nin yeni TPUv5 yonga setleri hakkında "öğrendiği" ile övündü ve devin konuşma modelinin tüketici sürümünün yeni bir sürümü olan Bard Advanced'i kullanacak Gemini Ultra'yı 2024'ün başlarında tanıtmayı planlıyor. Gemini Ultra şu anda test aşamasındadır ve halihazırda seçkin güvenlik uzmanlarının kullanımına açıktır.

Son önemli bilgi ise Gemini'nin Google Pixel 8 akıllı telefonlara tanıtılması, diğer şeylerin yanı sıra mesajlaşma programlarındaki Gboard uygulaması aracılığıyla hızlı yanıtlar oluşturulmasına da olanak sağlayacak. Bunlardan ilki WhatsApp ama önümüzdeki yıl iletişimle ilgili diğer uygulamalarda da bu tür çözümler karşımıza çıkacak. Ancak Google, Pixel 8 akıllı telefonlar için birçok yeni AI aracını duyurduğundan bu yalnızca bir başlangıç ve bunlar gelecekte diğer bazı cihazlarda da kullanılabilecek. Android. Ancak bunlar daha ileri planlardır ve şu anda herhangi bir ayrıntı verilmemiştir.

Gemini'nin GPT-4 gibi diğer yapay zeka modellerinden farkı nedir?

Google'ın yeni Gemini modeli bugüne kadarki en büyük ve en gelişmiş yapay zeka modellerinden biri gibi görünüyor, ancak Ultra modelinin piyasaya sürülmesi bunu kesin olarak belirleyecek. Şu anda AI sohbet robotlarını kullanan diğer popüler modellerle karşılaştırıldığında Gemini, kendi multimodal özelliğiyle öne çıkarken, GPT-4 gibi diğer modeller, gerçekten multimodal olmak için eklentilere ve entegrasyona güveniyor.

Doğruluk ve tarafsızlığa ilişkin endişeler

Gemini, yapay zeka yeteneklerinin geliştirilmesinde ileriye doğru büyük bir adım olmasına rağmen, diğer büyük dil modelleriyle aynı eksikliklere sahiptir. Her şeyden önce bu, yanlış bilgi yaratma olasılığıdır. Önyargılar aynı zamanda yeni dil modelinde mevcut olan eğitim verilerine de dayanmaktadır. Gerçek dünyanın sınırlı anlayışından da bahsetmeye değer. Google, yeni Gemini modelinin hata yapabileceğini, kanıtlara dayanmayan gerçekleri sunabileceğini ve sağduyuyla çelişebileceğini kabul ediyor.

Özellikle henüz tam olarak keşfedilmemiş yeni yeteneklere sahip olan Gemini Ultra için daha fazla teste ihtiyaç var. Google, olası zararı en aza indirmek için Gemini'yi dikkatli bir şekilde değerlendirmeye kararlıdır.

Ayrıca ilginç: Hakkında her şey Microsoft Yardımcı pilot: gelecek mi yoksa yanlış yol mu?

Gelecek İkizler'de

Gemini'nin Google tarafından piyasaya sürülmesi, yapay zeka geliştirmede yeni bir çağ başlattı. Önceki modellere ve insan temellerine kıyasla en iyi performansıyla Gemini, yapay zekanın gelecekteki olanaklarına işaret ediyor ancak bazı eksikliklerin giderilmesi için hâlâ daha fazla araştırmaya ihtiyaç var.

Gelecekte Gemini'nin Google ürünlerinde daha kullanışlı ve akıllı özellikler sunmasını bekleyebilirsiniz. Şirket ileriye dönük olarak Gemini'yi İngilizcenin ötesine genişletmeye ve temel model metodolojisini geliştirmeye devam etmeyi planlıyor.

Yalnızca izleyebilir ve Google'ın ne yaptığını bilmesini umabiliriz.

Ayrıca okuyun:

paylaş

Yuri Svitlyk

Karpat Dağları'nın oğlu, tanınmayan matematik dehası, "avukat"Microsoft, pratik fedakar, sol-sağ

Sonraki makale Acer Predator Extreme elektrikli scooter'ı, yeni oyun monitörlerini ve dizüstü bilgisayarlarını duyurdu »

önceki makale « Homeworld 3'ün çıkışı Mayıs 2024'e ertelendi

Yorum bırak

Etiketler: GoogleseçilmişYapay zeka