Kategoriler: BT haberleri

Yapay zeka şirketleri, doğrudan yasaklara aykırı olarak kitle iletişim sitelerinden veri topluyor

Ürününü "yapay zekaya sahip ücretsiz arama motoru" olarak tanımlayan Perplexity, son günlerde eleştirilerin hedefi oluyor. Forbes'un makalesini çalmak ve birden fazla platformda yeniden yayınlamakla suçlamasından kısa bir süre sonra Wired, Perplexity'nin Robot Hariç Tutma Protokolü'nü veya robots.txt'yi göz ardı ettiğini ve makalelerini kendi sitesinden ve diğer Condé Nast yayınlarından kaldırdığını bildirdi. Teknoloji sitesi The Shortcut da AI şirketini makalelerini kaldırmakla suçladı. Şimdi Reuters, Perplexity'nin robots.txt dosyalarını atlayan ve daha sonra teknolojisini eğitmek için kullandığı içerik için web sitelerini tarayan tek yapay zeka şirketi olmadığını ortaya çıkardı.

Reuters, lisans anlaşmalarına girebilmeleri için onları yapay zeka firmalarıyla buluşturan bir girişim olan TollBit'ten yayıncılara hitaben bir mektup gördüğünü bildirdi ve onları "çeşitli kaynaklardan (sadece bir şirketten değil) yapay zeka ajanlarının atlamaya karar verdiği konusunda uyardı." sitelerden içerik almak için robots.txt protokolü." Robots.txt dosyası, arama robotlarının hangi sayfalara erişip erişemeyeceğine ilişkin talimatlar içerir. Web geliştiricileri bu protokolü 1994'ten beri kullanıyor ancak buna bağlılık tamamen isteğe bağlı.

TollBit'in mektubunda hiçbir şirketin adı belirtilmedi ancak Business Insider, ChatGPT ve Claude sohbet robotlarının yapımcıları OpenAI ve Anthropic'in de robots.txt sinyallerini atladığını öğrendiğini söylüyor. Her iki şirket de daha önce web sitelerinin robots.txt dosyalarına yerleştirdiği "tarama yapma" talimatlarına uyduklarını belirtmişti.

Wired, araştırması sırasında Amazon sunucusundaki "kesinlikle Perplexity tarafından işletilen" bir makinenin web sitesinin robots.txt talimatlarını atladığını tespit etti. Wired, Perplexity'nin içeriğini temizlediğini doğrulamak için şirketin makalelerindeki araç başlıklarını veya hikayelerini anlatan kısa ipuçlarını kullandı. Aracın, makalelerini "minimum atıfla" doğru bir şekilde yeniden ifade eden sonuçlar ürettiği bildirildi. Hatta bazen makaleler için hatalı özetler bile oluşturabiliyordu. Wired, chatbotun bir vakada suç işleyen belirli bir Kaliforniya polis memuru hakkında haber yaptığını iddia ettiğini söylüyor.

Perplexity CEO'su Aravind Srinivas, Fast Company ile yaptığı röportajda yayına, şirketinin "Robot Hariç Tutma Protokolünü göz ardı etmediğini ve ardından bu konuda yalan söylemediğini" söyledi. Ancak bu, protokolü göz ardı eden botlardan faydalanmayacağı anlamına gelmez. Srinivas, şirketin kendi arama botlarının yanı sıra üçüncü taraf arama botlarını da kullandığını, Wired tarafından tespit edilen botun da bunlardan biri olduğunu açıkladı. Fast Company, Perplexity'nin tarayıcı sağlayıcısına Wired sitesini taramayı bırakmasını söyleyip söylemediğini sorduğunda "Bu karmaşık bir durum" dedi.

Srinivas, şirketinin uygulamalarını savundu, yayına bot dışlama protokolünün "yasal bir dayanak olmadığını" söyledi ve yayıncıların ve onun gibi şirketlerin yeni bir tür ilişki kurmak zorunda kalabileceğini öne sürdü. Ayrıca Wired'ın Perplexity sohbet robotunun bu şekilde davranmasını sağlamak için kasıtlı olarak ipuçları kullandığını, böylece normal kullanıcıların aynı sonuçları alamayacağını da ima etti. Aracın ürettiği yanlış bulgularla ilgili olarak Srinivas şunları söyledi: "Perplexity sohbet robotunun hatalı olduğunu hiçbir zaman söylemedik: 'Hiçbir zaman halüsinasyon görmediğimizi asla söylemedik.'

Ayrıca okuyun:

paylaş
Julia Alexandrova

Kahveci. Fotoğrafçı. Bilim ve uzay hakkında yazıyorum. Bence uzaylılarla tanışmak için çok erken. Her ihtimale karşı robotiğin gelişimini takip ediyorum ...

Yorum bırak

E-posta hesabınız yayımlanmayacak. Gerekli alanlar işaretlenmişlerdir.*