İddia: Microsoft, DALL-E 3 yapay zekasından endişelenen bir mühendisi susturdu
Bir Microsoft yöneticisi, OpenAI tarafından geliştirilen metinden imgeye yapay zekası DALL-E 3’ün, kullanıcıların şiddet içeren ya da müstehcen manzaralar (yakın vakitte Taylor Swift’i maksat alanlara benzer) oluşturmasına müsaade verebilecek …
Shane Jones, ABD senatörleri ve Washington eyaleti Başsavcısına yazdığı mektupta “DALL-E 3’ün bir kamu güvenliği riski oluşturduğu ve OpenAI bu modelle bağlantılı riskleri ele alana kadar kamu kullanımından kaldırılması gerektiği sonucuna vardım” dedi.
Jones, aralık ayı başlarında DALL-E 3’ün güvenlik bariyerlerini aşmasını sağlayan bir açık keşfettiğini tez ediyor. Sorunu Microsoft’taki üstlerine bildirdiğini, onların da kendisine “sorunu direkt OpenAI’a şahsen bildirmesi” talimatını verdiklerini söylüyor. Bunu yaptıktan sonra, açığın “şiddet içeren ve rahatsız edici ziyanlı görüntülerin” oluşturulmasına müsaade verebileceğini öğrendiğini sav ediyor.
OpenAI ve Microsoft’a nazaran açık yok
Jones, sonrasında ise kamuoyunu bildirmek için LinkedIn’de bir gönderi paylaşmış ve bunu Microsoft’a bildirmiş. Belirtilenlere nazaran Microsoft, ilgili paylaşımın derhal kaldırılmasını talep etmiş. Jones, kendisine Microsoft’un hukuk takımından ayrıntılı açıklama yapılacağının söylendiğini lakin bunun hiçbir vakit gerçekleşmediğini de aktarıyor.
OpenAI ise incelemeler sonucunda DALL-E 3’te bu türlü bir açığın bulunmadığını açıkladı. Ayrıyeten cinsel yahut şiddet içerikli istemleri engellemek için modelde önemli eğitimler ve sınırlamalar yaptıklarını belirtiyor. Misal halde Microsoft da bu türlü bir açığın olmadığını aktardı. Bununla birlikte kimileri bu açığın yahut farklı bir açığın gündemde olan Taylor Swift’in pornografik deepfake’leriyle bağlantılı olabileceğini söylüyor. Lakin bu bahis hakkında net bir telaffuz yok.