Bu konuda biraz devam etmek istiyorum, ki şu ana kadar bu konuda çok az endişe görüyorum. Çeşitli yerlerde, mesajlaşma uygulamaları da dahil olmak üzere biriktirdiğimiz büyük özel veri depoları var. Gen AI için gerçek bir "öldürücü uygulama" onları alıp bu veriyi gelire dönüştürmektir.
Örneğin, bazı güvenli mesajlaşma uygulamaları kullanıyorsanız, konuşma geçmişinizi yedeklemede çok faydalı olduklarını ve böylece "veri kaybetmemeniz" gerektiğini fark edeceksiniz. Bazı insanlar buna gerçekten güveniyor ama aynı zamanda (tesadüfen de) büyük bir veri yığını taşıdığın anlamına geliyor.
Bu veriler şu anda reklam şirketleri için tamamen karanlık. Değerli mi? Bilmiyorum. Belki de kârlı şekilde çıkarılabilecek her şey zaten kamu forumunda mevcuttur! Ama kesinlikle birisi bunu öğrenmek istiyor.
Benzer şekilde, bilgisayarınızda veya telefonunuzda bir teknoloji firması tarafından "bilinen" çok şey var ama belki de her teknoloji firması tarafından bilinmeyebilir. Örneğin, Google'da yıllarca yazdığım posta ve birçok bulut belgesi var, ama Meta, Claude ve OpenAI'de yok. Henüz.
Şimdi geleceği bilmiyorum. Belki on yıl sonra bir yapay zeka ütopyasında ya da distopyada yaşıyoruz ve hedefli reklamlarla ilgili endişeler sıradan kalır. Ama bugünün iş modellerini düşünürseniz, tüm bu verileri kullanmak bir sonraki sınırdır.
Tüm bunlar, insanları yerel olarak faydalı yapay zeka araçları kurmaya ikna etmeyi ve bu araçların ilgili veri depolarına erişimini sağlamayı gerektirir. Bu araçlar zaten çoğu yapay zeka şirketinden mevcut ve teknoloji firmalarının mevcut uygulamaları için "yapay zeka stratejileri" var.
Şimdi insanlar bunun yerel modeller ve TEE'lerle yapılabileceğini söyleyecek. Evet, olabilir. Ama faydalı bir şey yapmak için (metin yazmaya yardımcı olmak ve özetlemek dışında) bu araçların dünyada bir şeyler yapması gerekiyor. Bu da öncelikle, istemeden veri açığa çıkma riski yaratır.
Henüz (hali) şirketlerin kasıtlı olarak veriyi para kazanmaya çalışmasından bahsetmiyorum. Şu anda sadece kazara (veya kötü niyetli) sızdırma riskinden bahsediyorum. Modelin özel verileri dışa yönlendirmesine neden olan prompt enjeksiyon saldırıları.
Henüz ilk gerçek dünyada prompt enjeksiyon "solucanını" görmedik. Ama eminim gideceğiz! Heyecan verici olacak. Bu riske karşı savunmanın son teknolojisi... Şu anda biraz kabarık.
Örneğin, şu anda en iyi fikirlerimiz "hiçbir şeyin özel/kamu sınırlarını aşmasına asla izin vermemek" ki bu birçok görev için pek işe yaramıyor. Ya da "mahremiyet ihlallerini kontrol etmek için modelleri kullan" diyebilirim, bu bana peynirini çalan fareleri kedileri kovalayan kralın hikayesini hatırlatan Dr. Seuss hikayesini hatırlatıyor.
Ama bu endişe ikincil bir konudur. Gerçek risk, bu tür şeyleri üreten firmaların bunu *kasıtlı* olarak içgörü elde etmek için mühendislik yapması. Açık bir arama motoru kullanarak sizin için arama yapan bir temsilciyi düşünün. Özel içgörüler göndermek aramayı daha faydalı hale getiriyor!
Yani özel verileriniz yerel/TEE modeline neyi sevdiğinizi söyler. Temsilciden ürün aramasını istersiniz. Tercihlerinizle ilgili ne kadar özel bilgi bu aramaya kasıtlı olarak dahil ediliyor?
Yanıt, gördüğüm kadarıyla, çok! Bir arama motoru beklentileriniz hakkında ne kadar çok bağlam varsa, sonuçlar o kadar iyi olur. Ve tesadüfen, reklam hedefleme ve takip o kadar iyi.
Buna karşı bir itiraz ise: kimin umurunda! Belki de dünya şimdi böyle işleyecek. Hatta size "özel" olarak takip edip reklam veren modeller bile oluşturabiliriz; yani tüm gizli verilerinizi okuyorlar ve sadece doğru sabunu size satmak için kullanıyorlar. Bu o kadar mı kötü mu?
Elbette, aynı zamanda bu içgörülere erişmek isteyen hükümetler de olacaktır. Bu verileri suçluları (veya potansiyel suçluları) takip etmek ve tanımlamak için kullanabilseydiniz, onların verilerini kelimenin tam anlamıyla okumadan, harika bir soruşturma aracı olmaz mıydı?
Bunlar AGi gibi gelecek endişeleri değil. Nesil yapay zeka bunların hepsini şu anda yapabilir. Bu yüzden firmalar bugün bu fikirleri uygulamaya çalışıyor. Hükümetler (AB gibi) zaten özel veri okuyan modellere erişim talep ediyor.
Ne yaparsak seçelim, insanların bu seçimleri gözleri açık yapmalarını istiyorum. Kimsenin "bu özellik özel olduğunu iddia ediyor, neden bir kez Tamam diye tıklamayım" demesini ve beş yıl boyunca gizli veri akışını alım hattına aktarmasını istemiyorum.
İnsanlara bunu önemsitmeye çalışmak, bir genci güneş kremi sürdürmeye çalışmak gibi. Tüm riskler çok teorik görünüyor ve faydaları tamamen günümüzde. Hepimizin bir gün uyanıp keşke işleri farklı yapsaydık dilemesini istemiyorum.
249