Apple, kısa müddet evvel ortaya atılan Apple Intelligence’ın YouTube altyazıları bilgi setini müsaadesiz olarak kullandığı argümanı hakkında birinci defa konuştu.
Proof News tarafından kısa bir mühlet evvel yapılan ve yayınlanan bir araştırma, ortalarında Apple, Nvidia, Salesforce ve Anthropic üzere birtakım büyük teknoloji şirketlerine ilişkin olanların da bulunduğu birtakım yapay zeka modellerinin müsaadesiz olarak YouTube altyazılarını içeren bir data kümesi kullanılarak eğitildiğini sav ederek tartışmalara yol açtı.
Kar emeli gütmeyen EleutherAI tarafından hazırlanan “YouTube Altyazıları” isimli data seti, yüz milyonlarca abonesi olan Mr. Beast üzere tanınan içerik oluşturucular da dahil olmak üzere 170.000’den fazla kanaldan altyazı içeriyordu. Teknoloji şirketlerinin bu datalardan kar elde etmeye çalıştığı istikametinde tezler vardı ve bu bilgi setini kullanan Apple’ın OpenELM modelleri de tezlerden etkilendi.
Kısa bir sessizliğin akabinde 9to5Mac ile görüşen Apple, Apple Intelligence’da veya diğer AI/makine öğrenimi özelliklerinde OpenELM modelinin kullanılmadığını söyledi. Başka bir deyişle Apple’a nazaran, Apple Intelligence özelliklerinde bu YouTube Altyazı veritabanı yer almıyor.
OpenELM, bu yılın başlarında piyasaya sürülen bir açık kaynaklı model ailesi. Şirket, OpenELM’i “son teknoloji ürünü bir açık dil modeli” olarak tanımlıyor ve bunun “açık araştırma topluluğunu güçlendirmek ve desteklemek, gelecekteki açık araştırma çabalarının önünü açmak” için yayınlandığını söylüyor.
OpenELM’e, Apple’ın Makine Tahsili Araştırması web sitesi de dahil olmak üzere çeşitli kaynaklardan erişilebiliyor. Lakin Apple, 9to5Mac ile yaptığı görüşmede OpenELM modelinin gelecekteki sürümlerini oluşturma planlarının olmadığını belirtti.
Şirket daha evvel Apple Intelligence modellerini eğitmek için “temel modellerimizi eğitirken kullanıcıların özel kişisel verilerini veya kullanıcı etkileşimlerini” kullanmadığını açıklamıştı. Lakin, web siteleri şirkete bunu yapmamasını bilhassa söylemediği sürece lisanslı bilgileri ve tarayıcısı tarafından toplanan bilgileri kullanıyor: “Temel modellerimizi, belirli özellikleri geliştirmek için seçilen verilerin yanı sıra web tarayıcımız AppleBot tarafından toplanan halka açık veriler de dahil olmak üzere lisanslı veriler üzerinde eğitiyoruz. Web yayıncıları, veri kullanım kontrolüyle web içeriklerinin Apple Intelligence eğitimi için kullanılmasını devre dışı bırakma seçeneğine sahiptir.”