OpenAI'ın, GPT-4'ü eğitmek için YouTube'da bulunan bir milyon saatten fazla videoyu kullanarak konuşmayı yazıya dönüştüren Whisper modelini geliştirdiği bildiriliyor. The New York Times'ın haberine göre, şirket bu adımın yasal olarak tartışmalı olduğunun farkındaydı ancak bu eylemin adil kullanım çerçevesinde olduğuna inanıyordu. İddialara göre, OpenAI başkanı Greg Brockman, kullanılan videoların toplanması sürecinde bizzat yer aldı.

OpenAI sözcüsü Lindsay Held, yaptığı açıklamada her bir model için "benzersiz" veri kümeleri oluşturduklarını belirtti. Şirketin amacının bu veri kümeleriyle modellerin dünyayı daha iyi anlamalarını sağlamak ve küresel araştırma rekabet gücünü artırmak olduğunu ifade etti. Ayrıca Held, şirketin kamuya açık ve özel veri kaynakları dahil olmak üzere birçok kaynaktan yararlandığını ve sentetik veri üretme konusunu da araştırdıklarını ekledi.

Google sözcüsü Matt Bryant ise YouTube içeriklerinin izinsiz bir şekilde kazıma veya indirilmesini yasaklayan robots.txt dosyaları ve Hizmet Şartları'na dikkat çekti. Geçtiğimiz hafta gerçekleşen bir röportajda YouTube CEO'su Neal Mohan, OpenAI'ın Sora'yı eğitmek için YouTube videolarını kullanması iddialarına karşılık, bu tür bir eylemin platformun ilkelerini ihlal ettiğini belirtti.

PlayStation 2 Tahtı Sallantıda: Nintendo Switch En Çok Satan Konsol Olmaya Yakın PlayStation 2 Tahtı Sallantıda: Nintendo Switch En Çok Satan Konsol Olmaya Yakın

Öte yandan Google'ın da YouTube transkriptlerini topladığı belirtiliyor. Matt Bryant, modellerinin YouTube içerik üreticileriyle varılan anlaşmalar doğrultusunda eğitildiğini vurgulayarak, şirketin bu konuda şeffaf olduğunu ifade etti.