GPT-4'ün Eğitiminde YouTube Videoları Kullanılması Tartışma Yarattı

OpenAI, GPT-4'ü eğitmek için YouTube videolarını kullanarak konuşmayı yazıya dönüştüren bir model geliştirdiği bildiriliyor.

#Ai #Youtube

08.04.2024 - 19:12 Yayınlanma

GPT-4'ün Eğitiminde YouTube Videoları Kullanılması Tartışma Yarattı

OpenAI'ın, GPT-4'ü eğitmek için YouTube'da bulunan bir milyon saatten fazla videoyu kullanarak konuşmayı yazıya dönüştüren Whisper modelini geliştirdiği bildiriliyor. The New York Times'ın haberine göre, şirket bu adımın yasal olarak tartışmalı olduğunun farkındaydı ancak bu eylemin adil kullanım çerçevesinde olduğuna inanıyordu. İddialara göre, OpenAI başkanı Greg Brockman, kullanılan videoların toplanması sürecinde bizzat yer aldı.

OpenAI sözcüsü Lindsay Held, yaptığı açıklamada her bir model için "benzersiz" veri kümeleri oluşturduklarını belirtti. Şirketin amacının bu veri kümeleriyle modellerin dünyayı daha iyi anlamalarını sağlamak ve küresel araştırma rekabet gücünü artırmak olduğunu ifade etti. Ayrıca Held, şirketin kamuya açık ve özel veri kaynakları dahil olmak üzere birçok kaynaktan yararlandığını ve sentetik veri üretme konusunu da araştırdıklarını ekledi.

Google sözcüsü Matt Bryant ise YouTube içeriklerinin izinsiz bir şekilde kazıma veya indirilmesini yasaklayan robots.txt dosyaları ve Hizmet Şartları'na dikkat çekti. Geçtiğimiz hafta gerçekleşen bir röportajda YouTube CEO'su Neal Mohan, OpenAI'ın Sora'yı eğitmek için YouTube videolarını kullanması iddialarına karşılık, bu tür bir eylemin platformun ilkelerini ihlal ettiğini belirtti.

Öte yandan Google'ın da YouTube transkriptlerini topladığı belirtiliyor. Matt Bryant, modellerinin YouTube içerik üreticileriyle varılan anlaşmalar doğrultusunda eğitildiğini vurgulayarak, şirketin bu konuda şeffaf olduğunu ifade etti.

Kaynak: HABER MERKEZİ