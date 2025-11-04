ChatGPT'nin piyasaya çıkışıyla birlikte dikkatleri üzerine çeken büyük dil modelleri, sonrasında Gemini, DeepSeek, Llama ve Grok gibi farklı örneklerle günlük yaşamın bir parçası haline geldi. Ancak bu modellerin eğitildiği veri kaynakları, uzun süredir yapay zeka alanındaki en çok tartışılan konulardan biri olmaya devam ediyor.

Derlenen bilgilere göre, ChatGPT dahil olmak üzere birçok dil modeli yanıtlarını oluştururken kamuya açık internet sitelerinden faydalanıyor.

Reddit yüzde 40 ile ilk sırada

Online istatistik platformu Statista'nın Haziran ayında yayımladığı verilere göre, 2024'ün ilk çeyreğinde büyük dil modelleri tarafından en fazla alıntı yapılan web sitesi yüzde 40,11 oranla reddit.com oldu.

Uzmanlar, yapay zekaların Reddit gibi gerçek kullanıcıların doğal konuşmalarının yer aldığı ortamlardan veri toplamasını, geliştiricilerin resmi kaynaklardan çok 'gerçek insan dili”ne odaklandığının bir göstergesi olarak değerlendiriyor.

Reddit'i yüzde 26,3 ile 'internet ansiklopedisi' olarak tanımlanan Wikipedia izliyor. Düzenlenmiş içeriklerle öne çıkan Wikipedia, denetimsiz kullanıcı tartışmalarının yer aldığı Reddit'in gerisinde kaldı.

Statista verilerine göre, en çok başvurulan diğer kaynaklar ise şöyle sıralandı:

YouTube: Yüzde 23,5

Google: Yüzde 23,2

Yelp: Yüzde 21

Facebook: Yüzde 19,9

Amazon: Yüzde 18,7

Tripadvisor: Yüzde 12,4

Mapbox: Yüzde 11,2

OpenStreetMap: Yüzde 11,2

Google ve Reddit arasında yapay zeka anlaşması

Yapay zeka modellerinin eğitilmesi için teknoloji devleriyle sosyal medya platformları arasında çeşitli iş birlikleri de yapılıyor.

2024 yılında Google ile Reddit arasında imzalanan anlaşma kapsamında, Google'ın yapay zeka sistemlerinin Reddit verileriyle de beslenmesi kararlaştırıldı. Reuters'ın haberine göre, anlaşma gereği Google her yıl Reddit'e 60 milyon dolar ödeme yapacak.

Aynı zamanda Reddit, OpenAI ile de ChatGPT'nin eğitimi için veri paylaşımı anlaşması imzaladı. Böylece yapay zeka modellerinin yanıtlarında görülen "Reddit etkisi", bu iş birlikleriyle birlikte daha da güçlenmiş oldu.