#teyitpedia

İnternetin hafızası Wayback Machine tehlikede mi?

Yapay zeka yarışı, dijital arşivlerin geleceğini tehdit ediyor.

Ali Osman Arabacı / Yazı İşleri Sorumlusu

7 Şubat 2026 11:00 • 5 dk okuma

Teyit'te bir iddiayı araştırırken sıklıkla başvurduğumuz yöntemlerden biri, ilgili internet sayfasının geçmişteki halini incelemek.

Ancak yapay zeka şirketlerinin eğitim verisi ihtiyacı büyüdükçe haber yayıncıları dijital arşivlere kapılarını kapatmaya başlıyor. Peki bu durum, yanlış bilgiyle mücadelenin vazgeçilmez araçlarından Wayback Machine'i nasıl etkiliyor?

Yapay zeka şirketleri ne istiyor?

ChatGPT, Gemini, Llama gibi büyük dil modellerini eğitmek için devasa miktarda metin verisine ihtiyaç duyuluyor. İnternetteki haber siteleri, bloglar, forumlar ve ansiklopediler bu modellerin temel kaynağı. Yapay zeka şirketleri, bu içerikleri toplamak için otomatik tarayıcılar (botlar) kullanıyor. Tarayıcılar, internet sitelerini ziyaret ederek içeriklerini kopyalıyor ve bu veriler modellerin eğitiminde kullanılıyor.

Sorun şu ki bu tarayıcılar, içerik üreticilerinin izni olmadan çalışıyor. Bir gazetenin yıllar boyunca emek vererek ürettiği binlerce haber, bir yapay zeka modelinin eğitim verisine dönüşebiliyor. Bu durum telif hakları, gelir kaybı ve editoryal emek gibi konularda ciddi tartışmalara yol açtı.

Yayıncılar neden rahatsız?

Internet Archive, 1996'dan bu yana internetin hafızasını oluşturan kâr amacı gütmeyen bir kuruluş. Wayback Machine aracılığıyla bir trilyonun üzerinde internet sayfasının anlık görüntüsünü saklıyor. Kuruluşun amacı bilgiyi korumak ve kamunun erişimine açık tutmak.

Son dönemde bazı büyük haber kuruluşları, Internet Archive'in tarayıcılarını kısıtlamaya ya da tamamen engellemeye başladı. Nieman Lab'ın Ocak 2026'daki haberine göre The Guardian, Internet Archive'in kendi makalelerine erişimini sınırlandırdı.

Başka bir deyişle yayıncılar, yapay zeka şirketlerinin doğrudan kendi sitelerinden veri çekemediğinde Internet Archive'i bir "arka kapı" olarak kullanabileceğinden endişeleniyor. The New York Times da benzer kaygılarla Internet Archive'in tarayıcılarını aktif olarak engellediğini doğruladı.

Mesele yalnızca birkaç büyük isimle sınırlı değil. Nieman Lab'ın bin 167 haber sitesi üzerinden yaptığı incelemeye göre dokuz farklı ülkeden 241 haber sitesi, Internet Archive tarayıcılarından en az birini açıkça yasaklamış durumda. Bu sitelerin yüzde 87'si ABD'nin en büyük gazete zinciri USA Today Co.'ya ait. Şirketin CEO'su Mike Reed, yalnızca Eylül 2025'te 75 milyon yapay zeka botunu engellediklerini ve bunların yaklaşık 70 milyonunun OpenAI'dan geldiğini açıkladı.

Ama asıl sorun başka yerde

Internet Archive kurucusu Brewster Kahle, yayıncıların bu kararlarının kamuoyunun tarihsel kayıtlara erişimini azaltacağı uyarısında bulunuyor. Kahle'ye göre bu durum, kuruluşun "bilgi düzensizliğiyle" mücadele çalışmalarını da baltalayabilir.

Burada kritik bir ayrım var: Internet Archive bir yapay zeka şirketi değil. Amacı kâr elde etmek ya da içerikleri ticari bir modele dönüştürmek değil. Aksine, dijital bilginin korunması ve herkesin erişimine açık tutulması gibi kamusal bir hizmet sunuyor. Ancak yapay zeka şirketlerinin davranışları, bu kamu hizmetini de "şüpheli" kategorisine itiyor.

Internet Archive'in bu gerilimle ilgili attığı adımlar da var. Kuruluş, kütüphanelerine toplu erişimi kısıtlamak için hız sınırlama sistemleri ve filtreleme mekanizmaları kullanıyor. Internet Archive, büyük yapay zekâ şirketlerinin botlarını hala açıkça yasaklamıyor; ancak “robots.txt” dilini daha nötr bir hale getirmiş durumda.

Teyitçiler neden endişelenmeli?

Wayback Machine, dünya genelinde doğrulama kuruluşlarının en çok başvurduğu araçlardan biri. Teyit olarak biz de analizlerimizde bu aracı sıklıkla kullanıyoruz. Birkaç somut örnek vermek gerekirse:

System of a Down'ın "Türkler ve köpekler giremez" dediği iddiasını araştırırken, grubun resmi internet sitesindeki açıklamanın yıllar içinde kaldırılmış olduğunu gördük. Ancak Wayback Machine sayesinde 20 Haziran 2006 tarihli orijinal açıklamaya ulaştık ve iddianın grup tarafından reddedildiğini doğruladık.

Benzer şekilde uydurma restoranların çevrimiçi listelerde nasıl yıldız topladığını incelerken, TripAdvisor'ın yıllar içinde değişen sloganlarını Wayback Machine üzerinden takip edebildik. Bu değişim, platformun güvenilirlik iddiasının zamanla nasıl dönüştüğünü gözler önüne serdi.

Joe Biden'ın kızının babasının 2019'da öldüğünü açıkladığı iddia edilen videonun kaynağını araştırırken de orijinal TikTok paylaşımının silinmiş olduğunu gördük. Wayback Machine'de arşivlenmiş haline ulaşarak videonun aslında mizahi bir içerik üreticisine ait olduğunu tespit ettik.

Bu örnekler, dijital arşivlerin yalnızca bir "koleksiyon" olmadığını, aynı zamanda gerçeğin izini sürmek için vazgeçilmez bir araç olduğunu gösteriyor. Silinen bir paylaşım, kaldırılan bir haber veya değiştirilen bir açıklama; bunların tümü yanlış bilgiyle mücadelede kritik kanıtlar olabiliyor.

Çözüm ne?

Durum bir kısır döngüyü andırıyor: Yapay zeka şirketleri veri toplamak için agresif yöntemler kullandıkça, yayıncılar kapılarını herkese kapatıyor. Bu "herkes" arasına, kamusal hizmet sunan arşivler ve doğrulama kuruluşları da giriyor.

Bu gerilimin çözümü, muhtemelen yapay zeka şirketlerinin veri kullanımına ilişkin daha net yasal çerçevelerin oluşturulmasında yatıyor. Avrupa Birliği'nin yapay zeka düzenlemeleri, ABD'deki telif hakları davaları ve uluslararası platformların içerik politikaları bu tartışmanın farklı cepheleri. Ancak bu süreçte Internet Archive gibi kamusal hizmet sunan kuruluşların korunması, bilgiye erişim hakkı açısından hayati önem taşıyor.

Sonuç olarak internetin hafızasının korunması, yalnızca bir arşivcilik meselesi değil. Yanlış bilgiyle mücadeleden basın özgürlüğüne, toplumsal hafızadan bireysel bilgi edinme hakkına kadar pek çok alanı doğrudan etkileyen bir kamu yararı meselesi.