Araştırma: Yalan haber başlıklarda başlıyor

Bu yazı 2016 ABD Başkanlık Seçimleri’nden bu yana, yanlış haber konusunda okuduğunuz 100. yazı olabilir. Yanlış bilgilendirme ve kötü niyetli yanlış haberler yeni olmasa da artık herkes bu tür haberlerin varlığından haberdar. Artan bu farkındalık çok güzel (bir sorunu çözmenin ilk adımı, bir sorun olduğunu fark etmektir, değil mi?) ancak bu aşırı yükleme pek çok kişi için yanlış ve doğru arasındaki çizginin flulaşmasına neden oldu. Sayısal olarak neyin doğru olduğunu söylemek çok zor olsa da size doğru ve yanlış haberleri ayırmak için bazı yeni bilimsel kanıtlar sunabileceğimi umuyorum.

NECO 2017‘de yayımlanan yeni bir çalışmada, Sibel Adalı ile şu soruyu sorduk:

“Yanlış ve doğru haberler arasında sistematik biçimsel bir fark var mı?”

Bu soruna yaklaşımımızda, 3 farklı makale türüne baktık: doğru, yanlış ve parodi. Doğru haberler gerçek olduğu bilinen ve “güvenilir” haber kaynaklarından alınan haberlerdir. Yanlış haberler ise, yanlış bilgiyi kasıtlı olarak yaymaya çalışan, bilinen “yanlış haber” kaynaklarından alınan haberlerdir. Parodi haberler, hiciv amacı güttüklerini açıkça beyan eden ve yanlış bilgiyi kasıtlı olarak yaymayı amaçlamayan haber kaynaklarından alınan haberlerdir.

İşin karmaşık kısmı şu: Yanlış ve doğru haberlerin kesin referansını elde etmek oldukça güç. Bu nedenle, bu haberlerin kesin referansını belirleyebilmek için “mutlak kaynak” yaklaşımını benimsedik. Örneğin, haberi “genellikle çok güvenilir” ile “kasten yanlış, hiçbir zaman güvenilir değil” arasında bir yelpazede değerlendireceğimizde, bu yelpazenin aşırı uçlarını belirlemek isteriz. Yelpazenin aşırı uçlarını bulmak için Zimdar’ın kitle kaynaklı yanlış haber listesini ve Business Insider’ın en çok güvenilen haberler listesini kullandık. Parodi haberleri ise ana sayfasında parodi haber yaptığını belirten sitelerden topladık.

(Genellikle çok güvenilir / Kısmen doğru, çoğunlukla yanlı / Kasten yanlış, hiçbir zaman güvenilir değil)

Bu kesin referans yaklaşımını göz ardı etmeden, Craig Silverman‘ın “Bu Analiz, Facebook’ta Seçimle İlgili Viral ve Yanlış Haberlerin Doğru Haberleri Nasıl Geçtiğini Gösteriyor” başlıklı makalesinde kullandığı BuzzFeed veri kümesi, Burfoot ve Baldwin‘in parodi haberler üzerinde yaptıkları 2009 tarihli çalışmasında kullandıkları veri kümesi ve bizzat topladığımız yanlış, doğru ve parodi siyaset haberlerinden oluşan yepyeni veri kümesi olmak üzere bağımsız 3 veri kümesini analiz ettik.

Analiz etmek için, veri kümelerindeki her makalenin gövde metninde ve başlık metninde kullanılan pek çok farklı doğal dil özelliğini hesapladık. Daha sonra, makale türleri arasındaki farkları açıklığa kavuşturmak ve bu dil özelliklerinin haberin yanlış olduğunu öngörme becerisini göstermek için Wilcox hipotez testi yöntemleri ile Destekçi Vektör Makineleri (Support Vector Machines-SVM) tekniğini birlikte kullandık. Bu yöntemlere aşina değilseniz, kısaca şu şekilde açıklayabiliriz: Hipotez testi iki veri sınıfı arasında istatistiksel olarak anlamlı bir fark olup olmadığını belirlemek için kullanılır. SVM ise, bir veri göstergesinin sınıfını öngörmek için kullanılan eğiticili bir sınıflandırma yöntemidir. Bizim çalışmamızdaki sınıflar, yanlış haber, doğru haber ve parodi haber. Tek bir veri kümesinin sınırlandırmalarının nihai sonuçlarımızı etkilemeyeceğinden emin olmak için bu analizi her veri kümesine ayrı ayrı uyguladık. Bu yöntemlerle ilgili pek çok teknik ayrıntı var ancak bu ayrıntılarda boğulmamak için doğrudan sonuçlara geçeceğim. Daha fazla bilgi isteyenler (veya ayıracak zamanı olanlar) çalışmaya buradan ulaşabilirler.

Başlıklar yanlış ve doğru haberler için güçlü ayırt edici unsurlar

Yanlış ve doğru haber kaynakları arasındaki fark, açık ara, başlıklar. Özellikle Buzzfeed veri kümesi ve kendi veri kümemizde, yanlış haber başlıklarının doğru haber başlıklarından daha uzun olduğunu, uzunluk açısından ve teknik anlamda daha basit sözcükler içerdiğini gördük. Ayrıca, yanlış haber başlıklarında tamamı büyük harfle yazılmış sözcüklerin ve özel adların daha fazla, genel adların ve basit sözcüklerin ise daha az kullanıldığı görüldü. Buzzfeed veri kümesindeki yanlış haber başlıklarında analitik sözcükleri önemli ölçüde daha fazla kullanıldığını ve bizim veri kümemizdeki yanlış haber başlıklarında deyimlerin ve geçmiş zamanlı sözcüklerin yine önemli ölçüde daha fazla kullanıldığını tespit ettik.

Veri kümemizden rastgele seçilen birkaç örneğe baktığımızda sonuçlar pekişecektir:

Örnek 1

YANLIŞ HABER BAŞLIĞI: FLAŞ FLAŞ FLAŞ: New York Polisi Yeni Hillary E-postalarını Çıkardı: Kara Para Aklama, Çocuklarla Cinsel Suçlar, Çocuk İstismarı, Parayı Veren Düdüğü Çalar, Yalancı Şahitlik

DOĞRU HABER BAŞLIĞI: Mevcut Durum ve Cumhuriyetçilerin Obamacare Yerine Getirilecek Planları

Örnek 2

YANLIŞ HABER BAŞLIĞI: ACİL: Anaakım Medya Trump Zaferi Hakkında ÇOK ÖNEMLİ bir Gerçeği Saklıyor!

DOĞRU HABER BAŞLIĞI: Obama Deniz Sondajında Atlantik, Kutup Alanlarını Kapsam Dışı Bıraktı

Gördüğünüz gibi, bu sonuçlar yanlış haber yazarlarının özel ad ve deyimleri kullanmak için basit sözcükleri ve adları atlayarak başlığa olabildiğince çok içerik sığdırmaya çalıştıklarını gösteriyor. Diğer bir deyişle, yanlış haber başlıkları daha fazla puan almak için pek çok deyim ve adı verilmiş varlık kullanırken, doğru haber başlıkları kısa ve genel bir özet ifade kullanır (‘çok iddia’ya karşı ‘az iddia’)

Yanlış ve doğru haberlerin içeriği de önemli ölçüde farklı

Haberin yalnızca başlığı ayrıştırıcı unsur değildir, içerik yapısı da oldukça farklıdır. Özellikle, doğru haberlerin yanlış haberlerden önemli ölçüde uzun olduğunu, yanlış haberlerin daha az teknik sözcük, kısa sözcük, daha az noktalama, daha az alıntı ve daha yoğun sözcük fazlalığı kullandığını gördük. Dahası, yanlış haberler daha kolay okunur, yanlış haberlerde daha az analitik sözcük, önemli ölçüde daha fazla kişi zamiri ve zarf ile daha az ad kullanılır.

Bu çok sayıda fark, soyut görünebilir. Konuyu şu şekilde özetleyebiliriz: Yanlış haberlerin içeriğinde çok az bilgi veya fikir vardır ve başlığa çok fazla bilgi yığılır.

Bu sonuç özelliklerimizin küçük bir alt kümesini kullanarak haber kategorisini öngörme becerimizle daha da desteklenir. Yanlış haber başlıklarını doğrularından ayırmada %78, yanlış içeriği doğrudan ayırmada da %71 doğruluğa ulaştık. Bu, özelliklerin küçük alt kümesinin rastgele seçimler üzerindeki öngörümüzü %21 ve %28 arasında iyileştirdiği anlamına gelir. (Makine öğrenimine aşina değilseniz, şöyle özetleyebiliriz: Bu, temelde bir haberin yanlış veya doğru olduğunu, haberin hangi haber kategorisine düşmesi gerektiğini rastgele seçmektense, içerik yapısını kullanarak daha iyi şekilde otomatik olarak öngörebileceğimizi ifade eder.)

Gövde Metni / Taban / Yanlış – Doğru / Parodi – Doğru / Parodi – Yanlış

Veri kümemizdeki gövde ve başlık metinleri için en önemli 4 özelliği kullanarak elde edilen doğrusal çekirdek SVM sınıflandırması sonuçları. Doğruluk, 5 katlı çapraz geçerliliğin ortalamasıdır. Taban çoğunluğun bulunduğu sınıftır.

Yanlış içerik, parodi içerikle, gerçekle olduğundan daha yakından ilişkilidir

Şimdi, parodi haberlerimizi analize ekleyelim. Şimdiye kadar, yalnızca yanlış ve doğru kategorilerine baktık, ancak parodi kategorisini dahil etmek daha fazla öngörü sağlayabilir. Parodi haberleri analize eklerken, özellik dağılımlarımızın çoğunun parodi ve yanlış haberler için ortak olduğunu gördük. Özellikle, parodi ve yanlış içeriklerde gerçek içeriklere göre daha az sözcük, daha az teknik sözcük, daha az analitik sözcük ve önemli ölçüde daha çok sözcük fazlalığı ile daha az alıntı, daha az noktalama, daha fazla zarf ve daha az ad kullandığı görüldü. Parodi ve yanlış içerik arasındaki bu benzerlik, öngörü sonuçlarımızla da desteklenmektedir. Haberin parodi veya yanlış olduğunu öngörürken, taban üzerinde yanlış ve doğru karşılaştırmasında ya da parodi ve doğru karşılaştırmasında elde ettiğimizden çok daha düşük bir doğruluk artışı elde ettik.

Bu bulgu, pek çok nedenle ilginç ve yararlıdır. İlk olarak, basında yer alan yanlış haberlerin çoğunda, yanlış haberlerin doğası gereği inandırıcı olduğu ve doğru haber gibi görünmesinin amaçlandığı varsayılmıştır, ancak işin aslı böyle değildir. Parodi ve yanlış içerik arasındaki benzerlik yanlış haberlerin araştırmacı yöntemleri daha az kullandığını gösterir, parodi haberler ise absürt olması için yazılmıştır ve akla uygun iddiaları yoktur. Çoğu kişi için, bu bariz olabilir (yanlış haberler akla uygun iddialarda bulunamaz çünkü yanlıştırlar!) ancak bu durumun gözünüzden kaçan önemli etkileri olabilir. İnsanlar hala yanlış haberlere aldanmaktadır, 2016 ABD Başkanlık Seçimi’ni unutmayın; ancak yanlış haberlerde mantıksal veya delil teşkil eden içerik pek bulunmamaktadır. İletişim alanı bize biraz öngörü sağlayabilir.

Doğru haberler savlar üzerinden ikna ederken, yanlış haberler kısayolları kullanır

Bulgularımızı daha iyi bir şekilde açıklamak için, ikna için Detaylandırma Olasılığı Modeli’ne (ELM) bakalım. ELM’ye göre, insanlar merkezi yön ve çevresel yön olmak üzere, iki farklı yoldan ikna edilir. Merkezi yön, sunulan savların ve mesaj özelliklerinin özenle incelenmesinden doğar. Bu yön, yüksek enerji ve bilişsel çaba gerektirir. Buna karşın, çevresel yön mantıkla ve sunulan bilgilerin niteliği ile ilgisi olmayan fikirleri ilişkilendirmekten veya sanılar çıkarmaktan doğar. Bu yön, bulgusal yön veya çok enerji ve bilişsel çaba gerektirmeyen bir kısayol olarak da adlandırılabilir. İnsanlar bu kısayolları tercih etme eğilimindedir. Bu eğilim, Facebook’taki bir arkadaşa güvenmek (arkadaşlarım akıllıdır, asla yanlış haber paylaşmazlar!), içerik için bir makaleye hızla göz gezdirmek veya haberin başlığındaki ifadeye inanmak (başlık mantıklı görünüyor ve doğru olup olmadığını araştıracak zamanım yok) gibi şekillerde kendini gösterebilir. Bu kısayolların verdiği zarar sosyal ağlarda görünen aynılıkla (tencere yuvarlanmış kapağını bulmuş) veya tahmin edilen ilgi alanlarınıza göre sıralayan algoritmalarla da artar.

Peki, bunun bizim yanlış haber sonuçlarımız açısından anlamı nedir? Yanlış haberlerin başlığa çok fazla içerik sığdırdığını, hatta bazen başlıkta çok sayıda analitik sözcük kullandığını gördük. Buna karşın, yanlış haberlerin gövde içeriğinde çok az fikir olduğunu, çok fazla sözcük kullandığını (kendilerini sıklıkla tekrar ederler), analitik sözcüklerin ve doğrudan alıntıların eksik kaldığını da gördük. Dahası, yanlış haberlerin içerik yapısının çoğunun bilindik, tuhaf parodi haberlerin içerik yapısına benzer olduğunu da tespit ettik. İnsanlar güvenme konusunda kararlarını verirken kısayolları tercih etme eğiliminde olduğundan, tüm iddialar başlığa sığdırıldığında kullanıcılar daha fazlasını öğrenmek için makaleyi açmaya pek ihtiyaç duymayabilirler. Bu yanlış haber başlıkları genellikle insanlar ve varlıklar hakkındaki iddialarını tam cümlelerle, kişileri ve varlıkları eylemlerle ilişkilendirerek sunar. Bu nedenle, başlıklar erişimi kolay iddiaları hızlı bir şekilde öne sürmek için kullanılan temel mekanizmalardır. Yani, ihmal ettiğimiz için veya enerjimiz olmadığı için yanlış haberlere inanabiliriz. Bu durum, sosyal ağlardaki bilgiler hakkında bildiklerimizle de desteklenmektedir. Paylaşılan veya yorum yapılan bağlantıların çoğuna hiçbir zaman tıklanmaz, bu nedenle de yalnızca haberlerin başlıkları okunmaktadır (bu konu için Wang, Ramachandran ve Chaintreau’nun 2016 tarihli çalışmasına bakabilirsiniz).

Bir kişinin eğitimsiz veya ilgisiz olduğu için değil, yalnızca enerjisi olmadığı veya kafası dolu olduğu için yanlış haberlere ikna olabileceği bulgusu endişe vericidir. (Öğle yemeği yemediniz mi? Facebook molanızda yanlış haber paylaşabilirsiniz! Ne kadar eğitimli olursanız olun…) Ne yazık ki, yanlış haberlerin başlıklarındaki yanlış yönlendirici iddialar makul tartışmalarla değiştirmesi güç, yerleşik inançlara dönüşebilir (özellikle de bu yanlış inançlar önceden inandığınız şeylerle örtüşüyorsa). Bu sorunlara olası bir çare, yanlış iddiaları çürütmeyi hedefleyen makalelerin karşı iddiayı başlıklarına dahil ederek insanları ikna eden kısayollardan yararlanmalarıdır.

Genel olarak, bu çalışma yanlış haberleri tespit edebileceğimizi, ancak bir makalenin içeriğini okumak için zaman ayırmanın ve bilgiyi paylaşmadan önce önyargılarımızın doğruluğunu değerlendirmenin bizim sorumluluğumuz olduğunu göstermektedir.

Bu alanda yapmamız gereken daha çok iş var ancak bu arada, lütfen makalenin içeriğini okuyun ve paylaşmadan önce düşünün.

Kaynak: Benjamin D. Horne / Medium Çeviri: Emek Akman