Elon Musk’ın yapay zeka şirketi xAI, geçtiğimiz günlerde yapay zeka sohbet botu Grok 3’ü tanıttı. Grok yalnızca bir sohbet botu olmanın ötesinde X’e entegre bir yapay zeka asistanı.
Son günlerde Grok’un mesaisi tüm teyitçilerden daha fazla. Kullanıcılar arasında Grok’u bilgilerin doğruluğunu kontrol etmesi için kullanmak giderek yaygınlaşıyor. Şüpheli bir paylaşım gören pek çoğu paylaşımın altına Grok’u etiketliyor. Grok’un yeni Teyit olduğunu düşünen kullanıcılar bile var.

Bir X kullanıcısının paylaşımı.

Grok yeni Teyit mi?
Bir yapay zeka asistanının sizin için teyit yapmasının pek çok cezbedici tarafı var. Hakikatin peşine sizin yerinize onun düşmesi ve beklediğiniz yanıta dakikalar içinde zahmetsizce ulaşabilmek kulağa harika geliyor.
Peki bir yapay zekanın yaptığı doğrulamanın kesinliğinden emin olmak mümkün mü?
Grok’un kullanıcılar arasında yaygınlaşması teyitçiliğin geleceği ve teyitçilikte yeni modellerle ilgili soruları beraberinde getiriyor. Öyle ki kullanıcılardan biri Teyit’in Grok’a danışıp danışmadığını sormuş.

Bir X kullanıcısının paylaşımı.

Ne yalan söyleyelim, danışıyoruz. Gelin, danıştığımız bir iddiada Grok’un performansını inceleyelim.
Grok’a sarı renkli, ince, uzun, hamur benzeri bir makineden çıkan maddenin görüldüğü bir videoya dair iddiayı soruyoruz. İddiaya göre, makineden çıkan şey erişte ya da spagetti benzeri bir gıda ürünü. Grok’un görevi ise bir teyitçi gibi bu maddenin gerçekte ne olduğunu tespit etmek.

Grok’a ilk olarak “Videodaki şey nedir?” diye soruyoruz. Grok videodaki maddenin erişte, makarna veya benzeri bir hamur işi olduğuna kanaat getiriyor. Sarı renginin ise baharatlardan veya gıda boyasından kaynaklı olabileceğini aktarıyor. Kültürel ve bölgesel bağlantıları kurabilen asistanımız videonun Güney Asya bölgesinden olabileceğini aktarıyor. Grok, videonun hijyenik olmayan üretim koşullarından dolayı eleştirildiği bağlamını da yakalayabiliyor.

Grok ile sohbet ekranı.

Videoyu incelediğimizde analiz edilebilecek farklı detaylar göze çarpıyor. Örneğin, makineden çıkan maddenin paketlendiği ambalaj. Bu ambalajda ne yazdığını tespit etmek bizi sonuca yaklaştırabilir. Anlaşılan o ki Grok pek şüpheci yaklaşmıyor ve ipuçlarını toplayamıyor. Dolayısıyla ambalajın üstünde ne yazdığını biz ona soruyoruz.

Grok ile sohbet ekranı.
Grok ambalaj üzerindeki detayları yakalama konusunda başarılı. Ambalajda kırmızıyla yazılan "سوبر" kelimesinin “süper” anlamına geldiğini ve ambalajdaki telefon numarasının Pakistan’dan olabileceğini tespit ediyor.

Genel izleniminde ise Grok bu maddenin bir hamur işi olduğu fikrini değiştirerek videodaki maddenin bir temizlik ürünü olabileceğini aktarıyor. Grok “Çamaşır Sabunu Üretim Süreci” ve "Spagetti Çamaşır Sabunu Nasıl Yapılır” başlıklarından dolayı bu maddenin aslında bir çamaşır sabunu olduğunu söylüyor. Fakat videonun kendisinde bu başlıklar yok. Bu sonuca, muhtemelen videonun alıntılandığı hesabın açıklamasını analiz ederek ulaşıyor. Fakat, bu adımı analizinde belirtmiyor.
Analizin sonucunda yapay zeka asistanımız videodaki ürünün sarı, makarna benzeri bir çamaşır sabunu olduğunu ve üretim sürecinin hijyenik olduğunu aktarıyor.

Grok ile sohbet ekranı.

Sonuçta Grok’un analizi bizim yönlendirmelerimizle şekilleniyor ve iki analizi arasında tutarsızlık bulunuyor. Analizin nihai sonucunu merak ederseniz, burada.
Benzer tutarsızlıkları farklı analizlerde görmek de mümkün.
Geçtiğimiz günlerde “Stockholm’deki devasa obruk” ile ilgili bir analiz yayınladık. Biz analizi yayınlamadan önce kullanıcılar Grok’a iddianın gerçek olup olmadığını sormuş.

Bir kullanıcı ve Grok’un tweet zinciri.

Grok, obruk videosunun gerçek olduğunu, sokaklarda kaos olduğunu ve acil ekiplerinin olay yerinde olduğunu doğruluyor. Hatta 2023’te İsveç’te yaşanan benzer bir olaya referans veriyor.
Halbuki, Teyit’in analizine göre video yapay zeka araçlarıyla üretilmiş. Grok, muhtemelen bağlamı yakalayamadı ve benzer bir olay daha önce İsveç’te yaşandığı için yapay zeka videonun da gerçek olduğuna kanaat getirdi. Yani Grok, yapay zekayı tespit etmekte yetersiz kaldı.
Teyit’in aynı analizle ilgili yaptığı paylaşımın altında bir kullanıcı Grok’a videonun mu yoksa analizin mi doğru olduğunu sordu.

Bir kullanıcı ve Grok’un tweet zinciri.

Grok, bu defa Teyit’in analizinin doğru olduğunu aktarıyor. Hatta, “Viral kliplere değil, doğruluk kontrolüne güvenin.” diye ekliyor.
Bu örnekler, bir yapay zeka asistanının teyitçiliğine pek de güvenmemek gerektiğini gösteriyor. X, Grok hakkında sayfasında bunu açıkça dile getiriyor. Grok’un yanlış bilgileri doğru gibi verebileceğini, yanlış özet çıkarabileceğini ve bağlamı kaçırabileceğini aktarıyor.
“@grok bu gerçek mi?”
Platformların gerek tasarımları, gerekse virallik mekanizmaları sebebiyle yanlış bilgiden kaçınmak neredeyse imkansız hale geliyor. Böyle bir dijital ortamda kullanıcıların şüphelerini dakikalar içerisinde giderebilecek bir araç elbette rağbet görüyor.
Son zamanlarda sık gördüğümüz “@grok bu gerçek mi?” paylaşımları platformlarda ihtiyacımız olan doğruluk kontrolünü gözler önüne seriyor. Yanlış bilginin hızla yayıldığı platformlardan biri olan X’te böyle bir pratik geliştirmek şüphe kasını diri tutmaya yardımcı olabilir.

Öte yandan, sık sık hata yaptığı ortada olan bir yapay zeka botuna teyitçilik konusunda yüzde yüz güvenmek şu an için mümkün görünmüyor.
Şimdilik, en güvenilir teyitçiliği hala insanlar yapabiliyor. Şüphe kasımız bir yapay zeka asistanına göre çok daha iyi çalışıyor. Bu yüzden, Grok’a bir paylaşımın gerçekliğini doğrudan sormaktansa onu kendi teyitçilik pratiklerimize yardımcı olacak şekilde kullanmak daha yerinde bir yaklaşım olabilir.





