Veri gazeteciliği ve Türkiye’nin PDF çöplüğünde hakikat aramak

0
317
blank

Geçen ay burada, Türkiye’de veri haberciliğinin geldiği noktayı konuşmuş, bardağın dolu tarafına bakmaya çalışmıştık. Bugün ise biraz da o bardağın içindeki suyu kimin, neden bulandırdığını konuşalım. Çünkü veri haberciliği denilen o “havalı” kavram, Türkiye sahasına indiğinde çoğu zaman “Excel dosyası dilenme sanatı”na dönüşüyor.

Dünyada veri gazetecileri kendilerini “data miner” (veri madencisi) diye tanımlar. Bizde ise tablo daha çok “veri arkeolojisi” gibi, ya var ya yok, bir veri peşindeyiz. Neden mi? Çünkü bizde veri “çıkarılmaz”; kurumların web sitelerinin en karanlık dehlizlerinden, tozlu linklerin altından, 90’lardan kalma arayüzlerin içinden kazıya kazıya bulunur. Nadiren TÜİK’te, derneklerin yıllık çıkan kurum raporlarında, birkaç kişinin bireysel uğraşıp elde ettiği verilerde görünür, onların da bazıları veriye dönüşmeden modifiye edilir, örneğin enflasyon yüksek olduğu ancak TÜİK raporlarında yüksek çıkması eleştirildiği için enflasyonun üzerinden belirlendiği ürünler açıklanmamaya başlanır, kendi hesapladıklarını açıklayanlar engellenir.

“Yeni petrol” denilen şey bu mu?

Teknoloji konferanslarında o meşhur slaytı görmekten gına geldi: “Veri yeni çağın petrolüdür.” Doğru, veri petroldür. Ama Türkiye’de kurumlar bu petrolü rafine edip kullanıma sunmak yerine, onu tekrar toprağa gömmeyi; üstünü betonla kapatıp üzerine de bir “Faaliyet Raporu” binası dikmeyi tercih ediyor. Bir veri analisti ya da meraklı bir vatandaş olarak kamu kurumunun sayfasına giriyorsunuz. Amacınız basit: İlçenizdeki yeşil alan miktarının yıllara göre değişimini görmek. Beklentiniz ne? Temiz bir .csv dosyası, belki bir API bağlantısı; en kötü ihtimalle kopyalanabilir bir Excel tablosu. Peki gerçekte ne buluyorsunuz? Taranmış bir PDF. Hatta bazen o da değil: Bir Excel tablosunun ekran görüntüsü alınmış, Word’e yapıştırılmış, sonra PDF’e çevrilmiş, sonra o PDF tekrar resim gibi siteye yüklenmiş. İçinden bir satır veri çekmek bile mümkün değil. Bu, “Ferrari alıp ona tüp taktırmak” bile değil. Bu, Ferrari’yi at arabasına bağlayıp çekmeye çalışmak. O veriyi oradan almak için OCR (optik karakter tanıma) araçlarıyla boğuşmak, yanlış okunan “0”ları “O” harflerinden ayıklamak ve saatlerce temizlik yapmak zorundasınız. Veri haberciliği mesaisinin büyük kısmı analiz değil, bu “hamallık” ile geçiyor.

“Kurum içi çalışma gerektirir” bahanesi

Bir de işin CİMER ve Bilgi Edinme Hakkı boyutu var ki, orası tam bir kara mizah antolojisi. Basit bir soru soruyorsunuz, diyelim: “Geçen yıl il genelinde kaç adet ağaç dikildi?” Gelen cevap çoğu zaman standart bir şablondan ibaret: “Talep ettiğiniz bilgi, ayrı bir inceleme ve kurum içi çalışma gerektirdiğinden…” Bu cevabın Türkçesi şuna çıkıyor: “Veri elimizde var ama şu an onu senin anlayacağın formata sokmaya üşeniyoruz.” Ya da daha kötüsü: “Veriyi verirsek, o veriden bizim hoşumuza gitmeyecek bir hikaye çıkarabilirsin.” Oysa unutulan bir şey var: Veri, kamunun malıdır. O verinin üretilmesi için harcanan maaş da, kullanılan sunucunun elektriği de bizim vergilerimizle ödeniyor. Belediyenin çöp kamyonunun rotası “devlet sırrı” ya da “ticari sır” olamaz.

Vitrin süsü paneller

Son dönemde bir de “dashboard” (gösterge paneli) modası başladı. Her kurumun rengarenk, ibrelerin döndüğü, haritaların yanıp söndüğü panelleri var. Görünüşte harika, tam bir şeffaflık şöleni. Ama mouse ile üzerine gelip “Veriyi indir” dediğinizde… derin bir sessizlik. Size sadece “bakmanıza” izin veriyorlar, “dokunmanıza” değil. Oysa veri haberciliği, o rakamları alıp başka rakamlarla çarpıştırmak; gerçeğin sağlamasını yapmak demektir. Bize sadece sonucu gösteren değil, o sonuca nasıl ulaşıldığını denetlememizi sağlayan ham veri lazım. Vitrine bakıp “ne güzelmiş” dememizi bekleyenler, gazeteciliği halkla ilişkiler faaliyeti sanıyor.

Hepsiveri’nin veri gazeteciliği çağrısı: Formatı düzeltin

Biz hepsiveri.com olarak, Walter White titizliğinde, en saf ve en temiz verinin peşindeyiz. “Yemek yapacaksak” malzeme taze olmalı. Buradan tüm kamu kurumlarına, belediyelere ve özel sektöre açık bir çağrı yapalım: Şeffaflık, bin sayfalık PDF raporları yayınlamak değildir. Şeffaflık, veriyi makine tarafından okunabilir formatta sunmaktır.
    • PDF değil, XLS verin.
    • Resim/imaj değil, CSV verin.
    • Özet değil, ham veri verin.
Korkmayın, Excel dosyaları ısırmaz. Ama o dosyaların içindeki gerçekleri saklamaya çalışmak, gün gelir güvenilirliğinizi öyle bir kemirir ki hiçbir iletişim çalışması sizi kurtaramaz. Biz kazmaya devam edeceğiz. Gerekirse o PDF duvarlarını tırnaklarımızla aşacağız; ama o veriyi okunabilir, anlaşılabilir ve insani bir hikayeye dönüştüreceğiz. Çünkü verinin özgür olmadığı yerde, fikir de özgür olamaz.
Önceki İçerikTürkiye’de 15 yaş altına sosyal medya yasağı, dijital oyunlara yaş derecelendirmesi: Taslak ne getiriyor?
Sonraki İçerikHaber merkezinde “yapay zeka” bir oyuncak değil: Asıl hikaye yönetişim
Onur Metin
Onur Metin, ODTÜ Jeoloji Mühendisliği’nin ardından Anadolu Üniversitesi’nde gazetecilik yüksek lisansı yaptı. Gazetecilik kariyeri boyunca resmi istatistikler, uluslararası veri tabanları ve açık veri kaynaklarını kullanarak haberlerini sayısal verilerle güçlendirmeyi, okuyucuya daha derin ve denetlenebilir bir perspektif sunmayı öncelik edindi. Farklı haber sitelerinde geçici süreler çalıştıktan sonra önce kişisel sitesini (onurmetin.com.tr), ardından veri odaklı haber ve analiz ürettiği HepsiVeri’yi kurdu. Demokrasi, emek, eğitim, kent politikaları ve dijital haklar gibi alanlarda ürettiği içeriklerde, verilerden hikâye çıkarmayı; karmaşık veri setlerini grafikler, tablolar ve görselleştirmelerle herkesin anlayabileceği, şeffaf ve kaynakları açık gazetecilik ürünlerine dönüştürmeyi kendine temel görev olarak görüyor. Görülmeyenleri göstermek, olan biteni sayılarla görünür kılmak ve bu verilerin herkes tarafından okunabilir, sorgulanabilir ve yeniden kullanılabilir olmasını sağlamak için çalışmalarını birden fazla platformda sürdürüyor.

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz