Geçen ay burada, Türkiye’de veri haberciliğinin geldiği noktayı konuşmuş, bardağın dolu tarafına bakmaya çalışmıştık. Bugün ise biraz da o bardağın içindeki suyu kimin, neden bulandırdığını konuşalım. Çünkü veri haberciliği denilen o “havalı” kavram, Türkiye sahasına indiğinde çoğu zaman “Excel dosyası dilenme sanatı”na dönüşüyor.
Dünyada veri gazetecileri kendilerini “data miner” (veri madencisi) diye tanımlar. Bizde ise tablo daha çok “veri arkeolojisi” gibi, ya var ya yok, bir veri peşindeyiz. Neden mi? Çünkü bizde veri “çıkarılmaz”; kurumların web sitelerinin en karanlık dehlizlerinden, tozlu linklerin altından, 90’lardan kalma arayüzlerin içinden kazıya kazıya bulunur. Nadiren TÜİK’te, derneklerin yıllık çıkan kurum raporlarında, birkaç kişinin bireysel uğraşıp elde ettiği verilerde görünür, onların da bazıları veriye dönüşmeden modifiye edilir, örneğin enflasyon yüksek olduğu ancak TÜİK raporlarında yüksek çıkması eleştirildiği için enflasyonun üzerinden belirlendiği ürünler açıklanmamaya başlanır, kendi hesapladıklarını açıklayanlar engellenir.“Yeni petrol” denilen şey bu mu?
Teknoloji konferanslarında o meşhur slaytı görmekten gına geldi: “Veri yeni çağın petrolüdür.” Doğru, veri petroldür. Ama Türkiye’de kurumlar bu petrolü rafine edip kullanıma sunmak yerine, onu tekrar toprağa gömmeyi; üstünü betonla kapatıp üzerine de bir “Faaliyet Raporu” binası dikmeyi tercih ediyor. Bir veri analisti ya da meraklı bir vatandaş olarak kamu kurumunun sayfasına giriyorsunuz. Amacınız basit: İlçenizdeki yeşil alan miktarının yıllara göre değişimini görmek. Beklentiniz ne? Temiz bir .csv dosyası, belki bir API bağlantısı; en kötü ihtimalle kopyalanabilir bir Excel tablosu. Peki gerçekte ne buluyorsunuz? Taranmış bir PDF. Hatta bazen o da değil: Bir Excel tablosunun ekran görüntüsü alınmış, Word’e yapıştırılmış, sonra PDF’e çevrilmiş, sonra o PDF tekrar resim gibi siteye yüklenmiş. İçinden bir satır veri çekmek bile mümkün değil. Bu, “Ferrari alıp ona tüp taktırmak” bile değil. Bu, Ferrari’yi at arabasına bağlayıp çekmeye çalışmak. O veriyi oradan almak için OCR (optik karakter tanıma) araçlarıyla boğuşmak, yanlış okunan “0”ları “O” harflerinden ayıklamak ve saatlerce temizlik yapmak zorundasınız. Veri haberciliği mesaisinin büyük kısmı analiz değil, bu “hamallık” ile geçiyor.“Kurum içi çalışma gerektirir” bahanesi
Bir de işin CİMER ve Bilgi Edinme Hakkı boyutu var ki, orası tam bir kara mizah antolojisi. Basit bir soru soruyorsunuz, diyelim: “Geçen yıl il genelinde kaç adet ağaç dikildi?” Gelen cevap çoğu zaman standart bir şablondan ibaret: “Talep ettiğiniz bilgi, ayrı bir inceleme ve kurum içi çalışma gerektirdiğinden…” Bu cevabın Türkçesi şuna çıkıyor: “Veri elimizde var ama şu an onu senin anlayacağın formata sokmaya üşeniyoruz.” Ya da daha kötüsü: “Veriyi verirsek, o veriden bizim hoşumuza gitmeyecek bir hikaye çıkarabilirsin.” Oysa unutulan bir şey var: Veri, kamunun malıdır. O verinin üretilmesi için harcanan maaş da, kullanılan sunucunun elektriği de bizim vergilerimizle ödeniyor. Belediyenin çöp kamyonunun rotası “devlet sırrı” ya da “ticari sır” olamaz.Vitrin süsü paneller
Son dönemde bir de “dashboard” (gösterge paneli) modası başladı. Her kurumun rengarenk, ibrelerin döndüğü, haritaların yanıp söndüğü panelleri var. Görünüşte harika, tam bir şeffaflık şöleni. Ama mouse ile üzerine gelip “Veriyi indir” dediğinizde… derin bir sessizlik. Size sadece “bakmanıza” izin veriyorlar, “dokunmanıza” değil. Oysa veri haberciliği, o rakamları alıp başka rakamlarla çarpıştırmak; gerçeğin sağlamasını yapmak demektir. Bize sadece sonucu gösteren değil, o sonuca nasıl ulaşıldığını denetlememizi sağlayan ham veri lazım. Vitrine bakıp “ne güzelmiş” dememizi bekleyenler, gazeteciliği halkla ilişkiler faaliyeti sanıyor.Hepsiveri’nin veri gazeteciliği çağrısı: Formatı düzeltin
Biz hepsiveri.com olarak, Walter White titizliğinde, en saf ve en temiz verinin peşindeyiz. “Yemek yapacaksak” malzeme taze olmalı. Buradan tüm kamu kurumlarına, belediyelere ve özel sektöre açık bir çağrı yapalım: Şeffaflık, bin sayfalık PDF raporları yayınlamak değildir. Şeffaflık, veriyi makine tarafından okunabilir formatta sunmaktır.-
- PDF değil, XLS verin.
-
- Resim/imaj değil, CSV verin.
-
- Özet değil, ham veri verin.

