Olasılık teorisinde Benford yasası diye birşey var, duymayanlar için anlatayım. Rastgelelik içeren doğal süreçlerde ortaya çıkan sayıların ilk basamaklarındaki rakamlar düzgün bir dağılım göstermezler, 1'ler daha fazla görünür yaklaşık %30 gibi, 2'ler ondan da az, 3'ler daha az vs... Şöyle bir dağılım.
Rastgele sayılarda niye böyle bir örüntü ortaya çıkıyor diye tuhaf gelebilir size ama basit matematiksel bir ispatı var, okuyunca mantıklı olduğu görülür, detayını merak eden wikipedia sayfasına bakabilir, konu o değil çünkü...
Benford analizi ne işe yarar? Elinize bir veri kümesi geçtiğinde gerçekten "rastgele" olmasını beklediğiniz sayılarla "rastgele süsü verilmiş" sayılar arasındaki farkı kabak gibi gösteren bir metoddur. Bir muhasebecinin rapor ettiği rakamlara hemen uygulanabilir mesela. Eğer bu örüntü yoksa o rakamlara şüphe ile yaklaşabilirsiniz. Ama rakamları uyduranlar eğer bu kanundan haberdar ise bunu da dikkate alarak daha "profesyonel" şekilde uydurabilirler, mesela bir rastgele sayı üreteci kullanabilirler, o zaman işe yaramaz tabii Benford analizi... Yani bütün dertlere çare değildir ama en azından "el ile alel acele mi yazılmış" diye hızlıca bakılabilecek bir yöntemdir. O işe yarar...
Bunun COVID'le ne ilgisi var? Bizim sağlık bakanlığının verilerine amatör bir İspanyol istatistikci Benford analizi uygulamış ve maalesef veriler Benford testi gibi basit bir testi bile geçememiş. (Benim aklıma gelse ben yapardım, kolay bir işlem çünkü ama adam yapmış işte, kullandığı kodu da açık kaynak paylaşmış, aşağıdaki twit zincirinde detayları var)
https://twitter.com/steamtraen/status/1331985658139860998?s=24Yani zaten şüphe ile yaklaştığımız rakamlardı bunlar, bir de bu işin "acemice" yapıldığı ortaya çıkmış oldu... Gerçekten üzücü...
"...parce que je suis heureux en mer et peut-être pour sauver mon ame..." - Bernard Moitessier