Prawo Benforda cz. 2 - uzupełnienie i przykłady

in #polish6 years ago (edited)

number-1932106_960_720.jpg

Postanowiłem nieco rozwinąć mój poprzedni post o fenomenie zwanym prawem czy też rozkładem Benforda. Znajdziesz go tutaj (podstawy się przydadzą): Przestępcy, którzy nie znają prawa Benforda zawsze wpadną.

Zaskakująco, prawo Benforda nie zostało odkryte przez osobę o tym nazwisku, a astronoma Simona Newcomb'a. W 1881 roku zauważył on ciekawą rzecz - stronice w księdze z tablicami logarytmów, które miały jedynkę z przodu były bardziej zużyte niż inne. Prawo zostało tak nazwane po zauważeniu tego samego faktu przez Franka Benford'a. Dowód poznano dopiero w 1995 roku!

Uniwersalność prawa Benforda

Natura tak chciała, ze prawo to pojawia się w naturalnie stworzonych sytuacjach.

  • Przykładowo sprawdza się w badaniu powierzchni państw. Co prawda granice są stworzone przez człowieka, ale jak już wiemy większość czynników, które wpływają na decyzje ludzi są losowe ( więcej ).

Skalowanie danych nie wpływa na działanie tego rozkładu. Tak samo nie zależy od zastosowanego systemu liczbowego.

  • Rozkład Benforda nienaturalnie się wyostrza przy badaniu mas atomowych pierwiastka. Jedynka na pierwszych pozycjach pojawia się w ponad 44% przypadków

Badając prawo Benforda używa się raczej losowych danych. Wybrano próbkę n pierwiastków i je wylosowano ze wszystkich znanych.

  • Oczywiście losując liczby z liczb naturalnych prawo Benforda ukazuję się w sposób idealny z rozkładem. W układzie dziesiętnym, znacząca cyfra k pojawia się z częstotliwością proporcjonalną do log(1 + 1/k).

Ludzie rozpoznawalni muszą uważniej przyglądać się swoim działaniom. Pewien badacz nie omieszkał sprawdzić czy zwroty podatku uzyskiwane przez 13 lat przez Billa Clinton'a są zgodne z prawem Benforda. Okazało się, że tak.

whale-311283_960_720.png

Pułapki rozkładu Benforda

Prawo to jest uniwersalne, ale nie można za bardzo zawężać badanych danych. Przykładowo nie zadziała ono, jeżeli będziemy badać wypłaty tylko wielorybów na steemicie, a płotki pominiemy. Rzadko, który znany użytkownik zarobi na swoim poście 1$ lub 11$. Może się też zdarzyć, że whale zarabia najczęściej 100-200$, a bardzo rzadko powyżej i to prawo wtedy też będzie nie możliwe do zaufania.

Uwagi, opinie? Zapraszam do rozmowy.

Poprzednio w serii:

Sort:  

Czy można to brać pod uwagę na Steemie, gdzie nie ma czynnika losowego, a jedynie głosy innych ludzi?

Nie wiem czy masz to na myśli, ale jeśli chodzi o wartość głosów na steem, to najwięcej będzie tych najniższych podbić. Tak rozumiem to prawo.

Tak jest, aczkolwiek steemit jest młody i najwięcej postów dostaje te niskie voty więc prawo się jeszcze bardziej wyostrza :)

Głosy w pewnym sensie są też losowe w dużym ekosystemie. Czy steem jest już wystarczająco duży? Mam pewne obawy. Ale w przyszłości kiedy będzie spora liczba użytkowników i duży przedział wynagrodzeń/ilości kliknięć/innych danych (liczy się rozpiętość próbki tzn. muszą być dane różnych wielkości: 1-10,10-100,100-1000 a nie np tylko 1-10) to na bank prawo będzie działać.