Postanowiłem nieco rozwinąć mój poprzedni post o fenomenie zwanym prawem czy też rozkładem Benforda. Znajdziesz go tutaj (podstawy się przydadzą): Przestępcy, którzy nie znają prawa Benforda zawsze wpadną.
Zaskakująco, prawo Benforda nie zostało odkryte przez osobę o tym nazwisku, a astronoma Simona Newcomb'a. W 1881 roku zauważył on ciekawą rzecz - stronice w księdze z tablicami logarytmów, które miały jedynkę z przodu były bardziej zużyte niż inne. Prawo zostało tak nazwane po zauważeniu tego samego faktu przez Franka Benford'a. Dowód poznano dopiero w 1995 roku!
Uniwersalność prawa Benforda
Natura tak chciała, ze prawo to pojawia się w naturalnie stworzonych sytuacjach.
- Przykładowo sprawdza się w badaniu powierzchni państw. Co prawda granice są stworzone przez człowieka, ale jak już wiemy większość czynników, które wpływają na decyzje ludzi są losowe ( więcej ).
Skalowanie danych nie wpływa na działanie tego rozkładu. Tak samo nie zależy od zastosowanego systemu liczbowego.
- Rozkład Benforda nienaturalnie się wyostrza przy badaniu mas atomowych pierwiastka. Jedynka na pierwszych pozycjach pojawia się w ponad 44% przypadków
Badając prawo Benforda używa się raczej losowych danych. Wybrano próbkę n pierwiastków i je wylosowano ze wszystkich znanych.
- Oczywiście losując liczby z liczb naturalnych prawo Benforda ukazuję się w sposób idealny z rozkładem. W układzie dziesiętnym, znacząca cyfra k pojawia się z częstotliwością proporcjonalną do log(1 + 1/k).
Ludzie rozpoznawalni muszą uważniej przyglądać się swoim działaniom. Pewien badacz nie omieszkał sprawdzić czy zwroty podatku uzyskiwane przez 13 lat przez Billa Clinton'a są zgodne z prawem Benforda. Okazało się, że tak.
Pułapki rozkładu Benforda
Prawo to jest uniwersalne, ale nie można za bardzo zawężać badanych danych. Przykładowo nie zadziała ono, jeżeli będziemy badać wypłaty tylko wielorybów na steemicie, a płotki pominiemy. Rzadko, który znany użytkownik zarobi na swoim poście 1$ lub 11$. Może się też zdarzyć, że whale zarabia najczęściej 100-200$, a bardzo rzadko powyżej i to prawo wtedy też będzie nie możliwe do zaufania.
Uwagi, opinie? Zapraszam do rozmowy.
Poprzednio w serii:
- Popełnij błąd podczas projektowania gry, a wygram miliony - Edge Sorting
- Przestępcy, którzy nie znają prawa Benforda zawsze wpadną
- 100 Obserwujących! Wasze nicki zamieniam na liczby i gram w Lotto!
- Istnieje biblioteka, w której zapisane jest wszystko!
- Czy polityków lepiej losować niż wybierać?
- Dlaczego nie wiesz, że 0,9(9)=1?
- Jak wygrałem 2 SBD obstawiając ligę mistrzów losowo?!
- Czy z matematycznego punktu widzenia warto wierzyć w Boga?
- Jak poprawnie i dostatecznie losowo tasować karty (i łatwo)?
- Generator liczb lotto - kryptograficzny generator ISAAC wygrywa więcej od człowieka
Czy można to brać pod uwagę na Steemie, gdzie nie ma czynnika losowego, a jedynie głosy innych ludzi?
Nie wiem czy masz to na myśli, ale jeśli chodzi o wartość głosów na steem, to najwięcej będzie tych najniższych podbić. Tak rozumiem to prawo.
Tak jest, aczkolwiek steemit jest młody i najwięcej postów dostaje te niskie voty więc prawo się jeszcze bardziej wyostrza :)
Głosy w pewnym sensie są też losowe w dużym ekosystemie. Czy steem jest już wystarczająco duży? Mam pewne obawy. Ale w przyszłości kiedy będzie spora liczba użytkowników i duży przedział wynagrodzeń/ilości kliknięć/innych danych (liczy się rozpiętość próbki tzn. muszą być dane różnych wielkości: 1-10,10-100,100-1000 a nie np tylko 1-10) to na bank prawo będzie działać.