Korki nie istnieją! Czyli o magii liczb
Ostatnio w trakcie przeglądania Internetu natrafiłem na grafikę opublikowaną na stronie Piotra Schramma na Facebooku. Sprowokowała mnie ona do zrobienia wpisu – analizy, której celem jest wyjaśnienie na czym polega manipulacja w niej zawarta.
Wpis, oprócz grafiki, zawiera jedno zdanie: „Co do faktów.”
Zatem przyjrzyjmy się faktom. Ale najpierw małe wprowadzenie teoretyczne.
Ile samochodów jeździ drogą każdego dnia, czyli kilka słów o tym, czym są godziny szczytu
Wyobraźmy sobie odcinek drogi o długości 1 km. Zwykła, typowa droga jednojezdniowa o jednym pasie ruchu. Załóżmy, że na tej drodze mamy ograniczenie prędkości do 60 km/h. Oznacza to, że jeden samochód jadąc cały czas ze stałą prędkością 60 km/h pokona ten odcinek drogi w jedną minutę. Akurat ta informacja jest nam całkowicie zbędna w dalszych rozważaniach, ale chciałem w ten sposób rozgrzać nieco nasze szare komórki, by lepiej poradziły sobie z dalszą częścią tego wywodu.
Załóżmy też, że średnia długość samochodu to 6m, oraz że jadąc z prędkością 60km/h należy zachować średni odstęp 4m. Dzięki temu wiemy, że następny samochód pojawi się na tym odcinku drogi nie prędzej niż wtedy, gdy poprzedni przejedzie 10m (6+4). Zatem jednocześnie na tej drodze może znaleźć się 100 samochodów jadących w jednym kierunku. Oraz, co istotniejsze z punktu widzenia dalszych obliczeń, następny samochód pojawi się w tym samym punkcie tejże drogi 0,6 s. po poprzednim.
Wykorzystamy tutaj nieco matematyki i fizyki na poziomie szkoły podstawowej.
Na początek wyprowadzimy wzór na czas potrzebny na pokonanie drogi ze stałą prędkością ze wzoru na prędkość w ruchu jednostajnym prostoliniowym. Następnie za pomocą tegoż wzoru przeprowadzimy obliczenia, które doprowadziły nas do powyższej wartości 0,6 s.
v = \frac{s}{t} \rightarrow t = \frac{s}{v}
t = \frac{0.01 km}{60 km/h} = \frac{10 m}{\frac{60000 m}{3600 s}} = \frac{36000}{60000} = 0.6s
Godzinowa przepustowość tej drogi w bardzo dużym uproszczeniu to liczba samochodów, która będzie w stanie wjechać na tę drogę w czasie sześćdziesięciu minut, a więc w ciągu 3600 sekund.
x = \frac{3600}{0.6} = 6000
Zatem ten odcinek drogi może pokonać w ciągu godziny nie więcej niż 6000 samochodów.
Halo, mobilki, czy na tej drodze są korki?
Wyobraźmy sobie więc następującą historię:
Przeprowadzono badania statystyczne ruchu na wspomnianym odcinku drogi. Z badań tych wynika, że w ciągu doby po tej drodze przejeżdża ok. 76 000 samochodów.
Przeprowadźmy szybkie obliczenia:
76000:24 \approx 3167
W ciągu godziny przez ten odcinek przejeżdża średnio 3167 samochodów. Wcześniej obliczyliśmy, że przepustowość drogi wynosi 6000 samochodów na godzinę. Można więc wyciągnąć prosty wniosek: ta droga się nie korkuje.
Dołóżmy zatem kolejną cegiełkę do powyższych danych – informację, że w godzinach nocnych (22-6) tą drogą przemieszcza się w sumie ok. 2000 samochodów. Pozostałe pokonują ją w ciągu dnia:
76000 - 2000 = 74000
Teraz mamy 74000 samochodów do rozłożenia nie na 24, a na 16 godzin.
74000:16=4625
Kolejna informacja: między 10 a 14 oraz między 18 a 22 (czyli poza szczytem) po tej drodze przejeżdża średnio 2000 samochodów na godzinę. Zatem mamy 8 godzin po 2000 samochodów.
8 \times 2000 = 16000\\ 74000-16000=58000
Wynika z tego, że w godzinach 6-10 oraz 14-18 przejeżdża tą drogą 58000 samochodów.
58000:8 = 7250
7250 samochodów na godzinę w szczytowym momencie. O 1250 więcej, niż maksymalna przepustowość drogi. I można tak jeszcze długo uszczegóławiać dane.
Rozumiecie już, do czego zmierzam?
Błędne wnioski z prawdziwych danych
Piotr Schramm nie posłużył się w swoim wpisie błędnymi danymi. Chodzi o to, że do wyciągnięcia swojego wniosku posłużył się danymi ogólnymi, dotyczącymi całego okresu pandemii, ignorując fakt, że pandemia nie jest zjawiskiem jednostajnym.
Wspomniany wpis odnosi się do bieżącej sytuacji w Indiach. Media informują nas obecnie o kryzysie koronawirusowym w tym kraju i o kolejnych padających tam rekordach zachorowań i zgonów. A tymczasem komentarz dotyczący sytuacji aktualnej, która zmienia się dość dynamicznie, został oparty o dane z całego okresu pandemii, a więc grubo ponad roku. To mniej więcej tak, jakby do oceny natężenia ruchu w godzinach szczytu wziąć średnie obłożenie dróg z całej doby.
Nie mam zamiaru tutaj w żaden sposób oceniać tego, czy wspomniany wpis zawiera manipulację celową czy nieświadomą. Nie chcę atakować pana Piotra Schramma.
Chcę również mocno podkreślić, że jestem daleki od stawiania jednoznacznej oceny tego, jak poważny jest kryzys panujący obecnie w Indiach. To, co dla mnie jest istotne z punktu widzenia tego tekstu, to pokazanie, jaka manipulacja kryje się za danymi przedstawionymi we wpisie zacytowanym na początku. Chcę raczej pokazać sam błąd rozumowania stojący za tą grafiką i wyciągniętymi na jej podstawie wnioskami.
Jak wygląda rzeczywistość?
Spójrzmy na wykresy przedstawiające dynamikę pandemii w Indiach i w Polsce. Źródłem danych w tej analizie jest dla mnie COVID-19 Data Explorer dostępny na stronie Our World In Data. Poniższe dane są aktualne na dzień 11.05.2021 r.
Na wstępie chciałbym jeszcze zwrócić uwagę, że na wykresach każdy punkt przedstawia średnią z ostatnich siedmiu dni – dzięki temu łatwiej jest analizować trendy, ponieważ wykres nie jest aż tak poszarpany.
Polska
Najpierw przyjrzyjmy się sytuacji w naszym kraju.
W Polsce obecnie mamy okres wygaszania fali. Wykrywamy coraz mniej przypadków, stopniowo spada też liczba dziennych zgonów.
Indie
Teraz zerknijmy na sytuację w Indiach.
Widzicie różnicę? W Polsce mamy obecnie okres wygasania fali. Natomiast w Indiach jesteśmy w tej chwili na „górce”, której tej kraj jeszcze nie doświadczył od początku pandemii.
Co ważne, w Indiach przez większość czasu było wykrywanych naprawdę mało przypadków i zgonów, a więc sumaryczna liczba zachorowań i śmierci na milion mieszkańców za cały okres pandemii jest stosunkowo niska.
Panie, ale przecież tam jest prawie 1,5 miliarda ludzi!
Niektórzy słusznie zauważają, że 400 tysięcy przypadków na 1,5 miliarda ludzi to tak, jakby w Polsce zachorowało 10 000 osób. Co za tym idzie, jeśli w Indiach na COVID umiera 4000 osób, to tak, jakby w Polsce zmarło trochę ponad 100.
W tym miejscu trzeba zwrócić uwagę na to jakim państwem są Indie.
PKB per capita wynosi w Indiach nieco ponad 2000 USD, podczas gdy PKB per capita Polski to niemal 17000 USD (źródło). Ma to swoje konsekwencje na wielu płaszczyznach, w tym również w możliwościach testowania ludzi, docierania do nich i wielu innych aspektach zarówno walki z pandemią, jak i śledzenia jej rozwoju. A przecież nasze państwo wcale nie uchodzi za jakąś gospodarczą potęgę.
Ponadto w Indiach jest bardzo duży rozstrzał pomiędzy liczbą testów na milion w różnych regionach, co widać na wykresie dostępnym tutaj: źródło. Różnica jest porażająca – od 150 000 na milion do 20 000 na milion. W grudniu 2020 wyglądało to jeszcze gorzej – w stanie z najmniejszą liczbą testów było to zaledwie 605 testów na milion mieszkańców – źródło. Analiza danych dostępnych w pierwszym ze źródeł – przede wszystkim % pozytywnych testów – pozwala z dużą dozą prawdopodobieństwa przyjąć, że mamy spore niedoszacowanie w wynikach przynajmniej z części terytorium Indii.
Takich różnych mniejszych lub większych czynników wpływających na liczby widziane w statystykach pandemii jest pewnie jeszcze sporo. Nasze dane też nie są w pełni wiarygodne. Ale wiarygodne są trendy, które w nich widać.
W Indiach wcale nie jest dobrze…
Nawet jeśli uznamy, że dane w Indiach są porównywalnie wiarygodne, co nasze (z czym osobiście się nie zgadzam, ale możemy na chwilę przyjąć, że tak jest), to obecna sytuacja w Indiach jest co najmniej analogiczna do tej, jaką my mieliśmy u nas w połowie października – czyli na początku jesiennej fali pandemii.
Poniżej porównanie liczby nowych przypadków i zgonów na milion obywateli w czasie. Ponownie – dla większej czytelności każdy punkt na wykresie przedstawia średnią siedmiodniową.
W Indiach zaczęła się właśnie najgorsza fala od początku pandemii. I choć nie mamy w pełni wiarygodnych danych na ten temat, sytuacja w tym kraju na pewno nie jest łatwa.
Nie zmienia to faktu, że jesteśmy jednym z najgorzej radzących sobie z pandemią państw w Europie. Ale analiza przyczyn takiego stanu to temat na osobny tekst. Wydaje mi się również, że na ten temat powiedziano już wystarczająco dużo. Moja opinia nie wniesie nic nowego, a jedynie spowoduje zamęt.
Człowiek uczy się całe życie…
Liczby są bardzo przydatnym narzędziem do prezentowania rzeczywistości. Niestety, aby móc z nich korzystać, trzeba też być w stanie oceniać to, co za nimi stoi, osadzać je w kontekście i wyciągać na ich podstawie prawidłowe wnioski. Tego we wpisie pana Piotra Schramma zabrakło.
Na koniec chciałem polecić pewien artykuł, który znalazłem ostatnio na profilu znajomej na Facebooku:
Analfabetyzm matematyczny. Jak pseudonauka wykorzystuje to, że nie umiemy liczyć
Bardzo dobrze ujmuje to, co zaprezentowałem również w tym wpisie.
PS. Wkrótce pojawią się nowe wpisy z cyklu Szkoła Cyfrowego Życia. Tym razem będę poruszał temat baniek informacyjnych i algorytmów doboru treści.
PPS. Jeśli podobał Ci się ten wpis, to zachęcam Cię do udostępnienia go w swoich mediach społecznościowych. W ten sposób pomożesz mi zwiększyć grono osób, do którego on dotrze. Z góry dzięki!