piątek, 26 kwietnia 2024

statystyka w domu i w kamienicy

Istnieje bardzo prosty sposób, aby cyklicznie tłuc teksty reporterskie, które będą zyskiwać wysoką "klikalność" i "czytalność" w każdym medium, od "Głosu Koziej Wólki" po główną stronę Onetu. Należy cierpliwie poczekać aż Główny Urząd Statystyczny opublikuje dane o wynagrodzeniach w Polsce, w tym między innymi przeciętne miesięczne wynagrodzenie (ta wartość aktualnie wynosi ok. 8 400 zł. brutto). A potem wystarczy już tylko wyjść między ludzi, rzucić odpowiednim hasłem zawierającym owe 8 400 brutto i smakowite teksty same będą nam wpadać do dyktafonu niczym tłuste łososie do paszcz ustawionych na półkach skalnych niedźwiedzi w górnych biegach północnoamerykańskich rzek.

- "O panie, ja nie znam literalnie nikogo kto by tyle zarabiał!"

- "Łoboże, toć to jak by my razem zusammen do kupy wzięli moją wypłatę, starego robotę na czarno, dziadka rentę, kuzyna zasiłek i jeszcze dodatek na kota, to by my tyle nie uzbierali!"

- "Statystyka to jest proszę pana, że jak ja wychodzę z psem na spacer to oboje mamy średnio po trzy nogi" 

- "Bo to na pewno w największych miastach i na pracownikach korporacji te badania robili!"

Zwłaszcza zarzuty tego ostatniego gatunku powtarzają się relatywnie często, nawet w rzetelnych pismach. Że te badania to "kłamstwo", albo że były "źle robione". I właśnie one są najbardziej chybione, jako że GUS w zbieraniu danych o wynagrodzeniach posiłkuje się znacznie bardziej twardymi źródłami niż reporter radia Eska, który wychodzi z mikrofonem na bulwar w Kołobrzegu i pyta napotkanych młodych ludzi co sądzą o najnowszym singlu duetu Sarnah & Soból. Chociaż absurdalne są wszystkie te stwierdzenia, a cały worek oburzeń i zdziwień wynika z zupełnie innej przyczyny - z niezrozumienia tego, czym jest średnia (i że nie oznacza ona reprezentatywności dla jakiejś populacji, a czasami nawet wręcz przeciwnie) i z nieumiejętnego jej stosowania przez naukowców.

Współcześnie mamy bowiem jakiś przedziwny kult średniej arytmetycznej. Gdyby to zliczyć procentowo, to okazałoby się pewnie, że średnia arytmetyczna na przykład w takiej Polsce ma więcej wyznawców niż Kościół Rzymskokatolicki! Średnia ocen w szkole, średnie miesięczne wynagrodzenie, średnie oczekiwane trwanie życia, średni wiek samochodu, średni rachunek za prąd, średni iloraz inteligencji (??!!), średni dochód na członka rodziny, średnia długość penisa (analiza porównawcza wśród Latynosów, Azjatów i tych rdzennych mieszkańców Afryki, których nazwy na literę "M" już nie wolno wymawiać). 

Rozumiem, że średnia arytmetyczna jest najbardziej znaną miarą statystyczną, jak również jedną z najprostszych do policzenia, chociaż to ostatnie akurat w dobie komputerów i programów do liczenia wszystkiego nie powinno mieć decydującego znaczenia. Liczenie jednak średniej przy każdej żywej okazji jest bowiem idiotyczne i robi poznawczą krzywdę nie tylko tej konkretnej statystyce, ale statystyce jako nauce w ogóle. Ludzie - nie widząc przełożenia wyników badań statystycznych na życie codzienne, tak jak z owym przeciętnym wynagrodzeniem - tworzą potem te słynne legendy deprecjonujące ową gałąź nauki. W rodzaju tych aforyzmów przypisywanych Einsteinowi (to też ciekawa kwestia - wygląda bowiem na to, że w dobrym tonie jest każde mądrze brzmiące powiedzenie przypisać Einsteinowi), że "są trzy rodzaje kłamstw: polityka, statystyka i prognoza pogody".

A cała sprawa sprowadza się bowiem - i wiedzą to nie tylko przedstawiciele gatunku homo sapiens sapiens, ale i ich starsi bracia w ewolucji: szympansy karłowate, lepiej znane pod ksywą "bonobo" - do kwestii używania odpowiednich narzędzi. Toporne i uporczywe stosowanie średniej arytmetycznej do niemal każdego celu przypomina używanie widelca do spożywania każdej napotkanej potrawy. Niby można, tylko efekty będą różne. Z kurczakiem i pierogiem wyjdzie nieźle, z sushi czy chlebem nadal jakoś się uda, ale już z zupą, choćby i najgęstszą, niekoniecznie.

Średnia arytmetyczna to fajna statystyka, ale nie do wszystkiego się nadaje. Lub jeszcze trafniej: nadaje się dobrze do niewielu celów. A już na pewno nie nadaje się do przedstawiania danych o wynagrodzeniach w społeczeństwie. Bo średnia arytmetyczna jest miarą bardzo wrażliwą na skrajne i ekstremalne wartości

Wyobraźmy sobie kamienicę przy ulicy Statystycznej w hipotetycznym mieście Liczbark Warmiński. Jest w niej dziewięć mieszkań (po trzy na każdym piętrze), a na poddaszu mieści się luksusowy penthouse. Zamieszkany przez dyrektora finansowego w dużej spółce giełdowej, który miał taką fantazję, żeby zamieszkać w kamienicy, zamiast postawić sobie nad jeziorem neutralną klimatycznie willę z atrium, patio, romantyczną ruiną w sadzie, alpakami w ogrodzie i lwami na kolumienkach przy bramie wjazdowej. Miesięczne zarobki (na tak zwaną "rękę") mieszkańców tej kamienicy przedstawiają się następująco:
- Mieszkanie nr 1:      3 000 zł.
- Mieszkanie nr 2:      3 000 zł.
- Mieszkanie nr 3:      3 000 zł.
- Mieszkanie nr 4:      3 000 zł.
- Mieszkanie nr 5:      3 000 zł.
- Mieszkanie nr 6:      3 000 zł.
- Mieszkanie nr 7:      3 000 zł.
- Mieszkanie nr 8:      3 000 zł.
- Mieszkanie nr 9:      3 000 zł.
- Mieszkanie nr 10:  43 000 zł.

Ile wynosi średnia pensja ("na rękę") w tej kamienicy? 
7 tysięcy złotych polskich.

Ilu mieszkańców tej kamienicy widziało kiedykolwiek kwotę 7 tysięcy zł. na swoim pasku wypłaty?
To pytanie retoryczne, bo nawet nietresowany orangutan widzi, że tylko jeden.

Jaki sens ma liczenie średnich zarobków w tej kamienicy?
To też pytanie retoryczne, ale na wszelki wypadek podpowiem, że równie sensowne jest liczenie średnich zarobków gdziekolwiek. W mieście, w grupie zawodowej, w społeczeństwie. Średni arytmetyczna w każdej z tych sytuacji cierpi na to samo schorzenie - wrażliwość na ekstremalnie skrajne wartości. Które może nie pojawiają się w przypadku ocen szkolnych czy długości penisa, ale już w przypadku zarobków - jak najbardziej. I powodują, że analizy pod tytułem "średnie zarobki w Polsce" czy "przeciętne miesięczne wynagrodzenie" można bez czytania spuścić w toalecie albo przerobić na kiełbasę.

Od lat powtarzam, że znacznie pilniejsze od uczenia dzieci w szkole programowania, pisania CV, wychowania seksualnego, obywatelskiego czy jakiegoś jeszcze innego patriotycznego, są dwie inne kwestie. Jedna to pierwsza pomoc, a druga to krytyczna analiza i weryfikacja usłyszanych oraz przeczytanych informacji. Społeczeństwu bez tej właśnie umiejętności można wmówić niemal wszystko (zwłaszcza w dobie internetu), można zmanipulować je na niewyobrażalną skalę dowolną plotką, dowolną miarą statystyczną (pamiętajmy, że kalkulator statystyczny policzy nam wszystko, co mu każemy, ale znacznie ważniejszą kwestią jest odpowiedź na pytanie: po co?), czy wreszcie dowolną informacją, która jest spójna, logicznie tam wszystko wynika jedno z drugiego, wygląda "naukowo", ale jest na przykład oparta na fałszywych przesłankach. Wszystko to ukazało się ze swoim przerażającym obliczem podczas epidemii COViD-19, podczas wojny na Ukrainie, a jakby się tak szczerze rozejrzeć - ukazuje się w każdym kącie i w każdej mysiej dziurze niemal każdego dnia.

Myślenie abstrakcyjne, podstawy logiki, statystyki i ogólnej metodologii naukowej, umiejętność odróżniania korelacji od związku przyczynowo-skutkowego, krytyczna weryfikacja nie tylko źródeł, ale każdej napływającej informacji, jak również - wciąż, mimo internetu w każdej kieszeni - minimalny chociaż poziom wiedzy ogólnej to kompetencje znacznie istotniejsze niż promowane onegdaj usilnie programowanie (które za chwilę w ogromnej mierze przejmie na siebie "sztuczna inteligencja") w kontekście bycia człowiekiem świadomym i odpornym na manipulację w świecie zalewanym przez gigantyczne ilości danych, newsów i analiz. Przedmiot szkolny łączący te wszystkie zdolności (teraz podobno czynią to... lekcje matematyki, ha-ha!) widziałbym przynajmniej od początku liceum, jeśli nawet nie wcześniej.

A dlaczego podstawy statystyki? Dlatego, że statystyka to nie nikomu niepotrzebna nauka dla "jajogłowych", przekłamująca rzeczywistość, bo przecież "kto zarabia te osiem i pół tysiąca o których tam piszą w tych analizach?". Statystyka to nie piramidalne brednie o tym, że gdy człowiek wychodzi z psem na spacer, to podobno statystycznie każdy z nich ma po trzy nogi. I statystyka to nie tylko średnia arytmetyczna. W koszyku jest mnóstwo innych miar, które w danej sytuacji mogą być znacznie przydatniejsze niż średnia, trzeba tylko umieć je dobrać i z nich korzystać. Zwłaszcza, że niektóre noszą bardzo ładne nazwy, tak, że i wymowę można poćwiczyć, i w towarzystwie zabłysnąć, i z mandatu drogowego się wykpić.

Przede wszystkim jednak obywatel znający najbardziej elementarne podstawy statystyki nie zabłysnąłby przed dziennikarzem niczym posiadacz złotego zęba w ciemnym pomieszczeniu i nie skompromitowałby się stwierdzeniem, że skoro średnie (przeciętne) wynagrodzenie wynosi osiem tysiaków, to co drugi spotkany na ulicy człek powinien tyle zarabiać.
Po to właśnie statystyka, moi drodzy.

Zatem na koniec wróćmy jeszcze raz do naszej kamienicy z dziewięcioma mieszkaniami i penthousem.
Ile wynosi mediana zarobków w tej kamienicy?
3 000 złotych ("na rękę")

Ile wynosi dominanta zarobków w tej kamienicy?
3 000 złotych ("na rękę")

A na ten przykład ile wynosi mediana zarobków w Polsce?
Niewiele ponad 4200 złotych ("na rękę")

Da się?

25. kwietnia 2024, 19:49 CEST,  52.245 °N, 16.546 °E, trzecia planeta Układu Słonecznego

Brak komentarzy: