piątek, 30 września 2022

gdzie są TE liczby?

Są takie sytuacje, gdy ze wszystkich dziedzin wiedzy, które nie są nauczane w szkole a być powinny, na pierwszy plan wysuwa się podstawowa wiedza o metodologii nauk, zwłaszcza tych statystycznych i społecznych. Wiedza taka pozwoliłaby obronić się przed szeregiem manipulacji i półprawd funkcjonujących w przestrzeni publicznej.

 
Kilka tygodni temu pojawiły się na ulicach nowe billboardy pewnej fundacji, która wcześniej pytała między innymi "gdzie są TE dzieci". Tym razem plakaty przedstawiają "statystyki" dotyczące rozpadających się małżeństw i natychmiast wywoływały w internecie tzw. shitstorm. 
 
 
Trzeba przyznać, że nawet zabawne jest obserwowanie jak dorośli ludzie wykłócają się o rzeczy, które w warunkach powszechności wiedzy o której była mowa wyżej, mogłyby być zwyczajnie zignorowane lub wyśmiane. Tymczasem kompromitują się dyskutanci po obydwu stronach sporu o treści na tych nieszczęsnych billboardach. 
 
Kompromitują się ich pomysłodawcy. Bo publikują bez podania źródła jakieś niefalsyfikowalne dane. Bo między wierszami usiłują przeforsować istnienie nieweryfikowalnego związku przyczynowo-skutkowego między rodzajem zawartego małżeństwa a rozwodami. A dodatkowo posługują się mnóstwem skrótów myślowych i uproszczeń (zrównują "rozpad małżeństwa" z "rozwodem", gdy ten drugi w przypadku małżeństw kościelnych jest niemożliwy; w grę wchodzi tylko "unieważnienie", a to po pierwsze nie to samo, a po drugie - jest to skrajnie trudne do uzyskania, o ile nie jest się na przykład byłym prezesem TVP o drobiowym nazwisku).
 
Paradoksalnie równie mocno kompromitują się krytykanci billboardów, którzy szaleńczo usiłują zdyskredytować przedstawione na nich dane, w przekonaniu, że gdyby te dane jednak okazały się prawdziwe, to udowadniałyby tezę, którą usiłują przeforsować fundatorzy plakatów.
I to niezwerbalizowane przekonanie widać niemal w każdym krytycznym wobec tych billboardów tekście.
- "Chcą nas przekonać, że bycie wierzącą i praktykującą parą zmniejsza prawdopodobieństwo rozpadu małżeństwa"
- "Nowe billboardy fundacji Kórnice usiłują dowodzić, że wspólna modlitwa i msza w kościele chronią przed rozwodem"
To tylko dwa z szeregu przykładów, ale przykłady wystarczająco przerażające. Bo dalej w tych tekstach idzie tak, jak zarysowałem wyżej - krytycy plakatów są najwyraźniej przekonani, że gdyby te dane które widać na zdjęciu okazały się prawdziwe, to udowadniałyby przedstawioną na nich tezę. Dlatego chcą za wszelką cenę poddać w wątpliwość prawdziwość tych danych, pytają o źródła, przekonują że badań z USA nie można przekładać na warunki polskie, zwracają uwagę, że nie sprecyzowano o jaką religię chodzi itd.
 

Tymczasem to czy te dane są prawdziwe czy wzięte z Księżyca jest kompletnie bez znaczenia. Kompletnie! Nawet jeśli dane z plakatów są prawdziwe (a bardzo możliwe, że nawet i są), to zupełne nic to nie oznacza. Wartość poznawcza tych danych jest niemal zerowa w kontekście postawionej tezy, a już tym bardziej nie udowadniają one wpływu rodzaju ślubu czy to na jakość tego małżeństwa czy też na ewentualność rozwodu. Bo tego udowodnić się po prostu nie da (przynajmniej na gruncie naukowym).
 
My - ludzie z gatunku homo sapiens sapiens - mamy wtórnie wdrukowany pewien niebezpieczny mechanizm. Gdy tylko widzimy zestawione ze sobą jakieś liczby albo procenty, bezwiednie zakładamy, że są ze sobą powiązane i że jedno ma wpływ na drugie, albo że jedno wynika z tego drugiego. Jeśli w dodatku jest to okraszone stwierdzeniami typu: "wykonano badania...", "zaobserwowano, że...", wówczas już nawet siekierą się nas nie odrąbie od przekonania, że zachodzi między tymi zestawami danych ścisły związek.
 
Tymczasem zaobserwowano jakiś czas temu, że na przykład w dni w które sprzedaje się więcej lodów znacznie wzrasta liczba utonięć. Związek był bardzo silny - im więcej sprzedanych lodów tym więcej utonięć. Wzrost sprzedaży o kilkadziesiąt procent w danym dniu niemal zawsze skutkował dużym wzrostem liczby utonięć. Spadek sprzedaży lodów to spadek liczby utonięć. Ale czy to oznacza, że lody w jakiś tajemniczy sposób sprawiają, że ludzie się topią w czym się da: od basenów przydomowych po plaże nad oceanami? Czy po zjedzeniu lodów stajemy się ociężali i tracimy umiejętność dobrego pływania? A może na odwrót - ktoś był świadkiem utonięcia i tak się zdenerwował, że musiał sobie natychmiast zjeść loda, żeby się lepiej poczuć? I to utonięcia wpływają na sprzedaż lodów, a nie na odwrót? Oczywiście, że nie. Ani jedno, ani drugie. To klasyczny przykład, że nawet jeśli dwie zmienne (czyli po prostu jakiekolwiek obserwacje, z badań lub z "codziennego życia") współzmieniają się ze sobą (czyli jak jedna rośnie to druga również coś w analogiczny sposób: też rośnie, albo maleje) to jeszcze nie oznacza, że jedna WPŁYWA na drugą, albo ta druga na tę pierwszą. 
 
A nawet więcej: one bardzo rzadko wpływają na siebie! W świecie, w którym jesteśmy wprost zasypani liczbami, procentami, różnorakimi danymi, takich związków można zaobserwować miliony.
- Część (zdecydowanie większa) to po prostu czyste przypadki, które muszą się pojawić przy takiej masie liczb jaka nas otacza.
- A część to będą korelacje, gdzie w grę wchodzi jakaś trzecia zmienna, niewidoczna na pierwszy rzut oka i nie podkreślona w relacji z obserwacji, która tłumaczy wzrost zarówno pierwszej jak i drugiej zmiennej. W przykładzie z lodami i utonięciami jest nią temperatura powietrza. Im goręcej, tym ludzie kupują więcej lodów. Im goręcej, tym ludzie chętniej idą nad wodę (i mają więcej okazji, żeby się utopić). Z kolei w podręcznikowym przykładzie z paradoksem straży pożarnej (im więcej jednostek straży jedzie do pożaru, tym większe są potem straty materialne w tym pożarze) trzecią zmienną jest wielkość pożaru. Ale nadal ta trzecia zmienna jest tylko zmienną pośredniczącą, która tłumaczy współzmienność dwóch pozostałych, ale jeszcze nie oznacza wyłącznego związku przyczynowo-skutkowego.
 
W nauce bowiem, żeby udowodnić że jedno wpływa na drugie, nie wystarczy gdy widzimy że jak jedno się zmienia, to drugie też. Nie wystarczy więc także, gdy widzimy, że przy ślubach kościelnych związek rozpada się rzadziej, a przy cywilnych częściej. Bo do udowodnienia wpływu jednego na drugie musimy absolutnie wykluczyć, że na to drugie działa w taki sam sposób coś innego niż to pierwsze. Ładnie to się nazywa wykluczeniem wpływu zmiennych zakłócających.
 
I taki fizyk albo chemik ma w tym zakresie trochę łatwiej. Załóżmy, że chemik bada jakąś substancję X i chce udowodnić, że gdy doleje do niej kwasu - powiedzmy - solnego, to ta substancja X zmieni kolor na kanarkowy. Pierwsze, co taki chemik zrobi, to umieści substancję X w szczelnej probówce, w sterylnym laboratorium i jeszcze dodatkowo w jakimś równie szczelnym urządzeniu. Dlaczego? Żeby mieć 100% pewności, że to właśnie kwas solny, który zaraz będzie dolewał, wywoła zmianę koloru substancji na kanarkowy. Bo gdyby to robił na brudnym biurku, w zatęchłej kanciapie woźnego, wówczas nie mógłby mieć takiej pewności, bo zmianę koloru mogło wywołać coś innego niż ten kwas solny, na przykład jakieś drobinki kurzu, które mogły się dostać do probówki podczas eksperymentu, jakiś pyłek który wleciał przez otwarte okno, tynk który odpadł z sufitu, albo gołąb, który wrzucił do roztworu kawałek bagietki (była taka sytuacja, bodaj przy pracach nad Zderzaczem Hadronów!)
Natomiast, gdy nasz chemik zadba o to, żeby nic innego nie mogło się dostać do substancji X poza tym kwasem który będzie dolewał, wówczas może mieć pewność, że zadbał o idealne warunki eksperymentu.
 
W naukach społecznych jest trochę trudniej. Wprawdzie możemy zamknąć człowieka na kilka godzin w laboratorium i prowadzić jakieś eksperymenty związane z jego zachowaniem, zdolnościami poznawczymi i tak dalej, jednak nigdy w stu procentach nie wyeliminujemy wpływu na jego zachowanie innych czynników niż te, którymi sterujemy i których wpływ badamy. A zatem nigdy nie będziemy mieć takiej pewności, jaką są w stanie osiągnąć fizyk czy chemik. I dlatego też korzystamy ze skali prawdopodobieństwa, czyli z metod statystycznych.
 
A one nakładają na badaczy określone reguły, które sprawiają, że jednoznaczny wpływ czegoś na coś innego to nie jest kwestia tylko tego, że się nam coś wydaje z liczb, które mamy przed sobą. Wyobraźmy sobie, że bierzemy 100 przypadkowo wybranych osób, dzielimy je losowo na dwie równe grupy (A i B). Każdej osobie z grupy A dajemy do wypicia pół litra spirytusu, a każdej osobie z grupy B - wodę mineralną. Potem dajemy im do zrobienia jakieś zadanie - obydwu grupom takie samo. W tym zadaniu można uzyskać od 0 do 10 punktów. I nawet jeśli widzimy potem, że w grupie, która piła spirytus średni wynik to 2,5 punktu, podczas gdy w grupie z wodą mineralną jest to prawie 8 punktów, to chociaż różnica jest wyraźna na pierwszy rzut oka, to nadal nie możemy powiedzieć, że rodzaj napoju wpływa na zdolności niezbędne do rozwiązania tego zadania, ani też na jego wyniki.
Najpierw trzeba bowiem spełnić szereg określonych założeń, które mają tak paskudne nazwy, że nie wypada mówić o nich głośno przed godziną dwudziestą trzecią. Trzeba więc sprawdzić czy rozkład wyników w każdej z grup jest zbliżony do rozkładu normalnego, ilustrowanego słynną krzywą Gaussa, a robimy to na przykład przy pomocy testu Kołmogorowa-Smirnowa. Trzeba też wykonać testy na (uwaga, będzie brzydkie słowo!) homogeniczność wariancji w tych grupach i dopiero wtedy, gdy wszystkie te założenia są spełnione, możemy wrzucić dane do programu statystycznego, który nam powie, czy różnica tych uzyskanych wyników jest istotna statystycznie.
 
I jeśli jest, to wreszcie pozwala nam wysnuć wniosek (ale tylko z 95-procentową pewnością, bo tak zwykle ustalamy poziom istotności i przedziały ufności), że rodzaj napoju (spirytus vs. woda) wpływa na wyniki uzyskane w tym zadaniu.
 
Czyli - nie jest łatwo. A chodzi tylko o jakiś prosty wpływ, jak wpływ wypitego napoju na wykonanie jednego zadania. Mimo to nadal nie mamy 100-procentowej kontroli nad innymi niż napój zmiennymi, mogącymi wpływać na jakość rozwiązywania zadania (ktoś mógł skopać zadanie, bo rano pokłócił się z teściową, wciąż o tym myślał i nie mógł się skoncentrować, a nie dlatego, że wypił przed chwilą pół litra spirytusu).
 
A co w przypadku tak skomplikowanej sytuacji jak małżeństwo?
 
Teoretycznie moglibyśmy zaprojektować eksperyment. Bierzemy 100 par damsko-męskich (zostawmy na razie na boku inne konfiguracje), dzielimy je losowo na dwie grupy. Jednym każemy wziąć ślub kościelny, drugim - tylko cywilny. Potem zamykamy ich wszystkich na rok w jakimś "domu wielkiego brata" (tylko bez kamer), zapewniamy im identyczne warunki życia, funkcjonowania, spędzania wolnego czasu itd. I za rok sprawdzamy, ile procent w poszczególnych grupach się sobą znudziło.
Pomijając już fakt, że przeprowadzenie takiego eksperymentu jest nierealne, nadal nie mamy kontroli nad innymi niż rodzaj zawartego ślubu zmiennymi wpływającymi na trwałość związku (takimi jak cechy psychologiczne małżonków, ich dojrzałość życiowa, motywacja do zawarcia związku, umiejętność rozwiązywania konfliktów, reagowania na różne sytuacje, temperament i milion innych zmiennych osobowościowych).
 
Nie mamy kontroli, a mamy tych ludzi przecież 24/7 pod kloszem. Zatem co dopiero w realnym życiu, gdzie dochodzą dodatkowo różne zewnętrzne czynniki związane z funkcjonowaniem w społeczeństwie, wydarzeniami losowymi, kłopotami rodzinnymi, finansowymi etc.
 
Dlatego nawet taki utopijny eksperyment nie pomógłby nam udowodnić, że rodzaj małżeństwa (kościelne vs. cywilne) wpływa na prawdopodobieństwo zerwania związku, bo jest to zbyt złożona kwestia, którą trudno sprowadzać do jednowymiarowego wpływu jakiegoś jednego, określonego czynnika. I tym bardziej nie pomoże nam w tym analiza statystyk "z życia wziętych", jak w tym badaniu z billboardów, gdzie kontroli nad tym, co się działo w życiu badanych ludzi nie mamy absolutnie żadnej. Jeśli ktoś z tych statystyk wnioskuje o wpływie rodzaju małżeństwa na jego trwałość, to głosi piramidalne brednie i nie ma pojęcia o czym mówi. A jeśli ktoś twierdzi, że jest w stanie zaprojektować badanie, które taki wpływ udowodni, wówczas należy mu szczerze życzyć powodzenia, dać na drogę przysłowiowy krzyżyk i jeszcze porcję rosołową.
 
Skąd zatem wyraźne różnice w statystykach z billboardu (zakładając oczywiście, że są prawdziwe)?
Mogą wynikać z każdego z wymienionych powodów. Mogą być tylko przypadkowymi związkami. Może się okazać, że stoi za nimi jakaś trzecia zmienna, na przykład poziom religijności. Która wyjaśnia zarówno większą gotowość do zawarcia związku sakramentalnego, jak i potem do nie zrywania go (dzięki dodatkowej, zewnętrznej motywacji do trwania w takim związku: presja środowiska, świadomość grzechu etc.).
 
Mogą je również wyjaśniać podstawowe prawa statystyki, w tym przypadku te mówiące o niebezpieczeństwach związanych z nierównolicznością badanych grup (liczba małżonków "cywilnych" daleko przekracza tych "kościelnych, którzy razem chodzą do kościoła i codziennie razem się modlą"). A z szeregu prawideł statystycznych, na czele z centralnym twierdzeniem granicznym, wiemy że w mało licznych grupach łatwiej o uwypuklenie się jakichś nietypowych, niereprezentatywnych tendencji, podczas gdy w dużych grupach te nietypowe wyniki są "wygładzane" przez ilość przypadków, a rozkład obserwacji dąży do rozkładu normalnego.
 
Nie chodzi teraz jednak o to, by usilnie wyjaśniać różnice uwidocznione w badaniach niewiadomego pochodzenia. O ile nawet istnieje taka korelacja i małżeństwa "cywilne" rozwodzą się statystycznie "częściej" niż "kościelne", to na poziomie pojedynczego przypadku ani żaden ślub, czy to kościelny czy cywilny, nas nie "chroni" przed rozwodem, ani żaden nie zwiększa czy nie zmniejsza prawdopodobieństwa rozpadu małżeństwa. Kto tej subtelnej różnicy nie pojmuje powinien zamiatać drucianą szczotką drogi dojazdowe do punktu skupu żywca wieprzowego, a nie zajmować się statystyką i naukami społecznymi, albo pisać o tych kwestiach w gazetach czy internecie.
 
Liczbami możemy zilustrować wszystko, ale nie zawsze będzie to zgodne ze stanem faktycznym. Możemy też różne rzeczy wprowadzić do programu statystycznego i on nam wszystko policzy, ale gdy nie przestrzegamy określonych reguł teoretycznych, to zazwyczaj to, co nam wyjdzie z tego komputera możemy od razu przerobić na pasztet, albo powiesić na gwoździu w "sławojce". "Liczby nie wiedzą skąd pochodzą" - głosi tytuł jednego z podręczników do statystyki dla studentów nauk społecznych i w tym jednym zdaniu jest więcej sensu niż się komukolwiek wydaje. A przysłowiowy pies jest pogrzebany w tym, że zbyt często niektórzy z korelacji lub przypadkowych związków wyciągają zbyt daleko idące wnioski, a nawet piszą o tym w gazetach czy internecie.
 
Bo brak umiejętności odróżniania korelacji (współwystępowania, współzmienności) od związku przyczynowo-skutkowego jest jedną z największych bolączek naszych czasów. Związki przyczynowo-skutkowe częściej starają się badać psychologowie, z różnym skutkiem, ale zazwyczaj są to jednak proste reakcje i proste sytuacje. Z kolei socjologowie zwykle analizują bardziej skomplikowane zagadnienia i częściej dostrzegają korelacje, korzystają przy tym z danych statystycznych, demograficznych, takich jak autorzy omawianych billboardów. Socjologowie bardziej podkreślają jednak trendy, wskazują na różnice w intensywności czy zmienności danego zjawiska w zależności od różnych czynników czy kategorii socjodemograficznych. Ale nie formułują wtedy tez o wpływie jednego na drugie.
 
Gdyby większość osób, które zetknęły się z tym billboardem miała podstawową wiedzę metodologiczną, każda z nich machnęłaby na ten plakat ręką. "Ot, ktoś sobie powyciągał jakieś dane, ale nawet jeśli są prawdziwe, to one NICZEGO nie dowodzą". A tak mamy obrzucanie się internetowym błotem. Jedni próbują przekonać, że samo zawarcie kościelnego małżeństwa magicznie sprawi, że będzie ono zazwyczaj trwalsze niż cywilne (bo w cywilnych wiadomo: zgroza, deprawacja, lewactwo i erozja wszelkiej moralności). Drudzy próbują zakwestionować prawdziwość tych cyferek z plakatu, gdyż boją się, że jeśli one są prawdziwe, to faktycznie udowadniają, że rodzaj małżeństwa wpływa na jego trwałość.
 
W gąszczu wzajemnego zakrzykiwania się i budowania opozycji: z jednej strony "religijni fundamentaliści" i "katoprawica", a z drugiej cyniczna młodzież wieku atomowego i upadek obyczajów, ktoś nieśmiało (a słusznie) podniósł, że te dane z billboardów nie mówią też niczego o jakości związku, a ona jest często podstawą jego trwałości. Głos rozsądku niknie jednak w obliczu chęci przyłożenia oponentowi ideologicznym młotkiem z jakimś moralnościowym napisem.
Czyli: na Zachodzie bez zmian.

23. września 2022, 17:34 CEST,  52.245 °N, 16.546 °E, trzecia planeta Układu Słonecznego