Prawdopodobieństwo - język poszukujący przyczyny?
Obserwacja świata obciążona jest mnóstwem założeń i lukami różnej natury, które ciąg przyczyna-skutek rozpuszczają w niepewności tworzonych sądów. Wydobycie prawdy wymaga cierpliwości, spójnego mechanizmu porządkowania 'elementów układanki', z których chcemy zbudować opowieść. Matematyka z wieloaspektowością świata, którą człowiek chciałby zrozumieć, zmaga się w ramach działu zwanego probabilistyką (rachunek prawdopodobieństwa+statystyka+procesy stochastyczne). W jego ramach pozwala wydobyć z niepewności to, co się da, ale nie więcej. Istniejące w XX wieku paradygmat danych, które mają stanowić jedyne źródło możliwych do formułowania sądów i język oparty na korelacji, przyczyniły się do pozbawienia 'przyczyny' racji bytu w myśleniu fachowców w temacie. Założyli oni, że nie wiemy nic, jeśli nie dysponujemy pomiarami, a wnioskowanie przyczynowo-skutkowe staje się wtedy subiektywnym przekonaniem jednostek rezydującym między innymi pojęciami sfery tabu. Już we wstępie do niebanalnej książki "Przyczyny i skutki. Rewolucyjna nauka wnioskowania przyczynowego" Judea Pearl postawił problem matematycznej nieczułości i nierozstrzygalności wobec wynikania w ramach konkretnego zjawiska fizycznego - ciśnienie jest takie a nie inne, bo tak pokazuje barometr, czy w odwrotnym kierunku przebiega kauzalność? Trochę ta prowokacja polega na zbudowaniu 'nierealistycznego chłopca do bicia', by się z jego ułomnością rozprawić i pokazać skuteczność oraz potrzebę przemodelowania myślenia na tory, których zwolennikiem jest Pearl - informatyk badający AI (sztuczną inteligencję), filozof i 'rewolucjonista probabilistyczny'. Sam nie nazwałbym tego rewolucją, choć oferta promowanej przez niego perspektywy i potrzeby namysłu nad dominującymi narracjami i konwencjami w środowisku statystyków wymagają rozpatrzenia (str. 14):
"Każdy studiujący wstęp do statystyki słyszy frazes: 'Korelacja i przyczynowość są dwiema różnymi rzeczami'. I jak najsłuszniej! Pianie koguta jest skorelowane ze wschodem słońca, ale go nie powoduje. Niestety, z tego zdroworozsądkowego spostrzeżenia statystyka zrobiła fetysz. Mówi, że korelacja i przyczynowość nie są tym samym, lecz nie tłumaczy, na czym polega przyczynowość."
Opiniowana książka, napisana przez Pearla przy udziale Dany Mackenzie, oferuje czytelnikowi ogromny zasób faktów matematycznych, przykładów codzienności statystycznej, modeli budujących naukowe przekonania o rzeczywistości. Język autorów jest momentami ciężki, a co ważniejsze, raczej wymaga pewnych rudymentów, takiego obycia z podstawami statystyki (czym jest prawdopodobieństwo warunkowe, zdarzenie losowe, regresja, randomizacja,...). Tekst może chyba stanowić lekturę 'do poduszki' tylko dla specjalistów. Dla mnie to kopalnia przykładów potknięć we wnioskowaniu o różnych zjawiskach otaczającego nas świata (dominuje w nich epidemiologia z medycyną i społeczne zachowania ludzi poddane ilościowemu badaniu) i wspaniałych, czasem zdumiewających, sukcesów w poszukiwaniu przyczyn.
Główny pomysł na strukturę książki opiera się na metaforze trzy-etapowego procesu 'wtajemniczenia' w mechanizmy poprawnego wnioskowania o świecie; to tzw. Drabina Przyczynowości. Pierwszy etap, dostępny AI i zwierzętom, to kojarzenie faktów i danych z obserwacji. Drugi (dostępny ludziom od kilkudziesięciu tysięcy lat), to interwencja w świat pozwalająca na 'gdybanie'. Trzecim jest poziom rozbudowanej wyobraźni kontrfaktycznej, szukającej alternatyw dla doświadczanego świata. Główną tezą autorów jest potrzeba sięgania po ostatni szczebel, w którego okiełznaniu pomaga zestaw reguł powoli upowszechniających się w środowisku statystyków. Publikacja obfituje w schematyczne wykresy strzałkowe - proste symbole relacji zjawisk i stanów (proste koncepcyjnie i wizualnie, choć czasem stoi za nimi solidna dawka wiedzy). Bardzo dobrze tłumaczą zawiłości tekstu i argumentacje autorów. Przywołane liczne świadectwa kluczowych mechanizmów rozwijających probabilistykę, przykłady poważnych ogólnoludzkich problemów, w których statystyka pomogła nawet uratować życie milionom, dowodzą powagi sytuacji i przeczą pokutującym przekonaniom o oderwaniu nauki od życia. Szeroko przedyskutowana batalia o wykazanie istnienia przyczynowości między paleniem papierosów a rakiem płuc (207-233, 423-428) pokazała pułapki 'przedrewolucyjnego' myślenia o danych i poprawność nowego procesu wnioskowania. Debata o wpływie cholesterolu na zdrowie (314-321), czy nasza codzienność cywilizacyjna z przyczynami zmian klimatu (363-369) zmuszają do ciągłej autokorekty badawczej podczas poszukiwania odpowiedzi. Jest nawet smutny przykład, gdy na początku XX wieku zapomniano o dotychczasowych ustaleniach w związku ze szkorbutem, które ratowały życie podróżników (str. 376-377).
Autorzy w życiu zawodowym, a przez to i w książce, promują potrzebę modyfikacji języka, który stanowi codzienność statystyków. Chodzi nie tylko o oswojenie słowa 'przyczynowość', ale o szukanie intuicji i inspiracji w doświadczanym świecie przyrodniczym. Trochę w tym apelu jest niepotrzebnej emfazy, bo w skutecznym 'wyprowadzeniu' matematyków z symetrii skutek-przyczyna (kiedy z matematycznego punktu widzenia nie jest istotne czy to barometr wywołuje istnienie ciśnienia, czy ciśnienie skutkuje odczytem z ciśnieniomierza) od dawna uczestniczy kierunkowy specjalista (fizyk, biolog, socjolog,...). Więc jakoby dopiero odkrywcza (opracowana w latach 90.-tych XX wieku) metoda uwzględniania czynników zakłócających pozwoliła na uniknięcie sporej grupy pułapek (str. 175). Chyba jednak nie jest tak prosto. Oczywiście mają rację autorzy, gdy wskazują, że dominacja wnioskowania skupionego na bezpiecznie orzekanej korelacji, to niezbyt chwalebne metodologiczne kunktatorstwo. Doprowadzony do absurdu przykład z sądowym wykazywaniem warunku koniecznego i dostatecznego do zajścia pożaru, to symptomatyczny obraz 'zafiksowania' teoretycznego na wąskiej i niepraktycznej semantycznej dyspucie (proponuję każdemu eksperyment myślowy - czy tlen w pokoju, gdzie nastąpił pożar, warto rozważać w warunkowaniu zajścia przestępstwa podpalenia). Zapewne dogmaty statystyki, które zbudował Ronald Fisher należy poddać modyfikacji, szczególnie w związku z potrzebą budowania matematycznych odniesień do eksperymentatora posiadającego wiedzę o świecie, taką niewynikającą z zebranych danych. Postulowana od lat przez Pearla potrzeba przeformułowanie statystyki do języka oddziaływania przyczynowego, pozwala lepiej walczyć chociażby z różnego rodzaju negacjonistami i twórcami fake newsów.
Ciekawie wypadła dyskusja nad zderzeniem 'korelacji' z 'przyczynowością' w przypadku regresji. Na przykładach z ekonomii autorzy omawiają pokutujące wciąż przekonanie o tym, że "przyczynowość jest tylko przypadkiem granicznym korelacji". Analizując grafy przyczynowe typu: cena-podaż-popyt pokazują, że tzw. mechanizm 'zderzacza' (czyli obrazowo - jest to zmienna, do której 'zmierzają' strzałki wynikania przyczynowego od innych wielkości) pozwala kontrolować pewne czynniki zaburzające kalkulację rachunku ekonomicznego (str. 311-314). Jeśli do tego powiem, że wspaniale wypadł rozdział o paradoksach statystycznych, które zawsze wymagają sporej gimnastyki, szczególnie że niejeden zawodowy statystyk wpadł w ich pułapkę, to o wrażenie o satysfakcji z lektury nietrudno. Czym się różni dyskryminacja od uprzedzenia i czy rekrutacja wykazująca dysproporcje międzypłciowe to zawsze objaw czegoś niepokojącego (a jeśli tak, to jakie warunki ilościowe muszą być spełnione)? Pojawia się i do takich zawiłości ilościowy komentarz.
Chyba jednak wciąż sporo z przekonań autorów pozostaje dyskusyjna. Czy z taką sama dozą akceptacji wniosków można podchodzić do zwrotnego procesu poszukiwania jednostkowych przyczyn dla poznanych wcześniej populacyjnych zmienności? Końcowe rozdziały (o rozumowaniu kontrfaktycznym i mechanizmach mediacji) są w istocie rozważeniami nad zasadnością pytania i problemu (str. 324):
"Jedną rzeczą jest powiedzieć: 'Palenie powoduje raka płuc', a inną: 'Mój wuj Joe, który przez trzydzieści lat wypalał paczkę papierosów dziennie, żyłby nadal, gdyby nie był palaczem.' Różnica jest jednocześnie oczywista i głęboka: nie jest możliwe obserwowanie osób, które tak jak wuj Joe przez trzydzieści lat paliły papierosy i zmarły, w jakimś świecie równoległym, w którym osoby te przez trzydzieści lat nie paliły."
Osiągnięciem zawodowym Pearla jest rozwinięcie i promowanie technik statystycznych, które pozwalają poszerzyć probabilistyczny konserwatyzm o nowe spojrzenie na związek między światem danych, wzorów a rzeczywistością, którą nauka stara się opisać lub przewidzieć konsekwencje podejmowanych przez nas decyzji, dziejących się procesów. Zawsze będzie potrzeba pochylenia się nad zmiennością przyrody, by życie było znośniejsze, ciekawsze, bardziej świadome konsekwencji dokonywanych wyborów. Choć doprecyzowywanie metod statystycznych nie wymaga takiego humanistycznego namysłu, to co do zasady stanowi poligon testowy dla szablonów formalnego dowodzenia. Stąd konsekwencje ustaleń matematyki 'dotykają' filozofii moralności, kognitywistyki, świadomości, prawa i projektu maszyn myślących. Być może kiedyś uda się naukowcom sensownie przeszczepić te zasady w struktury AI, która od sieci bayesowskich poprzez rewolucję sieci neuronowych i głębokiego uczenia przechodzi obecnie do działania w ramach modelu przyczynowego. Czy uda się zbudować maszyny 'czujące' asymetrię wynikania, by ostatecznie rozróżnić dobro od zła? Sama końcówka książki jest rozważaniem ogólnej natury nad przyszłością AI ze szczególnym uwzględnieniem opisanych wcześniej przemian w probabilistyce.
"Przyczyny i skutku" to bardzo bogata w treści książka. Wymaga sporej gimnastyki umysłu, ale daje też satysfakcję. Sporo pytań pozostawia otwartych, choć jednocześnie pewne kręte ścieżki prostuje. Autorzy pokazując błędy w popularnym myśleniu unaoczniają, że sporo o świecie, który intuicyjnie i na podstawie własnego doświadczenia przyswajamy, ma swoje formalne uzasadnienie w matematyce. Po części ten nakreślony 'rewolucyjny' zwrot w probabilistyce to apel o dodatkowy namysł nad liczbami, które petabajtami przelewają się przez internet i budują informacyjny szum. Każdy wyboru musi dokonać sam i co z tym wszystkim zrobić.
BARDZO DOBRE - 8/10