Pułapki prawdopodobieństwa
Mark Twain zauważył, że jeśli jego sąsiad bije żonę codziennie, a on sam swojej nie uderzył nigdy, to statystycznie każdy z nich bije żonę co drugi dzień. Łatwo dajemy się zwieść odpowiednio przedstawionym danym statystycznym. Tym łatwiej, że statystyka i rachunek prawdopodobieństwa nie są dla ludzkich umysłów czymś naturalnym.
Nasze problemy w tych dziedzinach są związane z liczną grupą mechanizmów umysłowych nazywanych heurystykami. Heurystyki to skrótowe sposoby przetwarzania informacji, podejmowania decyzji, wydawania sądów i rozwiązywania problemów. W przeciwieństwie do algorytmów – metod „krok po kroku”, używanych na przykład w programach komputerowych – heurystyki wykorzystują tylko niewielką część dostępnych danych. W związku z tym ułatwiają i przyspieszają funkcjonowanie ludzkiego umysłu, ale (choć najczęściej działają skutecznie) bywają zawodne. Oszczędzając na czasie i energii poświęconym analizie informacji, jesteśmy bardziej narażeni na błędy.
Badaniu i wyjaśnianiu takich błędów poświęcili liczne eksperymenty i artykuły dwaj psychologowie z Uniwersytetu Hebrajskiego w Jerozolimie – Daniel Kahneman i Amos Tversky. Skupili się oni na podejmowaniu decyzji i formułowaniu ocen w warunkach niepewności, tzn. w sytuacjach, w których prawdopodobieństwo pewnych zdarzeń nie jest znane i należy je obliczyć bądź oszacować.
W jednym z bardziej znanych eksperymentów uczestnicy otrzymywali opis kobiety o imieniu Linda. Dowiadywali się z niego między innymi, że Linda jest panną, ma dyplom z filozofii, jako studentka angażowała się w inicjatywy antydyskryminacyjne i uczestniczyła w manifestacjach społecznych. Następnie mieli odpowiedzieć na pytanie, czy bardziej prawdopodobne jest, że Linda jest kasjerką, czy że jest kasjerką-feministką. Wbrew logice (wszystkie kasjerki-feministki są kasjerkami) większość badanych twierdziła, że druga możliwość jest bardziej prawdopodobna. Kahneman i Tversky stwierdzili, że osoby te posłużyły się heurystyką reprezentatywności – skoncentrowały się na zaakcentowanych w opisie cechach Lindy i zlekceważyły reguły rachunku prawdopodobieństwa.
Obok heurystyki reprezentatywności często wykorzystujemy też heurystykę dostępności – zdarzenia których przykłady łatwo odnajdujemy w pamięci (w szczególności związane z silnymi emocjami) oceniamy jako częste. To jeden z powodów dość powszechnych obaw przed podróżą samolotem – media donoszą o właściwie każdej większej katastrofie lotniczej. Statystyki świadczące o wyższym niż w przypadku transportu lądowego bezpieczeństwie lotów, choć znane, nie oddziałują wystarczająco na nasze odczucia. Z drugiej strony, trzydzieści razy więcej Amerykanów ginie z powodu uderzenia kawałkiem rozbitego samolotu niż w wyniku ataku rekina. Jednak badani szacujący prawdopodobieństwo śmierci z tych (i innych) przyczyn uważali, że znacznie łatwiej stać się ofiarą rekina. Można przypuszczać, że ich oceny nie były odporne na wpływ filmów ze szczękami w tytule.
Warto pamiętać, że w 2002 roku badania nad heurystykami docenił Komitet Noblowski – Kahneman otrzymał Nagrodę Nobla w dziedzinie ekonomii (Tversky zmarł kilka lat wcześniej). W 2011 roku ukazała się zadedykowana Tversky’emu książka Kahnemana „Thinking. Fast and Slow”, podsumowująca jego karierę naukową (po polsku można o pracy obu badaczy przeczytać np. w książkach prof. Tadeusza Tyszki).
Problemy z obliczaniem prawdopodobieństw w zadaniach ze swoich dziedzin mają nawet najwyższej klasy eksperci. Specjalistom medycznym z Harvardu przedstawiono następujący problem diagnostyczny: „Jeśli test na wykrycie choroby występującej z częstotliwością jeden na tysiąc daje błędny wynik, sygnalizując chorobę u osoby zdrowej w 5% badanych przypadków (natomiast u osoby chorej zawsze bezbłędnie wskazuje chorobę), to jakie jest prawdopodobieństwo, że wynik pozytywny rzeczywiście wskaże chorego, jeśli nie wiemy nic o innych symptomach?” (za: D. Buss „Psychologia ewolucyjna”, tłum. M. Orski, GWP, Gdańsk 2003). Prawidłowe rozwiązanie (2%) podało tylko 18% ekspertów. Pozostali zlekceważyli dane o częstości choroby i obliczyli tylko trafność testu (95%).
Powyższe zadanie przeformułowała para badaczy z Kalifornii – Leda Cosmides i John Tooby. Podali oni badanym studentom informacje o częstotliwości zdarzeń: „Na 1000 Amerykanów jedna osoba zapada na chorobę X. Jej wykryciu służy specjalny test. Ilekroć bada się nim osobę chorą, wynik jest pozytywny. Czasami jednak wynik pozytywny pojawia się u osób zdrowych. U 50 na 1000 przebadanych osób zdrowych pojawi się wynik pozytywny. Wyobraźmy sobie grupę wybranych losowo 1000 Amerykanów. Jak wiele osób, u których test wykaże chorobę, rzeczywiście na nią cierpi?”. Aż 76% studentów podało poprawną odpowiedź (naprawdę choruje jedna osoba).
Cosmides i Tooby, czołowi przedstawiciele coraz bardziej znaczącej w naukach społecznych psychologii ewolucyjnej, uważają, że ludzie liczą lepiej, niż wydawało się dotąd psychologom. Rzecz w tym, że łatwiej nam przyswajać i przetwarzać informacje o częstotliwości zdarzeń niż dane probabilistyczne. Częstotliwość jest dla ludzkich umysłów kategorią naturalną – przez tysiące lat nasi przodkowie właśnie w ten sposób kodowali wiedzę o najlepszych łowiskach czy najbezpieczniejszych szlakach.
Podobnie uważa Gerd Gigerenzer z Instytutu Maxa Plancka w Berlinie. Gigerenzer twierdzi, że nasza racjonalność jest ograniczona, ale ekologiczna, czyli dostosowana do wymagań środowiska. Heurystyki zawodzą rzadko, zaś ich wykorzystanie w problemach bardzo złożonych bądź w zupełnie naturalnej sytuacji braku danych jest najlepszym (a często jedynym) rozwiązaniem. Wiele jego eksperymentów wskazuje, że w pewnych zadaniach laicy, używając bardzo prostych heurystyk, radzą sobie lepiej niż eksperci.
Nieznajomość matematyki szkodzi
Niestety, nawet najbardziej optymistyczne poglądy naukowców na sprawność naszych zdolności obliczeniowych nie wykluczają istnienia pułapek, w które zdarza nam się wpadać, gdy stosujemy heurystyki, ani błędów w oszacowaniach prawdopodobieństwa, które miewają bardzo poważne skutki. W licznych dziedzinach życia wskazana jest bowiem jak największa precyzja rozumowań.
Przyjrzyjmy się kolejnemu eksperymentowi Kahnemana i Tversky’ego. Postawili oni przed badanymi następujący problem: W pewnym mieście doszło nocą do wypadku spowodowanego przez taksówkę. Kierowca odjechał z miejsca zdarzenia. W mieście tym działają dwie firmy taksówkarskie. Taksówki jednej z nich są zielone, a drugiej – niebieskie. Wiadomo przy tym, że 85% taksówek w mieście należy do firmy „zielonej”, a 15% do firmy „niebieskiej”. Świadek twierdzi, że wypadek spowodowała taksówka niebieska. Po zbadaniu jego zdolności percepcyjnych przy odpowiedniej widoczności ustalono, że jest on w stanie dokonać trafnej identyfikacji w 80% przypadków (myli się w 20%).
Badanych poproszono o obliczenie prawdopodobieństwa, że wypadek spowodowała niebieska taksówka. Najczęstsza odpowiedź brzmiała, że wynosi ono 80% (czyli tyle co trafność świadka). Poprawne rozwiązanie (41%) musi natomiast uwzględnić wyjściową proporcję taksówek obu firm w mieście (stosuje się tu wzór Bayesa).
Zadanie z taksówkami przypomina rzeczywiste problemy pojawiające się w wielu procesach sądowych (w szczególności przy ocenie wiarygodności świadków czy oszacowaniu odszkodowania). Dane probabilistyczne i statystyczne są w sądach wykorzystywane coraz częściej. Taki format mają na przykład różnego rodzaju dowody naukowe, które z natury obarczone są określonym prawdopodobieństwem pomyłki. Do tej grupy zalicza się często kluczowy w bardzo poważnych sprawach dowód z badań DNA.
Wskazane byłoby więc, gdyby prawnicy, a zwłaszcza sędziowie, mieli podstawową wiedzę z zakresu rachunku prawdopodobieństwa i potrafili ze zrozumieniem ocenić dane statystyczne. Badania na ten temat są jednak niepokojące (wiele urągających matematyce orzeczeń przedstawia prof. Józef Wójcikiewicz w książce „Temida nad mikroskopem”). Nawet sędziowie najwyższych instancji mają (ogólnoludzkie) problemy z liczeniem prawdopodobieństwa. Co więcej, istnieje tendencja do lekceważenia nawet bardzo silnych prawidłowości statystycznych przy wydawaniu wyroków. Sędziowie preferują tradycyjne dowody (np. zeznaniami świadka), mimo że tak naprawdę również one świadczą tylko o prawdopodobieństwie (nieraz niezbyt wysokim), a nie pewności, określonych zdarzeń (świadek może się mylić, kłamać itp.). Niestety, niejeden prawnik wybrał ścieżkę kariery, kierując się niechęcią do matematyki.
Bartłomiej Kucharzyk