Jak anegdota wypiera statystykę – dlaczego mózg ignoruje base rate?

Czas czytania: 5 min

Przytaczasz dane. Mówisz o średnich, o ryzyku, o trendach widocznych w populacji. W odpowiedzi słyszysz historię. „A ja znam kogoś, kto…”. Jedna konkretna opowieść wchodzi w miejsce wykresu. Czujesz, że rozmowa zaczyna skręcać w inną stronę – jakbyście nagle mówili o dwóch różnych rzeczach. To doświadczenie nie jest rzadkie. Ale skąd się ono bierze?

Ilustracja: Opracowanie własne

Rozumowanie statystyczne to umiejętność, a nie intuicja¹

Rozumowanie statystyczne (Statistical literacy) definiowane jako zdolność do interpretowania, krytycznej oceny i komunikowania informacji statystycznych, które pojawiają się w mediach, polityce czy debacie publicznej jest umiejętnością wieloskładnikową. Badacz Iddo Gal definiuje dwa obszary obejmujące rozumowanie statystyczne:

Wiedzę i umiejętności poznawcze – rozumienie takich pojęć jak średnia, rozkład, zmienność, próba i populacja oraz umiejętność czytania wykresów i tabel
Postawy i dyspozycje – gotowość do zadawania pytań o źródło danych, wielkość próby, sposób pomiaru oraz ograniczenia wyników

Innymi słowy, sama umiejętność liczenia nie wystarcza. Potrzebna jest także zdolność do krytycznej interpretacji. Zwłaszcza w społeczeństwie, w którym informacje statystyczne stanowią stały element komunikacji publicznej, rozumowanie statystyczne wydaje się być kluczowe.

Dlaczego intuicja zawodzi

Badania nad sądami probabilistycznymi pokazują, że ludzie nie zawsze uwzględniają informacje o częstości występowania zjawisk w populacji. Daniel Kahneman i Amos Tversky wykazali, że w ocenach prawdopodobieństwa osoby często ignorują tzw. częstości bazowe (base rates), czyli informacje o tym, jak częste jest dane zjawisko w całej populacji.² ³

Jak to wygląda w praktyce? Grupa liczy 100 osób, w której jest 70 prawników i 30 inżynierów – to jest base rate próby. Następnie przedstawiana jest pojedyncza osoba z grupy: “Mariusz ma 45 lat. Jest cichy, lubi matematykę i rozwiązywanie problemów logicznych. Spędza dużo czasu na majsterkowaniu i czytaniu książek science-fiction.” Po pytaniu o to jakie jest prawdopodobieństwo, że ta osoba jest inżynierem, większość ludzi odpowie że bardzo wysokie. Pomimo tego, jaki jest base rate, stereotypy znacząco przeważają przy ocenie prawdopodobieństwa.

Autorzy wyjaśnili to działaniem heurystyki reprezentatywności – tendencji do oceniania prawdopodobieństwa na podstawie podobieństwa do typowego przypadku, a nie na podstawie statystycznej częstości.⁴

Oznacza to, że nawet gdy informacja o rozkładzie w populacji jest dostępna, może być systematycznie niedoważana w porównaniu z opisem jednostkowego przypadku. Zjawisko to nazwano zaniedbywaniem częstości bazowych (base-rate neglect). W praktyce oznacza to przewagę informacji jednostkowej nad informacją statystyczną w intuicyjnym wnioskowaniu.

Siła anegdoty vs. dane statystyczne

W debacie publicznej często obserwujemy ten sam schemat: po przytoczeniu danych statystycznych pojawia się jednostkowa historia. Historia może mieć silny wpływ na ocenę sytuacji.

Już w latach 90. prowadzono eksperymenty porównujące skuteczność dowodów statystycznych i anegdotycznych. Allen i Preiss (1997), w metaanalizie badań nad perswazją, wykazali, że zarówno dowody statystyczne, jak i narracyjne mogą być skuteczne, ale ich wpływ zależy od kontekstu i sposobu prezentacji.⁵

Późniejsze badania wskazują, że pojedyncze, konkretne historie mogą silnie oddziaływać na ocenę ryzyka i decyzje, zwłaszcza gdy są emocjonalnie angażujące.⁶ Narracja dostarcza wyrazistego przykładu, który jest łatwy do wyobrażenia i zapamiętania.

Metaanaliza Freling i współpracowników (2020) pokazuje, że wpływ dowodów narracyjnych i statystycznych nie jest jednoznaczny – ich skuteczność zależy od tematu, odbiorcy i sposobu przedstawienia informacji. Jednak w sytuacjach o wysokim zaangażowaniu emocjonalnym konkretna historia może konkurować ze statystyką lub ją osłabiać.⁶

Z punktu widzenia wcześniejszych badań nad heurystykami (Tversky & Kahneman, 1974)⁴ nie jest to zaskakujące. Informacja jednostkowa jest bardziej wyrazista i „reprezentatywna” poznawczo niż abstrakcyjny rozkład liczbowy. W efekcie pojedynczy przypadek może mieć nieproporcjonalnie duży wpływ na ocenę zjawiska w populacji.

Wzorce populacyjne nie są opisem jednostek

Dane statystyczne opisują rozkłady i zależności w zbiorowościach. Mówią, jak często coś występuje w populacji i jakie są średnie różnice między grupami. Nie są jednak bezpośrednim opisem pojedynczej osoby.

Już w 1950 roku socjolog William S. Robinson pokazał, że zależności obserwowane na poziomie zbiorowości nie muszą występować na poziomie jednostek. W artykule Ecological correlations and the behavior of individuals wykazał, że korelacje obliczone dla grup (np. regionów) mogą znacząco różnić się od korelacji obliczonych dla osób.⁷ Zjawisko to nazwano później błędem ekologicznym.

Oznacza to, że fakt, iż dwie cechy współwystępują częściej w populacji, nie pozwala wprost wnioskować o każdej osobie należącej do tej populacji. Statystyka opisuje prawdopodobieństwa i tendencje, a nie gwarancje.

W tym sensie dane populacyjne i przypadki jednostkowe należą do dwóch różnych poziomów analizy. Mylenie ich prowadzi do nieporozumień: statystyka może być poprawnym opisem tendencji w zbiorowości, a jednocześnie pojedynczy przypadek może od niej odbiegać. Jedno nie unieważnia drugiego. Umiejętność rozróżnienia tych dwóch poziomów jest ważnym elementem rozumowania statystycznego¹, a jednocześnie badania nad wnioskowaniem probabilistycznym pokazują, że informacje o rozkładach w populacji bywają systematycznie niedoważane na rzecz informacji o pojedynczych przypadkach.² W takich sytuacjach poziom populacji i poziom jednostki zaczynają być traktowane jak równoważne, mimo że odnoszą się do różnych typów wnioskowania.

Gdy wzorce znikają z pola widzenia

Badania nad percepcją ryzyka pokazują, że ludzie nie oceniają zagrożeń wyłącznie na podstawie danych statystycznych. Paul Slovic wykazał, że oceny ryzyka są silnie powiązane z czynnikami takimi jak wyrazistość zdarzenia, możliwość wyobrażenia sobie skutków czy reakcja emocjonalna.⁸ Zdarzenia rzadkie, ale dramatyczne, mogą być postrzegane jako bardziej prawdopodobne niż wskazywałyby na to dane populacyjne.

W połączeniu z mechanizmem zaniedbywania częstości bazowych oznacza to, że pojedyncze, wyraziste przypadki mogą wpływać na ocenę całych zjawisk. Informacja o jednym zdarzeniu bywa traktowana jako reprezentatywna dla szerszego trendu, nawet jeśli dane pokazują inny rozkład.²

Nie jest to kwestia złej woli ani ignorancji. To konsekwencja sposobu, w jaki ludzie intuicyjnie przetwarzają informacje o prawdopodobieństwie i ryzyku. Jednak w debacie publicznej może to prowadzić do sytuacji, w której rozmowa o tendencjach statystycznych zostaje zastąpiona wymianą jednostkowych historii.

Podsumowanie

Rozumowanie statystyczne nie jest naturalnym odruchem. Wymaga wiedzy o rozkładach i prawdopodobieństwie, ale także gotowości do oddzielenia poziomu populacji od poziomu jednostki. Badania nad heurystykami pokazują, że intuicyjnie skłaniamy się ku temu, co konkretne i wyraziste, nawet gdy dostępne są dane opisujące szerszy wzorzec. Jednocześnie komunikacja oparta na narracji potrafi silnie kształtować postawy i ocenę ryzyka.

Dlatego spór między „statystyką” a „przypadkiem” często nie jest sporem o fakty. To spór o poziom analizy. Statystyka może trafnie opisywać tendencję w populacji, a pojedyncza historia może być równie prawdziwa – i jedno nie obala drugiego. Problem zaczyna się wtedy, gdy próbujemy użyć jednostkowego wyjątku do unieważnienia wzorca albo wzorca do opisania konkretnej osoby. Wzorce nie są ludźmi. A ludzie nie są wzorcami.

Bez umiejętności rozróżniania poziomu populacji i jednostki rozmowa przesuwa się z analizy rozkładów do analizy przypadków.

Bibliografia

Gal, Iddo. (2005). Statistical literacy: Meanings, components, responsibilities, the challenge of developing statistical literacy. Reasoning and Thinking. 1. 47-78. https://www.researchgate.net/publication/292714768_Statistical_literacy_Meanings_components_responsibilities_the_challenge_of_developing_statistical_literacy
Kahneman, D., & Tversky, A. (1983). Extensional versus intuitive reasoning: The conjunction fallacy in probability judgment. Psychological Review, 90(4), 293–315. https://doi.org/10.1037/0033-295X.90.4.293
Tversky, A., & Kahneman, D. (1973). Availability: A heuristic for judging frequency and probability. Cognitive Psychology, 5(2), 207–232. https://doi.org/10.1016/0010-0285(73)90033-9
Tversky, A., & Kahneman, D. (1974). Judgment under uncertainty: Heuristics and biases. Science, 185(4157), 1124–1131. https://doi.org/10.1126/science.185.4157.1124
Allen, M., & Preiss, R. W. (1997). Comparing the persuasiveness of narrative and statistical evidence using meta‐analysis. Communication Research Reports, 14(2), 125–131. https://doi.org/10.1080/08824099709388654
Freling, T. H., Yang, Z., Saini, R., Itani, O. S., & Abualsamh, R. R. (2020). When poignant stories outweigh cold hard facts: A meta-analysis of the anecdotal bias. Organizational Behavior and Human Decision Processes, 160, 51–67. https://doi.org/10.1016/j.obhdp.2020.01.006
Robinson, W. S. (1950). Ecological correlations and the behavior of individuals. American Sociological Review, 15(3), 351–357. https://doi.org/10.2307/2087176
Slovic, P. (1987). Perception of risk. Science, 236(4799), 280–285. https://doi.org/10.1126/science.3563507