Curiosando si impararivista di curiosità

Curiosità

Il paradosso di Simpson: quando la media inganna e i dati dicono il contrario

Un fenomeno statistico per cui una tendenza presente in tutti i sottogruppi può invertirsi quando i dati vengono aggregati: dai concorsi universitari ai trattamenti medici.

di Andrea Bertolotti··4 min di lettura
Diagramma del paradosso di Simpson: due rette in salita la cui aggregazione produce una retta in discesa
Diagramma del paradosso di Simpson: due rette in salita la cui aggregazione produce una retta in discesa

Immaginate due ospedali. In ognuno il chirurgo A ha un tasso di successo più alto del chirurgo B. Sembra ovvio concludere che, sommando i casi, A resti il migliore. Eppure i numeri totali possono raccontare l'opposto: B "vince". Non è un errore di calcolo: è il paradosso di Simpson, uno dei fenomeni più contro-intuitivi della statistica, capace di capovolgere una tendenza quando i dati vengono aggregati. Capire perché accade è una piccola, preziosa educazione al pensiero critico applicata ai numeri che leggiamo ogni giorno sui giornali.

Chi era Simpson (e perché il nome è ingannevole)

Il fenomeno prende il nome dallo statistico britannico Edward Hugh Simpson, che lo descrisse in un articolo del 1951. In realtà era già stato osservato da Karl Pearson all'inizio del Novecento e formalizzato da Udny Yule nel 1903, tanto che molti lo chiamano effetto Yule-Simpson. La descrizione del paradosso è semplice: una relazione (per esempio "il trattamento funziona") presente in ciascun sottogruppo può scomparire o addirittura invertirsi quando i sottogruppi vengono uniti in un unico insieme. Non c'è nulla di magico: è pura aritmetica delle proporzioni. Ma il nostro cervello, abituato a ragionare per medie, fatica ad accettarlo.

Grafico con due nubi di punti: ciascuna ha pendenza positiva, ma la retta complessiva ha pendenza negativa
La firma grafica del paradosso: dentro ogni gruppo la tendenza sale, ma la linea che riassume tutti i dati scende. Credit: Schutz, CC BY-SA 3.0, Wikimedia Commons.

Il caso più famoso: Berkeley, 1973

L'esempio da manuale arriva dall'Università della California a Berkeley. Nel 1973 i dati di ammissione ai corsi di dottorato sembravano mostrare una discriminazione di genere: era ammesso il 44% degli uomini contro il 35% delle donne. Ma quando i ricercatori Peter Bickel, Eugene Hammel e William O'Connell analizzarono i singoli dipartimenti, in uno studio pubblicato su Science nel 1975, la tendenza si invertì: nella maggior parte dei dipartimenti le donne erano ammesse a un tasso pari o superiore agli uomini. La spiegazione era la variabile nascosta: le donne facevano domanda in proporzione maggiore nei dipartimenti più selettivi (come molte discipline umanistiche), gli uomini in quelli con più posti disponibili (come ingegneria). Aggregando tutto, la struttura delle scelte produceva un'illusione statistica che assomigliava a una discriminazione.

La variabile confondente è il cuore del problema

Il motore del paradosso è sempre una variabile confondente: un terzo fattore che si distribuisce in modo diverso tra i gruppi e che "pesa" sull'esito. Nell'esempio dei chirurghi, basta che il chirurgo migliore operi i casi più gravi e quello peggiore i casi facili: i tassi medi si distorcono e il bravo chirurgo sembra peggiore. In medicina questo ha conseguenze serie. Un trattamento può apparire superiore a un altro nei dati complessivi solo perché è stato somministrato ai pazienti meno compromessi. Per questo gli studi clinici rigorosi usano la randomizzazione: distribuire i pazienti in modo casuale tra i gruppi neutralizza, in media, le variabili confondenti note e ignote, ed è il motivo per cui il trial controllato randomizzato è considerato lo standard d'oro della medicina basata sulle prove.

Aggregare o disaggregare? Dipende dalla causa

La domanda cruciale non è matematica ma causale: quale livello di analisi descrive davvero la realtà? Lo statistico Judea Pearl, vincitore del Turing Award e fondatore dell'inferenza causale moderna, ha mostrato in lavori ripresi anche dalla Stanford Encyclopedia of Philosophy che la risposta dipende dalla struttura causale del problema, non dai soli dati. Se la variabile che separa i gruppi è una causa dell'esito (come la gravità dei pazienti), bisogna guardare i sottogruppi; se invece è una conseguenza dell'intervento, aggregare può essere corretto. Non esiste quindi una regola fissa del tipo "disaggrega sempre": serve un modello esplicito di ciò che genera i numeri. È la differenza tra leggere i dati e capire i dati.

Un esempio con i numeri

Per toccarlo con mano, prendiamo due trattamenti contro i calcoli renali, un caso reale diventato classico. Il trattamento A guarisce l'81% dei calcoli piccoli (234 su 270) e il 73% di quelli grandi (192 su 263), per un totale del 78%. Il trattamento B guarisce l'87% dei piccoli (81 su 87) e il 69% dei grandi (55 su 80), per un totale dell'83%. Sul totale "vince" B; ma in entrambe le categorie di gravità vince A. Come è possibile? Perché A è stato usato soprattutto sui casi grandi e difficili, B soprattutto su quelli piccoli e facili: la diversa distribuzione della gravità — la variabile confondente — ribalta la media complessiva. Guardare il solo totale, in questo caso, porterebbe a scegliere il trattamento sbagliato.

Perché ci riguarda tutti

Il paradosso di Simpson non è un rompicapo per accademici. Riguarda le classifiche scolastiche, le statistiche sul mercato del lavoro, i dati epidemiologici, i tassi di mortalità durante una pandemia, perfino le medie di rendimento sportivo. Ogni volta che un titolo annuncia che "i salari medi sono saliti mentre ogni categoria di lavoratori guadagna meno", oppure che "la mortalità di una malattia è cresciuta benché ogni fascia d'età stia meglio", c'è quasi sempre un Simpson nascosto: di solito un cambiamento nella composizione della popolazione misurata. È accaduto anche con alcune statistiche sui vaccini, dove un farmaco poteva sembrare meno efficace solo perché somministrato a una popolazione più anziana e fragile.

La lezione, sintetizzata da molti testi di divulgazione statistica, è semplice e potente: prima di fidarsi di una media, chiediti sempre cosa è stato sommato, come erano fatti i gruppi e quale variabile potrebbe essersi nascosta nell'aggregazione. I numeri non mentono, ma chi li somma senza pensare può facilmente ingannare se stesso e gli altri. Il paradosso di Simpson, in fondo, non è una stranezza della matematica: è un promemoria sul fatto che contesto e causa contano almeno quanto i dati grezzi.

Una buona curiosità ogni mattina

Iscriviti gratuitamente: niente spam, solo articoli scelti.

Iscrivendoti accetti la privacy policy. Puoi disiscriverti in ogni momento.


Da scoprire

Continua a leggere

Altre storie che ti potrebbero piacere, scelte per te