Le tabelle di contingenza sono un particolare tipo di tabelle a doppia entrata (cioè tabelle con etichette di riga e di colonna), utilizzate in statistica per rappresentare e analizzare le relazioni tra due o più variabili.
In esse si riportano le frequenze congiunte delle variabili.
Il caso più semplice è quello delle tabelle tetracoriche, in cui ciascuna delle due variabili assume solo due possibili valori, per esempio:
Capelli
Occhi
biondi
non biondi
Totale
chiari
21
19
40
non chiari
9
51
60
Totale
30
70
100
in cui, tra le 100 persone esaminate, 30 hanno capelli biondi, 40 hanno occhi chiari, e 21 hanno capelli biondi e occhi chiari. Da questi dati è possibile ricavare i dati restanti della tabella.
Utilizzando le tabelle di contingenza e operando specifici calcoli su di esse, si può arrivare a determinare la dipendenza o indipendenza tra le due variabili considerate, ad esempio in base al valore assunto dall'indice di contingenza quadratico (di Pearson).
Le due variabili considerate sono di tipo quantitativo discreto o qualitativo. Indicando tali variabili con e , e rispettivamente con e le modalità rilevate per le due variabili, a ogni coppia si fa corrispondere nella tabella la sua frequenza associata , cioè il numero di elementi, tra gli della popolazione, che possiedono contemporaneamente la modalità di e di .
Y
X
Totale
Totale
dove
rappresenta le frequenze marginali assolute di ,
rappresenta le frequenze marginali assolute di .
Sommando tutte le frequenze assolute presenti nella tabella, troveremo la numerosità della popolazione:
Dalle frequenze assolute si ottengono le frequenze relative calcolando