Media (statistica)

singolo valore numerico

In statistica, la media è un singolo valore numerico che descrive sinteticamente un insieme di dati. Esistono diversi tipi di media che possono essere scelte per descrivere un fenomeno: quelle più comunemente impiegate sono le tre cosiddette medie pitagoriche (aritmetica, geometrica e armonica). Nel linguaggio ordinario, con il termine media si intende comunemente la media aritmetica. È l'indice di posizione più usato.[1]

Una funzione di distribuzione con evidenziate la moda, la mediana e la media

Definizione generale di Chisini

modifica
  Lo stesso argomento in dettaglio: Media Chisini.

Oscar Chisini ha formalizzato una definizione generale di media ampiamente accettata, che riflette la relatività del concetto di media rispetto al particolare fenomeno in analisi.

Dato un campione   di numerosità   e una funzione   in   variabili, la media delle   rispetto a   è definita come quell'unico numero  , se esiste, tale che sostituendolo a tutte le variabili il valore della funzione rimane inalterato:

 

Le medie comunemente impiegate (aritmetica, geometrica, armonica, di potenza) sono casi particolari ottenibili tramite questa definizione, per una funzione   opportuna[2].

Media aritmetica

modifica

La media aritmetica è il tipo di media impiegato più comunemente e quello al quale, con il termine "media", si fa in genere riferimento nel parlare comune. Viene usata per riassumere con un solo numero un insieme di dati su un fenomeno misurabile (per esempio, l'altezza media di una popolazione).

Viene calcolata sommando tutti i valori a disposizione e dividendo il risultato per il numero complessivo dei dati.

La formula della media aritmetica semplice per   elementi è:[3][4]

 

Nel caso in cui si disponga della distribuzione di frequenze del fenomeno (carattere) misurato è possibile calcolare più agilmente la media aritmetica a partire dalle seguente formula:

 

dove   è il numero di modalità assunte dal carattere     rappresenta la  -esima modalità di   e   la corrispondente frequenza assoluta. Essendo poi  , ne deriva che:

 

dove   rappresenta la frequenza relativa della  -esima modalità del carattere  

La media aritmetica ponderata (o media pesata) viene calcolata sommando i valori in analisi, ognuno moltiplicato per un coefficiente (detto anche peso) che ne definisce l'"importanza", e dividendo tutto per la somma dei pesi (quindi è una combinazione lineare convessa dei dati in analisi). Alla luce di questa definizione, la media aritmetica semplice è un caso particolare di media aritmetica pesata nella quale tutti i valori hanno peso unitario.

La formula generale per la media pesata è quindi:

 

dove   è il peso del termine  -esimo.

Si dimostra facilmente che la media aritmetica è un indice di posizione, in quanto aggiungendo o moltiplicando tutti i valori per una stessa quantità la media stessa aumenta o è moltiplicata per quella stessa quantità. Come tutti gli indici di posizione, la media aritmetica fornisce l'ordine di grandezza dei valori esistenti e permette di conoscerne la somma dei valori (moltiplicando la media per il numero   di elementi).

Oltre che in matematica, la media aritmetica è ampiamente impiegata in svariati campi, quali economia, sociologia e nella maggior parte delle discipline accademiche.

Nonostante la media aritmetica sia spesso usata per fare riferimento alle tendenze, non fornisce un dato statistico robusto in quanto risente notevolmente dei valori anomali (outlier). Per questo si considerano spesso anche altri indici, come la mediana, che sono più robusti rispetto ai valori anomali e si fa un'analisi comparata. Un tentativo di ridurre l'effetto dei valori estremi nel calcolo della media aritmetica è costituito dalla trimmed mean, ovvero un particolare calcolo della media nel quale si considera solo una certa percentuale dei valori più centrali, tralasciando i valori agli estremi di questi. È comune, per esempio, il calcolo della trimmed mean al 50%, che consiste nella media aritmetica del 50% dei valori più centrali, tralasciando dunque il 25% dei valori più piccoli e il 25% di quelli più grandi.

Proprietà della media aritmetica

modifica

La media aritmetica gode delle seguenti proprietà:[5]

  • la somma degli scarti di ciascun valore di   dalla media aritmetica è nulla:
 
  • la somma del quadrato degli scarti di ciascun valore di   da una costante   è minima quando   è pari alla media aritmetica:
 
  • la media aritmetica relativa ad un collettivo di   unità suddiviso in   sottogruppi disgiunti può essere calcolata come la media ponderata delle medie dei sottogruppi, con pesi uguali alla loro numerosità:
 
dove   ed   rappresentano rispettivamente la media aritmetica e la numerosità dell' -esimo sottogruppo;
  • la media aritmetica   di un carattere   ottenuto a partire dalla trasformazione lineare   di un carattere   è uguale a  , dove   è la media aritmetica del carattere  .

Esempio

modifica

Dati cinque numeri:

 

la loro media aritmetica è data da:

 

Media ponderata

modifica

Per calcolare la media ponderata di una serie di dati di cui ogni elemento   proviene da una differente distribuzione di probabilità con una varianza   nota, una possibile scelta per i pesi è data da:

 

La media ponderata in questo caso è:

 

e la varianza della media ponderata è:

 

che si riduce a   quando tutti i  .

Intuitivamente questa scelta avviene perché il peso che viene dato ad ogni valore è il reciproco del quadrato della varianza, ossia il reciproco del quadrato dell'"incertezza". In pratica più è grande l'incertezza (in questo caso misurata dalla varianza) più il valore associato alla stessa pesa meno. Oppure, dal punto di vista opposto, più si è certi del valore più questo pesa.

In modo più formale si può dire che questa media pesata è lo stimatore di massima verosimiglianza della media delle distribuzioni di probabilità nell'ipotesi che esse siano indipendenti e normalmente distribuite con la stessa media.

Media geometrica

modifica

La media geometrica di   termini è la radice  -esima del prodotto degli   valori:

 

Sfruttando le proprietà dei logaritmi, l'espressione della media geometrica può essere resa trasformando i prodotti in somme e le potenze in prodotti:

 

Dalla precedente scrittura si ricava anche una proprietà della media geometrica: il logaritmo della media geometrica è uguale alla media aritmetica dei logaritmi. Infatti, svolgendo il logaritmo su entrambi i lati dell'uguaglianza e ricordando che  , si ottiene:

 

Nel caso si disponga della distribuzione di frequenze della variabile, è possibile calcolare più facilmente la media geometrica attraverso la seguente formula:

 

dove  è il numero delle modalità assunte dalla variabile  ,   rappresenta la  -esima modalità di   e   la corrispondente frequenza assoluta. Dalla precedente si ottiene anche:

 

Analogamente al caso della media aritmetica, attribuendo un peso ai termini si può calcolare la media geometrica ponderata:

 

La media geometrica può essere vista anche come media aritmetico-armonica. Definendo infatti due successioni:

 
 

  e   convergono alla media geometrica di   e  .

Infatti le successioni convergono ad un limite comune. Si può infatti osservare che:

 

Lo stesso ragionamento può essere applicato sostituendo le medie aritmetica e armonica con una coppia di medie generalizzate di ordine finito e opposto.

La media geometrica si applica a valori positivi. Ha un chiaro significato geometrico: ad esempio la media geometrica di due numeri è la lunghezza del lato di un quadrato equivalente ad un rettangolo che abbia i lati di modulo pari ai due numeri. Lo stesso vale in un numero di dimensioni superiore. La media geometrica trova impiego soprattutto dove i valori considerati vengono per loro natura moltiplicati tra di loro e non sommati. Esempio tipico sono i tassi di crescita, come i tassi d'interesse o i tassi d'inflazione.

Una caratteristica è che valori piccoli (rispetto alla media aritmetica) sono molto più influenti dei valori grandi. In particolare, è sufficiente la presenza di un unico valore nullo per annullare la media.

Esempio

modifica

Dati cinque numeri:

 

la loro media geometrica è data da:

 

Media armonica

modifica
  Lo stesso argomento in dettaglio: Media armonica.

La media armonica di   termini è definita come il reciproco della media aritmetica dei reciproci:[6]

 

Per praticità di calcolo si può applicare la seguente formula, ottenuta tramite le proprietà di somme e prodotti:

 

Se a un insieme di dati è associato un insieme di pesi  , è possibile definire la media armonica ponderata come:

 

La media armonica semplice rappresenta un caso particolare, nel quale tutti i pesi hanno valore unitario.

La media armonica è fortemente influenzata dagli elementi di modulo minore: rispetto alla media aritmetica risente meno dell'influenza di outlier grandi, ma è influenzata notevolmente dagli outlier piccoli.

Esempio

modifica

Dati cinque numeri:

 

la loro media armonica è data da:

 

Media di potenza

modifica

La media di potenza (o media generalizzata o media di Hölder o media  -esima) rappresenta una generalizzazione delle medie pitagoriche. È definita come la radice  -esima della media aritmetica delle potenze di esponente   degli   valori considerati:

 

Molte altre medie sono casi particolari della media generalizzata, per opportuni valori di  :

  • media aritmetica, per  ;
  • media geometrica, per  ;
  • media armonica, per  ;
  • media quadratica, per   (usata soprattutto in presenza di numeri negativi per eliminare i segni);
  • media cubica, per  .

Inoltre:

  •  
  •  

Ad ogni termine può essere associato un coefficiente detto peso, in genere rappresentato dalla frequenza oppure da un valore il quale descrive l'importanza (oggettiva o soggettiva) che il singolo elemento riveste nella distribuzione. Se ai dati in esame si assegna un insieme di pesi  , tali che  , è possibile definire la media pesata:

 

Media aritmetico-geometrica

modifica

La media aritmetico-geometrica (AGM) di due numeri reali positivi   e   è definita come limite comune di due successioni definite come segue.

Si determinano la media aritmetica   e la media geometrica   di   e  

 
 

Quindi si itera il procedimento, sostituendo   ad   e   a  . In questo modo si ottengono due successioni:

 
 

Le due successioni sono convergenti e hanno limite comune, detto media aritmetico-geometrica di   e  , indicata come   o talvolta come  .

La media geometrica di due numeri è sempre minore della media aritmetica, di conseguenza   è una successione crescente,   è decrescente e si ha   (le disuguaglianze sono strette se  ).

Quindi   è un numero compreso fra la media aritmetica e la media geometrica di   e  .

Inoltre, dato un numero reale  , vale la relazione

 

Esiste anche un'espressione in forma integrale di  :

 

dove   rappresenta l'integrale ellittico completo di prima specie:

 

Inoltre, poiché la media aritmetico-geometrica converge piuttosto rapidamente, la formula precedente è utile anche nel calcolo degli integrali ellittici.

Il reciproco della media aritmetico-geometrica di   e   è chiamata costante di Gauss, in onore del matematico tedesco Carl Friedrich Gauss.

 

Media integrale

modifica

Una generalizzazione del concetto di media a distribuzioni continue prevede l'uso di integrali. Supponiamo di avere una funzione  , integrabile. Allora si può definire la media   come:

 

Data inoltre una funzione   tale che  , detta peso, si può definire la media integrale pesata   come:

 

Più in generale data una funzione   dove   è un insieme sul quale è definita una funzione di integrazione, si definisce la media   come:

 

Media temporale

modifica

La media temporale, spesso usata nella trattazione di segnali, è chiamata componente continua. Si tratta della media integrale calcolata in un intervallo di tempo tendente all'infinito.

 

per  

  1. ^ Glossario Istat Archiviato il 31 dicembre 2011 in Internet Archive.
  2. ^ Giorgio dall'Aglio, Calcolo delle probabilità, 3ª ed., Bologna, Zanichelli, 2003, p. 127.
  3. ^ The International Union of Pure and Applied Chemistry (IUPAC), IUPAC - arithmetic mean (A00440), su goldbook.iupac.org. URL consultato il 16 febbraio 2022.
  4. ^ Sheldon, p. 69.
  5. ^ Luigi Pace e Alessandra Salvan, INTRODUZIONE alla STATISTICA, I Statistica Descrittiva, Udine e Padova, CEDAM, 1996, ISBN 88-13-19939-2.
  6. ^ The International Union of Pure and Applied Chemistry (IUPAC), IUPAC - harmonic mean (H02745), su goldbook.iupac.org. URL consultato il 16 febbraio 2022.

Bibliografia

modifica

Voci correlate

modifica

Altri progetti

modifica

Collegamenti esterni

modifica
Controllo di autoritàLCCN (ENsh85010516 · GND (DE4130070-1 · J9U (ENHE987007295828005171