Le famiglie di dispersione esponenziale sono un insieme di modelli parametrici, appartenenti a una classe più ampia, esprimibile tramite una funzione di distribuzione ascrivibile a
p
(
y
|
θ
,
ϕ
)
=
exp
{
θ
y
−
b
(
θ
)
a
(
ϕ
)
+
c
(
y
,
ϕ
)
}
{\displaystyle p(y|\theta ,\phi )=\exp {\left\{{\frac {\theta y-b(\theta )}{a(\phi )}}+c(y,\phi )\right\}}}
in cui
y
∈
S
⊆
R
{\displaystyle y\in {\mathcal {S}}\subseteq \mathbb {R} }
,
θ
∈
Θ
⊆
R
{\displaystyle \theta \in \Theta \subseteq \mathbb {R} }
,
ϕ
>
0
{\displaystyle \phi >0}
,
a
(
ϕ
)
>
0
{\displaystyle a(\phi )>0}
. Il parametro
θ
{\displaystyle \theta }
è detto "parametro naturale", mentre
ϕ
{\displaystyle \phi }
è detto "parametro di dispersione". Spesso
a
(
ϕ
)
=
ϕ
{\displaystyle a(\phi )=\phi }
oppure
a
(
ϕ
)
=
ϕ
/
w
{\displaystyle a(\phi )=\phi /w}
, con
w
{\displaystyle w}
costante nota. Inoltre, per alcuni importanti modelli, come Poisson , esponenziale e Bernoulli ,
ϕ
=
1
{\displaystyle \phi =1}
, dunque sono parametrizzate solo da
θ
{\displaystyle \theta }
.[ 1]
Esiste anche una versione vettoriale, che si applica per risposte
y
∈
R
k
{\displaystyle \mathbf {y} \in \mathbb {R} ^{k}}
multivariate, ovvero
p
(
y
|
θ
,
ϕ
)
=
exp
{
θ
T
y
−
b
(
θ
)
a
(
ϕ
)
+
c
(
y
,
ϕ
)
}
{\displaystyle p(\mathbf {y} |{\boldsymbol {\theta }},\phi )=\exp {\left\{{\frac {{\boldsymbol {\theta }}^{T}\mathbf {y} -b({\boldsymbol {\theta }})}{a(\phi )}}+c(\mathbf {y} ,\phi )\right\}}}
in cui
ϕ
{\displaystyle \phi }
è ancora una grandezza scalare.[ 2]
La trattazione delle famiglie di dispersione esponenziale nella forma sopra specificata risulta particolarmente funzionale alle analisi di regressione e allo studio dei modelli lineari generalizzati .
Definendo la funzione generatrice dei cumulanti
K
Y
(
t
|
θ
,
ϕ
)
{\displaystyle K_{Y}(t|\theta ,\phi )}
come il logaritmo della funzione generatrice dei momenti
M
Y
(
t
|
θ
,
ϕ
)
=
E
[
e
t
Y
]
{\displaystyle M_{Y}(t|\theta ,\phi )=\mathbb {E} [e^{tY}]}
, si ottiene
M
Y
(
t
|
θ
,
ϕ
)
=
E
[
e
t
Y
]
=
∫
S
e
t
y
p
(
y
|
θ
,
ϕ
)
d
y
=
exp
{
b
(
θ
+
t
⋅
a
(
ϕ
)
)
−
b
(
θ
)
a
(
ϕ
)
}
K
Y
(
t
|
θ
,
ϕ
)
=
log
M
Y
(
t
|
θ
,
ϕ
)
=
b
(
θ
+
t
⋅
a
(
ϕ
)
)
−
b
(
θ
)
a
(
ϕ
)
{\displaystyle {\begin{array}{l}M_{Y}(t|\theta ,\phi )=\mathbb {E} [e^{tY}]=\int _{\mathcal {S}}e^{ty}p(y|\theta ,\phi )dy=\exp \left\{{\frac {b(\theta +t\cdot a(\phi ))-b(\theta )}{a(\phi )}}\right\}\\[12pt]K_{Y}(t|\theta ,\phi )=\log M_{Y}(t|\theta ,\phi )={\frac {b(\theta +t\cdot a(\phi ))-b(\theta )}{a(\phi )}}\end{array}}}
da cui si possono ricavare i generici cumulanti di ordine
r
{\displaystyle r}
derivando
r
{\displaystyle r}
volte
K
Y
{\displaystyle K_{Y}}
in
t
=
0
{\displaystyle t=0}
, risulta pertanto
κ
r
(
Y
)
=
∂
r
K
Y
(
t
|
θ
,
ϕ
)
∂
t
r
|
t
=
0
=
a
(
ϕ
)
r
−
1
b
(
r
)
(
θ
)
{\displaystyle \kappa _{r}(Y)=\left.{\frac {\partial ^{r}K_{Y}(t|\theta ,\phi )}{\partial t^{r}}}\right|_{t=0}=a(\phi )^{r-1}b^{(r)}(\theta )}
dove
b
(
r
)
{\displaystyle b^{(r)}}
denota la derivata
r
{\displaystyle r}
-esima di
b
{\displaystyle b}
,
r
=
1
,
2
,
3
,
…
{\displaystyle r=1,2,3,\dots }
.
A partire da questo risultato è facile ottenere le espressioni per media e varianza della variabile
Y
{\displaystyle Y}
:
E
[
Y
]
=
κ
1
(
Y
)
=
b
′
(
θ
)
Var
(
Y
)
=
κ
2
(
Y
)
=
a
(
ϕ
)
b
″
(
θ
)
{\displaystyle {\begin{array}{l}\mathbb {E} [Y]=\kappa _{1}(Y)=b'(\theta )\\[10pt]{\text{Var}}(Y)=\kappa _{2}(Y)=a(\phi )b''(\theta )\end{array}}}
e poiché
V
a
r
(
Y
)
>
0
{\displaystyle \mathrm {Var} (Y)>0}
e
a
(
ϕ
)
>
0
{\displaystyle a(\phi )>0}
consegue che
b
″
(
θ
)
>
0
{\displaystyle b''(\theta )>0}
, vale a dire che
b
(
θ
)
{\displaystyle b(\theta )}
è una funzione convessa e
b
′
(
θ
)
=
μ
(
θ
)
=
E
[
Y
]
{\displaystyle b'(\theta )=\mu (\theta )=\mathbb {E} [Y]}
è una funzione strettamente crescente , con dominio
Θ
{\displaystyle \Theta }
e codominio lo spazio delle medie
M
{\displaystyle {\mathcal {M}}}
, dunque anche biiettiva , con inversa
θ
(
μ
)
{\displaystyle \theta (\mu )}
.
I cumulanti di ordine 3 e 4 danno rispettivamente una misura di asimmetria e curtosi .
Si è visto
V
a
r
(
Y
)
{\displaystyle \mathrm {Var} (Y)}
esprimibile come funzione di
ϕ
{\displaystyle \phi }
e di
θ
{\displaystyle \theta }
, ma poiché
θ
{\displaystyle \theta }
è in relazione biunivoca con
μ
{\displaystyle \mu }
, è possibile scrivere[ 1]
V
a
r
(
Y
)
=
a
(
ϕ
)
b
″
(
θ
)
=
a
(
ϕ
)
v
(
μ
)
{\displaystyle \mathrm {Var} (Y)=a(\phi )b''(\theta )=a(\phi )v(\mu )}
in cui
v
(
μ
)
{\displaystyle v(\mu )}
viene denominata "funzione di varianza". La funzione di varianza caratterizza, assieme ad
a
(
ϕ
)
{\displaystyle a(\phi )}
, una precisa famiglia di dispersione esponenziale. Ad esempio solo 6 famiglie della classe DE hanno funzione di varianza al più quadratica (
v
(
μ
)
=
α
+
β
μ
+
γ
μ
2
{\displaystyle v(\mu )=\alpha +\beta \mu +\gamma \mu ^{2}}
).[ 3]
Per le ragioni presentate precedentemente si può pensare di esprimere l'intera distribuzione come espressione di media
μ
{\displaystyle \mu }
e varianza
σ
2
=
a
(
ϕ
)
v
(
μ
)
{\displaystyle \sigma ^{2}=a(\phi )v(\mu )}
e a tal fine introdurre una notazione compatta
Y
∼
D
E
(
μ
,
a
(
ϕ
)
v
(
μ
)
)
{\displaystyle Y\sim DE(\mu ,a(\phi )v(\mu ))}
, con
μ
∈
M
,
ϕ
>
0
,
a
(
ϕ
)
>
0
{\displaystyle \mu \in {\mathcal {M}},\ \phi >0,\ a(\phi )>0}
.[ 2]
Principali famiglie di dispersione esponenziale
modifica
La classe delle famiglie di dispersione esponenziale, come visto, è in grado di racchiudere sia distribuzioni continue, che discrete. La tabella sottostante riassume i principali modelli che ne fanno parte, le loro caratteristiche e le relazioni tra i parametri tradizionali e quelli della dispersione esponenziale.
Distribuzioni continue
S
{\displaystyle {\mathcal {S}}}
θ
{\displaystyle \theta }
Θ
{\displaystyle \Theta }
b
(
θ
)
{\displaystyle b(\theta )}
ϕ
{\displaystyle \phi }
a
(
ϕ
)
{\displaystyle a(\phi )}
M
{\displaystyle {\mathcal {M}}}
v
(
μ
)
{\displaystyle v(\mu )}
Distribuzione normale
N
(
μ
,
σ
2
)
{\displaystyle {\mathcal {N}}(\mu ,\sigma ^{2})}
R
{\displaystyle \mathbb {R} }
μ
{\displaystyle \mu }
R
{\displaystyle \mathbb {R} }
θ
2
/
2
{\displaystyle \theta ^{2}/2}
σ
2
{\displaystyle \sigma ^{2}}
σ
2
{\displaystyle \sigma ^{2}}
R
{\displaystyle \mathbb {R} }
1
{\displaystyle 1}
Distribuzione gamma
G
a
(
α
,
α
μ
)
{\displaystyle Ga\left(\alpha ,{\frac {\alpha }{\mu }}\right)}
[
0
,
+
∞
)
{\displaystyle [0,+\infty )}
−
1
/
μ
{\displaystyle -1/\mu }
(
−
∞
,
0
)
{\displaystyle (-\infty ,0)}
−
ln
(
−
θ
)
)
{\displaystyle -\ln(-\theta ))}
1
/
α
{\displaystyle 1/\alpha }
1
/
α
{\displaystyle 1/\alpha }
(
0
,
+
∞
)
{\displaystyle (0,+\infty )}
μ
2
{\displaystyle \mu ^{2}}
Distribuzioni discrete
Distribuzione binomiale (riscalata)
1
m
B
i
(
m
,
μ
)
{\displaystyle {\frac {1}{m}}Bi(m,\mu )}
{
0
,
1
m
,
2
m
,
…
,
1
}
{\displaystyle \left\{0,{\frac {1}{m}},{\frac {2}{m}},\dots ,1\right\}}
ln
(
μ
1
−
μ
)
{\displaystyle \ln \left({\frac {\mu }{1-\mu }}\right)}
R
{\displaystyle \mathbb {R} }
ln
(
1
+
exp
(
θ
)
)
{\displaystyle \ln(1+\exp(\theta ))}
1
{\displaystyle 1}
1
/
m
{\displaystyle 1/m}
(
0
,
1
)
{\displaystyle (0,1)}
μ
(
1
−
μ
)
{\displaystyle \mu (1-\mu )}
Distribuzione di Poisson
P
o
(
μ
)
{\displaystyle Po(\mu )}
N
{\displaystyle \mathbb {N} }
ln
μ
{\displaystyle \ln {\mu }}
R
{\displaystyle \mathbb {R} }
exp
(
θ
)
{\displaystyle \exp(\theta )}
1
{\displaystyle 1}
1
{\displaystyle 1}
(
0
,
+
∞
)
{\displaystyle (0,+\infty )}
μ
{\displaystyle \mu }
Distribuzione binomiale negativa (riscalata)
1
r
B
i
n
e
g
(
r
,
1
1
+
μ
)
{\displaystyle {\frac {1}{r}}Bineg\left(r,{\frac {1}{1+\mu }}\right)}
N
{\displaystyle \mathbb {N} }
ln
(
μ
1
+
μ
)
{\displaystyle \ln \left({\frac {\mu }{1+\mu }}\right)}
(
−
∞
,
0
)
{\displaystyle (-\infty ,0)}
−
ln
(
1
−
exp
(
θ
)
)
{\displaystyle -\ln(1-\exp(\theta ))}
1
{\displaystyle 1}
1
/
r
{\displaystyle 1/r}
(
0
,
+
∞
)
{\displaystyle (0,+\infty )}
μ
(
1
+
μ
)
{\displaystyle \mu (1+\mu )}
rientrano nella classe anche la distribuzione normale inversa e la distribuzione di Tweedie .
^ a b Alessandra Salvan, Nicola Sartori e Luigi Pace, Modelli Lineari Generalizzati , Milano, Springer, 2020, ISBN 978-88-470-4001-4 .
^ a b Bent Jørgensen, Exponential Dispersion Models , in Journal of the Royal Statistical Society. Series B (Methodological) , vol. 49, n. 2, 1987, pp. 127-162.
^ (EN ) Carl N. Morris, Natural exponential families with quadratic variance functions , in The Annals of Statistics , vol. 10, n. 1, 1982, pp. 65-80.