Variabili strumentali
Da Wikipedia, l'enciclopedia libera.
In statistica, la stima con il metodo delle variabili strumentali è utilizzata nell'analisi di regressione lineare. Un'ipotesi standard del modello classico di regressione lineare è che la variabili esplicative non siano correlate con la componente non spiegata, o disturbo; laddove tale ipotesi viene meno, la regressione con il consueto metodo dei minimi quadrati non consentirà di ottenere stime consistenti (cioè asintoticamente corrette e con varianza asintoticamente nulla). Se tuttavia è disponibile una variabile strumentale, è ancora possibile ottenere stime consistenti.
Il metodo di stima di un modello lineare tramite variabili strumentali è anche noto come metodo dei minimi quadrati a due stadi (o 2SLS, dall'inglese Two-Stages Least Squares).
Indice |
[modifica] Illustrazione del metodo
Si consideri il modello di regressione lineare:
Nel modello classico di regressione si ipotizza che le variabili esplicative non presentino correlazione con i disturbi , . Il metodo dei minimi quadrati ottiene lo stimatore per il parametro come soluzione all'equazione:
Ciò conduce allo stimatore (dei minimi quadrati ordinari, in inglese Ordinary Least Squares, o OLS):
Poiché e sono incorrelati, passando al limite per il secondo termine nell'espressione sopra converge a zero in probabilità, così che la stima è consistente.
Quando l'ipotesi standard viene meno, tuttavia, lo stimatore dei minimi quadrati non è più consistente. Può in tal caso essere utile considerare una variabile strumentale , , non correlata con il disturbo (e, idealmente, correlata con la variabile esplicativa ). Grazie ad essa è possibile impostare uno stimatore tramite il metodo dei momenti, tale da soddisfare la condizione:
Dalla condizione sopra discende lo stimatore (delle variabili strumentali, in inglese Instrumental Variables, o IV):
Poiché e non presentano correlazione, lo stimatore godrà della proprietà di consistenza. Può essere interessante osservare che tale stimatore costituisce un caso più generale di quello ottenuto con il metodo dei minimi quadrati; tale metodo, in altre parole, può essere pensato come una stima tramite variabili strumentali, in cui le stesse variabili esplicative ( nella notazione sopra adottata) sono utilizzate come variabili strumentali.
[modifica] Il caso multivariato
La procedura descritta sopra è immediatamente adattabile al caso multivariato. Si consideri una matrice X di N osservazioni di K regressori, e una matrice Z di N osservazioni di P variabili strumentali, tale che:
dove I denota la matrice identità di dimensione N, e:
Si può allora scrivere:
Così che la consistenza dello stimatore è assicurata:
[modifica] Applicazione del metodo
La correlazione tra regressori e disturbi in un modello di regressione lineare può insorgere in una serie di circostanze. Alcuni casi notevoli, generalmente menzionati in letteratura, sono:
- Omissione di variabili rilevanti, se il modello di regressione (multivariata) non include tra i regressori una variabile, che pure avrebbe rilevante potere esplicativo nei confronti della variabile dipendente;
- Errore nelle variabili esplicative, laddove i dati relativi a uno o più regressori sono affetti da un errore di misura, distinto dal disturbo ;
- Equazioni simultanee, nei casi in cui il sistema oggetto di analisi mette insieme diversi modelli statistici che operano simultaneamente.
Il metodo delle variabili strumentali è spesso applicato con una procedura di stima con i minimi quadrati a due stadi (in inglese, Two-Stages Least Squares, o 2SLS). Nell'approccio 2SLS, in un primo stadio di stima i regressori ( nella notazione sopra) sono regrediti sulle variabili strumentali (), ottenendo dei valori di previsione di primo stadio . Nel secondo stadio, la variabile dipendente () è regredita sui valori di previsione di primo stadio , ottenendo le stime .
Per le sue caratteristiche, il metodo delle variabili strumentali è soggetto a problemi legati alla scelta delle variabili strumentali stesse. Al di là dei requisiti formali per il funzionamento del metodo (assenza di correlazione con i disturbi), queste ultime potranno essere individuate mediante considerazioni strettamente relative al problema oggetto di analisi statistica. Modifiche esogene di una data politica (ad es., cancellazione di un programma di borse di studio), differenze geografiche nell'applicazione di dati standard (ad es., differenze di risultati necessari per il superamento di un dato esame in diversi stati), o mera casualità potranno definire delle opportune variabili strumentali.
[modifica] Bibliografia
- Greene, W.H. (2000), Econometric Analysis, Prentice-Hall, ISBN 0-13-013297-7, analizza nel dettaglio il modello classico di regressione lineare nel caso multivariato, con particolare riferimento alle sue applicazioni nell'ambito dell'econometria, disciplina per cui rappresenta il testo di livello universitario/master di riferimento (in inglese); il metodo delle variabili strumentali è trattato nel Capitolo 9.
- Wooldridge, J.M. (2002), Econometric Analysis of Cross Section and Panel Data, MIT Press, ISBN 0-262-23219-7, tratta in maniera più approfondita la stima tramite variabili strumentali, nel caso di modelli ad una singola equazione (capitolo 5) e di modelli di equazioni simultanee (capitolo 8); si tratta di un testo di riferimento per studi a livello di dottorato (in inglese).