Regression mit stochastischen Regressoren

Bei der Regression mit stochastischen Regressoren handelt es sich um spezielle statistische Analyseverfahren zur Aufdeckung möglicher Abhängigkeiten einer statistischen Größe von anderen Größen, den sogenannten Regressoren. In klassischen Regressionsmodellen (z. B. einfache lineare Regression, multiple lineare Regression) wird in der Regel angenommen, dass die Regressoren nichtzufällige, häufig sogar einstellbare Größen sind. In vielen praktischen Fällen, insbesondere bei ökonometrischen Modellen, kann diese Annahme nicht beibehalten werden. Man muss von zufälligen, also stochastischen Regressoren ausgehen. Dabei ist insbesondere von Interesse, wie sich stochastische Regressoren auf die Eigenschaften der Schätzungen (z. B. Kleinste-Quadrate-Schätzer) und Signifikanztests auswirken. Kurz gesagt ist es so, dass die für klassische Regressionsmodelle bekannten Eigenschaften (zumindest näherungsweise) erhalten bleiben, solange die stochastischen Regressoren unkorreliert mit den Störtermen sind (es liegt sogenannte Exogenität vor). Sind sie allerdings korreliert (es liegt sogenannte Endogenität vor), dann muss man prinzipiell andere Wege gehen.

Beispiele

Autoregressiver Prozess erster Ordnung (AR(1))

Der autoregressive Prozess erster Ordnung ist ein einfaches Modell der Zeitreihenanalyse und hat die Form

Y t = β 0 + β 1 Y t 1 + ε t , t = 1 , , n {\displaystyle Y_{t}=\beta _{0}+\beta _{1}Y_{t-1}+\varepsilon _{t}\quad ,t=1,\dots ,n} ,

wobei ε t {\displaystyle \varepsilon _{t}} weißes Rauschen darstellt. Der Regressor zum Zeitpunkt t {\displaystyle t} ist der zufällige Regressand vom Zeitpunkt t 1 {\displaystyle t-1} .

Fehler-in-den-Variablen-Modell

Gegeben sei im einfachsten Fall ein einfaches lineares Regressionsmodell (siehe z: B.[1]):

Y i = β 0 + β 1 x i + ε i ;   i = 1 , , n {\displaystyle Y_{i}=\beta _{0}+\beta _{1}x_{i}+\varepsilon _{i};\ i=1,\dots ,n} ,

jedoch kann x i {\displaystyle x_{i}} nur mit zufälligem Fehler u i {\displaystyle u_{i}} beobachtet werden, d. h. man hat dann den stochastischen Regressor z i = x i + u i {\displaystyle z_{i}=x_{i}+u_{i}} . Solche Modelle nennt man Fehler-in-den-Variablen-Modelle.

Simultane Gleichungen

Als Beispiel betrachte man die keynesianische Konsumfunktion mit zwei simultanen Gleichungen (siehe z. B.[2]):

Y i = β 0 + β 1 X i + ε i ;   X i = Y i + I i ;   i = 1. , n {\displaystyle Y_{i}=\beta _{0}+\beta _{1}X_{i}+\varepsilon _{i};\ X_{i}=Y_{i}+I_{i};\ i=1.\dots ,n}

Dabei ist Y i {\displaystyle Y_{i}} der Konsum, X i {\displaystyle X_{i}} das Einkommen und I i {\displaystyle I_{i}} die Investition. Setzt man die erste Gleichung in die zweite ein, ergibt sich:

X i = 1 1 β 1 ( β 0 + I i + ε i ) {\displaystyle X_{i}={\frac {1}{1-\beta _{1}}}(\beta _{0}+I_{i}+\varepsilon _{i})} ,

d. h. X i {\displaystyle X_{i}} ist zufällig, weil es von ε i {\displaystyle \varepsilon _{i}} abhängt.

Allgemeiner Fall

Wir betrachten ein multiples lineares Regressionsmodell in Vektor-Matrix-Form

Y = X β + ε {\displaystyle Y=X\beta +\varepsilon } .

Dabei ist Y {\displaystyle Y} der n {\displaystyle n} -dimensionale zufällige Vektor der Regressanden, X {\displaystyle X} die ( n × r ) {\displaystyle (n\times r)} -Matrix der Regressoren, β {\displaystyle \beta } der r {\displaystyle r} -dimensionale zu schätzende Parametervektor und ε {\displaystyle \varepsilon } der n {\displaystyle n} -dimensionale zufällige Vektor der Störgrößen mit E ε = 0 {\displaystyle \operatorname {E} \varepsilon =0} und Cov ε = σ 2 I n {\displaystyle \operatorname {Cov} \varepsilon =\sigma ^{2}I_{n}} . Hierbei wird angenommen, dass die Datenmatrix X {\displaystyle X} mit Wahrscheinlichkeit 1 vollen Rang hat, d. h. P [ Rang ( X ) = r ] = 1 {\displaystyle \operatorname {P} \left[\,\operatorname {Rang} (X)=r\,\right]=1} . Der Kleinste-Quadrate-Schätzer für β {\displaystyle \beta } hat die Gestalt

b = ( X T X ) 1 X T Y = β + ( X T X ) 1 X T ε {\displaystyle b=(X^{T}X)^{-1}X^{T}Y=\beta +(X^{T}X)^{-1}X^{T}\varepsilon } .

Da man schreiben kann b = β + A ε {\displaystyle b=\beta +A\varepsilon } , mit A = ( X T X ) 1 X T {\displaystyle A=(X^{T}X)^{-1}X^{T}} , ist b {\displaystyle b} eine lineare Funktion der Störgrößen, was b {\displaystyle b} zu einem linearen Schätzer macht.

Nichtzufällige Regressoren

In diesem Standardfall gilt bekanntermaßen

  • b {\displaystyle b} ist beste lineare erwartungstreue Schätzfunktion (BLUE) mit Cov b = σ 2 ( X T X ) 1 {\displaystyle \operatorname {Cov} b=\sigma ^{2}(X^{T}X)^{-1}} .
  • Falls das durchschnittliche Quadrat der beobachteten Werte der erklärenden Variablen auch bei einem ins Unendliche gehendem Stichprobenumfang endlich bleibt: lim n 1 n X T X = Q {\displaystyle \lim _{n\to \infty }{\frac {1}{n}}X^{T}X=Q} mit positiv definitem Q {\displaystyle Q} , dann ist b {\displaystyle b} konsistent für β {\displaystyle \beta } .
  • Falls die Störgröße normalverteilt ist, dann ist auch b {\displaystyle b} normalverteilt und es können t- bzw. F-verteilte Teststatistiken gebildet werden.

Exogenität der Regressoren

Darunter versteht man, dass die Regressoren X {\displaystyle X} zwar stochastisch, aber unkorreliert mit dem Störterm ε {\displaystyle \varepsilon } sind, siehe z. B.[3] Im obigen Fehler-in-den-Variablen-Beispiel hat man die Exogenität, wenn u i {\displaystyle u_{i}} und ε i {\displaystyle \varepsilon _{i}} unkorreliert sind. Dann gilt:

  • b {\displaystyle b} ist weiterhin BLUE mit Cov b = σ 2 E ( X T X ) 1 {\displaystyle \operatorname {Cov} b=\sigma ^{2}\operatorname {E} (X^{T}X)^{-1}} , siehe [4]
  • Falls 1 n X T X {\displaystyle {\frac {1}{n}}X^{T}X} in Wahrscheinlichkeit gegen eine positiv definite Matrix Q {\displaystyle Q} konvergiert, dann ist b {\displaystyle b} konsistent für β {\displaystyle \beta } , siehe z. B.[5]
  • Falls ε {\displaystyle \varepsilon } normalverteilt ist, dann ist b {\displaystyle b} asymptotisch normalverteilt. Die klassischen Teststatistiken können für große n {\displaystyle n} benutzt werden.

Allgemeine stochastische Regressoren

X {\displaystyle X} und ε {\displaystyle \varepsilon } sind korreliert, wie z. B. bei der keynesianischen Konsumfunktion. Dann ist b {\displaystyle b} verzerrt und nicht mehr konsistent für β {\displaystyle \beta } . Die klassischen Teststatistiken können nicht benutzt werden. Es müssen prinzipiell andere Methoden gewählt werden.

Für Modelle der Zeitreihenanalyse, wenn allgemeiner als im obigen AR(1)-Beispiel ein ARMA-Modell vorliegt, gibt es spezielle, zum Teil rekursive Kleinste-Quadrate-Verfahren, die im Allgemeinen auf nichtlineare Kleinste-Quadrate-Schätzer führen, siehe z. B.[6]

Unter dem Stichwort Simultane Gleichungen findet man die Methode der Instrumentvariablen, und da z. B. den zweistufigen Kleinste-Quadrate-Schätzer (engl. two-stage least-squares estimator) und den mit der verallgemeinerten Momentenmethode (engl. Generalized Method of Moments) gewonnenen Schätzer GMM-Schätzer, siehe z. B.[7]

Einzelnachweise

  1. Schneeweiß, H.: Ökonometrie, Physica Verlag 1990 (4. Auflage) Kapitel 7 (3. Auflage 1978)
  2. Schönfeld, P.: Methoden der Ökonometrie, Band II, Stochastische Regressoren und simultane Gleichungen, Vahlen (München) 1971
  3. Green, W.H.: Econometric Analysis, Prentice Hall 2002 (5. Auflage), Seite 42, full text
  4. Green, W.H.: Econometric Analysis, Prentice Hall 2002 (5. Auflage), Theorem 4.3
  5. Verbeek, M.: A Guide to Modern Econometrics, Wiley 2004 (2. Auflage), Seite 34, full text
  6. Brockwell, P. J. and Davis, R. A.: Time Series: Theory and Methods, Springer 1991 (2. Auflage)
  7. Green, W.H.: Econometric Analysis, Prentice Hall 2002 (5. Auflage), Kapitel 15