[Vorheriges Kapitel]    [Nächstes Kapitel]    [Inhaltsverzeichnis]    [Fachbereich Geowissenschaften]

6 Statistische Grundlagen

Es werden mehrere Zwischenprodukte zu bestimmen sein, um aus den drei Kanalinformationen der AVHRR-Messungen die Wolkenbasistemperatur ableiten zu können. Dies sind u.a. die Wasseroberflächentemperatur, die Information darüber, ob ein Pixel voll, zum Teil oder gar nicht bewölkt ist und die optische Dicke einer betrachteten Wolke. So ist die gestellte Aufgabe rein formal nicht lösbar, da mehr unbekannte Parameter als unabhängige Messungen vorliegen. Dieses Problem löst sich aber zum Teil durch die Art des Zusammenhangs der gewünschten Informationen untereinander. Außerdem stehen neben den Einzelmessungen noch Zusatzinformationen zur Verfügung. Ergibt z.B. die Auswertung der drei Strahldichten für ein Pixel, daß es voll bewölkt ist, so kann im Anschluß daran die optische Dicke der darin enthaltenen Wolke ebenfalls aus allen drei Kanalinformationen bestimmt werden. Dies geht natürlich nur dann, wenn die Verfahren zur Bestimmung des Bedeckungsgrades und der optischen Dicke nicht zu einem einzigen Gleichungssystem mit den Kanalinformationen gehören. Als Zusatzinformation wird z.B. die SST eines unbewölkten Pixels für die Analyse des bewölkten Nachbarpixels benutzt werden, da starke Gradienten in der Wassertemperatur zwischen wolkenlosen und bewölkten Gebieten nicht vorauszusetzen sind (vgl. Kap. 7.4). Der Rückschluß von AVHRR-Meßdaten auf einzelne Parameter (optische Dicke und Wolkenbasistemperatur) mit statistischen Methoden darf also für jede Größe alle drei Kanäle benutzen.

6.1 Multiple lineare Regression

Die multiple lineare Regression ist ein geeignetes Verfahren, um von mehreren Meßgrößen auf eine gesuchte Unbekannte zu schließen. Da Strahldichten und Helligkeitstemperaturen über die PLANCK-Funktion (Gleichung 3) nichtlinear gekoppelt sind, können beide hier als Meßwerte (Regressoren) verwendet werden. Die Regressanden werden u.a. die optische Dicke und die Wolkenbasistemperatur sein. Um mögliche spätere Unklarheiten zu vermeiden, werden im folgenden die Prinzipien der multiplen linearen Regression sowie einiger Gütekriterien in Anlehnung an SCHUCHARD-FICHER u.a. (1981) kurz vorgestellt.
Das Ziel ist die Bestimmung der Koeffizienten aj der Regressionsgleichung
y = a0 + a1x1 + a2x2 + ...+ anxn,
(16)
wobei y der Regressand und xj die Regressoren sind. Für eine Stichprobe der Größe N können die Koeffizienten aj mit Hilfe der Methode der kleinsten Quadrate bestimmt werden:
 sum N
   [yi- (a0 + a1xi1 + ...+ anxin)]2 --> minimal
 i=1
(17)
Dabei ist die Linearitätsbedingung Dy/Dxj = const.   zu beachten. Zur Berechnung der Koeffizienten der Regressionsgleichungen (16) werden Unterprogramme eines mathematischen Programmpaketes verwendet.

6.2 Beurteilung und Probleme der Regression

Beim Aufstellen der Regressionsgleichung sind rein physikalische Gesichtspunkte maßgebend, d.h. es dürfen nur Regressoren benutzt werden, bei denen ein physikalisch sinnvoller Zusammenhang mit dem Regressanden besteht. Diese Forderung ist hier aber keine bedeutende Beschränkung, da die Strahlungsübertragungsgleichung (11) fordert, daß eine Änderung der optischen Dicke bzw. der Temperatur einer Schicht (Wolkenbasishöhe) eine Strahldichteänderung in allen hier betrachteten Spektralbereichen zur Folge hat. Somit besteht für alle Strahldichten ein physikalischer Zusammenhang mit diesen beiden Zielgrößen.
Die Beurteilung der Güte eines Regressionsansatzes erfolgt durch Untersuchung folgender Größen:
Das Bestimmtheitsmaß r2 wird definiert als
      sum         --
 2   --Ni=1(y'i--y)2-
r =   sum N  (yi - y)2,
       i=1
(18)
wobei --
y der Mittelwert des Regressanden und yi' der aus der Regressionsgleichung ermittelte Schätzwert sind. Es ist also das Verhältnis der erklärten zur gesamten Streuung. Für r2 = 1 stimmen der gemessene und der aus der Regressionsgleichung berechnete Regressand für alle i überein. Als Prüfverfahren für das Bestimmtheitsmaß dient der F-Test, bei dem die Nullhypothese getestet wird, die besagt, daß kein Zusammenhang zwischen Regressoren und Regressand besteht. Die Signifikanztests für die Ablehnung dieser Hyphothese erfolgen hier stets auf dem 99 % Niveau.
Der Standardfehler
     V~   sum N---'-----2
s =   --i=1(yi--yi)-
          N  - 2
(19)
ist die Standardabweichung der Differenzen zwischen dem tatsächlichen und vorhergesagten Wert, falls diese Differenzen normalverteilt sind.
Um den Gesamtfehler der Regressionsgleichung zu erhalten muß noch der Meßfehler des Satellitenradiometers berücksichtigt werden. Dies wird hier durch zufälliges "verrauschen" der vom Modell berechneten Strahldichten erreicht. Die aus dem so veränderten Datensatz berechneten Regressionskoeffizienten sind dann besser an die realen Satellitendaten angepaßt als bei Benutzung der exakten Modellergebnisse. Die statistische Prüfung der Koeffizienten geschieht mit dem T-Test.
Da die Strahldichten der verschiedenen Kanäle gut miteinander korreliert sind, bildet Multikollinearität hier das Hauptproblem der Regressionsanalyse. Eine exakte Messung derselben ist nicht möglich (SCHUCHARD-FICHER u.a., 1981). Es werden deshalb folgende Kriterien aufgestellt, die alle erfüllt sein müssen, damit eine Regressionsgleichung akzeptiert wird:
  -
der Betrag der einfachen Korrelationskoeffizienten der Regressoren untereinander ist kleiner als 0.85;
  -
es gilt:  sum iri2 - r2 < 0.5 . r2, wobei die r i die einfachen Korrelationskoeffizienten der Regressoren mit dem Regressanden sind (simple r test);
  -
der Regressionskoeffizient eines Parameters verändert sich um weniger als 15 % bei Aufnahme eines weiteren Regressors in die Regressionsgleichung.

Die oben angegebenen Schwellwerte sind durch verschiedene Tests mit geteilten Datensätzen entstanden. Die Regressionsanalyse verlangt u.a., daß die zu untersuchenden Ereignisse voneinander unabhängig sind. Die in Kapitel 5 vorgestellten Variationen der Modellparameter bedeuten aber, daß eine solche Unabhängigkeit hier nicht gegeben ist: Es stehen nur drei unabhängige pTF-Profile zur Verfügung. Eine beachtenswerte Verzerrung der Regressionsergebnisse ist aber dadurch nicht zu erwarten, denn Testrechnungen zeigten, daß die variierten Parameter (SST, TB, TTOP usw.) die Strahldichten am Außenrand deutlich stärker beeinflussen als die pTF-Profile. Trotzdem werden die Regressionsergebnisse zusätzlich gemäß den statistischen Standardverfahren auf Autokorrelation der Residuen und Heteroskedastizität überprüft, die das Verhältnis der Restschwankungen untereinander bzw. gegenüber der abhängigen Variablen untersuchen. Die Auswirkungen abhängiger Ereignisse müßten sich auch in beobachtbaren Regelmäßigkeiten bei den Restschwankungen zeigen.



[Vorheriges Kapitel]    [Nächstes Kapitel]    [Inhaltsverzeichnis]    [Fachbereich Geowissenschaften]