[Vorheriges Kapitel]
[Nächstes Kapitel]
[Inhaltsverzeichnis]
[Fachbereich Geowissenschaften]
6 Statistische Grundlagen
Es werden mehrere Zwischenprodukte zu bestimmen sein, um aus den drei Kanalinformationen
der AVHRR-Messungen die Wolkenbasistemperatur ableiten zu können. Dies sind u.a. die
Wasseroberflächentemperatur, die Information darüber, ob ein Pixel voll, zum Teil
oder gar nicht bewölkt ist und die optische Dicke einer betrachteten Wolke. So ist
die gestellte Aufgabe rein formal nicht lösbar, da mehr unbekannte Parameter als
unabhängige Messungen vorliegen. Dieses Problem löst sich aber zum Teil durch die
Art des Zusammenhangs der gewünschten Informationen untereinander. Außerdem
stehen neben den Einzelmessungen noch Zusatzinformationen zur Verfügung. Ergibt
z.B. die Auswertung der drei Strahldichten für ein Pixel, daß es voll bewölkt ist, so
kann im Anschluß daran die optische Dicke der darin enthaltenen Wolke ebenfalls
aus allen drei Kanalinformationen bestimmt werden. Dies geht natürlich nur dann,
wenn die Verfahren zur Bestimmung des Bedeckungsgrades und der optischen Dicke
nicht zu einem einzigen Gleichungssystem mit den Kanalinformationen gehören. Als
Zusatzinformation wird z.B. die SST eines unbewölkten Pixels für die Analyse des
bewölkten Nachbarpixels benutzt werden, da starke Gradienten in der Wassertemperatur
zwischen wolkenlosen und bewölkten Gebieten nicht vorauszusetzen sind (vgl. Kap. 7.4).
Der Rückschluß von AVHRR-Meßdaten auf einzelne Parameter (optische Dicke und
Wolkenbasistemperatur) mit statistischen Methoden darf also für jede Größe alle drei Kanäle
benutzen.
6.1 Multiple lineare Regression
Die multiple lineare Regression ist ein geeignetes Verfahren, um
von mehreren Meßgrößen auf eine gesuchte Unbekannte zu schließen. Da Strahldichten und
Helligkeitstemperaturen über die PLANCK-Funktion (Gleichung 3) nichtlinear gekoppelt sind,
können beide hier als Meßwerte (Regressoren) verwendet werden. Die Regressanden werden u.a.
die optische Dicke und die Wolkenbasistemperatur sein. Um mögliche spätere Unklarheiten zu
vermeiden, werden im folgenden die Prinzipien der multiplen linearen Regression sowie
einiger Gütekriterien in Anlehnung an SCHUCHARD-FICHER u.a. (1981) kurz
vorgestellt.
Das Ziel ist die Bestimmung der Koeffizienten aj der Regressionsgleichung
| (16) |
wobei y der Regressand und xj die Regressoren sind. Für eine Stichprobe der Größe N
können die Koeffizienten aj mit Hilfe der Methode der kleinsten Quadrate bestimmt werden:
| (17) |
Dabei ist die Linearitätsbedingung Dy/Dxj = const. zu beachten. Zur Berechnung der
Koeffizienten der Regressionsgleichungen (16) werden Unterprogramme eines mathematischen
Programmpaketes verwendet.
6.2 Beurteilung und Probleme der Regression
Beim Aufstellen der Regressionsgleichung sind
rein physikalische Gesichtspunkte maßgebend, d.h. es dürfen nur Regressoren benutzt
werden, bei denen ein physikalisch sinnvoller Zusammenhang mit dem Regressanden
besteht. Diese Forderung ist hier aber keine bedeutende Beschränkung, da die
Strahlungsübertragungsgleichung (11) fordert, daß eine Änderung der optischen Dicke bzw. der
Temperatur einer Schicht (Wolkenbasishöhe) eine Strahldichteänderung in allen hier
betrachteten Spektralbereichen zur Folge hat. Somit besteht für alle Strahldichten ein
physikalischer Zusammenhang mit diesen beiden Zielgrößen.
Die Beurteilung der Güte eines Regressionsansatzes erfolgt durch Untersuchung folgender
Größen:
Das Bestimmtheitsmaß r2 wird definiert als
| (18) |
wobei der Mittelwert des Regressanden und yi' der aus der Regressionsgleichung ermittelte
Schätzwert sind. Es ist also das Verhältnis der erklärten zur gesamten Streuung. Für r2 = 1
stimmen der gemessene und der aus der Regressionsgleichung berechnete Regressand für alle i
überein. Als Prüfverfahren für das Bestimmtheitsmaß dient der F-Test, bei dem die
Nullhypothese getestet wird, die besagt, daß kein Zusammenhang zwischen Regressoren und
Regressand besteht. Die Signifikanztests für die Ablehnung dieser Hyphothese erfolgen hier stets
auf dem 99 % Niveau.
Der Standardfehler
| (19) |
ist die Standardabweichung der Differenzen zwischen dem tatsächlichen und vorhergesagten
Wert, falls diese Differenzen normalverteilt sind.
Um den Gesamtfehler der Regressionsgleichung zu erhalten muß noch der Meßfehler des
Satellitenradiometers berücksichtigt werden. Dies wird hier durch zufälliges "verrauschen" der
vom Modell berechneten Strahldichten erreicht. Die aus dem so veränderten Datensatz
berechneten Regressionskoeffizienten sind dann besser an die realen Satellitendaten angepaßt als
bei Benutzung der exakten Modellergebnisse. Die statistische Prüfung der Koeffizienten
geschieht mit dem T-Test.
Da die Strahldichten der verschiedenen Kanäle gut miteinander korreliert sind, bildet
Multikollinearität hier das Hauptproblem der Regressionsanalyse. Eine exakte Messung
derselben ist nicht möglich (SCHUCHARD-FICHER u.a., 1981). Es werden deshalb folgende
Kriterien aufgestellt, die alle erfüllt sein müssen, damit eine Regressionsgleichung akzeptiert
wird:
-
-
- der Betrag der einfachen Korrelationskoeffizienten der Regressoren untereinander ist
kleiner als 0.85;
-
-
- es gilt:
iri2 - r2 < 0.5 r2, wobei die r
i die einfachen Korrelationskoeffizienten der
Regressoren mit dem Regressanden sind (simple r test);
-
-
- der Regressionskoeffizient eines Parameters verändert sich um weniger als 15 % bei
Aufnahme eines weiteren Regressors in die Regressionsgleichung.
Die oben angegebenen Schwellwerte sind durch verschiedene Tests mit geteilten Datensätzen
entstanden. Die Regressionsanalyse verlangt u.a., daß die zu untersuchenden Ereignisse
voneinander unabhängig sind. Die in Kapitel 5 vorgestellten Variationen der Modellparameter
bedeuten aber, daß eine solche Unabhängigkeit hier nicht gegeben ist: Es stehen nur
drei unabhängige pTF-Profile zur Verfügung. Eine beachtenswerte Verzerrung der
Regressionsergebnisse ist aber dadurch nicht zu erwarten, denn Testrechnungen zeigten, daß die
variierten Parameter (SST, TB, TTOP usw.) die Strahldichten am Außenrand deutlich stärker
beeinflussen als die pTF-Profile. Trotzdem werden die Regressionsergebnisse zusätzlich
gemäß den statistischen Standardverfahren auf Autokorrelation der Residuen und
Heteroskedastizität überprüft, die das Verhältnis der Restschwankungen untereinander bzw.
gegenüber der abhängigen Variablen untersuchen. Die Auswirkungen abhängiger Ereignisse
müßten sich auch in beobachtbaren Regelmäßigkeiten bei den Restschwankungen
zeigen.
[Vorheriges Kapitel]
[Nächstes Kapitel]
[Inhaltsverzeichnis]
[Fachbereich Geowissenschaften]