Schwetz Arbeit

  • November 2019
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Schwetz Arbeit as PDF for free.

More details

  • Words: 1,916
  • Pages: 13
4

1. Einleitung Charakteristikum von Mehrebenenanalysen: Zahlreiche Datensätze, die in der sozialwissenschaftlichen Forschung analysiert werden, haben eine hierarchische Struktur. Sehr häufig liegen Variablen für Untersuchungseinheiten vor, die in natürlicher Weise übergeordneten Einheiten (Einheiten höherer Ordnung) zugeordnet werden können. Ein anschauliches Beispiel dafür sind Daten für einzelne Schüler, die nach den Schulklassen oder Schulen, die sie besuchen, zusammengefasst werden können. Im Sinn eines statistischen Verfahrens kann von einer Mehrebenenanalyse dann gesprochen werden, wenn Gegenstände verschiedener Ordnung in einer Analyse simultan verrechnet werden und somit hinsichtlich der Wirkungen auf eine abhängige Variable neben Merkmalen der individuellen Einheiten auch Merkmale kollektiver Einheiten Berücksichtigung finden. Anwendungsfälle für Mehrebenenanalysen sind folglich Datensätze mit einer hierarchischen Struktur, bei denen Daten für individuelle und kollektive Einheiten vorliegen, die in Bezug aufeinander zu analysieren sind. In der Regel wird als abhängige Variable ein Individualmerkmal (z.B. die Schulleistung von Schülern) untersucht, zu dessen Erklärung bzw. Vorhersage weitere Individualmerkmale (z.B. Motivation, schulische Einstellungen) und zudem noch Merkmale der Einheiten einer höheren Ordnung (z.B. des Unterrichts in der Schulklasse, Merkmale der Schule, des Wohngebietes) herangezogen werden. (http://www1.ku-eichstaett.de/PPF/PaedagogikI/allgphdx.htm) In einer Mehrebenenanalyse können untersucht werden: •

Effekte von Individualvariablen (z.B. Geschlecht, Alter, sozialer Status).



Effekte von Aggregatvariablen (Merkmale von Schulklassen, Schulen, Wohngebieten, Gemeindeklassen).



Das Zusammenwirken von Aggregat- und Individualvariablen.

Die Mehrebenenanalyse ist eigentlich eine Erweiterung zur einfachen Regressionsgleichung. Sie bietet im Gegensatz zur Regressionsanalyse den Vorteil, Kontexteffekte, sprich Unterschiede zwischen Klassen und zwischen Schulen berücksichtigen zu können. Die Residualgrößen, d.h. „der Teil der Abweichung des beobachteten y-Wertes vom Mittelwert aller Beobachtungswerte“ sind Kernstücke der Mehrebenenanalyse.

5

Um die Gleichungen und Untersuchungen meiner Arbeit besser verständlich zu machen, möchte ich kurz eine einfache Regressionsgleichung interpretieren. yi = ß0 + ß1x1i + ei y = Responsevariable

ß0 = Regressions-intercept

ß1 = Steigung

x1 = Prädiktor für Schüler i

ei = Residual ( Rest)

2. Forschungsfrage: Ich werde in meiner Arbeit die Mehrebenenanalyse in ihren unterschiedlichen Punkten behandeln. Der Datensatz, mit welchem ich arbeiten werde beinhaltet Daten von 19 Schulen, 56 Klassen und 930 Schülern. Ich werde jedoch kein 3-Ebenen, sondern ein „ 2-Ebenenmodell untersuchen, d.h. ich behandle nur Unterschiede zwischen Klassen und Unterschiede zwischen Individuen. Ich habe es mit Prädiktoren wie Mathenoten, Gesamtnoten, Lehrerurteil usw. zu tun. Die einzelnen Schritte der Mehrebenenanalyse werde ich im Hinblick auf folgende Forschungsfrage untersuchen. „ Gibt es beim Random-Slope-Modell und beim Random-Intercept-Modell Unterschiede bezüglich der Outlierklassen? In statistics, an outlier is a single observation "far away" from the rest of the data. (vgl.www.wikipedia.at) Outlier sind so genannte “ Ausreißer”, Daten bzw. Werte, die sich von anderen Werten hervorheben, bzw. aus der Menge herausstechen. Ich untersuche nun den Unterschied der „Outlier“ bezüglich der Klassen aus meinem Datensatz zwischen dem Random-intercept und dem Random-slope-modell. Nun werde ich im Hinblick auf meine Forschungsfrage einige Modelle und Grafiken der Mehrebenenanalyse am Computer errechnen und interpretieren. Manche Schritte betreffen auch solche Modelle, in denen noch keine Outlier berechnet werden und ich sie daher auch noch nicht interpretiere.

6

3. Mehrebenenanalyse Nachdem ich meinen Datensatz, der aus 20 Variablen besteht vom SPSS nach MLwin transferiert habe, werde ich als erstes ein Nullmodell erstellen. Die Responsevariable( yachse) dieser Gleichung stellen hier die Mathenoten 98 dar. Beim Nullmodell gibt es noch keine Steigung, sondern nur ein Regressions-intercept (siehe Nullmodell, ß0 cons). Daher haben wir hier auch noch keinen Prädiktor. Nullmodell:

Grafische Darstellung des Nullmodells:

7

Diese Grafik zeigt alle 56 Klassen aus dem Datensatz. Die Geraden sind deswegen alle parallel zur x-Achse, weil das Nullmodell noch keine Steigung hat. Wie sich jedoch erkennen lässt sind die Regressionsgeraden nicht alle gleich lang. Dies lässt sich folgend interpretieren: Je länger die Regressionsgerade, desto heterogener die Klasse → Je kürzer, die Gerade, umso homogener die Klasse. Als nächsten Schritt gehe ich vom Nullmodell über in das Random-interceptmodell. Das Random-intercept-modell bedeutet folgendes: Es wird nun für jede Klasse ein Intercept berechnet. Im Gegensatz zum Nullmodell gibt es in dieser Gleichung eine Steigung, jedoch wird sie bei allen Klassen konstant gehalten. Die Responsevariable sind wiederum die Mathenoten 98. Da wir jedoch im Random-intercept eine Steigung haben, obgleich sie für alle Klassen gleich ist, gibt es hier einen Prädiktor, nämlich Mathenoten 97 zentriert. Random-Intercept-Modell:

8

Grafische Darstellung des Random-intercept: Wiederum sieht man hier die Regressionslinien der 56 Klassen. Diesmal erhält jede gerade eine Steigung, jedoch dieselbe. Daher bleiben die Geraden zueinander parallel. Anhand der Länge der Linien lässt sich abermals feststellen, wie homogen bzw. heterogen eine Klasse ist. Die Homogenität zeugt davon, dass in der Klasse ein ausgleichender Mathematikunterricht stattfindet.

Da ich nun das erste Random-intercept-modell errechnet habe, kann ich genauer auf meine Forschungsfrage eingehen. Um ersten Aufschluss über die Outlierdaten zu bekommen, möchte ich sie mir im bereits errechneten Random-intercept- Modell anschauen. Da es sich bei den Outlierdaten um Daten handelt, die Ausreißer darstellen bzw. sich vom Rest der Werte sei es positiv oder negativ hervorheben beziehe ich mich im nächsten Schritt nur auf Solche. Ich untersuche den Unterschied zwischen den Klassen, daher stelle ich nun fest, welche die beste und welche die schlechteste Klasse ist. Klasse 41. Abstand 2.3686

Rang 56.000

Klasse 52. Abstand -2.3686

Rang 1.0000

Interpretation: Da beim Random intercept Modell nur die Intercepte der einzelnen Klassen berechnet werden die Steigungen aber konstant gehalten werden, haben alle Klassen die gleichen Steigungen.

9

Klasse 41 stellt mit dem Rang 56 die beste Klasse dar, Klasse 52 mit dem Rang 1 die schlechteste. Jedoch lässt sich bei Vergrößerung der Grafik zum RI-Modell feststellen, dass die Klasse 41 eine kürzere Regressionslinie hat, d.h. sie ist also heterogener, als Klasse 52. Der Abstand der Klasse 41 von der General Line beträgt 2.3686 und der Abstand der Klasse 52,-2.3686. Dies bedeutet beide Klassen sind gleich weit von der General Line entfernt. Der einzige Unterschied besteht darin, dass Klasse 41 oberhalb und Klasse 52 unterhalb der General Line liegt. Somit lässt sich allgemein für das Random Intercept Modell besagen, dass Klasse 41 die modellhafte Klasse darstellt und Klasse 52 zu intervenieren wäre. Ich werde bei meinen weitern Berechnungen mich auf die Klassen 41 und 52 konzentrieren und ihre Veränderungen bezüglich der Änderungen vom Modell interpretieren. Der nächste Schritt stellt die Erweiterung des Random-intercept-modell um die Dummyvariablen dar. Dummyvariablen sind nominalskalierte Variablen, die keine Steigung, sondern eine Differenz.( wie. Z.b. Geschlecht) Random-intercept-modell mit Dummyvariablen:

10

Grafische Darstellung RI-Modell mit Dummyvariablen:

Bei der Erweiterung der Gleichung um die Dummyvariablen ergibt sich folgende Veränderung in Bezug auf die Outlierklassen. Klasse 41:

Intercept 1.1080

Rang 49.000

Klasse 52: Intercept -2.3686

Rang 1.0000

Interpretation: Klasse 41 verliert um sieben Positionen ihren 56 Rang und steht jetzt auf dem Rang 49. Ihr Abstand zur General Line hat sich von 2.3686 auf 1.1080 verringert. Dies bedeutet, sie ist nun nicht mehr die beste Klasse. Die beste Klasse ist nun Klasse 38 logischerweise mit dem 56 Rang und dem Abstand, 2,3686. Klasse 52 hingegen bleibt auf dem Rang 1 und somit die schlechteste Klasse. Somit ergibt sich beim Random-intercept Modell mit Dummyvariablen eine kleine Änderung. Der beste Platz wechselt von der 41. auf die 38 Klasse. Der schlechteste Platz bleibt gleich mit der Klasse 52

11

Im nächsten Schritt werde ich das Random-intercept-Modell um einige Prädiktoren, welche ich auswähle verändern. Ich habe alle Prädiktoren meines Datensatzes ausgewählt, weil ich denke, dass hierbei die interessantesten Werte von Outliern zustande kommen.

Random-intercept-Modell mit allen Prädiktoren:

Grafische Darstellung des RI-Modell mit allen Prädiktoren:

12

Natürlich interessieren mich bei der Erweiterung dieser Gleichung auch die Veränderung der Outlierdaten. Klasse 41: Abstand 0.82264

Rang 45.000

Klasse 52: Abstand -2.3686

Rang 1.0000

Interpretation: Die Klasse 41 verliert weitere Plätze und sinkt auf den Rang 45. Der Abstand zur General Line wird immer weniger, da sich die Klasse immer mehr dem Durchschnitt annähert. Klasse 38 ist bleibt bei der Erweiterung der Gleichung die beste Klasse. Mit dem Rang 1 und dem Abstand -2.3686 von der General Line bleibt die Klasse 52 trotz der Erweiterung um alle im Datensatz vorhandenen Prädiktoren die schlechteste Klasse. Resümee: Aus den bisherigen drei unterschiedlichen Gleichungen ist und bleibt Klasse 52 die schlechteste Klasse.

Mein letzter Schritt mit dem ich auf meine Forschungsfrage eingehe, ist das Random-SlopeModell. Im Gegensatz zum Random-intercept-Modell können nicht nur die Intercepte der einzelnen Klassen variieren, sondern auch die Steigungen. Das bedeutet die Steigungen können verschiedene Zahlenwerte annehmen. Diese Veränderung vom Random-interceptmodell zum Random-slope-modell in Hinblick auf Änderung der Outlier ist meine eigentliche Forschungsfrage. So interessiert es mich nun am meisten, ob sich die beiden Modelle unterschiedlich auf die Outlier auswirken. UM am besten zwischen RI und RS bezüglich der Outlier unterscheiden zu können werde ich ebenfalls ein Random-slope-modell mit allen im Datensatz vorhandenen Prädiktoren erstellen.

13

Random-Slope-Modell mit allen Prädiktoren:

Grafik zum Random- slope mit Varianzfunktion:

Die erste Abbildung zeigt nun verschiedene Steigungen der Klassen, dass bedeutet folgendes: Je steiler die Kurve, desto mehr sind die Testpunkte des diesjährigen Mathetests, von den Testpunkten des Vorjahres abhängig. Die beste Klasse sollte daher eine geringe Steigung und

14

eine möglichst kurze Regressionslinie haben. Dies würde dann bedeuten, dass ein ausgleichender Mathematiktest stattfindet und die Klasse nicht sehr selektiv ist. Klasse 52 :

Abstand -2.3686

Steigung -0.70286

Rang 1.0000

14.000

Klasse 41:

Abstand 0.88715

Steigung 0.29518

Rang 46.000

35.000

Klasse 38:

Abstand 1.6992

Steigung 1.6992

Rang 54.000

54.000

Interpretation: Laut Random-slope-Modell liegt Klasse 52 auf dem 14. Rang, d.h. auch im Random-slopemodell wird diese Klasse als eher schlechte Klasse eingestuft; Allerdings nicht als schlechteste Klasse, sowie im Random-intercept-Modell. Der Abstand zur General Line jedoch liegt bei gleich bleibenden -2.3686, somit einem negativen Abstand. Klasse 52 hat zudem eine negative Steigung von -0.70286. Laut Random-slope-modell wird die Klasse 41 wesentlich schlechter eingestuft als beim Random-intercept, nämlich auf den 35. Rang. Nach dem Random-slope wäre die Klasse 41 eine durchschnittsklasse und nicht eine bessere Klasse. Ihre Steigung ist mit 0.29518 ziemlich gering. Klasse 38 hingegen wird sowohl vom Random-slope, als auch vom Random-intercept mit dem Rang 54 als eine sehr gute Klasse eingestuft. Sie hat eine eher höhere Steigung von 1.6992. Abschluss zu meiner Forschungsfrage: Anhand der beiden Modelle lässt sich nun nicht genau sagen, welche Klasse wirklich besser ist. Man kann aber feststellen, dass die Klassen meist unterschiedlich eingestuft wurden, trotz dem, dass bei beiden Gleichungen mit allen Prädiktoren des Datensatzes gerechnet wurde. Gleiche Ergebnisse erzielen die beiden Modelle eigentlich nur für die Klasse 38 und zwar dahingehend, dass sie eine der besten Klassen darstellt.

Als letzten Punkt in der Mehrebenenanalyse möchte ich ein Random-intercept- Modell mit einer nicht kognitiven Responsevariablen durchführen. Hierfür wähle ich die responsevariable „Angst“. Auch wenn dies meine Forschungsfrage nicht mehr direkt behandelt, halte ich dennoch die Outlierdaten für erwähnenswert und interessant.

15

Random-intercept-Modell mit der Responsevariable Angst:

Klasse 52: Abstand -2.3686

Rang 1.0000

Klasse 41: Abstand 0.43893

Rang 38.000

Klasse 38: Abstand -0.88715

Rang 11.000

Interpretation: Genauso wie im Random-intercept mit allen Prädiktoren, errechnet das RI mit der Responsevariable Angst den Rang 1, somit den schlechtesten Platz für die Klasse 52. Ähnlich wie im Random-slope stuft diese Gleichung Klasse 41 eher als durchschnittsklasse ein. Ihr Abstand zur General Line beträgt 0.43893. Mit dem Rang 11 wird die Klasse 38, welche im RI mit allen Prädiktoren die beste Klasse war im RI mit der Responsevariable Angst zu einer der schlechtesten Klassen. Sie hat einen negativen Abstand von -0.88715 zur General Line, d.h. sie liegt unterhalb der General Line.

16

Literaturverzeichnis: Quellen aus dem Internet: http://www.wikipedia.org.de http://www1.ku-eichstaett.de/PPF/PaedagogikI/allgphdx.htm Buch: Schwetz, H. (2003): Die Klasse macht den Unterschied. Mehrebenenanalytische Untersuchung der Effekte von Unterricht. (Erziehungswissenschaft, Bd. 15). Landau: Verlag Empirische Pädagogik Schwetz, H. & Subramanian, S.V. (2005): Einführung in die Mehrebenenanalyse mit MLWin. Von der Regressionsanalyse zum Random-Slope-Modell (Forschung, Statistik & Methoden, Band 9). Landau: Verlag Empirische Pädagogik

Related Documents

Schwetz Arbeit
November 2019 15
Arbeit
April 2020 16
Studien Arbeit
June 2020 7
Mais-arbeit
October 2019 32
Arbeit Timm Schorsch.pdf
November 2019 17