Lieber Horst Weishaupt, wir sprachen im ersten Teil dieser Gesprächsserie über die Schulstatistik als einen wichtigen Datenbestand zur datengestützten Analyse der Situation des Schulwesens. Während deren Anfänge bereits lange zurückreichen, haben die flächendeckenden Leistungsuntersuchungen in Deutschland eigentlich erst mit den PISA-Erhebungen zu Beginn der 2000er Jahre begonnen.

Das ist richtig. Die OECD hatte in den 1990er Jahren mit einem umfangreichen System des Bildungsmonitorings begonnen, weil sie nicht nur die Bedeutung von Bildung für das wirtschaftliche Wachstum und den gesellschaftlichen Wohlstand erkannt hatte, sondern auch die bildungspolitischen Entwicklungen in den Mitgliedsländern datengestützt beobachten wollte. Sie übte Druck auf die Mitgliedsländer aus, die Bildungsstatistiken zu verbessern und zu vereinheitlichen. Schließlich strebte sie mit der PISA-Studie eine länderübergreifende Erhebung des Leistungsstands der Bevölkerung am Ende der Pflichtschulzeit an. Ziel war es, Kompetenzen für die Bewältigung künftiger Lebenssituationen zu erfassen und nicht primär schulisches Wissen. Der geplante Beginn der PISA-Studie 2000 nötigte die Kultusministerkonferenz zu dem Konstanzer Beschluss im Oktober 1997. Er leitete mehrere Schritte zur datengestützten Evaluation der Leistungsentwicklung an den Schulen und zur Verbesserung der Schul- und Unterrichtsqualität durch die Kultusministerkonferenz ein.  2000, 2003 und 2006 ermöglichte die internationale PISA-Studie durch nationale Erweiterungen auch innerdeutsche Ländervergleiche. 2006 beschloss dann die Kultusministerkonferenz erstmals eine umfassende Monitoringstrategie, die im Hinblick auf die Untersuchung von Schülerleistungen drei Ebenen unterschied. Für internationale Vergleiche beteiligte sich Deutschland weiterhin an der alle drei Jahre mit wechselndem Schwerpunkt (Lesen, Mathematik, Naturwissenschaften) durchgeführten PISA-Studie am Ende der Sekundarstufe I und in der Primarstufe (4. Jahrgangsstufe) an der alle 5 Jahre durchgeführten Lesestudie (PIRLS/IGLU, zuletzt 2016) und der alle 4 Jahre stattfindenden TIMSS-Studie in Mathematik und Naturwissenschaften. Anders in der Sekundarstufe II: Nach der TIMSS-Studie 1995 in Mathematik und Naturwissenschaften wurden in dieser Schulphase in Deutschland keine flächendeckenden Leistungsstudien mehr durchgeführt.

Dabei liegen aber die nationalen und die internationalen Erhebungen nicht in einer Hand, oder? Mit dem ZIB (Zentrum für internationale Bildungsvergleichsstudien) in München und dem IFS (Institut für Schulentwicklungsforschung) in Dortmund führen derzeit zwei von Bund und Ländern finanzierte wissenschaftliche Einrichtungen an Universitäten die internationalen Schulleistungsuntersuchungen durch. In den vergangenen Jahren lag diese Aufgabe auch schon in Berlin am Max-Planck-Institut für Bildungsforschung, an der Universität Hamburg oder auch am Leibniz-Institut für die Pädagogik der Naturwissenschaften und Mathematik der Uni Kiel. Für die nationalen Erhebungen wurde hingegen mit dem Institut für Qualitätsentwicklung im Bildungswesen (IQB) ein eigenes, allein von der Kultusministerkonferenz finanziertes Institut eingerichtet.

Stimmt. Bereits im Jahr 2004 wurde das IQB (Institut für Qualitätsentwicklung im Bildungswesen) als wissenschaftliche Einrichtung der Länder an der Humboldt-Universität in Berlin gegründet. Neben der Entwicklung und Operationalisierung der Bildungsstandards für einzelne Fächer besteht eine Kernaufgabe des IQB darin, die in den Bildungsstandards formulierten Kompetenzanforderungen vor Abschluss des jeweiligen Bildungsabschnitts durch Ländervergleiche in der Primarstufe und der Sekundarstufe I zu überprüfen und darüber zu berichten, inwieweit sie in den einzelnen Ländern erreicht werden. Diese ländervergleichenden Leistungsüberprüfungen fanden bisher

  • in der vierten Jahrgangsstufe der Grundschule in Deutsch und Mathematik in den Jahren 2011 und 2016 statt. Die eigentlich für 2020 geplante dritte Leistungsüberprüfung wurde auf diesen Frühsommer verschoben und steht ganz im Zeichen der Auswirkungen der Corona-Pandemie auf die Leistungen der Schülerinnen und Schüler am Ende der Grundschule.
  • in der Sekundarstufe I in der 9. Klassenstufe in Mathematik und den Naturwissenschaften (Biologie, Chemie, Physik) 2012 und 2018 statt. In Deutsch und Englisch/Französisch wurden bisher Erhebungen 2009 und 2015 im 9. Schuljahr durchgeführt. Die für dieses Jahr geplante dritte Erhebung wurde auf 2022 verschoben.

Ganz grob zusammengefasst muss man sagen, dass die Leistungsüberprüfungen eher einen Rückgang als ein Anstieg der Leistungen bei den Schülerinnen und Schülern beobachten lassen. In der Sekundarstufe bestehen vor allem zwischen den Schularten sehr große Leistungsunterschiede, die eigentlich nicht hinnehmbar sind, aber bisher weder die Öffentlichkeit noch die Politik wirklich aufgerüttelt haben.

Sie sagen also, dass die Ergebnisse der Leistungsüberprüfungen durch das IQB bisher zu wenig Auswirkungen auf das Handeln der Politik hatten und dass die Reaktion der Öffentlichkeit ebenfalls verhalten geblieben ist. Wie erklären Sie sich das?

Zunächst sind die Kinder der meinungsbildenden Schichten der Bevölkerung in der Regel wenig betroffen. Sie können – notfalls mit Unterstützung durch die Familie – meist eine erfolgreiche Schullaufbahn ihrer Kinder und damit aussichtsreiche schulische Qualifikationen für das Erwerbsleben sicherstellen – zur Not über den Besuch von Privatschulen und anderer Möglichkeiten im Schulrecht, ungewünschte Bildungswege zu vermeiden. Dazu kommt, dass mögliche gesellschaftliche Auswirkungen einer unzureichenden Bildung der Bevölkerung insgesamt nicht genug gesehen werden: Bis vor wenigen Jahren gab es ein erhebliches Überangebot an qualifizierten Arbeitskräften. Dass sich dies in den kommenden beiden Jahrzehnten gravierend ändern wird, wenn die geburtenstarken Jahrgänge das Erwerbsleben verlassen und stattdessen geburtenschwache Jahrgänge ins Erwerbsleben eintreten, wird bisher ignoriert, obwohl sich diese Situation kaum noch ändern lässt: auf zehn Personen in Deutschland, die in den kommenden zwei Jahrzehnten das Erwerbsleben verlassen kommen nur sieben, die sie ersetzen können – und von diesen haben drei einen Migrationshintergrund.

Hinzu kommt aus meiner Sicht aber auch eine unzureichende Berichterstattung über die Ergebnisse der IQB-Erhebungen: Diese verfolgt eher eine psychologische und keine schulpädagogische Perspektive und vernachlässigt damit die für die politische Steuerung relevanten Problemlagen. Die Grundlage der Berichterstattung sind die einzelnen Schülerinnen und Schüler, ihre individuellen Merkmale und Schülerleistungen. Dabei sind ein zentrales Ergebnis aller Leistungsstudien die erheblichen Unterschiede zwischen Schülerinnen und Schülern unterschiedlicher Sozialgruppen und mit bzw. ohne Migrationshintergrund. Diese individuellen Problemlagen werden in den Berichten ausführlich beschrieben, nicht aber die sich dadurch ergebende pädagogische Situation der Lehrkräfte in einzelnen Schulen und in den unterschiedlich zusammengesetzten Klassen. Leider wird auch das bei der Auswertung der ersten PISA-Studie entwickelte Konzept differentieller Lern- und Entwicklungsmilieus nach Schularten und Schulen bei den IQB-Auswertungen nicht mehr für die Analyse von Leistungsunterschieden zwischen Schularten herangezogen – vielleicht, weil es auf steuerungsrelevante Fehlentwicklungen verweisen könnte? Bei gleicher Lernausgangslage am Beginn der Sekundarstufe I zeigten sich am Gymnasium durchschnittlich günstigere Leistungsfortschritte als an den nichtgymnasialen Schularten der Sekundarstufe. Zu den Ursachen wurde bisher viel zu wenig geforscht. Anhand der Daten der PISA-Studie von 2000 zeigte sich darüber hinaus, dass durch die Differenzierung nach Schularten und innerhalb der nichtgymnasialen Schularten nach sozialer Zusammensetzung der Schülerinnen und Schüler sich kumulierende negative Auswirkungen auf die Leistungen der Schülerinnen und Schüler ergaben. Seitdem haben die soziale Segregation in den Großstädten und die Heterogenität der Schülerschaft an den Schulen stark zugenommen, ohne den möglichen Folgen für die Leistungsentwicklung der Schülerinnen und Schüler intensiv nachzugehen.

Wenn ich Sie richtig verstehe, spielen Sie mit Ihrer letzten Aussage auf die großen sozialen Unterschiede zwischen Wohnvierteln in den Städten an, die in den letzten Jahrzehnten – unterstützt durch steigende Mietpreise und andere soziale Entwicklungen – zu einer sich verstärkenden Wohnsegregation führen. Sowohl von der Stadtforschung als auch von Institutionen, die sich für die Integration von Migranten in unsere Gesellschaft einsetzen, werden diese Probleme häufig beschrieben. Dadurch ergeben sich nicht nur soziale Unterschiede zwischen den Schulen nach Schulart, sondern auch nach Wohnviertel. Für die Sekundarstufe behaupten Sie, wenn ich Sie richtig verstehe, dass sich die Problemlagen an nichtgymnasialen Schulen in sozial benachteiligten Wohnvierteln potenzieren.

Ja, genau das meine ich. Bezogen auf die Grundschule kann ich sagen, dass 2016 laut IQB-Erhebungen 34 Prozent aller Grundschulklassen in Deutschland unter sozial schwierigen Bedingungen arbeiten, weil entweder die durchschnittliche soziale Lage der Eltern der Schülerinnen und Schüler auf eine niedrige Bildung und häufig unqualifizierte Berufe schließen lässt und/oder wenigstens die Hälfte der Schülerinnen und Schüler einen Migrationshintergrund haben. Im Vergleich zu den restlichen Grundschulklassen werden in Grundschulklassen in sozial schwierigen Lagen deutlich mehr Schülerinnen und Schüler mit sonderpädagogischem Förderbedarf unterrichtet, mehr Kinder dieser Klassen hatten wenig Vorschulförderung, die dort tätigen Lehrkräfte haben häufiger keine Lehrbefähigung in Deutsch und Mathematik, die Schulen sind kaum häufiger gebundene Ganztagsschulen, jahrgangsübergreifender Unterricht findet seltener statt und nur gut die Hälfte der Kinder dieser Grundschulklassen wachsen mit Deutsch als Familiensprache auf. All diese Befunde weisen auf zusätzliche, sich kumulierende Herausforderungen an sozial benachteiligten Schulen hin. Wenn Schulen da gegensteuern wollen, so müssen die Lehrkräfte erhebliche pädagogische Anforderungen bewältigen, die deutlich über die individuelle Lage der einzelnen Schülerinnen und Schüler in der Klasse hinausgehen.

In der Sekundarstufe I haben wir zu den unterschiedlichen sozialen Bedingungen nach Schularten und einzelnen Schulen – das IQB klammert solche Auswertungen aus – nur wenige Auswertungsergebnisse der VERA-Erhebungen nach sozialer Lage der Schulen in Nordrhein-Westfalen, Rheinland-Pfalz und Schleswig-Holstein. Sie belegen neben gravierenden sozialen Unterschieden zwischen Schulen auch schon dramatisch zu nennende Leistungsunterschiede nach sozialer Zusammensetzung der Schülerinnen und Schüler an den Schulen.  Es fehlen aber bisher Auswertungen der IQB-Erhebungen in der Sekundarstufe, um auch den Anteil der Klassen zu bestimmen, die sich in dieser Schulstufe in sozial schwieriger Lage befinden. Diese Klassen konzentrieren sich auf die Großstädte, sind aber auch im Randbereich der Verdichtungsräume und im ländlichen Raum zu finden. Sie lassen sich nur über detaillierte einzelschulische Analysen identifizieren, die VERA-Daten mit Daten der Schulstatistik kombinieren.

Damit sprechen Sie schon die dritte Ebene des Monitoringkonzepts der KMK an, nämlich die jährliche stattfindenden, flächendeckenden Leistungsüberprüfungen als ein „Verfahren zur Qualitätssicherung auf Ebene der Schulen“ (kurz VERA; KMK 2016, S. 13) in der 3. und 8. Jahrgangsstufe. Diese von den Lehrkräften an den Schulen durchgeführten Erhebungen nach bundeseinheitlichen Vorgaben des IQB sollen den Schulen einerseits eine Standortbestimmung in Bezug auf die Bildungsstandards ermöglichen und andererseits helfen, die kompetenzbezogenen Konzepte der Bildungsstandards im Unterricht zu vermitteln. Ist denn nicht genau das der Versuch, Informationen über die oben beschriebenen „Brennpunktschulen“ zu erhalten, um dann gezielt gegenzusteuern?

Genau da liegt das Problem: VERA kann für die Schul- und Unterrichtsentwicklung der einzelnen Schulen – als zentrale Begründung der flächendeckenden Leistungstests gegenüber den Schulen – nur wirksam werden, wenn es bei Bedarf ausreichende Unterstützungsmaßnahmen für die Schulen gibt und vor allem den Schulen unter sozial schwierigen Bedingungen in erheblichem Umfang zusätzliche Ressourcen zur Verfügung gestellt werden. Dies ist bisher aber kaum im erforderlichen Umfang der Fall, entsprechende Unterstützungs- und Fortbildungsstrukturen wurden kaum ausgebaut. Deshalb stehen die Schulen diesen Leistungsüberprüfungen zunehmend skeptisch bis ablehnend gegenüber. Inzwischen hat nicht nur Niedersachsen die VERA-Erhebungen ausgesetzt. Auch in den anderen Ländern gibt es Unterschiede bei der Umsetzung des Konzepts, z. B. bezogen auf die in die Leistungsüberprüfung einbezogenen Unterrichtsfächer und den Verpflichtungsgrad der Teilnahme. Die meisten Länder können sich nicht entschließen, jährlich ausführlich über die Ergebnisse zu berichten. Einige Länder verzichten selbst auf Berichte über die landesweiten Ergebnisse. Steuerungsrelevant können die Ergebnisse der VERA-Erhebungen aber nur werden, wenn Unterschiede zwischen Schulen, Problemlagen und deren mögliche Ursachen öffentlich bekannt sind und auf dieser Grundlage über Handlungsstrategien entschieden werden kann.

Wünschenswert an einem durchgängigen Monitoringkonzept wäre ja auch, dass die Ergebnisse zwischen den Untersuchungsebenen in Beziehung gesetzt werden können – also, dass internationale, nationale und einzelschulische Ergebnisse nach einem einheitlichen Erhebungskonzept erhoben und ausgewertet werden, damit Vergleiche möglich sind.

Naja, grundsätzlich gibt es Abstimmungsprozesse zwischen den internationalen Schulleistungsstudien und den Aufgabenstellungen der IQB-Erhebungen, um die Ergebnisse in Beziehung setzen zu können. Auch die Erhebung von sozialen Hintergrundmerkmalen der Schülerinnen und Schüler ist vereinheitlicht. Die VERA-Erhebungen basieren ebenfalls auf an den Bildungsstandards orientierten Aufgabenstellungen, sie sind methodisch aber nicht in gleicher Weise mit den IQB-Leistungsüberprüfungen abgestimmt, wie diese mit den internationalen Leistungsstudien. Die Kultusministerien verweisen einerseits auf die andere Aufgabenstellung der VERA-Erhebungen, die primär der einzelschulischen Unterrichtsentwicklung dienen sollen und auf die fehlende Erhebungsobjektivität, weil die Lehrkräfte selbst die Überprüfungen durchführen und die Ergebnisse weitergeben. Aber es gibt auch keine vergleichenden Auswertungen zwischen den an den IQB-Erhebungen teilnehmenden Klassen und den in diesen Klassen ein Jahr zuvor erzielten VERA-Ergebnissen. Aus meiner Sicht fehlt hier einfach der politische Wille, die VERA-Ergebnisse stärker für die Evaluation der Leistungsentwicklung an den Schulen zu nutzen, weil sich daraus politisch unliebsame Folgerungen für die Steuerung der Schulentwicklung ergeben könnten.

Und dann hätten wir ja im Bereich der schulischen Bildungsforschung auch noch die Verknüpfung der bildungsstatischen Daten mit Leistungsdaten wie z. B. den Ergebnissen aus den VERA-Vergleichsarbeiten oder den IQB-Bildungstrends. Das wäre natürlich insgesamt ein mächtiger Datensatz – aber da hören wir sehr häufig, dass eine Verknüpfung methodisch und datenschutzrechtlich gar nicht möglich sei. Wie sehen Sie das?

Natürlich ist das möglich und in Hamburg besteht bereits durch entsprechende rechtliche Regelungen diese Möglichkeit. Aus Sicht der Schulstatistik könnten die wenigen schulstatistisch erfassten Merkmale mit den Einstellungsdaten der IQB-Erhebungen angereichert werden, um differenziertere Einschätzungen über schulische Konstellationen anhand der Schulstatistik zu erhalten. Aus Sicht der Schulleistungsforschung könnten die wenigen Erhebungsmerkmale der VERA-Erhebungen um die im Rahmen der Schulstatistik erfassten schulorganisatorischen und personellen Daten ergänzt werden. Dies würde – wie Beispiele zeigen – erhebliche zusätzliche steuerungsrelevante Informationen für die Schulverwaltung ermöglichen. Rheinland-Pfalz unterstützt beispielsweise den Bestand kleiner Dorfgrundschulen, was allerdings große Klassen und relativ wenige Lehrkräftestunden je Schüler an den Grundschulen in sozial schwieriger Lage in den Großstädten zur Folge hat, was möglicherweise zu den dort häufig sehr schlechten durchschnittlichen Leistungen der Schülerinnen und Schüler beiträgt. Generell waren die Zusammenhänge zwischen durchschnittlicher sozialer Lage der Schülerinnen und Schüler der Schulen und den durchschnittlichen Leistungen weniger eng als zu erwarten. Relativ viele Schulen in sozial günstigen Lagen wiesen vergleichsweise schlechte Durchschnittsleistungen auf, was näher zu untersuchen wäre. Doch dieses Wissen wird von den Kultusministerien aus meiner Sicht eher gescheut als angestrebt.