Einführung
Die Integration von Schutzsuchenden auf dem Wohnungsmarkt, dem Arbeitsmarkt und in der Zivilgesellschaft steht im Fokus der öffentlichen Debatte. Hintergrund sind die hohen Zuwanderungszahlen der Jahre 2015/2016 (insbesondere aus Syrien, Irak und Afghanistan) und 2022 (insbesondere aus der Ukraine). Daten über Schutzsuchende in Deutschland, anhand derer sich Integrationsfortschritte abbilden und Implikationen für die Integrationspolitik ableiten lassen, sind daher von zentraler Bedeutung.
Um die Integration von Personen mit Einwanderungsgeschichte in Deutschland zu beleuchten, nutzt die amtliche Statistik den Mikrozensus (MZ). Während der Mikrozensus ein detailliertes sozioökonomisches Bild über Eingewanderte liefert, sind Schutzsuchende hier weder zuverlässig identifizierbar noch umfassend abgedeckt1. Eindeutig identifizier- und umfassend abbildbar sind Schutzsuchende jedoch in den Verwaltungsdaten des Ausländerzentralregisters (AZR), das wiederum Basis für die Erstellung der amtlichen Ausländerstatistik im Statistischen Bundesamt ist. Aus diesem gehen jedoch keine zuverlässigen Informationen zu sozioökonomischen Merkmalen sowie Wohn- und Lebensbedingungen hervor.
Eine Zusammenführung von Ausländerzentralregister und Mikrozensus kann somit Synergien schaffen. Zuverlässige Informationen zum Aufenthaltsstatus können mit einer breiten Palette sozioökonomischer Merkmale kombiniert werden. Dadurch kann ohne zusätzliche Befragungen ein wichtiger Beitrag zur Schließung der Datenlücke bezüglich der Integration von Schutzsuchenden in Deutschland geleistet werden.
Da Ausländerzentralregister und Mikrozensus weder einen gemeinsamen Personenidentifikator besitzen noch genügend Informationen für eine probabilistische Verknüpfung (beispielsweise über Namen, Geburtsdatum und Adresse) vorhanden sind, wird ein Statistical-Matching-Algorithmus für die Zusammenführung benötigt. Aus datenschutzrechtlicher Perspektive bietet dieses Vorgehen den Vorteil, dass keine individuellen Personen in den unterschiedlichen Datenquellen identifiziert werden müssen.
Was ist Statistical Matching?
Im Gegensatz zur Verknüpfung von Informationen über identische Einheiten kann das Statistical Matching als ein Imputationsproblem formuliert werden, bei dem eine Zielvariable für eine Person in einem Empfängerdatensatz auf der Grundlage von Informationen über ähnliche Personen – statistische Zwillinge – in einem Spenderdatensatz vorhergesagt wird (Cielebak/Rässler, 2019).
Im vorliegenden Anwendungsfall lässt sich das Problem anhand von Schaubild 1 formal beschreiben: Wir verwenden Informationen über Schutzsuchende aus dem Ausländerzentralregister (Spender), um im Mikrozensus (Empfänger) zu schätzen, mit welcher Wahrscheinlichkeit eine befragte Person schutzsuchend ist. Für die Imputation verwenden wir eine Auswahl gemeinsamer Variablen (G). Das Ziel ist die Analyse der unbeobachteten bivariaten Verteilungen des Schutzsuchendenstatus (S) und des Erwerbsstatus (E). Implizit beruht dieses Vorgehen auf der Annahme bedingter Unabhängigkeit dieser unbeobachteten bivariaten Verteilung gegeben der gemeinsamen Variablen G.
- Spender mit G, S
- Empfänger mit G, E
- Vorhersage Ŝ = ƒ (G)
- Synthetischer Datensatz mit G, E, Ŝ
Datenquellen
Das Ausländerzentralregister ist eines der größten Verwaltungsregister in Deutschland. Es enthält Informationen zu allen ausländischen Personen, die sich nicht nur vorübergehend in Deutschland aufhalten. In der Regel sind das Personen, die sich länger als drei Monate in Deutschland aufhalten2. Das Ausländerzentralregister führt die Datenbestände aller Behörden zusammen, die mit asyl- und aufenthaltsrechtlichen Aufgaben betraut sind, und dient diesen als zentrale Informationsplattform. Für statistische Zwecke erhält das Statistische Bundesamt als Grundlage für die Erstellung der Ausländerstatistik nach § 23 AZR-Gesetz einen jährlichen Datenauszug. Dieser enthält alle notwendigen aufenthaltsrechtlichen Informationen zur statistischen Abbildung von Schutzsuchenden in Deutschland.
Im Jahr 2021 wurden 11,8 Millionen ausländische Personen im Ausländerzentralregister erfasst, davon waren 1,9 Millionen Schutzsuchende.
Der Mikrozensus liefert statistische Informationen zur Bevölkerungsstruktur, zur wirtschaftlichen und sozialen Lage der Bevölkerung, zu Familien, Lebensgemeinschaften und Haushalten, zu Erwerbstätigkeit, Arbeitssuche, Bildung/Ausbildung und Weiterbildung, Wohnsituation sowie Gesundheit. Der Mikrozensus ist eine Zufallsstichprobe. Jede Auswahleinheit hat die gleiche Wahrscheinlichkeit, in die Stichprobe zu gelangen. Es wird das Verfahren einer einstufigen Klumpenstichprobe genutzt, bei dem Flächen (Auswahlbezirke) gezogen werden, in denen die Haushaltebefragung erfolgt. Im Rahmen der Hochrechnung wird der Mikrozensus an Eckwerte der Bevölkerungsfortschreibung angepasst.
Ablauf des Statistical Matching
a) Harmonisieren der Datenquellen
Um Ausländerzentralregister und Mikrozensus für das Statistical Matching vorzubereiten, müssen die Metadaten der Datenquellen abgeglichen und die Datenbestände bestmöglich harmonisiert werden. Die für das Statistical Matching benötigten gemeinsamen Variablen sind Geschlecht, Alter, Alter bei Einreise, Jahr des Zuzugs, Staatsangehörigkeit, Familienstand und Kreis3. Sie werden in eine einheitliche Form gebracht. Außerdem werden beide Datensätze bestmöglich auf einen vergleichbaren Personenkreis eingeschränkt. An einem Beispiel: 2015 waren neu ankommende Geflüchtete von der Auswahl als Befragte im Mikrozensus praktisch ausgeschlossen, weil sie in Notunterkünften untergebracht waren. Sie gehörten damit nicht zur primären Zielpopulation des Mikrozensus, also zur Bevölkerung in Privathaushalten. Sie wurden aber auch nicht gänzlich zur Bevölkerung in Gemeinschaftsunterkünften gezählt, weil die ihnen von Behörden zur Verfügung gestellten vorübergehenden Unterkünfte – leerstehende Gewerbe oder Einzelhandelsflächen, stillgelegte Militärkasernen oder umgewidmete Schulturnhallen – teilweise nicht zu den bekannten Adressen von Gemeinschaftsunterkünften gehörten. Um auch das Ausländerzentralregister auf Personen in Privathaushalten einzuschränken, wurden alle Fälle ausgeschlossen, bei denen die aktenführende Ausländerbehörde eine Erstaufnahmeeinrichtung, eine Polizeidienststelle oder eine Außenstelle des Bundesamtes für Migration und Flüchtlinge (BAMF) ist.
Für das Jahr 2021 umfasst der bereinigte Datensatz des Ausländerzentralregisters nach der Harmonisierung noch 11,6 Millionen Personen, davon sind 1,9 Millionen Schutzsuchende.
b) Modell mit gemeinsamen Variablen trainieren und anhand der Testdaten evaluieren
Um den Schutzsuchendenstatus im Mikrozensus auf Basis der Informationen aus dem Ausländerzentralregister zu schätzen werden im Anschluss an die Harmonisierung der Datensätze unterschiedliche Algorithmen aus dem Bereich des Machine-Learning trainiert und bewertet.
Hierfür werden die harmonisierten Daten zunächst zu 90 % in Trainingsdaten (2021: 10,5 Millionen Personen) und zu 10 % in Testdaten (2021: 1,2 Millionen Personen) aufgeteilt. Um den Anteil der Schutzsuchenden in den Trainingsdaten zu erhöhen, wurden in den Trainingsdaten Datensätze von Personen entfernt, deren erste Staatsangehörigkeit zu einem Land gehört, dessen Anteil Schutzsuchender im Ausländerzentralregister unter 1 % liegt. Anhand dieser Trainingsdaten (2021: 5,4 Millionen Personen) lernt der Algorithmus die Modellparameter. Außerdem wird die optimale Einstellung der Hyperparameter4 mittels Kreuzvalidierung5 aus den Trainingsdaten ermittelt. Sobald die besten Hyperparameter gefunden und die entsprechenden Modellparameter gelernt wurden, wird das daraus entstandene Modell verwendet, um den Schutzsuchendenstatus im Testdatensatz vorherzusagen. Anschließend können innerhalb der Testdaten tatsächliche und vorhergesagte Ergebnisse verglichen werden.
Die beste Performance hat dabei im vorliegenden Fall ein C5.0-Klassifikationsbaum (Kuhn/Johnson, 2013) gezeigt. Klassifikationsbäume teilen die Beobachtungen mit möglichst wenigen Verzweigungen in möglichst homogene Gruppen (Blätter). Anhand der Blätter können zwei Arten von Vorhersagen getroffen werden. Erstens kann das erzeugte Modell binäre Vorhersagen liefern, also eine negative oder positive Entscheidung darüber, ob jemand als Schutzsuchender eingestuft wird oder nicht. In diesem Fall bestimmt die Mehrheit der vorhergesagten Ergebnisse in jedem Blatt des Baums denselben Status für alle Beobachtungen in diesem Blatt. Zweitens kann das Modell für jede Beobachtung eine Wahrscheinlichkeit Pi(Si|Gi) für positive und negative Vorhersagen liefern, also die Wahrscheinlichkeit, mit der das Modell einer Beobachtung zuschreibt, dass es sich um einen Schutzsuchenden handelt. Diese Wahrscheinlichkeit wird durch den Anteil der vorhergesagten positiven und negativen Ergebnisse in jedem Blatt des Baums bestimmt. Die Wahrscheinlichkeit P(S|G) wird im nächsten Schritt als Ausgangspunkt für eine multiple Imputation genutzt.
c) Multiple Imputation im Mikrozensus
Um die Unsicherheit der Vorhersage aus dem Schätzmodell zu berücksichtigen, wird der Schutzsuchendenstatus im Empfängerdatensatz, dem Mikrozensus, nicht nur einmal vorhergesagt, sondern zehnmal. Es werden demnach zehn potentiell unterschiedliche Schutzsuchendenstatus zugeordnet, die anhand der ermittelten Wahrscheinlichkeit P(S|G) gezogen werden. Dieses Vorgehen wird als multiple Imputation bezeichnet und hilft uns zu beurteilen, wie viel Unsicherheit beziehungsweise Varianz wir zu der bereits vorhandenen Varianz in unseren Daten hinzufügen.
d) Inferenz mit Konfidenzintervallen durch Rubin’s combining rules
Mit Hilfe des R-Packages „mice“ lassen sich der gepoolte Erwartungswert, die gepoolte Varianz und die zugehörigen Freiheitsgrade der Studentschen t-Verteilung aus den zehn Schätzungen für den Erwartungswert und die Varianz berechnen. Mit diesen kann nach Rubin (1987) ein 95 %-Konfidenzintervall für den Erwartungswert berechnet werden. Intuitiv ergeben sich hierbei kleinere Konfidenzintervalle, wenn die zehn vorhergesagten Schutzstatus übereinstimmen, das heißt dass das Schätzmodell eine sehr hohe oder sehr niedrige Wahrscheinlichkeit dafür schätzt, dass eine Person einen Schutzstatus hat.
Evaluierung des Statistical Matching
Eine sorgfältige Evaluierung ist für ein Statistical-Matching-Projekt von zentraler Bedeutung. Die Grundannahme, die bedingte Unabhängigkeit der unbeobachteten bivariaten Verteilung der zusammengeführten Variablen, ist nicht überprüfbar. Dennoch gibt es Eigenschaften eines Statistical-Matching-Verfahrens, die evaluiert werden können. Hierzu zählt zunächst die Güte der Schätzung der Zielvariablen. Allerdings stellt eine ausreichende Performance bei der Vorhersage der Zielvariablen erst eine notwendige und noch keine hinreichende Bedingung für belastbare Ergebnisse dar. Ein entscheidender Indikator für ein gelungenes Statistical Matching ist, dass die im Spenderdatensatz beobachteten Eigenschaften wie uni- und bivariate Verteilungen sowie Korrelationsstrukturen im Empfängerdatensatz reproduziert werden können (Cielebak/Rässler 2019).
a) Evaluierung des Schätzmodells für die Zielvariablen
Für die Bewertung der Güte eines Klassifizierungsalgorithmus wird üblicherweise eine Konfusionsmatrix verwendet. Darin werden die vorhergesagten und tatsächlichen Werte der Zielvariablen in den Testdaten gegenübergestellt. Aus dieser Matrix können Metriken wie Genauigkeit, Sensitivität und Spezifität abgeleitet werden, um die Modellleistung zu bewerten.
Vorhersage | Schutzsuchende/r | Kein/e Schutzsuchende/r |
---|---|---|
Vorhersage "Schutzsuchende/r" | a | b |
Vorhersage "kein/e Schutzsuchende/r" | c | d |
- Genauigkeit = (a+d)/(a+b+c+d)
- Präzision = a/(a+b)
- Spezifität = a/(a+c)
Im vorliegenden Fall ist die Zielvariable ein binärer Indikator, der angibt, ob eine im Ausländerzentralregister erfasste Person humanitären Schutz sucht oder nicht. Mit rund 16 % positiven und 84 % negativen Angaben ist die Zielvariable in den Testdaten deutlich ungleich verteilt. Die Vorhersage von ausschließlich negativen Ergebnissen würde daher bereits eine hohe Genauigkeit von 84 % liefern. Wenn es darum geht, seltene Ereignisse vorherzusagen, ist die Präzision des Modells informativer und wird deshalb auch bereits zur Parameteroptimierung innerhalb des Klassifikations-Algorithmus in unserem Fallbeispiel verwendet.
Vorhersage | Schutzsuchende/r | Kein/e Schutzsuchende/r | Insgesamt |
---|---|---|---|
Vorhersage "Schutzsuchende/r" | 141 767 | 42 606 | 184 373 |
Vorhersage "kein/e Schutzsuchende/r" | 43 879 | 934 879 | 978 758 |
Insgesamt | 185 646 | 977 485 | 1 163 131 |
- Genauigkeit = 0,93
- Präzision = 0,77
- Spezifität = 0,76
Im Rahmen der Evaluierung des Schätzmodells sollte auch der Einfluss der unterschiedlichen Prädiktoren betrachtet werden. So kann bei Klassifikationsbäumen zum Beispiel der Anteil der Abzweigungen im Baum, die mit einem Prädiktor assoziiert sind oder der Anteil der Daten an deren Zuordnung zu einem Blatt des Baumes ein Prädiktor beteiligt war, gemessen und verglichen werden. Daran gemessen haben den größten Einfluss auf die Vorhersagen des Modells die Variablen Staatsangehörigkeit und Jahr der Einreise. Im Hinblick auf die Zusammensetzung der schutzsuchenden Bevölkerung ist dieses Ergebnis intuitiv nachvollziehbar. Personen mit syrischer, afghanischer und irakischer Staatsangehörigkeit, die in den Jahren 2014 bis 2016 eingereist sind, machten Ende 2021 rund 38 % der Schutzsuchenden aus.
b) Reproduktion zentraler Eigenschaften aus dem Spenderdatensatz
Ende 2021 waren 1 862 000 in Privathaushalten lebende Schutzsuchende im Ausländerzentralregister registriert. Nach Anwendung des Statistical Matching werden 1 770 000 Schutzsuchende im Mikrozensus geschätzt. Dabei ist anzumerken, dass das Schätzverfahren im Hinblick auf Präzision optimiert wurde. Falsch positive Schätzungen werden also negativer bewertet als falsch negative Vorhersagen.
Das Ziel des Statistical Matching ist in aller Regel nicht die Reproduktion der Gesamtzahl der Zielpopulation, sondern die Analyse von unbeobachteten Verteilungen innerhalb der Zielpopulation. Daher ist die Evaluation der Reproduktion von Verteilungen aus dem Spenderdatensatz besonders zentral (Cielebak/Rässler, 2019).
Relativ einfach lässt sich in diesem Zusammenhang überprüfen, ob die univariaten Randverteilungen aus den Spenderdaten auch nach dem Statistical Matching im synthetischen Datensatz erhalten geblieben sind. Am Beispiel der Verteilung der Schutzsuchenden nach Einreisejahr zeigt sich in Schaubild 3 folgendes Bild:
Um zu beurteilen, ob eine Verteilung nach der Imputation erfolgreich erhalten wurde, kann, neben dem visuellen Eindruck, auch ein Hellingerabstand berechnet werden. Der Hellingerabstand misst die Ähnlichkeit zwischen zwei Verteilungen auf einer Skala zwischen 0 und 1, wobei 0 perfekte Ähnlichkeit und 1 perfekte Ungleichheit anzeigt. Angestrebt werden dabei Werte von nicht größer als 0,05. Werte um 0,1, wie im Falle der Verteilung der Ersteinreisejahre, werden in der Literatur aber auch noch als akzeptabel bewertet (Eurostat, 2013).
Eine andere Möglichkeit, die Verteilung von Spender- und Empfängerdatensatz zu vergleichen besteht mittels eines Kolmogorov-Smirnov-Tests. Bei diesem besagt die Nullhypothese, dass die beiden Verteilungen gleich sind. Die Alternativhypothese besagt hingegen, dass es einen signifikanten Unterschied zwischen den beiden Verteilungen gibt. Der p-Wert von 0,292 liegt über dem zuvor definierten Signifikanzniveau von 5 % beziehungsweise 0,05, weshalb die Nullhypothese nicht verworfen werden kann.
Neben univariaten Verteilungen können auch bivariate Verteilungen betrachtet werden. Der visuelle Eindruck in Schaubild 4 bestätigt den Erhalt der zentralen Merkmale in der Alters- und Geschlechtsstruktur der Schutzsuchenden im synthetischen Datensatz. Die Formen der Bevölkerungspyramiden ähneln sich deutlich. Hellingerabstand und der Kolmogorov-Smirnov-Test (K-S-Test) weisen auf univariater Ebene auch hier auf einen Erhalt der Randverteilung hinsichtlich der Altersvariable nach Geschlecht hin.
Ergebnisse
Mit den synthetischen, um den Schutzstatus angereicherten Mikrozensusdaten lassen sich eine Vielzahl an sozioökonomischen Fragen zu Schutzsuchenden beantworten. Der Mikrozensus bietet hier zum Beispiel Informationen zur Erwerbsbeteiligung, den Wirtschaftszweigen der Erwerbstätigen und den Nettoeinkommen oder zu Schulabschlüssen.
Im Hinblick auf die Erwerbsbeteiligung zeigt sich im Jahr des Zuzugs noch eine geringe Erwerbsbeteiligung der Schutzsuchenden und gleichzeitig große Konfidenzintervalle. Dabei gilt zu beachten, dass die Größe der 95 %-Konfidenzintervalle mit der Anzahl der Beobachtungen zusammenhängt. Mit zunehmender Aufenthaltsdauer nimmt dann auch die Erwerbstätigenquote zu, insbesondere bei den Männern. Personen, die 2021 bereits zwischen zwei und drei Jahren in Deutschland lebten, sind zu etwa einem Viertel erwerbstätig – Männer häufiger (37,5 %), Frauen seltener (11,9 %). Nach einem Aufenthalt zwischen fünf und sechs Jahren liegt der Anteil für Männer bei 56,8 % und für Frauen bei 15,1 %.
Externe Validierung der Ergebnisse
Im vorliegenden Fall können diese Schätzungen mit externen Ergebnissen validiert werden. In einem gemeinsamen Projekt haben das Institut für Arbeitsmarkt- und Berufsforschung (IAB), das Sozio-oekonomische Panel (SOEP) des Deutschen Instituts für Wirtschaftsforschung (DIW Berlin) und das Bundesamt für Migration und Flüchtlinge (BAMF) eine gezielte Befragung von neu angekommenen Geflüchteten6 durchgeführt. Auswahlgrundlage für die Befragung war das Ausländerzentralregister. Im Rahmen der ersten Welle dieser Befragung wurden insgesamt 4 500 Geflüchtete befragt. Die Befragung ist als Längsschnittbefragung angelegt, in denen Personen seit 2016 wiederholt befragt wurden. Ergebnisse zur Arbeitsmarktbeteiligung sind von Brücker et al. (2023) veröffentlicht worden.
Sowohl die Schätzung mithilfe von Statistical Matching als auch die gezielte Befragung machen deutlich, dass die Erwerbstätigkeit mit voranschreitender Aufenthaltsdauer zunimmt und dabei der Anstieg bei Männern deutlich stärker ausgeprägt ist als bei Frauen.
Die Erwerbstätigenquote von geflüchteten Frauen und Männern beträgt im ersten Jahr nach dem Zuzug nach Deutschland in der Befragung zunächst 7 %. Durch das Statistical Matching ergibt sich ein 95 %-Konfidenzintervall zwischen 4 % und 26 %. Das Ergebnis der Befragung liegt damit zwar im Konfidenzintervall der auf den Mikrozensus übertragenen Ergebnisse (siehe Schaubild 5), bei Neuangekommenen sind die Konfidenzintervalle aber so groß, dass mit dem Matching-Verfahren keine präzise Aussage möglich ist.
Sechs Jahre nach dem Zuzug liegt der Anteil der Erwerbstätigen in der IAB-BAMF-SOEP-Studie unter den Geflüchteten bei 54 %. Mittels Schätzung über Statistical Matching von Ausländerzentralregister und Mikrozensus sind es zwischen 38 % und 45 %. Bei Männern geht die Befragung zu diesem Zeitpunkt von 67 % Erwerbstätigen aus, bei Frauen von 23 %. Die Schätzungen aus dem um den Schutzstatus erweiterten Mikrozensus liegen für Männer zwischen 53 % und 61 % und für Frauen zwischen 11 % und 19 %.
Auch nach mehr als sechs Jahren in Deutschland liegt die Schätzung des Statistical Matching etwas unter denen der IAB-BAMF-SOEP-Studie. In der Vergleichsstudie sind 62 % der Geflüchteten, die seit 2013 nach Deutschland gekommen sind und mindestens sieben Jahre hier gelebt haben, erwerbstätig. Bei geflüchteten Männern beträgt dieser Anteil 67 %, bei den Frauen sind es 26 %. Im synthetischen Datensatz des Mikrozensus liegt das Konfidenzintervall für beide Geschlechter zusammen bei 49 bis 51 %. Frauen sind auch hier mit 22 bis 26 % zu einem deutlich geringeren Anteil in den Arbeitsmarkt integriert als Männer mit 60 bis 64 %.
Schaubild 6 vergleicht visuell die Schätzungen aus dem statistischen Matching mit den Ergebnissen aus der IAB-BAMF-SOEP-Befragung von Geflüchteten. Schätzungen für Geflüchtete mit einer Aufenthaltsdauer von weniger als einem Jahr können aufgrund großer Konfidenzintervalle nicht sinnvoll interpretiert werden. Darüber hinaus schätzt das hier vorgestellte Verfahren ab einer Aufenthaltsdauer von drei Jahren eine geringere Erwerbsbeteiligung insgesamt im Vergleich zu den Ergebnissen der IAB-BAMF-SOEP-Befragung. Während die Schätzungen für Frauen recht gut übereinstimmen, prognostiziert das Statistical Matching niedrigere Beschäftigungsquoten, insbesondere für Männer mit längerer Aufenthaltsdauer. Inwieweit die Unterschiede auf Verzerrungen durch das Statistical Matching oder auf potentielle Verzerrungen in den Längsschnittdaten der IAB-BAMF-SOEP-Befragung zurückzuführen sind, beispielsweise dadurch dass arbeitslose männliche Flüchtlinge eine höhere Wahrscheinlichkeit haben, aus der Stichprobe auszuscheiden (engl. attrition-bias), kann im Rahmen dieser Arbeit nicht bewertet werden7.
Diskussion und Fazit
Das Statistical Matching ist ein kostengünstiger, ohne zusätzliche Befragungen auskommender Ansatz, der es grundsätzlich ermöglicht, kurzfristig einen Überblick für Zusammenhänge zu gewinnen, über die allein aus den einzelnen Datenquellen keine Erkenntnisse möglich sind. Es liefert im vorliegenden Fall auf Basis von Schätzungen zusätzliche Erkenntnisse über die Erwerbsbeteiligung von Schutzsuchenden für das Jahr 2021. Je nach Auswertung lassen große Konfidenzintervalle aber keine präzisen Aussagen zu. Zudem können die Ergebnisse lediglich Aufschluss über die berücksichtigte Gruppe der Personen in Privathaushalten geben.
Darüber hinaus deuten zusätzliche Analysen der Berichtsjahre 2019 und 2020 darauf hin, dass die Ergebnisse bis einschließlich 2021 relativ stabil sind. Erste Analysen für 2022 zeigen jedoch auch, dass das Statistical Matching an seine Grenzen stößt, wenn Sonderereignisse hinzukommen. Schutzsuchende, die infolge des russischen Angriffs aus der Ukraine flohen, wurden 2022 im Mikrozensus nicht vollständig erfasst. Im Ausländerzentralregister ist zum Stichtag 31.12.2022 hingegen von einer weitgehend vollständigen Erfassung ukrainischer Schutzsuchender auszugehen (Statistisches Bundesamt, 2023). Die derart ungleiche Erfassung von Geflüchteten in beiden Datenquellen macht eine sinnvolle Harmonisierung unmöglich, wodurch eine notwendige Voraussetzung für Statistical Matching nicht erfüllt ist.
Im Vergleich zu traditionellen Befragungen, bei denen alle Variablen gemeinsam erfasst werden, besteht bei einer mittels Statistical Matching erzeugten Schätzung eine höhere Gefahr von systematischen Verzerrungen. Unverzerrte Ergebnisse beruhen auf der Annahme der bedingten Unabhängigkeit - und diese ist nicht überprüfbar. Vor diesem Hintergrund sind zwei Punkte besonders wichtig: Zum einen die sorgfältige Evaluation der erzielten Ergebnisse und zum anderen die umfassende Kommunikation der Unsicherheit, die bei einer Schätzung von Wahrscheinlichkeiten besteht.
Das vorgestellte Verfahren stellt eine zusätzliche Option dar, den Zusammenhang zwischen Schutzstatus und Erwerbsbeteiligung zu schätzen, wenn diese Merkmale nicht gemeinsam erhoben beziehungsweise die relevanten Informationen aus unterschiedlichen Datenquellen nicht eindeutig verknüpft werden können oder sollen. Allerdings zeigen die Analysen auch, dass diese Schätzung mit erhöhter Unsicherheit verbunden ist. Daher eignet sich diese Option vor allem zur Anwendung im Kontext von explorativen Untersuchungen.
Fußnoten:
1: Der Mikrozensus erfasst ein Migrationsmotiv. Die Ergebnisse zu den Migrationsmotiven beruhen auf einer Selbsteinschätzung der Befragten. Wenn mehrere der vorgegebenen Kategorien zutreffen, werden die Befragten gebeten, den Hauptgrund anzugeben.
2: Qualitätsbericht der Statistik über Schutzsuchende.
3: Im Mikrozensus Wohnort und im Ausländerzentralregister Approximation des Wohnortes über die zuständige Ausländerbehörde.
4: Hyperparameter sind Parameter, die vor dem Training festgelegt werden. Beispielsweise wird dem C5.0 Algorithmus vorgegeben wie viele einzelne Klassifikationsbäume aufeinander aufbauend gelernt werden, um das finale Modell zu erreichen (Boosting).
5: Die Trainingsdaten werden mittels K-Folds-Kreuzvalidierung nochmals in K=10 gleichgroße Teilmengen aufgeteilt. Nacheinander werden für unterschiedliche Einstellungen der Hyperparameter für jede dieser Teilmengen Performance-Metriken ermittelt, während die jeweils anderen Teilmengen für das Training verwendet werden.
6: Die Definition der Geflüchteten in der IAB-BAMF-SOEP-Befragung entspricht weitgehend der Definition der Schutzsuchenden der amtlichen Statistik. Inbegriffen sind jeweils Personen, die sich noch im Asylverfahren befinden, Personen denen bereits ein Schutzstatus zuerkannt wurde und Personen, deren Asylantrag abgelehnt wurde, die sich aber noch in Deutschland aufhalten.
7: Brücker et al. (2023) berichten, Gegenmaßnahmen zu ergreifen, um den attrition-bias zu mildern.
Literatur
Brücker, H./Jaschke, P./Kosyakova, Y./Vallizadeh, E. (2023): Entwicklung der Arbeitsmarktintegration seit Ankunft in Deutschland: Erwerbstätigkeit und Löhne von Geflüchteten steigen deutlich. IAB-Kurzbericht 13/2023.
Cielebak, J./Rässler, S. (2019): Data Fusion, Record Linkage und Data Mining. In: Baur, N., Blasius, J. (Hg.) Handbuch Methoden der empirischen Sozialforschung. 423-439.
Eurostat (2013): Statistical Matching: A Model-based Approach for Data Integration. Methodologies & Working papers.
Kuhn, M./Johnson, K. (2013): Classification Trees and Rule-Based Models. In: Applied Predictive Modeling. 369-413.
Statistisches Bundesamt (2023), Bevölkerung und Erwerbstätigkeit - Statistik über Schutzsuchende, Qualitätsbericht 2022.
Rubin, D. B. (1987): Multiple Imputation for Nonresponse in Surveys. John Wiley and Sons.