Basisregister für Unternehmen: Bessere Datenqualität und weniger Bürokratieaufwand dank Once-Only Prinzip
Grundlegende Informationen über die Unternehmen in Deutschland, wie beispielsweise Name, Sitz und Wirtschaftszweig, liegen derzeit in rund 120 verschiedenen Registern vor. Diese Mehrfacherfassung von Daten führt zu einem erhöhten Aufwand an Pflege und Bürokratie für Unternehmen und Verwaltung. Zudem birgt dieses Vorgehen die Gefahr von Inkonsistenzen zwischen den einzelnen Datenbeständen.
Um für eine effiziente, digitale Verwaltung Mehrwerte zu generieren und die digitale Handlungsfähigkeit des Staates zu stärken, wurde das Statistische Bundesamt 2021 gesetzlich damit beauftragt, ein zentrales Register über Unternehmensbasisdaten für Deutschland aufzubauen. Ziel war die Konsolidierung der Unternehmensbasisdaten an einer zentralen Stelle sowie die Gewährleistung von deren Aktualität und Richtigkeit. Das Basisregister für Unternehmen wird dabei räumlich, organisatorisch und personell getrennt von den Bereichen, die Aufgaben der Bundesstatistik wahrnehmen, aufgebaut und betrieben.
Das Basisregister für Unternehmen speichert Stammdaten aus verschiedenen Quellregistern, sichert deren Qualität und vergibt eine bundeseinheitliche Wirtschaftsnummer ("beWiNr"). Als solche fungiert die Wirtschafts-Identifikationsnummer nach § 139c der Abgabenordnung. Dadurch können aktuelle Stammdaten zu allen Unternehmen in Deutschland bereitgestellt werden, zum Beispiel für das Organisationskonto zum Onlinezugangsgesetz (OZG), die Bundesagentur für Arbeit oder das Bundesamt für Justiz.
Durch das Zuweisen der beWiNr als registerübergreifendem, eineindeutigem Identifikator ermöglicht das Basisregister die Umsetzung des Once-Only Prinzips für Unternehmen. Mehrfachmeldungen an verschiedene Register können dadurch zukünftig entfallen. Dies entlastet einerseits Unternehmen und Verwaltung und steigert andererseits die Qualität der Registerdaten für die Verwaltung und die amtliche Statistik. Das Statistische Bundesamt leistet mit dem Basisregister für Unternehmen einen wichtigen Beitrag zum Bürokratierückbau sowie zu einer modernen, digitalen und vernetzten Registerlandschaft.
Zurzeit wird das Basisregister nacheinander mit den Daten aus den Quellregistern befüllt. Da alle Daten aus vorhandenen Registern gewonnen werden, müssen die Unternehmen selbst nicht tätig werden. Der Livegang des Basisregisters ist für das dritte Quartal 2025 vorgesehen. Perspektivisch sollen der Funktionsumfang sowie der Kreis der Nutzerinnen und Nutzer erweitert werden, etwa durch die Anbindung weiterer unternehmensbezogener Register in Deutschland. Fünf Jahre nach Inkrafttreten des Unternehmensbasisregistergesetzes (UBRegG) werden die darin beschriebenen Maßnahmen evaluiert und Vorschläge zur weiteren Optimierung erarbeitet.
Weitere Informationen stehen auf der Webseite zum Basisregister für Unternehmen zur Verfügung.
Europäische Datenräume und die Rollen der amtlichen Statistik
Europäische Datenräume sind ein Schlüsselelement der Europäischen Datenstrategie, die 2020 von der Europäischen Kommission veröffentlicht wurde. Das Ziel besteht darin einen Binnenmarkt für Daten zu schaffen und durch den sicheren und vertrauenswürdigen Austausch von Daten die globale Wettbewerbsfähigkeit und Datensouveränität Europas gewährleisten zu können. Der Austausch von Daten soll sowohl im öffentlichen als auch privaten Sektor gefördert werden und erfolgt nach gemeinsam vereinbarten Standards und Leitlinien.
Neben rechtlichen Grundlagen, die durch den Data Act und Data Governance Act geschaffen wurden, werden aktuell die technischen Rahmenbedingungen für das EU-Großprojekt etabliert. Derzeit sind 14 Europäische Datenräume (siehe Schaubild) in strategisch und wirtschaftlich wichtigen Bereichen geplant. Die Anzahl der Datenrauminitiativen steigt aber bereits kontinuierlich.
Eine wichtige Vorgabe der EU-Kommission im Hinblick auf den Datenaustausch ist die Interoperabilität der Daten innerhalb und zwischen den Datenräumen. Diese Komplexität des Vorhabens birgt viele Herausforderungen.
Auch im Europäischen Statistischen System (ESS) wird derzeit intensiv über die Rollen der amtlichen Statistik in den Europäischen Datenräumen diskutiert. Aufgrund von nationalen und europäischen Rechtsvorgaben besteht für die amtliche Statistik die Pflicht die Qualität der Statistiken kontinuierlich zu verbessern und über die traditionelle Statistikproduktion hinaus nach neuen Wegen zur Weiterentwicklung amtlicher Statistiken zu suchen, um beispielsweise die Aktualität der Statistiken zu optimieren oder die Belastung der Befragten zu reduzieren.
Potentiale und Herausforderungen für die amtliche Statistik
Europäische Datenräume und ähnliche Initiativen, wie Datenplattformen, können vielversprechende Potentiale für die amtliche Statistik bieten. Einerseits könnte die amtliche Statistik als Datenanbieter in Datenräumen auftreten oder als Datennutzer von dem vielfältigen Datenangebot profitieren. Durch die jahrelange Erfahrung im Management und der Verarbeitung von Daten kann die amtliche Statistik ihre Expertise im Bereich der Standardisierung und Interoperabilität von Daten einbringen.
Andererseits muss die amtliche Statistik die Vorgaben der statistischen Prinzipien und Qualitätsstandards einhalten, sodass die Quelle der Daten aus den Datenräumen geprüft und zusätzlich Metadaten mit Erläuterungen zur Verfügung stehen müssen. Auch die Monetarisierung der Daten in Datenräume könnte eine Herausforderung für die amtliche Statistik sein, denn je nach Entscheidung des Dateninhabers, die oftmals aus der Privatwirtschaft kommen, werden die Daten gegen Entgelt oder kostenlos im Datenraum bereitgestellt. Außerdem muss die Nachhaltigkeit der Datenquelle gewährleistet werden, um die Statistiken auch dauerhaft um die neuen Daten ergänzen zu können. Darüber hinaus müssen geeignete rechtliche Rahmenbedingungen für die amtliche Statistik bestehen. Positive Entwicklungen sind im Rahmen des Gesetzentwurfs zum Europäischen Gesundheitsdatenraum (EHDS) zu erkennen. Denn für die amtliche Statistik ist die Möglichkeit vorgesehen ausgewählte Gesundheitsdaten im Rahmen der Sekundärnutzung für statistische Zwecke wiederzuverwenden.
Das Statistische Bundesamt beobachtet die aktuellen Entwicklungen im Datenökosystem sowohl auf nationaler als auch europäischer Ebene und befasst sich mit den Auswirkungen auf die amtliche Statistik. Der Fokus lieg aktuell insbesondere auf den Themen Gesundheit, Mobilität und Green Deal aufgrund der Fortschritte dieser Datenräume. Darüber hinaus steht das Statistische Bundesamt bereits mit einigen Ministerien im Austausch, da diese bei der Etablierung von Europäischen Datenräumen eingebunden sind und auch auf nationaler Ebene die Einrichtung von Datenräumen fördern.
Weitere Informationen finden Sie im WISTA-Artikel zur Europäischen Datenstrategie.
Das Bund-Länder-Projekt zum Aufbau einer bundesweiten Kulturstatistik
Die vom Deutschen Bundestag eingesetzte Enquete-Kommission "Kultur in Deutschland" (2003 bis 2007) erkannte eine unübersichtliche, heterogene Datenlage und schlussfolgerte, dass eine verlässlichere Datenbasis über das kulturelle Leben in Deutschland dringend notwendig sei. Auch auf europäischer Ebene ist eine verbesserte Kulturstatistik notwendig, um unter anderem die Leistung der Kultur- und Kreativbranche besser zu erfassen und faktenbasiert unterstützen zu können.
Mit dem Ziel, eine fundierte Datenbasis für kulturpolitische Entscheidungen zu schaffen, führt das Statistische Bundesamt im Auftrag der Beauftragten der Bundesregierung für Kultur und Medien sowie der Kultusministerkonferenz seit 2014 in mehreren Phasen das Bund-Länder-Projekt zum Aufbau einer bundesweiten Kulturstatistik durch. Dem Arbeitskreis Kulturstatistik als steuerndes Gremium, welches Zielsetzungen definiert und Arbeitsergebnisse abnimmt, gehören neben dem Deutschen Städtetag, der Kultusministerkonferenz und der Beauftragten der Bundesregierung für Kultur und Medien sechs weitere Organisationen an.
Im Rahmen des Projekts entstanden bisher beim Statistischen Bundesamt jährlich Berichte zu unterschiedlichen Kultursparten wie beispielsweise Museen, Bibliotheken und Archive, Film und Fernsehen sowie Bildende Kunst. Ergänzt werden diese Berichte durch den alle zwei Jahre erscheinenden Kulturfinanzbericht sowie Kulturindikatorenberichte. Letztere werden federführend vom Hessischen Statistischen Landesamt erstellt.
Für die Kulturstatistik werden sowohl amtliche Daten (Mikrozensus, Berufsbildungs-, Hochschul- und Umsatzsteuerstatistik) als auch nicht amtliche Daten unterschiedlicher Verbände und Institutionen (Museums-, Theater- und Bibliotheksstatistik) genutzt.
Derzeit befindet sich das Projekt in der dritten Phase (2023 bis 2027) mit dem Namen "Kontinuierliche bundesweite Kulturstatistik". Anlässlich dazu wurden mittels einer Nutzendenumfrage unter anderem bislang unerfüllte Bedarfe nach Kulturdaten sowie die Zufriedenheit der Nutzenden und die Art und Häufigkeit der Nutzung des kulturstatistischen Datenangebots des Statistischen Bundesamtes ermittelt. Die Analyse der Datenbedarfe und Datenlücken offenbart, dass insbesondere detaillierte Informationen zum Publikumsverhalten sowie zu regional tiefer gegliederten Daten fehlen.
Auch der Bedarf an Daten zur kulturellen Bildung, zur finanziellen und personellen Ausstattung von Kulturämtern sowie zur sozialen Lage von Kulturschaffenden wurde hervorgehoben. Zudem wünschen sich die Befragten besser vergleichbare Daten über Zeiträume hinweg sowie harmonisierte Daten und Konzepte, um internationale und regionale Vergleiche zu erleichtern. Insbesondere im Hinblick auf eine detailliertere regionale Datenerhebung signalisierten die Gemeinden und Landkreise ihr Interesse an einer intensiveren Zusammenarbeit.
Um eine langfristige und kontinuierliche Datenversorgung im Bereich der Kulturstatistik, wie von der Enquete-Kommission "Kultur in Deutschland" empfohlen, sicherzustellen, bedarf es allerdings einer rechtlichen Grundlage. Dies könnte die erforderliche Verlässlichkeit und Stabilität der Datenerhebung und -bereitstellung im Sinne der Enquete-Kommission und der Datennutzenden gewährleisten. Eine Rechtsgrundlage würde zudem die Zusammenarbeit mit den Datenproduzenten stärken und sicherstellen. Entsprechende Untersuchungen sind Teil des laufenden Projektes.
Weitere Informationen finden Sie auf unserer Themenseite "Kultur" und im WISTA-Artikel zur Nutzendenumfrage der Kulturstatistik.
Das Datenlabor des Bundesministeriums des Innern und für Heimat (BMI) im Statistischen Bundesamt
Wegbereiter für datenbasierte Lösungen im Ressort BMI
In allen Ressorts sowie dem Bundeskanzleramt und dem Bundespresseamt wurden vor dem Hintergrund des zweiten Open-Data-Gesetzes und der Datenstrategie der Bundesregierung sogenannte Datenlabore eingerichtet. Ein gemeinsames Ziel ist datengestützte Entscheidungen in Politik und Verwaltung weiter zu fördern.
Das Datenlabor des BMI wurde als operative Analyseeinheit im Statistischen Bundesamt eingerichtet. Mit seiner technischen und methodischen Expertise bietet es Lösungen in der Arbeit mit Daten: von experimenteller Datenarbeit über ad-hoc-Analysen bis hin zum Einsatz von Künstlicher Intelligenz (KI). Bedarfstragende aus dem BMI und dessen Geschäftsbereich können sich an das Datenlabor wenden, um Unterstützung bei datenbezogenen Fragestellungen oder Produktentwicklungen zu erhalten.
Wegbereiter in der Zusammenarbeit
Die interdisziplinären Datenlabor-Produktteams arbeiten eng mit den Bedarfstragenden zusammen, um auf Grundlage ihrer Fachexpertise ein passgenaues Datenprodukt bis zur MVP-Reife (Minimal Viable Product) zu entwickeln. Die Bedarfe werden mit agilen Methoden, Werkzeugen und Mindset umgesetzt. So entstehen in einer iterativen Entwicklung nutzendenfreundliche und innovative Lösungen im Ressort BMI. Diese tragen zur datengestützten Entscheidungsfindung bei und schaffen dadurch Mehrwert für Verwaltung und Gesellschaft. Das können beispielsweise interaktive Dashboards sein, die alle relevanten Daten eines Verfahrens aufbereiten oder personelle und technische Hilfestellungen bei komplizierten Datenanalysen.
Die strategische Leitung und Fachaufsicht über das Datenlabor erfolgt durch die im Referat DG I 4 im BMI angesiedelte Stelle der Chief Data Scientist (CDS). Regelmäßige Austauschformate und Workshops verzahnen dabei das operative Tagesgeschäft im Statistischen Bundesamt mit der übergreifenden strategischen Planung.
Hervorzuheben ist zudem die ressortübergreifende Zusammenarbeit aller Datenlabore. Eine Interministerielle Arbeitsgruppe (IMAG), ein Peer-to-Peer Netzwerk und ein intensiver Austausch auf Arbeitsebene ermöglichen es strategische, inhaltliche und technische Themen abzustimmen und Synergien in der gesamten Bundesverwaltung zu nutzen. Die Bündelung der Fähigkeiten erlaubt es gemeinsam große Herausforderungen anzugehen – zum Beispiel die Pilotierung eines gemeinsamen Datenpools als Datenplattform zum Datenaustausch oder der Einsatz von großen Sprachmodellen (LLM) zur Unterstützung von Verwaltungsprozessen.
Ein weiteres Beispiel bietet das im Aufbau befindliche Beratungszentrum für Künstliche Intelligenz des BMI: Hier hat das Datenlabor des BMI im Statistischen Bundesamt unter Einbeziehung des Bundeskanzleramtes und vier Pilotressorts bei der Umsetzung des Markplatzes der KI-Möglichkeiten unterstützt.
Weiterführende Informationen finden Sie auf der Webseite des Datenlabors. Diese steht im gesamten Geschäftsbereich des BMI zur Verfügung.
Georeferenzierung
Der grundsätzliche Bedarf an statistischen Informationen von Wissenschaft, Politik und Wirtschaft umfasst zum einen immer aktuellere und zeitnah bereitgestellte Daten. Zum anderen erhöht sich der Bedarf an detaillierten und kleinräumig vorliegenden Daten. Hinsichtlich der Kleinräumigkeit bietet die Georeferenzierung ein großes Potential, indem Ereignisse oder statistischen Merkmalen eine Geoinformation wie beispielsweise eine Geokoordinate zugewiesen wird.
Die Erstellung kleinräumiger Datenangebote ist auch aufgrund des hohen Nutzerbedarfs ein wichtiges Ziel der amtlichen Statistik, welches in den letzten Jahren intensiv verfolgt wurde. Solche Angebote unterstützen die evidenzbasierte politische Entscheidungsfindung und ermöglichen das Monitoring der Umsetzung politischer Maßnahmen, insbesondere im Hinblick auf die Nachhaltigkeitsziele der Agenda 2030 der Vereinten Nationen.
Gemäß § 10 des Bundesstatistikgesetzes darf die geografische Gitterzelle von einem Hektar (100m x 100m) für die dauerhafte regionale Zuordnung der Erhebungsmerkmale und für (statistikinterne) Analysen genutzt werden. Neben der höheren räumlichen Tiefe bieten rasterbasierte Darstellungen flexible Analysemöglichkeiten unabhängig von administrativen Raumgliederungen. Damit lassen sich Veränderungen von räumlichen Phänomenen über die Zeit besser darstellen. Außerdem können über die Geokoordinaten bzw. Gitterzellen Verknüpfungen mit anderen Statistiken oder externen Daten, wie Fernerkundungs-, Mobilfunk- oder anderen neuen digitalen Daten erstellt werden. Hierdurch wird das Analysepotential der Daten wesentlich erhöht und um Informationen erweitert, ohne dass dabei eine zusätzliche Belastung für die Auskunftgebenden entsteht.
Auf Grundlage geokodierter Daten können interaktive Datenangebote wie zum Beispiel der Tourismusatlas, die Agrarstrukturerhebung (Atlas Agrarstatistik) oder eine Darstellung von Straßenverkehrsunfällen (Unfallatlas) bereitgestellt werden.
Durch die Umsetzung der Geokodierung im Statistischen Verbund wurde in den vergangenen Jahren eine ausgezeichnete Datengrundlage geschaffen, die es ermöglicht, statistische Informationen adäquat, zeitgemäß und entsprechend den internationalen Standards bereitzustellen und verbreiten zu können.
Bedeutung der Hotellerie im Jahr 2022 als interaktive Rasterkarte des Tourismusatlas (mit Klick auf die Karte öffnet sich ein neues Fenster)
Konjunkturelle Frühindikatoren
Unser Ziel: Daten zur Konjunkturlage früher für unsere Nutzenden aus Politik und Verbänden bereitstellen!
Gerade in konjunkturell schwierigen Zeiten ist es wichtig, die wirtschaftliche Entwicklung schnell und zuverlässig bewerten zu können. Durch die fortschreitende Digitalisierung ergeben sich hierfür neue Möglichkeiten durch Prozessverbesserungen und methodische Weiterentwicklungen.
Dazu hat das Statistische Bundesamt ein Pilotprojekt ins Leben gerufen, mit dem Ziel, bereits 15 Tage nach Ende des Monats erste quantitative Einschätzungen der Konjunkturlage als experimentelle Daten bereitzustellen. Aktuell liegt der Veröffentlichungszeitraum von Konjunkturstatistiken etwa zwischen 30 und 70 Tagen nach Ende des Berichtszeitraums.
Mit einem ganzheitlichen Ansatz werden Prozesse entlang der Statistikproduktion optimiert. Dadurch sollen möglichst früh bereits Echtdaten von den Betrieben verwendet werden. Außerdem werden die Methoden zur Schätzung ausstehender Meldungen weiterentwickelt.
Dabei arbeiten wir eng mit den Verbänden der meldenden Betriebe sowie den statistischen Ämtern der Länder zusammen. Je mehr gemeldete Werte vorliegen, desto zuverlässiger wird unsere Frühschätzung. Deswegen ist es für uns essentiell, zu einem frühen Zeitpunkt einen möglichst großen Anteil an tatsächlichen Ergebnissen zur Verfügung zu haben.
Zum Zeitpunkt t+15 haben wir derzeit zwischen 50 und 60 % der Daten vorliegen.
Dieser Anteil soll erhöht werden, in dem Betriebe vermehrt auf automatisierte Meldungen direkt aus dem betrieblichen Rechnungswesen setzen.
Ca. 7 % der Betriebe haben ihre Daten zum Zeitpunkt t+15 zwar bereits gemeldet, die Daten überschreiten jedoch Plausibilitätsgrenzwerte und können daher unplausibel sein. Daher müssen sie zunächst weiter überprüft werden, bevor eine Weiterverarbeitung möglich ist. Dieser Anteil soll reduziert werden, indem die Landesämter soweit wie möglich automatisiert plausibilisieren und eine zusätzliche Überprüfung aus Bundesperspektive die Qualität der Daten sicherstellt.
Kommen die Daten dann im Statistischen Bundesamt an, werden sie zur Berechnung der Konjunkturindikatoren weiterverarbeitet. Hier entwickeln wir die bisher entwickelten Schätzverfahren weiter, um demnächst das Ziel einer zuverlässigen Frühschätzung zu erreichen. Es wird geprüft, ob unter Berücksichtigung der gegebenen Datenlage Methoden aus dem Bereich des maschinellen Lernens für die Vorabschätzung in Frage kommen. Auch die Nutzung früh verfügbarer externer Daten zur Stärkung der Datengrundlage wird untersucht.
Scannerdaten
Bei Scannerdaten handelt es sich um digitale Transaktionsdaten über Umsatz, Absatz und Art der verkauften Artikel, die an den Kassen von Einzelhandelsgeschäften erfasst werden. Sie haben aufgrund ihres Umfangs und ihrer schnellen Verfügbarkeit das Potenzial verschiedene Statistiken zu digitalisieren, ihre Qualität zu sichern und sie zu erweitern. Der Schwerpunkt im Statistischen Bundesamt liegt bei der Vorbereitung der Nutzung von Scannerdaten in der Verbraucherpreisstatistik. Gleichzeitig werden aber auch weitere Nutzungspotenziale wie beispielsweise zur Messung der Konjunktur oder von regionalen Preisunterschieden untersucht.
Im Bereich der Verbraucherpreisstatistik sichern Scannerdaten vor dem Hintergrund des Wandels im Einzelhandel mit langfristig geringerem Aufwand die Genauigkeit und Qualität der Messung der Preisentwicklung in Deutschland für ausgewählte Produktgruppen. Dabei können Scannerdaten die traditionelle Vor-Ort-Erhebung allmählich ersetzen. Aktuell arbeiten das Statistische Bundesamt und die Statistischen Ämter der Länder daran, Scannerdaten aus den Bereichen Lebensmittel, Getränke und Drogerie in der laufenden Produktion der Verbraucherpreisstatistik zu nutzen. Damit folgt der Statistische Verbund den Entwicklungen anderer europäischer Statistikämter, die Scannerdaten zum Teil schon seit mehreren Jahren für die Erhebung von Preisen in den Bereichen Lebensmittel, Getränke und Drogerie sowie auch für Elektronik, Bekleidung oder Pauschalreisen nutzen.
Darüber hinaus untersucht das Statistische Bundesamt, inwiefern sich Scannerdaten für die Berechnung regionaler Preisunterschiede auf Ebene der Kreise und kreisfreien Städte eignen. Eine neue Konjunkturstatistik über Absätze nach Warengruppen im Einzelhandel auf der Grundlage von Scannerdaten befindet sich im Aufbau. Außerdem ist aufgrund der hohen Aktualität der Scannerdaten die Entwicklung eines Frühindikators über die Konjunktur im Einzelhandel geplant.
Erste Ergebnisse und weiterführende Informationen finden Sie auf EXSTAT und in unseren Pressemitteilungen.
Fernerkundungsdaten
Mittels Satelliten- und anderen Fernerkundungsdaten, wie beispielsweise Luftbildern, lassen sich objektive Informationen der Erdoberfläche und -atmosphäre berührungsfrei ermitteln. Durch ihre schnelle und überregionale Verfügbarkeit – auch über administrative Grenzen hinaus, die georeferenzierte Darstellung und die zahlreichen Einsatzmöglichkeiten wird die Nutzung von Fernerkundungsdaten als sehr vielversprechend für die Weiterentwicklung der amtlichen Statistik angesehen. So können sie zum Beispiel die Genauigkeit und Aktualität amtlicher Daten, im Sinne einer schnelleren Datenproduktion und einer kleinräumigen Ergebnisdarstellung, verbessern oder zur Qualitätssicherung und Qualitätskontrolle amtlicher Daten beitragen.
Aus diesen Gründen werden Fernerkundungsdaten beim Statistischen Bundesamt bereits in verschiedenen Machbarkeitsstudien und Projekten für unterschiedliche Anwendungszwecke geprüft, insbesondere hinsichtlich Ertragsschätzungen in der Landwirtschaft, Gebäudeerkennung sowie Konjunkturschätzungen:
Das Projekt "Satellitengestützte Ertragsschätzung in der Erntestatistik" (SatAgrarStat_Plus) ist ein bis Mitte 2023 angelegtes Verbundprojekt zwischen dem Statistischen Bundesamt und den Statistischen Landesämtern von Bayern, Berlin-Brandenburg, Hessen, Niedersachsen, Nord, Nordrhein-Westfalen sowie dem Projektpartner Julius-Kühn Institut (JKI). Auf Basis von Daten des europäischen Erdbeobachtungsprogramms Copernicus werden Möglichkeiten und Vorteile fernerkundungsbasierter Ertragsschätzungen am konkreten Anwendungsfall der amtlichen Erntestatistik untersucht. Im Projekt werden auf Basis von Satellitendaten Erträge auf Schlag- wie auch auf Landkreisebene in ausgewählten Bundesländern für die Kulturarten Winterweizen, Wintergerste, Winterraps und Sommergerste geschätzt und validiert. Ziel des Vorhabens ist es, Voraussetzungen zu schaffen, die satellitengestützte Ernteertragsabschätzung im Prozess der Statistikproduktion zu verankern, um in Zukunft bei den Ernteertragsabschätzungen sowohl eine größere regionale Tiefe als auch eine verbesserte Qualität zu erreichen. Im WISTA-Artikel zum SatAgrarStat Projekt finden Sie weitere Informationen.
Bei der Konzeption des Registerzensus wird im Rahmen der Machbarkeitsstudie "Satelliten- und andere Fernerkundungsdaten für das Gebäude- und Wohnungsregister" (Sat4GWR) vom Statistischen Bundesamt untersucht, inwieweit Fernerkundungsdaten zur Qualitätssicherung der Daten aus dem noch aufzubauenden Gebäude- und Wohnungsregister für den Registerzensus unterstützend eingesetzt werden können. In dem vom BMI finanzierten IF-Bund-Innovationsprojekt "Sat4GWR_IF-Bund – Fernerkundung & Künstliche Intelligenz für den Registerzensus" werden Algorithmen auf Basis neuronaler Netze entwickelt, mit denen Gebäude auf Luftbildern und Satellitendaten erkannt und Gebäudemerkmale, wie beispielsweise die Gebäudenutzung, abgeleitet werden können. Hierfür arbeitet das Statistische Bundesamt mit dem Deutschen Zentrum für Luft- und Raumfahrt (DLR) und dem Bundesamt für Kartographie und Geodäsie (BKG) zusammen. Das Projekt ist im Oktober 2021 gestartet und läuft bis voraussichtlich Dezember 2024. Anschließend sollen die Ergebnisse bis 2028 in den Registerzensus überführt werden. Im EXSTAT-Werkstattbericht zu Fernerkundung und künstlicher Intelligenz für den Registerzensus finden Sie weitere Informationen.
In der Machbarkeitsstudie "Satellitengestützte Konjunkturschnellschätzung" wird aufbauend auf dem Projekt "Smart Business Cycle Statistics" ein auf Satellitendaten basierender Wirtschaftsindikator der European Space Agency (ESA) auf die Eignung als Echtzeit-Indikator der deutschen Wirtschaft untersucht. Die Idee hinter der Nutzung von Satellitendaten für Konjunkturstatistiken ist, dass wirtschaftliche Aktivitäten optische Spuren auf der Erdoberfläche hinterlassen, die von Satelliten erfasst werden und darauf basierend quantifiziert werden können. Unter der Nutzung von Radar-Satellitendaten beobachtet der untersuchte Indikator der ESA Fertigungsparkplätze an Automobilproduktionsstätten an 15 Standorten in Deutschland. Die Entwicklung dieses ESA-Indikators könnte Rückschlüsse auf die Produktion im Fahrzeugbau ermöglichen und somit die amtliche Konjunkturschnellschätzung unterstützen. Weitere Informationen finden Sie in den EXSTAT-Werkstattberichten zur satellitengestützten Konjunkturschnellschätzung sowie zu Smart Business Cycle Statistics.
Data Literacy
Daten, Zahlen und Statistiken bestimmen unseren Alltag. Daher stehen wir als Individuen und als Gesellschaft vor der Herausforderung, uns neues Wissen anzueignen, also datenkompetent ("data literate") zu werden. Wer datenkompetent ist, kann die Zuverlässigkeit von Datenquellen beurteilen, Daten zielgerichtet aufbereiten und einordnen sowie sinnvolle Schlüsse aus diesen Daten ziehen.
Das Wissen und Verständnis für den Umgang mit Zahlen und Daten ist heutzutage eine Schlüsselkompetenz. Die Förderung von Datenkompetenz führt zu mehr digitaler Bildung und Teilhabe, zur Stärkung demokratischer Prozesse und zu einem verantwortungsvollen Umgang mit den Daten. Vor diesem Hintergrund will das Statistische Bundesamt das Verständnis von Data Literacy verbreiten und die dazugehörigen Kompetenzen weiter stärken – sowohl innerhalb als auch außerhalb der öffentlichen Verwaltung. Data Literacy umfasst dabei nicht nur Statistikkompetenz oder ein mathematisches Grundverständnis, sondern auch Fertigkeiten wie Digital- und Medienkompetenz.
Daher intensiviert das Statistische Bundesamt im interdisziplinären Netzwerk Data Literacy seit 2021 den Austausch mit Wissenschaft, Schulen sowie Expertinnen und Experten für Data Literacy durch regelmäßige Treffen. Als Netzwerkpartnerinnen und Netzwerkpartner wollen wir voneinander lernen und uns gegenseitig auf dem Laufenden halten. Wir orientieren uns an der Empfehlung des Statistischen Beirats für die Fortentwicklung der amtlichen Statistik für die Jahre 2022 bis 2026 und wollen den Ausbau von Data Literacy sowohl innerhalb als auch außerhalb der öffentlichen Verwaltung vorantreiben.
Weitere Informationen finden Sie auf unserer Themenseite zu Data Literacy.
Künstliche Intelligenz und Maschinelles Lernen
Maschinelles Lernen ist ein Teilgebiet des Forschungsfeldes "Künstliche Intelligenz". Es beschreibt Herangehensweisen, bei denen ein Algorithmus Muster in Lerndaten erkennt, also gleichsam erlernt. Die erkannten Muster werden dann unter anderem auf unbekannte (z. B. neu eingehende) Daten übertragen, um beispielsweise auf Dauer nicht oder nur händisch durchführbare Klassifikationsaufgaben in der amtlichen Statistik zu automatisieren. Die zentralen Qualitätsversprechen der Statistischen Ämter des Bundes und der Länder erfordern dabei einen besonders sorgfältigen Umgang mit den Daten.
Das Statistische Bundesamt sammelt seit ca. 2015 kontinuierlich Erfahrung im Einsatz von Verfahren der Künstlichen Intelligenz und des Maschinellen Lernens (KI/ML) beispielsweise zur Codierung (Einordnung in die standardisierten Klassifikationssysteme für wirtschaftliche Tätigkeiten, Konsumgüter usw.), Plausibilisierung (Finden und Korrigieren fehlerhafter Werte) und Imputation (Ersetzen fehlender Werte). Insbesondere Aufgabenstellungen, die mit Natural Language Processing zur Textverarbeitung bearbeitet werden, treten in der amtlichen Statistik zunehmend häufiger auf. Die Ziele des Einsatzes von KI/ML sind dabei stets effizientere Prozesse (beispielsweise in der Datenaufbereitung), umfangreichere Analyseoptionen (beispielsweise durch Zuschätzung von Merkmalen an bestehende Erhebungen ohne Mehrbelastung der Auskunftgebenden) oder eine höhere Qualität (beispielsweise durch automatisierte Durchführung von andernfalls nicht erfolgten Plausibilisierungen).
Das Statistische Bundesamt ist zuverlässiger Statistikproduzent, digitaler Datenmanager und Datenkompetenzzentrum sowie kundenorientierter Informationsdienstleister. Der qualitätsgesicherte Einsatz von modernen Methoden und Techniken aus dem Bereich KI/ML ist hierbei unerlässlich. Neben der regelmäßigen Durchführung zugehöriger methodischer Untersuchungen modernisiert das Statistische Bundesamt dafür außerdem seine IT- und Dateninfrastruktur und qualifiziert seine Beschäftigten für den Umgang mit neuen Technologien und digitalen Arbeitsformen.
Beispiele für unsere Aktivitäten zu Künstlicher Intelligenz und Maschinellem Lernen:
Registerdaten
Daten aus Verwaltungsregistern haben großes Potential für die amtliche Statistik. Durch Modernisierung, Aufbau und Verknüpfung einzelner Register können für Politik, Wirtschaft, Bürgerinnen und Bürger bedarfsgerechte und verlässliche Informationen bereitgestellt werden. Durch den Verzicht auf Befragungen zugunsten einer stärkeren Nutzung von Registerdaten sinkt die Belastung für bisher auskunftspflichtige Personen oder Unternehmen. Leitgedanke ist dabei das Once-Only-Prinzip – Daten, die bereits in der Verwaltung vorliegen, müssen nicht erneut erhoben werden.
In Zukunft sollen verlässliche Bevölkerungszahlen durch einen rein registerbasierten Zensus bereitgestellt werden. Dies spart langfristig Kosten und entlastet alle, die bisher im zehnjährigen Turnus Auskunft geben mussten. Bis 2031 soll dann schrittweise auf den sogenannten Registerzensus umgestellt werden. Nach diesem methodischen Umstieg werden auch Daten zu Gebäuden und Wohnungen, Haushalten und Familien sowie Arbeitsmarkt und Bildung weitgehend automatisiert aus vorhandenen Datenquellen gewonnen. Dadurch können Zensusergebnisse häufiger, aktueller und tiefer regional untergliedert bereitgestellt werden – und das in bewährt hoher Qualität und unter Einhaltung höchster Datenschutzstandards. Zugleich wird die amtliche Statistik dem zukünftigen Datenbedarf der Europäischen Kommission gerecht.
Bis es soweit ist, müssen bestehende Register modernisiert und gepflegt werden. Zum Teil müssen fehlende Register aufgebaut werden. In Deutschland gibt es zum Beispiel noch kein Verwaltungsregister mit Informationen zu allen Gebäuden und Wohnungen, das vielfältige Nutzungsmöglichkeiten bieten könnte (u.a. als Datengrundlage für qualifizierte Mietspiegel, für das Monitoring der Klimaschutzziele im Gebäudesektor oder für den Registerzensus).
Für den Aufbau von Registern wird stets eine gesetzliche Grundlage benötigt. Für das geplante Basisregister für Unternehmensstammdaten ist diese rechtliche Grundlage schon vorhanden. Im Basisregister werden beispielsweise Name, Anschrift und Wirtschaftszweig von Unternehmen nach hohen Datenschutzanforderungen gespeichert und dank einer Identifikationsnummer dem jeweiligen Unternehmen zugeordnet. Das entlastet Unternehmen spürbar, da Unternehmensdaten nur noch einmalig der Verwaltung nach dem Once-Only Prinzip mitgeteilt werden müssen.
In einem ersten Schritt zur modernen, digitalen Verwaltung hat das Statistische Bundesamt eine sogenannte "Verwaltungsdateninformationsplattform" (kurz: VIP) eingerichtet. Sie dient Politik und Verwaltung als Referenz über die Verfügbarkeit und Beschaffenheit von Verwaltungsdaten, sodass diese nicht erneut abgefragt werden müssen. Die VIP schafft außerdem mehr Transparenz darüber, welche Informationen von welcher Behörde gespeichert werden.
Weitere Informationen finden Sie hier:
Themenseite zum Registerzensus
Verwaltungsregister
Experimentelle Statistiken
Auf der Grundlage neuer Daten und Methoden entstehen experimentelle Statistiken (kurz: EXSTAT), die neue Perspektiven auf verschiedene Themenfelder der Statistik eröffnen. Im Vergleich zur amtlichen Statistik unterscheiden sich experimentelle Statistiken im Reifegrad und der Qualität, insbesondere in Bezug auf Harmonisierung, Erfassungsbereich, Koheränz und Methodik. Dennoch sind es Ergebnisse der Statistischen Ämter des Bundes und der Länder, die interessante, neue Perspektiven auf verschiedene Themenfelder der Statistik bieten. Beispiele für experimentelle Statistiken, die das Statistische Bundesamt nutzt, beziehen sich auf Mobilfunkdaten, Satellitendaten und Scannerdaten.
In dem sich das Statistische Bundesamt methodisch weiterentwickelt und neue digitale Daten erforscht und nutzt, kann es die Erfüllung seines gesetzlichen Auftrages zukünftig sicherstellen. Seit Anfang 2020 werden die Ergebnisse experimenteller Statistiken unter Einhaltung des Transparenzgebotes veröffentlicht und neue Perspektiven auf die amtliche Statistik geschaffen. Besonders in Krisenzeiten liefern experimentelle Statistiken zu wirtschaftlichen Entwicklungen eine wichtige Datengrundlage für politische Entscheidungen. So lieferten beispielsweise Scannerdaten in der Preisstatistik wichtige Erkenntnisse, welche Güter zu Beginn der Covid-19-Pandemie am häufigsten gekauft wurden.
Um den steigenden Bedarf an aktuellen Daten zu decken, arbeitet das Statistische Bundesamt auch in Zukunft gemeinsam mit Partnern an innovativen, experimentellen Lösungen.
Weitere Informationen finden Sie auf unserer EXSTAT-Themenseite