Experimentelle Statistiken Scannerdaten in der Verbraucherpreisstatistik und zur Bestimmung regionaler Preisunterschiede

EXSTAT

Scannerdaten

Scannerdaten sind digitale Transaktionsdaten über Umsatz, Absatz und Art der verkauften Artikel, die an den Kassen von Einzelhandelsgeschäften erfasst werden. Scannerdaten haben das Potenzial verschiedene Statistiken zu digitalisieren, Qualität zu sichern und zu erweitern. Scannerdaten können beispielsweise in der Verbraucherpreisstatistik oder zur Bestimmung regionaler Preisunterschiede eingesetzt werden.

Scannerdaten in der Verbraucherpreisstatistik

Digital verfügbare Kassendaten des Einzelhandels, sogenannte Scannerdaten, sind eine vielversprechende Datenquelle für die Preisstatistik. In der amtlichen Verbraucherpreisstatistik wird die manuelle Preiserhebung durch Preiserheberinnen und Preiserheber vor Ort in den Geschäften und Dienstleistungsunternehmen durch neue Formen der Preiserhebung ergänzt oder teilweise ersetzt. Zu nennen sind hier insbesondere die automatisierte Preiserhebung im Internet (Web Scraping) und die Nutzung von Scannerdaten. Im Gegensatz zum Web Scraping werden Scannerdaten bislang noch nicht in der amtlichen deutschen Verbraucherpreisstatistik genutzt.

Für die Preisstatistik sind nicht Daten über einzelne Transaktionen relevant, sondern zusammengefasste Verkaufsdaten zu einzelnen Artikeln in großen, umsatzstarken Einzelhandelsketten beziehungsweise -geschäften. Insgesamt haben Scannerdaten das Potenzial, mit langfristig geringerem Aufwand die Genauigkeit und Qualität der Messung der Verbraucherpreise in Deutschland für ausgewählte Produktgruppen im Zuge der dynamischen Preissetzung zu sichern und die traditionelle Vor-Ort-Erhebung allmählich zu ersetzen

Mit der Nutzung von Scannerdaten können Preise und Mengen in den jeweiligen Geschäften für einen wesentlich längeren Zeitraum erfasst werden als derzeit. Bislang werden Preise in einem spezifischen Geschäft in der Regel an einem Tag im Monat erhoben. Die zunehmende Menge an Beobachtungen steigert die Genauigkeit und ermöglicht zusätzliche Auswertungen, zum Beispiel für die Preisentwicklung von Bio-Produkten.

Im Vergleich mit der aktuellen Vorgehensweise bei der Berechnung des Verbraucherpreisindex (VPI) treten bei der Nutzung von Scannerdaten jedoch völlig neue Herausforderungen methodischer, organisatorischer und technischer Art auf. Aktuell untersucht das Statistische Bundesamt, in welcher Form Scannerdaten in der laufenden Produktion genutzt werden können. Ergebnisse zum aktuellen Kaufverhalten werden in unseren Pressemitteilungen veröffentlicht. Ausführliche Informationen zur Methodik und zum Datencharakter sind im Wissenschaftsmagazin WISTA in folgenden Beiträgen zu finden:

Ausgabe 4/2020: Einsatz von Scannerdaten während der COVID-19-Pandemie

Ausgabe 4/2019: Fortschritte beim Einsatz von Web Scraping in der amtlichen Verbraucherpreisstatistik

Ausgabe 2/2019: Nutzung von Scannerdaten in der Preisstatistik

Verwendung von Scannerdaten zur Bestimmung regionaler Preisunterschiede

Scannerdaten lassen sich nicht nur für die Verbraucherpreisstatistik, sondern auch für diverse andere Statistiken verwenden, beispielsweise zur Bestimmung regionaler Preisunterschiede. Das Statistische Bundesamt führte zwei Machbarkeitsstudien im Lebensmittel- und Drogeriebereich durch, um die Eignung von Scannerdaten zum Darstellen von regionalen Preisunterschieden zu prüfen.

In einer zweiten Machbarkeitsstudie verwendete das Statistische Bundesamt Scannerdaten von verschiedenen Discountern und Drogeriemärkten aus dem Jahr 2020. Die einzelnen Artikel aller Handelsketten wurden auf der Ebene der Kreise und der kreisfreien Städte aggregiert. Dadurch konnte ein Jahresdurchschnittspreis für jeden Artikel eines Kreises oder einer kreisfreien Stadt gebildet werden. Unter Berücksichtigung des gesamten Lebensmittelsortiments waren Unterschiede von etwa vier Prozentpunkten in der regionalen Preissetzung mithilfe des multilateralen GEKS-Tornqvist-Preisindex festzustellen. Die Vergleiche fallen bei der isolierten Betrachtung einzelner Produktgruppen teilweise höher aus. Die nachfolgenden interaktiven Karten zeigen die Preisindizes für das gesamte Lebensmittelsortiment sowie für einzelne Produktgruppen.

1 von 4

Lebensmittel (2020)

2 von 4

Zucker, Marmelade, Honig und andere Süßwaren (2020)

3 von 4

Wein (2020)

4 von 4

Bier (2020)

In einer ersten Machbarkeitsstudie nutzte das Statistische Bundesamt Scannerdaten einer Einzelhandelskette aus dem Lebensmittelbereich aus dem Jahr 2017. Die Daten aus den Filialen dieser Kette wurden auf Ebene der Kreise und kreisfreien Städte aggregiert. Unter Berücksichtigung des gesamten Lebensmittelsortiments waren Unterschiede von etwas mehr als drei Prozentpunkten in der regionalen Preissetzung mithilfe des multilateralen GEKS-Fisher-Preisindex festzustellen. Die Vergleiche fallen bei der isolierten Betrachtung einzelner Produktgruppen teilweise deutlich höher aus. Die folgenden interaktiven Karten zeigen die Preisindizes für das gesamte Lebensmittelsortiment beziehungsweise für Artikel, die an Bedienungstheken ausgegeben werden.

1 von 2

Lebensmittel und Tabakwaren (2017)

2 von 2

Bedienungstheke (2017)

Die Ergebnisse der ersten Machbarkeitsstudie präsentierte das Statistische Bundesamt auf der Statistischen Woche 2021 in Kiel (Book of Abstracts) und auf dem virtual 63rd ISI World Statistics Congress 2021 (Proceedings / Video). Dabei wurden weiterführende Analysen hinsichtlich der Bestimmung der Determinanten regionaler Preisunterschiede sowie eine Anwendung zur Einkommensungleichheit vorgestellt.