Publikation Hierarchisches Klassifizieren von Scannerdaten: ein Methodenvergleich mit Anwendung in der Verbraucherpreisstatistik

Datum 17. Februar 2025

Die Nutzung von Scannerdaten in der Verbraucherpreisstatistik hat viele Vorteile, bringt allerdings auch einige Herausforderungen mit sich. Eine der Herausforderungen ist die Klassifizierung der Artikel nach dem vom Verbraucherpreisindex verwendeten Klassifikationssystem COICOP. Aufgrund der großen Datenmenge bei Scannerdaten ist eine automatisierte Klassifizierung mittels maschinellen Lernens zwingend, um die Daten effizient in der amtlichen Statistik verwenden zu können. Dieser Beitrag analysiert einen Ansatz aus der aktuellen Forschung, der die zugrunde liegende hierarchische Struktur der COICOP-Klassifikation bei der automatisierten Klassifizierung berücksichtigt. Außerdem werden die Auswirkungen von Fehlklassifizierungen auf den Verbraucherpreisindex untersucht.

Auszug aus der Publikation "WISTA - Wirtschaft und Statistik", 1/2025

Autoren: Daniel Nietzer, Karola Henn, Chris-Gabriel Islam, Keno Krewer, Carsten Monzert