Publikation Erkennung nicht relevanter Unternehmen in den Handwerksstatistiken

Datum 13. April 2016

Die Handwerksstatistiken werden seit dem Berichtsjahr 2008 vollständig aus Verwaltungsdaten gewonnen. Dabei treten teilweise Klassifizierungsprobleme auf, die derzeit aufwendig in den Statistischen Ämtern der Länder manuell gelöst werden. Der vorliegende Aufsatz zeigt, wie sich maschinelle Lernalgorithmen einsetzen lassen, um mit relativ geringem personellen Aufwand Beobachtungen in Gruppen einzuteilen. Es wird der Einsatz von Support Vector Machines in Verbindung mit dem Klassifikationsverfahren Random Forests für die Klassifizierung der Handwerkseigenschaft im Unternehmensregister dargestellt.

Auszug aus der Publikation "WISTA - Wirtschaft und Statistik", 2/2016

Autoren: Diplom-Volkswirt Jörg Feuerhake, Florian Dumpert