Imputation

Durch Antwortverweigerungen von Haushalten entstehen missings (Lücken) in den Erhebungsdaten. Insbesondere Fragen zu Einkommen und Vermögen werden manchmal nicht beantwortet. Für die Auswertung ergeben sich in Folge zwei Möglichkeiten: Entweder wird das Problem ignoriert und die Auswertung wird nur für jene Haushalte durchgeführt, die den Fragebogen vollständig beantwortet haben, oder die missings werden durch imputierte Werte ersetzt.

Die erste Variante verzerrt die Ergebnisse, da die fehlenden Antworten nicht zufällig über die Respondenten der Stichprobe verteilt sind. So belegt die internationale Forschung, dass vermögende Haushalte eher Antworten zu Vermögensfragen verweigern, als ärmere Menschen (siehe z. B. Barceló, 2006). Werden die Auswertungen ohne jene der Haushalte mit Antwortverweigerungen herangezogen, dann sind die Ergebnisse nicht repräsentativ für die Gesamtheit der an der Umfrage teilnehmenden Haushalte. Das errechnete durchschnittliche Vermögen wird zu niedrig sein, da vermögende Haushalte nicht hinreichend berücksichtigt sind. In der HFCS-Erhebung werden fehlende Antworten daher imputiert. Das verwendete Imputationsverfahren heißt "Multivariate Imputation by Chained Equations".

Hierbei werden missings durch prognostizierte Werte ersetzt. Die Schätzungen erfolgen auf Basis von Regressionsmodellen. Zum Beispiel kann die Höhe eines Kredits von einem Haushalt, der die Antwort hierzu verweigert hat, anhand der Kredithöhen von Haushalten geschätzt, die u. a. ein ähnliches Bildungsniveau, Alter, Einkommen und Wohnbedingungen haben. Welche solcher Charakteristika zur Schätzung geeignet sind, wird anhand diverser Kriterien statistisch evaluiert.

Detaillierte Informationen zum Thema Imputation in der ersten Welle des HFCS in Österreich sind im Kapitel 5 der Methodischen Grundlagen für Österreich veröffentlicht.