Varianzschätzung

Um die Varianz der Schätzer – also die Unsicherheit der Aussagen über die Grundgesamtheit anhand des Datensatzes – statistisch korrekt zu schätzen, müssen das komplexe Stichprobendesign, die Gewichtung, und die Imputationen berücksichtigt werden. Doch aus Anonymisierungsgründen sind weder alle notwendigen Informationen zum Stichprobendesign (z. B. Strata oder Cluster) noch die zur Gewichtung (z. B. Design- oder Nonresponse-Gewichte) im veröffentlichten Datensatz vorhanden. Die Aufgabe der Varianzschätzung kann somit dem Benutzer des Datensatzes nicht alleine überlassen werden.

Daher wurden für den HFCS zusätzlich zu den finalen Haushaltesgewichten sogenannte Resampling-Gewichte erstellt. Diese Gewichte basieren auf einem sogenannten „Bootstrapping“ Verfahren unter der Einbeziehung des Stichprobendesigns. Hierfür werden auf Basis der Bruttostichprobe der Erhebung 1.000 zufällig ausgewählte Subgruppen an Haushalten nach vorgegebenen Kriterien ausgewählt und der Erstellungsprozess der finalen Haushaltsgewichte wiederholt sowie eine Endlichkeitskorrektur beachtet. Die der veröffentlichten User Database beigefügten Resampling-Gewichte enthalten somit alle notwendigen Informationen für eine korrekte Varianzschätzung mittels der „Bootstrapping“-Methode. Dem Benutzer des Datensatzes stehen dafür bis zu 1.000 Resampling-Gewichte zur Verfügung.

Detaillierte Informationen zur Erstellung und Verwendung von Resampling-Gewichten in der ersten Welle des HFCS in Österreich sind im Kapitel 8 der Methodischen Grundlagen für Österreich veröffentlicht.