Zeszyt 23/2011

Kolegium Analiz Ekonomicznych oświadcza, że wersją pierwotną czasopisma jest wersja papierowa.

Wojciech Roszka

Powiększanie zasobów informacyjnych ankietowych baz danych

Streszczenie
Celem niniejszego opracowania jest próba zastosowania statystycznych metod integracji danych na podstawie źródeł ankietowych, które nie posiadają wspólnego klucza identyfikacyjnego, nie zawierają informacji o tych samych jednostkach, a zawierają zmienne wspólne. Wynikiem zastosowania tych metod jest syntetyczny zbiór zawierający zmienne ze wszystkich integrowanych źródeł, a także najczęściej posiadający liczebność najliczniejszego z nich. Metodą umożliwiającą tak zdefiniowaną integrację jest parowanie statystyczne (statistical matching). W celu przeprowadzenia empirycznej weryfikacji metody postanowiono połączyć dane ze zbioru Badania Aktywności Ekonomicznej Ludności (106 152 unikalnych rekordów, 130 zmiennych) oraz Polskiego Generalnego Sondażu Społecznego (1 277 unikalnych rekordów, 1 600 zmiennych), żeby wzbogacić PGSS o zmienne z BAEL oraz zwiększyć liczebność zbioru. Efektem zastosowania metody jest nowy zbiór zawierający zmienne z obu baz (1 730 zmiennych) o liczebności 106 152 rekordów.

***

Zooming information resources survey databases

Abstract
The purpose of the article is an application of statistical data integration methods based on survey data which do not contain unique id, information on the same units and contain common variables. The result of the application is a synthetic dataset which contain all the variables from integrated sets and a number of units of the largest one. The method which enables such integration is statistical matching. The empirical procedure is based on Polish Labour Force Survey (106152 respondents, 130 variables) and Polish General Social Survey (1277 respondents, 1600 variables). The purpose is to enrich PGSS with LFS variables and to increase the number of units. The effect of the integration is a new synthetic data file with 1730 variables and 106125 units.

spis treści zeszytu 23

Copyright © Kolegium Analiz Ekonomicznych Szkoły Głównej Handlowej w Warszawie 2011-2022   ISSN 1232-4671
sie wyburaczylo