Структура данных

В первой волне второго этапа обследования RLMS-HSE в 1994 году была реализована модель выборки, репрезентирующей население РФ. В дальнейшем, в каждой волне ставилась задача опросить каждое домохозяйство, на момент проведения опроса фактически проживающее в жилище, входящем в выборку 1994 года. Это означает, что и домохозяйства, и входящие в их состав люди, проживающие по выборочным адресам, репрезентируют население России. Данные репрезентативных выборок (cross-sectional analysis) по каждой волне обследования представлены на страничке данных в формате SPSS под заголовком "Репрезентативная выборка". Они отсортированы по идентификатору соответствующей волны (например, X^*)ID_I - для файлов данных по индивидам).

Кроме того, в задачи обследования в каждой последующей волне входил опрос всех людей, ранее участвовавших в исследовании. При возможности найти новый адрес переехавших домохозяйств, опрошенных ранее в составе репрезентативной выборки, их опрашивали и в последующих волнах обследования. Однако, поиск осуществлялся только в пределах одного и того же населенного пункта или района. Такие семьи и индивиды не входят в репрезентирующую население России выборку соответствующей волны (хотя входят в репрезентативную выборку какой-то из более ранних волн). Данные по этим семьям и индивидам могут использоваться только для панельного анализа.

Данные всех опрошенных - и репрезентативной выборки, и тех, кто не входит в нее, но является частью панельной составляющей выборки - находятся на страничке данных в формате SPSS под заголовком "Полная выборка".

В каждом из файлов под заголовком «Полная выборка» присутствует переменная, указывающая, к какой части выборки относится данное наблюдение: к репрезентативной выборке или только к панельной части: это переменные Х_ORIGSM. Те домохозяйства и индивиды, которые входят в выборку, репрезентирующую население России в данной волне, имеют значение «1» в соответствующей переменной Х_ORIGSM. Те, кто не входит в репрезентативную выборку данной волны, но кем нужно дополнить выборку при проведении панельного анализа, в переменной X_ORIGSM имеют значение «0».

Семейные файлы обоих типов отсортированы по идентификационной переменной домохозяйства в соответствующей волне (XID_H).

Индивидуальные файлы отсортированы по уникальному идентификатору (IDIND).

Переменная Х_INWGTявляется постстратификационным весом индивида. Веса выравнивают выборочную совокупность репрезентативной выборки данной волны, приводя показатели выборки к параметрам генеральной совокупности по полу, возрасту и типу поселения. Использование весов - на усмотрение исследователя.

^*)Примечание: "X" в данном и последующих случаях является обозначением буквы, фигиурирующей в названии переменных для различения переменных разных волн. Так, для 5-ой волны это буква - А, для 6-ой волны - буква B и так далее в алфавитном порядке латинского алфавита. Соответствие буквенных обозначений волнам можно посмотреть в разделе "График волн".

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.

Российский мониторинг экономического положения и здоровья населения НИУ ВШЭ

Структура данных