Анализ российских домохозяйств по структуре потребления товаров и услуг. Потребление алкогольной про...
Эссе на тему
Анализ российских домохозяйств по структуре потребления товаров и услуг.
Потребление алкогольной продукции в общей структуре
потребления российских домохозяйств
Выполнила:
Проверила:
Москва
2007
Содержание
Анализ и интерпретация результатов- 7
Приложение 2. SPSS-синтаксис обработки микроданных Росстата- 18
Для целей исследования динамики и внутренних закономерностей в структуре потребительских расходов домашних хозяйств как отечественная, так и зарубежная государственная статистика выделяет отдельной статьёй расходы на алкогольную продукцию. Крупные репрезентативные исследования, связанные с изучением бюджетов домохозяйств также традиционно выделяют алкогольную продукцию из общей структуры потребления. Так, например, российское панельное исследование «Российский мониторинг экономики и здоровья» (Russian Longitudinal Monitoring Study – RLMS) содержит целый блок вопросов, касающийся объёмов, крепости приобретаемой домохозяйством алкогольной продукции и сумм, потраченных на её покупку. Несмотря на то, что алкоголь не является продуктом питания первой необходимости и не входит, скажем, в минимальный продуктовый набор (потребительскую корзину), употребление алкоголя является важной исследовательской темой как в социальной статистике, так и в специализированных социологических исследованиях, изучающих социальные аспекты и характер употребление алкоголя различными социальными группами.
Сложность данной исследовательской темы не в последнюю очередь определяется множеством системных, социальных и ситуативных факторов, обусловливающих употребление спиртных напитков. Часто алкоголь употребляется как аперитив, либо напиток, выгодно дополняющий пищу, в других случаях – служит средством психологического расслабления, снятия стресса, обычно употребление спиртных напитков при торжествах, отмечании событий и достижений. Важно отметить, что во многих случаях употребление алкоголя сопровождает и даже инициирует процесс человеческого, дружеского общения, вплетается во внутренние стандарты взаимодействия в группах – т.е. здесь мы видим прямой путь, через который в проблему изучения употребления алкогольных напитков приходят социально обусловленные детерминанты. Нельзя не отметить, что в ряде наиболее печальных случаев употребление алкоголя является важной физиологической потребностью – тогда можно говорить о развитии алкогольной зависимости. Проблема алкоголизма являлась одновременно острой и щекотливой темой едва ли не на всём протяжении российской истории, и современный её период – не исключение. Напротив, современные процессы либерализации экономики в целом (если сравнивать с советским периодом российской истории) и расширения рынка алкогольной продукции вкупе с интенсивным развитием СМИ и их открытостью для дискуссий относительно проблем и норм употребления алкоголя, заметно подогревают указанную тему. Наконец, тенденции оптового и розничного оборота спиртного представляют прямой государственный интерес, поскольку во многих государствах акцизная политика является если не важнейшим, то важным инструментом государственного регулирования экономики и пополнения государственного бюджета. Неудивительно, что именно связанные с оборотом алкогольной продукции отрасли экономики относятся к числу наиболее криминализованных, что весьма актуально и для современной России.
Современные системы учёта, методы сбора и анализа данных по социальным проблемам позволяют исследователям глубоко проникать в корни изучаемых явлений. Выборочные обследования бюджетов домохозяйств, проводимые органами государственной статистики и негосударственными исследовательскими агентствами позволяет дать оценки не только общих тенденций употребления алкоголя, но и связать характеристики потребления с особенностями домохозяйств. Так, В.С. Тапилина в своей работе обобщает результаты волн мониторинга RLMS за 1994–2002 годы относительно профилей употребления спиртных напитков российским потребителем [1]. В.А. Алексунин основывает свой анализ на данных маркетингового исследования потребителей вина, вычленяя из них интересные детерминанты, достойные социологического анализа [7].
В своём эссе мы воздержимся от попыток оценить реальные объёмы потребления алкогольной продукции по всевозможным социальным срезам. Вместо этого, попытаемся выяснить, как связаны расходы на алкоголь с прочими потребительскими расходами домохозяйств, какие закономерности наблюдаются при рассмотрении домохозяйств с разной ресурсной базой, какие типы домохозяйств по структуре потребления можно выделить. Более чётко, мы должны будем решить следующие задачи исследования:
1. Представить общую характеристику состава расходов на алкогольную продукцию в общей структуре потребительских расходов современных российских домохозяйств;
2. Исследовать корреляционные связи расходов домохозяйств на спиртные напитки с прочими потребительскими расходами, учитывая возможные вариации в зависимости от материальной обеспеченности домохозяйств и варианты учёта расходов (непосредственно в рублях, либо же в долях от общего объёма потребительских расходов);
3. Предложить типологию российских домохозяйств по структуре потребления, в том числе – с адекватным учётом доли расходов на алкогольные напитки.
Информационной основой исследования послужат открытые микро-данные (базы данных) Росстата за 4 квартал 2004 года, содержащие релевантную информацию более, чем по 53 тысячам российских домохозяйств (с репрезентативной российской выборкой). Подробнее данные будут рассмотрены ниже. Исходя из поставленных задач и имеющихся информационных ресурсов, определимся с методологией исследования.
Решение поставленных задач будет базироваться на данных выборочных обследований с применением «количественной» методологии. Поэтому прежде чем переходить к характеристике собственно используемых статистических методов, полезно будет остановиться на общих вопросах достоверности данных, получаемых в ходе подобных опросов. Известно, что при выборочных обследованиях, когда информация записывается со слов респондента, всё зависит от его честности и открытости (а также, вообще говоря, от того, что и как спрашивают, но этих вопросов мы сейчас не касаемся). Наиболее часто, вероятно, утаивается информация по доходам, но и расходная часть также может искажаться. Не в последнюю очередь это касается алкогольной продукции, когда респондент может сознательно занизить объёмы собственного потребления (из-за стеснения перед интервьюером, или членами своей семьи, если они присутствуют при интервью). В упомянутой выше работе В.С. Тапилиной это проблема разбирается достаточно полно, даже предложена интересная методика «взвешивания» показателей потребления алкоголя для более адекватной оценки объёмов и частоты употребления спиртных напитков. Объёмы потребления алкоголя для значительной доли респондентов умножались на коэффициенты, выведенные, исходя из ответов тех респондентов, которые, по ряду критериев, проявили наибольшую «честность» в остальных ответах, а также опрашивались в отсутствии членов домохозяйств так, что у них не было оснований скрывать от них истинную информацию. В результате полученные показатели потребления алкоголя оказались «заметно выше (в среднем примерно на 62%) публикуемых в официальной статистике», причём эти оценки хорошо согласовывались с оценками других исследователей, полученных по другим методикам. В имеющихся у нас данных отсутствует дополнительная информация об условиях, в которых проводилось интервью, да и рамки эссе не позволяют нам провести аналогичную процедуру взвешивания. Вместо того, чтобы пытаться дать наиболее адекватные оценки суммарного потребления алкогольной продукции, нас будут интересовать зависимости потребления спиртного от различных параметров бюджетов домохозяйств и характеристик самих домохозяйств. Посему мы примем имеющиеся данные «как есть», полагая, что возможные искажения реальных объёмов закупок спиртного не повлияют на оценки искомых взаимосвязей.
Что касается используемых статистических методов, мы, разумеется, будем опираться на методы описательной статистики (средние величины, процентные распределения – линейные и условные), корреляционный анализ, с помощью которого постараемся установить зависимости между величинами «алкогольной» и прочих статей расходов домохозяйств. Там, где это необходимо, для установления достоверности различий и зависимостей мы будем прибегать к стандартным проверкам гипотез, встроенным в статистический пакет: одномерный дисперсионный анализ, критерий хи-квадрат на независимость признаков в таблице сопряжённости, проверка значимости (значимого отличия от нуля) коэффициентов корреляции.
Искомую типологию потребления домохозяйств в относительных показателях расходов по статьям потребительского бюджета постараемся построить с помощью методов кластерного анализа (k-средних), который как раз подходит для анализа выборок большого объёма (несколько тысяч наблюдений). В качестве критериев выбора кластерного решения будем ориентироваться на 1) возможность интерпретации решения, 2) наполненность кластеров, 3) соотношение расстояний между кластерными центрами и средних расстояний до центров кластеров. Полученные кластеры проверим на перекрёстных распределениях с такими характеристиками домохозяйств, как местожительства и регион проживания, размер домохозяйства, дециль располагаемых ресурсов домохозяйства и т.д.
Для анализа данных используется пакет SPSS 13.0. Это особенно удобно, так как исходные данные распространяются, в том числе, в «родном» формате этой программы. Поскольку в ходе анализа приходилось прибегать к разного рода трансформациям данных, а также повторять анализ с разными параметрами, были использованы возможности протоколирования и программирования синтаксиса SPSS (внутреннего командного языка программы). Краткое введение в синтаксис SPSS на русском языке, а также коллекция мини-программ обработки информации для этого статистического пакета была найдена на русскоязычной версии сайта «Raynald’s SPSSTools» («Raynald’s SPSSTools по-русски»), см. #"_Toc184600930">Используемые данные
Основной анализ базируется на ставших недавно доступными микро-данных регулярных выборочных обследований бюджетов домашних хозяйств, проводимых Федеральной службой государственной статистики РФ. Мы использовали наиболее свежие из доступных данные: за 4 квартал 2004 года. В обследовании участвовало 53 159 домохозяйств и, соответственно, 143 750 индивидов – членов этих домохозяйств. Росстат распространяет обезличенные данные в открытом доступе на специальном сайте в форматах DBF и SAV (формате SPSS) [5]. Описание использованных файлов и переменных вынесено в приложение.
Данные получены на основе ежедневных дневниковых записей расходов домохозяйств и охватывают двухнедельный период. Таким образом, например, полученный после обследования показатель расхода домохозяйства на приобретение алкогольной продукции характеризует суммарные расходы домохозяйства на алкоголь в течение 2 недель[1]. Затем все показатели приводились к квартальному периоду путём домножения на соответствующий коэффициент.
По ходу анализа результатов мы обращаемся также к агрегированным данным Росстата, представленным в статистических сборниках, а также, по возможности, сравниваем наши выводы с выводами авторов рассмотренных работ.
Зафиксируем, в первую очередь, средние расходы на алкогольную продукцию за 4 квартал 2004 года по децильным группам располагаемых ресурсов и в целом по выборке, а также – средние значения потребительских расходов и средние доли расходов на алкоголь в потребительских расходах. Значительное отклонение долей домохозяйств в децилях от 10% общей выборки объясняется сложным механизмом формирования децильной (группирующей) переменной, предложенным Росстатом, который предусматривает отдельное ранжирование домохозяйств городской и сельской местности, а также учитывает численности домохозяйств и индивидуальные коэффициенты взвешивания.
Таблица 1. Средние оценки сумм потребительских расходов и расходов на покупку алкогольных напитков по данным за 4 квартал 2004 г.
Децили по среднедушевым располагаемым ресурсам |
Все потребительские расходы |
Расходы на покупку алкогольных напитков |
Доля расходов на покупку алкогольных напитков среди потребительских расходов |
|||
Среднее |
Ст. откл. |
Среднее |
Ст. откл. |
Среднее |
Ст. откл. |
|
1 дециль (наименьшие ресурсы) N=5396 |
10421 |
6629 |
149 |
394 |
.014 |
.037 |
2 дециль N=6793 |
13436 |
8403 |
235 |
551 |
.016 |
.038 |
3 дециль N=6958 |
15773 |
10048 |
301 |
628 |
.018 |
.036 |
4 дециль N=7061 |
17569 |
11628 |
363 |
735 |
.019 |
.036 |
5 дециль N=6969 |
19857 |
13443 |
424 |
795 |
.020 |
.037 |
6 дециль N=6276 |
23566 |
16009 |
529 |
1018 |
.021 |
.037 |
7 дециль N=5223 |
27010 |
19057 |
653 |
1148 |
.023 |
.038 |
8 дециль N=3589 |
29532 |
21459 |
714 |
1318 |
.024 |
.040 |
9 дециль N=2820 |
34196 |
26571 |
873 |
1572 |
.026 |
.042 |
10 дециль ( наибольшие ресурсы) N=2074 |
45772 |
43971 |
1167 |
2373 |
.027 |
.044 |
Всего (N=53159) |
20806 |
18562 |
455 |
1019 |
.020 |
.038 |
Рисунок 1. Гистограмма расходов домохозяйств на покупку алкогольных напитков за 4 квартал 2004 г.
На рисунке 1 представлен фрагмент гистограммы переменной «Расходы на покупку алкогольных напитков (руб.)»: максимальное значение шкалы ограничено суммой 5000 рублей, хотя максимальная оценка квартальной суммы расхода составила по обследованным домохозяйствам 29600 рублей; в интервал 0–5000 рублей попадают 97,3% домохозяйств. Таким образом, мы видим характерный процесс убывания численности домохозяйств при переходе к более крупным суммам затрат на спиртные напитки.
Всего же 41,3% домохозяйств указало нулевые расходы на приобретение алкогольной продукции. Это отчасти согласуется с выводами, сделанными В.С. Тапилиной: «доля потребителей алкогольных напитков в составе населения в возрасте 15 лет и старше за последнее десятилетие колебалась в интервале 75-78%». Доля лиц вообще не употребляющих алкоголь позволяет отнести Россию, по её мнению, к группе наиболее благополучных стран в этом отношении. Да и среди тех, кто потребляет алкоголь, по частоте, т.е. регулярности потребления напитков российские потребители не выделяются в худшую сторону от других стран. Российская специфика, связанная с неумеренным потреблением алкоголя, однако, связана с «поляризованностью» потребителей спиртных напитков: интенсивность потребления в группе наиболее склонных к напитку очень высока, равно как высоки и разовые объёмы потребления.
Оценённая по выборке доля расходов на потребление алкоголя (из общего объёма потребительских расходов) в 2% согласуется с опубликованными агрегированными данными государственной статистики. В целом, согласно сборнику [РСЕ, 2005], доля расходов на покупку алкогольных напитков снизилась с 5–6% в конце 1980-х–начале 1990-х гг. до приблизительно 4% в середине 1990-х и далее – примерно до 2% в настоящее время. То, что это произошло на фоне роста расходов на продукты питания, я склонна связывать с ростом ценовой доступности алкоголя в 90-е гг. прошлого века, а также – с переключением части потребителей на производство собственных вин и самогона (такая точка зрения также встречается в исследованной мной литературе).
Исследуем корреляции между расходами на алкоголь и прочими статьями потребительских расходов по децильным группам. Статьи расходов представим в начале в рублёвом выражении, а затем – в долях от общего объёма потребительских расходов в квартале.
Таблица 2. Коэффициенты корреляции Пирсона между расходами на приобретение алкогольных напитков (руб.) и прочими статьями потребительских расходов по децилям
Дециль по среднедушевым располагаемым ресурсам
Расходы на покупку продуктов питания
Расходы на питание вне дома
Расходы на покупку непродовольственных товаров
Расходы на оплату услуг
1 дециль
.203
-.013
.134
.102
2 дециль
.294
.000
.205
.155
3 дециль
.304
.051
.207
.183
4 дециль
.368
.083
.208
.174
5 дециль
.398
.070
.203
.179
6 дециль
.387
.096
.188
.192
7 дециль
.429
.151
.194
.168
8 дециль
.424
.160
.218
.204
9 дециль
.404
.118
.132
.137
10 дециль
.429
.184
.086
.071
Из матрицы корреляций виден рост степени линейной зависимости между потреблением алкоголя и общим потреблением продуктов питания для более состоятельных домохозяйств. Также заметна растущая (хотя и не слишком чёткая) связь между расходами на алкоголь и тратами на питание вне дома. Первая тенденция, вероятно, связана со включением всё более дорогого (и качественного) алкоголя в стандартный продуктовый набор для состоятельных домохозяйств (стоимость продуктов и алкоголя растёт как бы параллельно), тогда как в первых децилях относительно дешёвое спиртное может покупаться от случая к случаю и не обнаруживать устойчивого соотношения с расходами на продукты питания. Второе наблюдение, несомненно, связано с большими расходами на приём пищи в кафе и ресторанах для более обеспеченных децилей, что также опосредованно связано с покупкой более дорогого алкоголя. Корреляции расходов на спиртные напитки со статьями непродовольственных товаров и услугами являются весьма скромными и не обнаруживают заметных тенденций к изменению по мере перехода от дециля к децилю.
Аналогичный анализ, выполненный, однако, для процентных представлений тех же статей расходов относительно общих потребительских расходов домохозяйств, позволяет расширить толкование взаимосвязей между алкоголем и другими направлениями расходования средств бюджетов (табл. 3).
Таблица 3. Коэффициенты корреляции Пирсона между расходами на приобретение алкогольных напитков (% от потребительских расходов) и прочими статьями потребительских расходов (% от потребительских расходов) по децилям
Дециль по среднедушевым располагаемым ресурсам
Расходы на покупку продуктов питания
Расходы на питание вне дома
Расходы на покупку непродовольственных товаров
Расходы на оплату услуг
1 дециль
-.079
-.036
-.024
-.143
2 дециль
-.089
-.030
-.036
-.141
3 дециль
-.080
-.008
-.055
-.122
4 дециль
-.041
-.006
-.079
-.144
5 дециль
-.020
-.019
-.088
-.152
6 дециль
-.003
-.003
-.117
-.131
7 дециль
.023
.029
-.141
-.148
8 дециль
.018
.022
-.162
-.106
9 дециль
.059
.009
-.192
-.112
10 дециль
.135
.043
-.239
-.150
Во-первых, заметно, постепенная смена знака взаимосвязи для алкоголя и продуктов, а также – алкоголя и расходов на питание вне дома. Хотя связи достаточно слабые, напрашивается интерпретация, что для малоресурсных домохозяйств приобретение алкогольных напитков, отчасти, конкурирует с приобретением основных продуктов питания, а также – питанием в столовых и кафе, а для более состоятельных граждан больший процент затрат на питание оборачивается и большим процентом затрат на приобретение алкоголя. При этом заметно усиливается отрицательная корреляция статей алкоголя и непродовольственных расходов с ростом номера децильной группы, что, вероятно, объясняется тем, что для более состоятельных децилей непродовольственные товары могут быть достаточно дороги, на фоне которых затраты на алкоголь сильно «мельчают». И наоборот, в случае отсутствия крупных покупок (ТДП, акций, недвижимости) стабильно высокие затраты на качественный алкоголь также поддерживают отрицательную корреляцию с непродовольственными расходами.
Проведём теперь кластерный анализ с целью выявить возможные типологии домохозяйств по структуре потребления. Нас особенно интересует участие в данной типологии расходов на приобретение алкогольной продукции. Однако, из табл. 4 видно, что долевые показатели вкладов статей расходов в общую сумму потребительских издержек имеют не только существенно различные средние значения (что естественно объясняется разной важностью указанных статей для ежедневного функционирования домохозяйства), но и значительно различные между собой стандартные отклонения. Попытка кластеризации в исходных показателях, таким образом, не позволит должным образом учесть дифференциацию потребления алкогольных напитков в домохозяйствах. Поэтому перед кластерным анализом была выполнена стандартизация переменных и кластерный анализ далее выполнялся в пространстве стандартизированных показателей.
Таблица 4. Описательная статистика потребительских расходов домохозяйств в долях от общей суммы потребительских расходов
N
Минимум
Максимум
Среднее
Станд. отклонение
Расходы на покупку продуктов питания
53159
.00
1.00
.4965
.18269
Расходы на питание вне дома
53159
.00
.92
.0140
.04080
Расходы на покупку алкогольных напитков
53159
.00
.75
.0198
.03787
Расходы на покупку непродовольственных товаров
53159
.00
1.00
.2718
.17375
Расходы на оплату услуг
53159
.00
1.00
.1978
.12458
Итого
53159
Отметим, что для нахождения конечного решения по алгоритму k-средних потребовалось провести 71 итерацию: такое большое их количество естественно обусловлено большим количеством наблюдений в файле данных. Центры кластеров в стандартизированных показателя представлены в табл. 5, а в исходных – в табл. 6.
Таблица 5. Центры кластеров (в стандартизированных переменных)
Номер кластера
2
3
4
Расходы на покупку алкогольных напитков
2.34
-.20
-.30
-.05
Расходы на покупку продуктов питания
.14
-.92
.66
-.59
Расходы на питание вне дома
-.19
-.13
-.25
3.17
Расходы на покупку непродовольственных товаров
-.34
1.06
-.62
-.23
Расходы на оплату услуг
-.39
-.02
.07
.16
Таблица 6. Центры кластеров (в исходных показателях – долях от общей суммы потребительских расходов)
Номер кластера
2
3
4
Итого по выборке
Расходы на покупку алкогольных напитков
.11
.01
.01
.02
.02
Расходы на покупку продуктов питания
.52
.33
.62
.39
.50
Расходы на питание вне дома
.01
.01
.00
.14
.01
Расходы на покупку непродовольственных товаров
.21
.46
.16
.23
.27
Расходы на оплату услуг
.15
.20
.21
.22
.20
Таблица 7. Матрица расстояний между кластерными центрами (в стандартизированных показателях)
Номер кластера
1
2
3
4
1
3.11
2.75
4.23
2
3.11
2.32
3.56
3
2.75
2.32
3.68
4
4.23
3.56
3.68
Таблица 8. Средние расстояния до центра в каждом из кластеров (в стандартизированных показателях)
Номер кластера
Среднее
N
Станд. отклон.
1
1.69
5106
1.05
2
1.43
18021
.70
3
1.27
26856
.63
4
2.02
3176
1.35
Итого
1.41
53159
.79
На основе изучения соотношений расстояний в табл. 7 и 8 можно назвать решение с 4 кластерами приемлемым, так как средние расстояния до центра своего кластера в полученных кластерах не превосходят расстояния между кластерными центрами. Вместе с тем, на основе стандартного отклонения из табл. 8 можно судить, что самый большой (третий) кластер является, в то же время, самым компактным (наименьшее среднее расстояние до центра при наименьшем стандартном отклонении), а наименьший кластер (4-й) является одновременно и самым разнородным. Таким образом, потенциально можно было бы попробовать кластерное решение с большим числом кластеров, однако в данном эссе мы остановимся на четырёхкластерном решении.
Размеры кластеров 1–4 получены, соответственно, следующие: 5106, 18021, 26856, 3176, или, в процентах от общей выборки: 9,6%, 33,9%, 50,5%, 5,9%. Содержательную интерпретацию построим, прежде всего, на основе табл. 6.
Итак, кластерный анализ выделяет большую (половина выборки) группу домохозяйств с типичным для России характером потребительских расходов (кластер №3): около 60% составляют потребительские расходы, расходы на питание вне дома практически отсутствуют, уровень трат на непродовольственные товары достаточно низок, значительна доля платных услуг; на спиртные напитки отводится примерно 1% потребительских расходов (чуть ниже среднероссийского показателя). Сюда устойчиво попадают более половины домохозяйств из первых четырёх децилей по располагаемым ресурсам (табл. 9).
Близок к кластеру №3 как по размерам, так и по расстоянию между кластерными центрами, кластер №2. Эту группу домохозяйств тоже можно назвать типичной, однако модель потребления здесь иная: только треть потребительских расходов идёт на покупку продуктов питания, тогда как немногим меньше половины расходов приходится на непродовольственные товары. Различий в доле затрат на алкогольную продукцию с третьим кластером не наблюдается. Можно предполагать, что подобная модель потребления в большей степени характерна для более состоятельных домохозяйств, что и подтверждается данными табл. 9.
Первый и четвёртый кластеры невелики по объёму (9,6 и 5,9% выборки, соответственно) и отличаются от «основных» групп домохозяйств выраженным преобладанием незначительных в среднем расходных статей бюджетов: алкогольных напитков и питания вне дома. Эти статьи не получили бы сколько-нибудь значимого проявления, если бы исходные данные не были бы стандартизированы. Кластер №4 характеризуется весьма высокими расходами на питание вне дома, тогда как доли расходов на продукты питания и непродовольственные товары опускаются чуть ниже средневыборочного уровня. Кластер №1, вероятно, объединяет активных потребителей алкоголя, доля расходов на который здесь составляет более 10%, что делает её сопоставимой с расходами на непродовольственные товары и услуги в этом же кластере. Доля же расходов на продукты питания также значительна: более половины потребительского бюджета, что приближает эту группу домохозяйств к третьему кластеру.
Если судить по расстояниям между кластерными центрами, наиболее обособленным является четвёртый кластер (удалён от всех прочих, а в особенности от кластера №1).
Рассмотрим распределение по кластерам домохозяйств различной численности, разного числа детей, разной ресурсной обеспеченности (по децильным группам), а также – разной местности проживания (город/село) и проживающих на разных территориях (в разных регионах). Согласно критерию хи-квадрат независимости признаков в таблицах сопряжённости, на уровне значимости p<0,001 можно говорить о наличии зависимости всех исследованных переменных и номера кластера. Таким образом, построенная на основе долей расходов потребительского бюджета 4-кластерная группировка отчасти объясняется учётом перечисленных признаков домохозяйств, определяющих характер потребления.
В распределении децильных групп по кластерам, очевидная связь отмечается для второго и третьего кластеров. Во второй кластер входит значительная часть обеспеченных домохозяйств (начиная с 8 дециля – более половины всех домохозяйств), третий же кластер, преимущественно, объединяет низкодоходные домохозяйства: туда попадают ¾ представителей первого дециля, 2/3 – второго и т.д. Вместе с тем, из-за значительного размера третьего кластера, сюда же относится примерно четверть домохозяйств-представителей верхнего дециля (с наибольшими располагаемыми ресурсами). Вероятность попадания в первый кластер также несколько выше для высокоресурсных домохозяйств. Сюда попадают примерно 10% домохозяйств из 5-го дециля и выше, и примерно 7-8% домохозяйств ниже 5-го дециля. Взаимосвязь доходов и вероятности попадания домохозяйства в кластер №4 практически не прослеживается, за исключением относительно низких процентов попадания в данный кластер для первых 2-3 децилей. Таким образом, второй кластер можно коротко охарактеризовать как «зажиточные домохозяйства», третий – «малоресурсные», первый кластер тяготеет к зажиточным, но все децили представлены в нём более или менее ровно, а четвёртый кластер практически иррелевантен к переменной дохода (дециля располагаемых ресурсов).
Таблица 9. Распределение децильных групп по кластерам, % по строке
Номер кластера
1
2
3
4
1 дециль (с наименьшими ресурсами)
7.4
17.6
71.5
3.5
2 дециль
8.8
21.8
65.0
4.4
3 дециль
8.6
26.9
59.5
5.1
4 дециль
9.8
29.4
55.2
5.6
5 дециль
10.0
34.2
49.4
6.4
6 дециль
9.6
38.9
43.8
7.7
7 дециль
11.0
44.6
36.7
7.8
8 дециль
10.6
50.0
32.3
7.1
9 дециль
11.1
53.5
28.4
7.0
10 дециль (с наибольшими ресурсами)
12.4
57.4
23.0
7.1
Total
9.6
33.9
50.5
6.0
Таблица 10. Распределение домохозяйств городской и сельской местности по кластерам, % по строке
Номер кластера
1
2
3
4
городская местность
N
2778
11585
18659
2746
%
7.8
32.4
52.2
7.7
сельская местность
N
2328
6436
8197
430
%
13.4
37.0
47.1
2.5
Итого
N
5106
18021
26856
3176
%
9.6
33.9
50.5
6.0
Что касается различий между городской и сельской местностью в разделении по кластерам, они не слишком велики. Тем не менее, первый и второй кластеры, как видно, чуть активнее притягивает к себе сельские домохозяйства, а третий и четвёртый – городские. При этом, учитывая заметный перевес городских домашних хозяйств в выборке (равно как и в российском обществе в целом), первый и второй кластеры неверно было бы назвать «сельскими».
Таблица 11. Распределение домохозяйств разного размера по кластерам, % по строке
Номер кластера
1
2
3
4
1 человек
8.6
18.1
69.9
3.4
2 человека
11.1
30.0
53.6
5.3
3 человека
9.5
40.6
42.4
7.6
4 человека
8.9
43.5
39.6
8.0
5 человек и более
8.8
42.1
44.1
5.1
Итого
9.6
33.9
50.5
6.0
Значительные различия в составе кластеров наблюдаются по размеру домохозяйств. Основная часть хозяйств, состоящих из одного человека (70%) относятся к третьему кластеру. Можно предположить, что в существенной степени такой перевес формируется домохозяйствами одиноких пенсионеров (что хорошо согласуется с характеристикой третьего кластера как малоресурсного). Напротив, менее 20% из домохозяйств-одиночек нашли своё место в первом кластере. Первый кластер интенсивно притягивает к себе расширенные домохозяйства, состоящие из 3 и более человек (более 40% таких семей). Первый кластер выделяется тем, что в него входит каждое десятое домохозяйство из 2 человек. Четвёртый же кластер вновь оказывается практически иррелевантен к данной группировке; можно лишь отметить, что чаще прочих к этой группе принадлежат не маленькие и не большие семьи (по 3-4 человека).
Таблица 12. Распределение домохозяйств по числу детей до 16 лет по кластерам, % по строке
Номер кластера
1
2
3
4
отсутствие детей
9.9
29.3
55.3
5.4
1 ребенок
8.9
42.8
40.9
7.4
2 детей
8.9
43.7
40.4
6.9
3 детей
9.8
41.6
46.3
2.3
4 и более детей
4.7
26.2
69.2
.0
Итого
9.6
33.9
50.5
6.0
Перекрёстная классификация по наличию детей расширяет предыдущее наблюдение для второго кластера – более 40% семей с детьми относятся к данной группе (группу «4 и более детей» в данном случае можно не рассматривать из-за её малочисленности; соответствующие ей проценты не слишком надёжны). Существенных зависимостей с остальными кластерами не просматривается.
Добавляют к пониманию сути полученных кластеров средние оценки натуральных доходов в денежном выражении. Для 1–4 кластеров они составили, соответственно, 3524, 3380, 2399, 2254 руб. (различия в средних значимы на уровне p<0,001 согласно F-критерию одномерного дисперсионного анализа). Первые два кластера, вероятно, за счёт чуть большей концентрации в них сельских домохозяйств имеют большие оценки поступлений натуральных ресурсов.
Исследователи современных тенденций в статистике потребления алкогольных напитков россиянами отмечают следующие особенности: вопреки расхожему мнению, заметна доля россиян, которые практически не употребляет алкогольные напитки; по этому показателю Россия не уступает многим развитым странам мира. По частоте (регулярности) употребления спиртного российские потребители также не выделяются в худшую сторону. Ещё один положительный момент связан с тем, что молодёжь предпочитает слабоалкогольные напитки крепким. Тем не менее, за последнее десятилетия наблюдается устойчивый рост как частоты, так и интенсивности потребления алкоголя, что ведёт к ещё большему обособлению групп российских потребителей, характеризующихся неумеренным потреблением спиртных напитков [1]. Заметно различаются региональные профили употребления спиртного [6]. Принимая тезис о допустимости в принципе употребления алкоголя, нельзя не отметить, что социальные, медицинские и культурные последствия низкой «культуры пития» очевидны, поэтому не к последним задачам социальных наук относятся установление социальных причин, норм и профилей потребления алкоголя, выработка практических рекомендаций по коррекции потребления алкоголя и отношения к нему в российском обществе.
Понимая важность подобных исследовательских задач, российские статистические органы в рамках выборочных бюджетных обследований домохозяйств выделяют расходы на потребление алкоголя отдельной строкой, а статистика розничного оборота представляет данные даже по видам алкогольной продукции в региональном разрезе. Отметим, что в новых статистических сборниках Росстата (начиная с 2005 г.), помимо традиционной российской классификации структуры расходов домохозяйств, публикуются данные по потреблению алкоголя в соответствии с Классификатором конечного индивидуального потребления по целям, созданном в соответствии с Международным классификатором индивидуального потребления по целям (COICOP). Однако в данной классификации потребление алкогольной и табачной продукции попадают в одну и ту же статью.
Следуя общемировой практике распространения важнейших
статистических данных, Росстат начал пробную публикацию первичных
(неагрегированных) данных выборочных обследований бюджетов домохозяйств, что
открывает новые перспективы исследования потребительских расходов на
микроуровне.
Поставив задачу исследовать, как связаны расходы на потребление алкоголя с
прочими расходными статями бюджетов домохозяйств, мы получили, во-первых,
оценки средних долей расходов на алкоголь в 10 децильных группах по
располагаемым ресурсам (они варьируются от 1% в наименее обеспеченных до 3% в
наиболее обеспеченных домохозяйствах со средним по выборке в районе 2%, что
соответствует среднероссийскому уровню по оценкам Росстата), во-вторых,
исследовали корреляции расходов на алкоголь и прочих потребительских расходов
домохозяйств, представив их сначала в рублёвом выражении, а затем – в долях от
общей суммы потребительских расходов в квартале. Основной результат –
усиливающаяся положительная взаимосвязь расходов на продукты питания и расходов
на питание вне дома с расходами на алкоголь при переходе от нижних децилей к
верхним. Усиление отрицательной взаимосвязи расходов (в % выражении) на
алкоголь и на непродовольственные товары объясняется наличием крупных
непродовольственных покупок в состоятельных домохозяйствах, которые нивелируют
процент затрат, приходящийся на алкоголь, продукты питания, услуги и прочие
регулярные расходы.
Расходы по различным потребительским статьям в процентном выражении были стандартизированы для придания им одинаковой дисперсии и, следовательно, равного их учёта по последующем кластерном анализе. Разбиение 53 тысяч домохозяйств на 4 кластера с помощью метода k-средних обеспечило сильно неодинаковые по своему размеру кластеры, их которых 2 наиболее крупных (50 и 33% выборки) представляют типовую структуру потребления, соответственно, малообеспеченных и состоятельных домохозяйств. Достаточно специфический небольшой кластер (6%) представляет домохозяйства с выраженной доминантой расходов на питание вне дома (эта статья достигает в среднем 14% общих потребительских расходов). Хотя некоторые российские регионы оказываются представленными в этом кластере значительно большим числом домохозяйств, чем в среднем по выборке, устойчивой географической специфики, равно как и зависимости от других характеристик домохозяйства, выявить не удалось. Наконец, первый кластер домохозяйств обнаруживает значительную долю расходов на алкоголь в сравнении с остальными статьями. Здесь прослеживается чёткая географическая специфика: чаще других в данный кластер попадают домохозяйства национальных автономных округов и областей РФ (см. прил. 3).
Полученные кластеры могут получить более содержательную интерпретацию, будучи подвергнуты разложению по большему числу социально-демографических факторов. Такие характеристики в использованных микро-данных Росстата также представлены, однако нуждаются в дополнительных преобразованиях, связанных с экспортом и слиянием из других файлов. Другим направлением дальнейшего анализа может стать попытка построить аналогичную кластерную типологию, приняв к рассмотрению лишь данные домохозяйств, потреблявших алкоголь в период статистического наблюдения. Это позволит не смешивать в одних и тех же кластерах потребляющих и не потребляющих алкоголь, что, возможно, даст более яркие результаты по интересующим нас переменным.
Файлы данных и описания загружены с веб-сайта #"#">chlico
Число наличных лиц в домохозяйстве
Группировка по числу лиц в домохозяйстве
Фактическое число детей до 16 лет
Группировка по числу детей до 16 лет в домохозяйстве
Расход на конечное потребление
Денежный доход
Располагаемые ресурсы
Дециль по среднедушевым располагаемым ресурсам
Потребительские расходы
Расходы на покупку продуктов питания
Расходы на питание вне дома
Расходы на покупку алкогольных напитков
Расходы на покупку непродовольственных товаров
Расходы на оплату услуг
Налоги, сборы, платежи
Другие расходы
Денежные расходы
Прирост финансовых активов
Натуральный доход
Коэффициент взвешивания (общий)
Все стоимостные показатели приведены к квартальной базе. При проведении анализа были вычислены вспомогательные показатели; смысл и указания к вычислениям понятны из синтаксиса SPSS, приведённого в следующем приложении.
Число наблюдений (домохозяйств) в файле: 53 159.
* Расределения номинальных и порядковых переменных.
FREQUENCIES
VARIABLES=ter mest chlico chisl chdet chisd decilr
/ORDER= ANALYSIS .
* Распределения некоторых числовых переменных.
FREQUENCIES
VARIABLES=potras prod pitres alk neprod uslug natdox /FORMAT=NOTABLE
/STATISTICS=MEAN MEDIAN
/HISTOGRAM
/ORDER= ANALYSIS .
* Вычисление доли расходов на алкоголь в общих потребительских расходах.
COMPUTE alkp = alk/potras .
EXECUTE .
* Вычисление аналогичных долей остальных статей.
COMPUTE prodp = prod/potras .
COMPUTE pitresp = pitres/potras .
COMPUTE neprodp = neprod/potras .
COMPUTE uslugp = uslug/potras .
* Определение тех домохозяйств, чьи расходы на алкоголь не превосходят 5000 руб.
* Определение тех домохозяйств, чьи расходы на алкоголь равны 0.
COMPUTE sumalk5000 = alk<=5000.
COMPUTE sumalk0 = alg=0.
* Вычисление указанных выше групп.
FREQUENCIES
VARIABLES=sumalk5000 sumalk0
/ORDER= ANALYSIS .
* Определение средних расходов на алкоголь по децильным группам.
MEANS
TABLES=potras alk alkp BY decilr
/CELLS MEAN COUNT STDDEV
/STATISTICS ANOVA .
* Изучение корреляционной структуры по децильным группам.
SORT CASES BY decilr .
SPLIT FILE
LAYERED BY decilr .
CORRELATIONS
/VARIABLES=prod pitres alk neprod uslug
/PRINT=TWOTAIL NOSIG
/MISSING=PAIRWISE .
CORRELATIONS
/VARIABLES=alkp prodp pitresp neprodp uslugp
/PRINT=TWOTAIL NOSIG
/MISSING=PAIRWISE .
SPLIT FILE
OFF.
* Вычисление стандартизированных значений расходов.
DESCRIPTIVES
VARIABLES=prod pitres alk neprod uslug /SAVE
/STATISTICS=MEAN STDDEV MIN MAX .
* Кластерное решение с 4 кластерами.
QUICK CLUSTER
Zalkp Zprodp Zpitresp Zneprodp Zuslugp
/MISSING=LISTWISE
/CRITERIA= CLUSTER(4) MXITER(100) CONVERGE(0)
/METHOD=KMEANS(NOUPDATE)
/SAVE CLUSTER DISTANCE
/PRINT INITIAL ANOVA CLUSTER DISTAN.
* Получение координат кластерных центров в исходных координатах
(не стандартизированных).
MEANS
TABLES=potras alk alkp BY QCL_3
/CELLS MEAN COUNT STDDEV
/STATISTICS ANOVA .
* Вычисление средних расстояний до центра кластера
(для определения "среднего диаметра" кластеров).
MEANS
TABLES=QCL_4 BY QCL_3
/CELLS MEAN COUNT STDDEV
/STATISTICS ANOVA .
* Наложение кластеров на основные группирующие переменные.
CROSSTABS
/TABLES=ter mest chisl chisd decilr BY QCL_3
/FORMAT= AVALUE TABLES
/STATISTIC=CHISQ
/CELLS= COUNT ROW
/COUNT ROUND CELL .
* Вычисление среднего размера натуральных поступлений по кластерам.
MEANS
TABLES=natdox BY QCL_3
/CELLS MEAN COUNT STDDEV
/STATISTICS ANOVA .
Номер кластера
1
2
3
4
Aлтайский край
10.9
52.3
32.3
4.5
5.3
29.3
61.5
3.9
19.1
34.6
38.1
8.2
26.6
14.4
56.3
2.8
7.2
51.6
34.2
7.0
10.4
42.5
41.7
5.4
3.9
36.0
57.2
2.8
6.9
42.9
40.4
9.8
10.4
42.3
44.6
2.6
16.0
35.9
47.3
.8
9.4
42.2
41.8
6.5
12.7
35.1
48.6
3.6
7.0
37.4
46.9
8.7
7.7
23.2
65.3
3.8
6.3
19.2
71.5
3.0
6.6
31.9
58.7
2.8
12.2
34.0
43.5
10.4
9.7
34.8
49.9
5.6
7.2
23.0
61.0
8.7
6.3
18.8
62.1
12.7
11.7
50.7
31.4
6.2
20.6
49.8
28.5
1.1
.3
10.5
89.1
.0
7.4
36.1
53.6
2.9
10.8
28.5
56.5
4.2
5.5
41.1
47.0
6.3
16.8
36.4
40.2
6.6
29.0
26.6
44.4
.0
10.8
39.2
37.5
12.5
13.1
35.1
39.5
12.4
11.8
27.0
55.2
6.0
9.9
36.1
44.9
9.0
14.5
37.8
45.9
1.9
5.8
28.2
63.2
2.7
7.7
20.1
62.0
10.2
9.4
19.2
63.4
8.0
10.0
43.1
42.1
4.8
16.5
16.3
62.9
4.2
4.6
16.6
71.1
7.6
5.6
21.5
64.0
9.0
8.5
48.5
32.3
10.8
7.5
21.0
62.5
8.9
10.8
32.5
47.5
9.2
10.4
32.1
51.6
6.0
7.0
49.4
38.9
4.7
7.4
44.6
44.0
4.0
14.2
19.8
63.5
2.5
10.3
32.4
44.9
12.4
29.4
34.4
35.3
.9
12.5
26.5
55.8
5.3
9.2
34.7
49.8
6.3
7.2
22.2
68.9
1.8
6.8
25.5
63.0
4.7
12.9
30.5
54.7
2.0
9.0
36.2
43.0
11.8
9.1
11.1
75.9
3.8
6.6
38.6
52.5
2.3
12.4
40.3
33.5
13.8
6.2
15.0
76.1
2.7
10.4
42.6
39.8
7.1
7.9
60.7
26.1
5.3
9.6
56.9
26.4
7.1
4.8
23.8
65.2
6.2
7.7
39.2
47.5
5.7
12.3
38.5
43.3
5.9
14.2
45.4
39.8
.6
18.3
29.5
50.1
2.1
9.9
35.3
49.1
5.7
5.2
35.1
56.3
3.5
9.7
44.9
42.8
2.6
13.4
33.7
45.7
7.2
3.0
27.4
64.8
4.8
1.7
28.0
68.8
1.5
11.1
43.0
41.9
4.1
9.0
36.5
50.3
4.1
12.8
26.6
53.9
6.7
11.1
34.8
49.8
4.3
10.4
35.5
45.6
8.5
13.4
31.6
49.4
5.7
2.2
28.8
67.2
1.7
5.4
36.6
54.5
3.5
7.7
31.6
53.8
6.8
11.1
47.1
40.1
1.8
9.0
46.8
30.5
13.7
11.4
60.1
21.2
7.3
17.0
32.7
44.6
5.8
9.5
49.4
35.9
5.2
14.0
47.4
34.1
4.5
Итого
9.6
33.9
50.5
6.0
[1] Для сравнения, исследование RLMS фиксирует данные о расходах за неделю перед опросом, при этом дневниковых записей домохозяйства не ведут.