Рациональные числа

Интересная статистика и данные из разных областей

Измерение неравенства: что такое коэффициент Джини?

Коэффициент Джини является наиболее распространённым показателем неравенства. Но что он на самом деле измеряет? И чем он отличается от других показателей неравенства?

Коэффициент Джини, или индекс Джини, является наиболее распространённым показателем неравенства. Он был разработан итальянским статистиком Коррадо Джини (1884—1965 гг.) и назван в его честь

Обычно он используется для измерения неравенства доходов, но также может применяться для измерения неравенства любого распределения — распределения богатства или даже ожидаемой продолжительности жизни

Неравенство измеряется по шкале от 0 до 1, где более высокие значения указывают на более высокий уровень неравенства. Иногда этот показатель может быть представлен в процентах от 0 до 100%, тогда он называется «индексом Джини»

Значение 0 означает полное равенство, когда все имеют одинаковый доход. Значение 1 означает полное неравенство, когда один человек получает весь доход, а все остальные — ничего

Как рассчитывается коэффициент Джини?

Существует два основных способа расчёта коэффициента Джини. Оба приводят к одним и тем же значениям, но дают нам два представления о том, что именно измеряет коэффициент

Метод 1: Расчёт разницы между доходами двух человек по отношению к среднему значению

Первый метод можно проиллюстрировать следующим мысленным экспериментом

Представьте двух людей, случайно столкнувшихся на улице. Они сравнивают свои доходы и выясняют, насколько один из них богаче другого. Насколько большую разницу можно ожидать?

Этот ожидаемый разрыв между двумя случайно выбранными людьми и измеряется коэффициентом Джини. Он рассчитывается как среднее значение разрыва между всеми парами людей в населении

Если доходы распределены равномерно, то можно ожидать небольшой разрыв между доходами двух случайно выбранных людей. Там, где высокий уровень неравенства, мы можем ожидать большой разрыв

Однако, если измерять этот показатель в абсолютном выражении, он также будет зависеть от богатства населения в целом. Если даже самые обеспеченные представители населения имеют низкий доход, то абсолютный разрыв между доходами людей будет маленьким. И наоборот — там, где доходы в целом высоки, даже небольшая относительная разница (напрмер, в %) будет означать большой разрыв в абсолютных показателях

По этой причине коэффициент Джини учитывает также средний доход среди населения

В частности, он рассчитывается как ожидаемый разрыв в пределах удвоенного среднего дохода. Для простоты представим, что всё население состоит из тех двух человек, встретившихся на улице. Если их общий доход составляет 100 $, то средний по населению будет 50 $. Если доход первого составляет 100 $, а второго — 0 $, разница в доходах будет равна 100 $, что как раз в два раза больше среднего уровня дохода

Таким образом, наибольшее возможное значение среднего разрыва, то есть удвоенный средний доход — ситуация абсолютного неравенства. Все доходы принадлежат одному человеку, а остальные вовсе не имеют дохода — коэффициент Джини равен 1

Наименьшее возможное значение среднего разрыва, то есть 0 — ситуация абсолютного равенства. Доходы всех людей равны — коэффициент Джини равен 0

Метод 2: Разрыв между «кривой Лоренца» и «линией идеального равенства»

Слева указана доля дохода, получаемая каждой пятой частью гипотетического населения. Справа — суммарные доходы всех групп населения. Получившийся справа график называется «кривой Лоренца»

Для населения, среди которого доходы распределены абсолютно равномерно, «кривая Лоренца» будет представлять собой прямую диагональную линию: 10% самых бедных будут получать 10% от общего дохода, 20% — 20% от общего дохода и т. д. Это показано на графике как «линия равенства»

Но среди населения, представленного на нашей диаграмме, доходы распределяются неравномерно. 60% населения с наименьшим доходом получает 30% от общего дохода

Коэффициент Джини показывает, насколько «кривая Лоренца» отклоняется от «линии равенства», сравнивая площади A и B на картинке. Отклонение рассчитывается следующим образом:

коэффициент Джини = A ÷ (A + B)

Если доходы распределяются абсолютно равномерно, «кривая Лоренца» будет совпадать с «линией равенства». Площадь A, как и коэффициент Джини, будет равна 0. Если один человек получает все доходы, а остальные не имеют никакого, «кривая Лоренца» совпадает с осью X — общие доходы будут сконцентрированы в конце графика. Площадь B будет равна нулю, а коэффициент Джини — 1

Сравнение показателей: Рассказывает ли показатель Джини ту же историю, что и другие показатели неравенства?

Показатели неравенства пытаются обобщить информацию о том, насколько распределение неравномерно — точно так же, как стандартное отклонение. В таких суммарных показателях заложены суждения о том, что именно должно иметь наибольшее значение при измерении неравенства

Для примера сравним два выдуманных общества. В первом богатые люди намного богаче тех, кто находится в середине распределения, но доходы более бедных лишь немного ниже тех, что получают в середине. Во втором — обратная ситуация: доходы богатых лишь немного выше доходов средних, но бедные намного беднее

В каком обществе выше неравенство? Ответ будет зависеть от того, какие разрывы в разных частях распределения считать вносящими наибольший вклад в уровень неравенства. Такие оценочные суждения неявно заложены в математические определения показателя неравенства

Это относится ко всем показателям неравенства, и коэффициент Джини не является исключением. Но его отличает более высокая чувствительность к изменениям в середине распределения, чем в самом верху и внизу

Особенности коэффициента Джини можно рассмотреть на примере четырёх стран. На диаграммах показано, как он соотносится с двумя другими показателями неравенства — долями дохода 1% и 10% самого богатого населения. Для наглядности приведена динамика с течением времени. По вертикали — разница в % относительно показателей 1900 года

Мы видим, что существенное изменение доли доходов 1% самых богатых сопровождается незначительным изменением коэффициента Джини. Это справедливо как для стран с растущим уровнем неравенства (США), так и для стран, где уровень неравенства снижается (Уругвай)

В то же время, коэффициент Джини гораздо точнее отслеживает долю доходов самых богатых 10%. Коэффициент Джини не чувствителен к изменениям только в самой верхней части распределения

Источник — Our World in Data

Число бесплатных и платных пользователей Дуолинго и поисковый интерес к сервису, 2021—2023

Слева — квартальный показатель ежедневных активных пользователей по всему миру, справа — число платных подписчиков. Снизу — поисковый интерес по запросу «duolingo» в США, где 100 — максимальное значение

Chartr

Тиражи ежедневных газет и число сотрудников газетных издательств в США + структура выручки The New York Times

На первой картинке слева — тиражи будничных (голубой) и воскресных (фиолетовый) выпусков всех газет в США с 1940 по 2020 год. Чёрный график справа — число сотрудников в газетных издательствах с 2000 по 2022 год

На втором изображении — годовые выручки издательства The New York Times с 2010 по 2022 год с разбивкой на:
— подписки на электронную версию (фиолетовый)
— подписки на печатную версию (зелёный)
— рекламу (синий)
— другое (серый)

Справа — 10 крупнейших издательств и платформ по числу платных подписчиков. Данные опираются на отчёты самих организаций, поэтому актуальны по состоянию с 2021 по 2023 год в зависимости от СМИ

Уровень шумового загрязнения и потери слуха в 50 городах мира, 2017

С возрастом люди постепенно теряют слух, но внешние факторы могут ускорить этот процесс. В исследовании Mimi аналитики рассчитали, насколько быстрее может начать ухудшаться слух людей из-за шумового загрязнения в крупных городах. Показатель потери слуха они выразили в годах и оценках от 0 до 1. Например, в Мюнхене из-за городского шума слух людей может быть на 12 лет старше реального возраста (оценка 0,17), а в Дели слух людей может ухудшиться на 20 лет раньше (оценка 1)

На диаграммах степень потери слуха обозначена длиной полосок, а размером спиралей — уровень шумового загрязнения. Второй показатель также выражен от 0 до 1. Круг в основании — сумма этих двух показателей. Красный цвет означает, что метрики выше среднего по миру, синий — ниже

Federica Fragapane

Статистика ментального здоровья в мире

На диаграммах и картах:
— Оценочное число людей, страдающих различными психическими заболеваниями, 2019
— Число психиатров на 100 тысяч человек, 2017
— Доля респондентов, сообщавших об эпиходах тревожного расстройства или депрессии на протяжении жизни, 2020
— Оценочное число людей, страдавших шизофренией за последний год, 2019
— Оценочное число людей с тревожным расстройством и подушевой ВВП в странах мира, 2019
— Соотношение оценочного числа людей с депрессивным расстройством среди мужчин и женщин в странах мира, 2019
— Соотношение оценочного числа людей с тревожным расстройством среди мужчин и женщин в странах мира, 2019
— Соотношение оценочного числа людей с шизофренией среди мужчин и женщин в странах мира, 2019
— Соотношение оценочного числа людей с биполярным расстройством среди мужчин и женщин в странах мира, 2019
— Соотношение оценочного числа людей с расстройством пищевого поведения среди мужчин и женщин в странах мира, 2019

Все оценочные данные основаны на результатах репрезентативных опросов, медицинских данных и статистическом моделировании

Остальные карты и диаграммы — в источнике

Our World in Data

Статистика изучения и покорения космоса человеком

На диаграммах:
— ежегодное число запущенных в космос объектов, 1957—2022
— общее число запущенных в космос объектов, 1957—2022
— количество полезного груза и корпусов ракет на разных орбитах, 1958—2022 (не учитываются обломки от запусков или столкновений)
— ежегодное число полётов человека в космос, 1961—2021
— общее число полётов человека в космос, 1961—2021
— общее число людей, летавших в космос, 1961—2021
— стоимость отправки 1 кг груза на низкую околоземную орбиту в зависимости от объёма груза, 1961—2021 (с поправкой на инфляцию)
— число обнаруженных околоземных астероидов разного размера, 1900—2022
— число обнаруженных экзопланет с разбивкой на методы, 1992—2022
— ежегодные бюджеты НАСА с поправкой на инфляцию, 1959—2022

Our World in Data

Куда Россия экспортировала нефть по морю, 28 января 2022 — 13 января 2023

Чёрный — Азия, розовый — Северная Европа, серый — Южная Европа, голубой — страны Средиземноморья, жёлтый — другие страны, бирюзовый — неизвестно

Необходимо учитывать, что указаны объёмы экспорта только при помощи танкеров

На второй диаграмме — выручка России от экспорта нефти в миллиардах $ с января по ноябрь 2022 года

Bloomberg

Как менялась стоимость контейнерных перевозок в мире и на 6 ключевых маршрутах, ... Рациональные числа Как менялась стоимость контейнерных перевозок в мире, 2017—2023

Freightos Baltic Index (FBX) — один из наиболее широко используемых индексов фрахтовых ставок. Аналитики Балтийской биржи и компании Freightos ежедневно изучают мировые ставки контейнерных перевозок на 12 мировых торговых линиях. Индекс выступает в качестве косвенного показателя для акций судоходства

На графике указаны медианные цены на перевозку 40-футового контейнера без охлаждения от порта до порта. По состоянию на 23 июня 2023 года стоимость составляла 1297$, что являлось самым низким показателем с 18 октября 2019 года (1237$)

Freightos Data

Рождаемость в Китае после начала применения и отмены закона «Одна семья — один ребёнок», 1980—2022

Закон «Одна семья — один ребёнок» был введён в Китае в 1979 году для контроля численности населения. В 2015 году был отменён из-за демографических и экономических причин, а также недовольства населения

Рождаемость на графике выражена в количестве новорождённых на 1000 человек в год

Chartr

Как менялся мировой рекорд по самому быстрому решению кубика Рубика 3×3×3, 2003—2023

16 июня 2023 года Макс Парк побил предыдущий рекорд, решив кубик Рубика за 3,13 секунды. Предыдущий рекорд был установлен китайцем Юшенгом Ду в 2018 году, которому для решения понадобилось 3,47 секунды

Chartr

Динамика количества успешных восхождений на Эверест, 1953—2022

29 мая 1953 года участники девятой британской альпинистской экспедиции первыми покорили высочайшую точку Земли. А теперь может случиться так, что вы будете стоять в очереди к вершине

Спад числа восхождений в 2015 был вызван крупной лавиной, а в 2020 причиной стали локдауны в связи с пандемией коронавируса. Пик случился в 2019 — 877 успешных восхождений

Chartr

Всеобщий географический и статистический карманный атлас 1908 года

В атласе показан многогранный срез мира и особенно Европы через призму разноплановых данных. Есть диаграммы с социальной, демографической, экономической, культурной, военной и культурной статистикой

Полный скан справочника в формате PDF. Выше самые интересные диаграммы и карты, остальное тут

Оди

Число заявлений о банкротстве корпораций в США, 2010—2023

Под корпорациями понимаются организации с активами/пассивами на сумму 2+ млн $ с государственным долгом или на сумму 10+ млн $ без госдолга

Синие шкалы на первой диаграмме — число банкротств с января по май каждого года, голубые шкалы — банкротства в остаток года. На второй диаграмме — ежемесячное число банкротств за последние 3,5 года

Chartr

Число носителей крупных языков мира, 2023

В качестве крупных были выбраны языки с 50 и более миллионами носителей, для которых этот язык первый. Цветами обозначены языковые семьи, диагональным текстом — языковая группа. Под названием каждого языка указано число носителей в миллионах

Kristin Blain

Как выглядела планета во время последнего Ледникового периода ≈ 26 000—19 000 лет назад

Картограф Перрин Ремонте составил снимок Земли того времени, используя данные об уровне моря и ледниках, полученные в ходе исследований 2014 и 2021 годов, а также современные топографические данные

Белым цветом обозначена площадь суши в наши дни, серым — площадь суши в Ледниковую эпоху, голубым — площадь ледяного покрова

Visual Capitalist

Ранее Ctrl + ↓