Рациональные числа

Интересная статистика и данные из разных областей.

Ctrl + ↑ Позднее
7 апреля   население

Снижение экстремальной нищеты

Ниже несколько диаграмм о том, как менялась бедность в конце 20 и начале 21 веков.

Распределение бедных людей по уровням дохода, 1981—2013: мир, в процентах:

Распределение бедных людей по уровням дохода, 1981—2013: мир, по числу людей:

Распределение бедных людей по уровням дохода, 1990—2013: Африка к югу от Сахары, по числу людей:

Распределение бедных людей по уровням дохода, 1984—2013: Китай, по числу людей:

Все они из этого материала: OurWorldinData

7 апреля   бедность   Доход

Явка на выборах 1620%

Чарльз Данбэр Бёрджесс Кинг — либерийский государственный и политический деятель. Был президентом этой страны с 1920 по 1930 годы. В 1927 году он в очередной раз претендовал на пост президента Либерии во Всеобщих выборах.

И победил с невероятным результатом — он набрал 243 000 голосов, 96,43% от их общего числа. Правда, избирателей в стране было зарегистрировано на тот момент только 15 000. Через полвека, в 1982 году это достижение было занесено в Книгу рекордов Гиннесса в качестве выборов с самым высоким уровнем фальсификации.

Кинг пробыл президентом до 1930 года, когда ему пришлось пришлось подать в отставку под угрозой импичмента от Палаты представителей Либерии и угрозой введения внешнего управления страной со стороны Лиги наций.

7 апреля   выборы

Существует ли связь между орфографическими ошибками и негативными отзывами в интернете?

Текст основан на исследовании проекта Priceonomics, который анализировал данные своего клиента Datafiniti, который ведет базу данных товаров и отзывов на них.

Чтобы получить ответ на вопрос в заголовке, исследователи собрали 100 тысяч обзоров на тысячи разных товаров, а чтобы быть уверенными, что эти данные так сказать «стандартизированы», специально брались только те отзывы, которые имели текст и рейтинг (обычно это рейтинг в звездах, который показывает на положительный или негативный опыт). Анализируя собранную информацию, авторы оценивали три аспекта:
1. Длина отзыва,
2. Орфографические ошибки,
3. Грамматические ошибки.

Исследование показало, что негативные отзывы чаще имеют опечатки или орфографические ошибки и их авторы часто неправильно используют апострофы. Эти отзывы, как правило, длинные и включают в себя подробную информацию о товары и опыте его использования. Положительные отзывы с пятью звездами обычно короткие и без знаков пунктуации. Тест показал, что значительная часть авторов отзывов совершают много ошибок, как орфографических, так и грамматических. Только 61% отзывов успешно прошли все проверки.

Длина отзывов

Негативные рецензии в большинстве своем длинные и имеют больше ошибок, чем комментарии с положительным опытом.

Распределение отзывов по звездам
доля отзывов по каждой звездей

Отсюда видно, что абсолютное большинство проанализированных комментариев имеют высокий рейтинг — пять звезд. Понимание этого поможет правильно посмотреть на общую тенденцию и сделать некоторые сравнения, когда мы доберемся до конкретных деталей.

Теперь оценим длину отзывов. Эта зона наиболее разнообразна в собранных данных. Ряд обзоров на товары имеют очень короткие комментарии или даже суперкороткие (одно слово), тогда как другие могут спокойно соответствовать стандартам школьных эссе, как например отзыв с Amazon из 1028 слов на фильм «Темный рыцарь» 2008 года.

Чтобы можно было легче визуализировать отзывы по их длине, авторы исследования разделили их на три группы: до 25 слов включительно, до ста слов включительно и более ста.

Какой длины отзыв?
доля отзывов по каждому типу длины на основе количества слов

Как можно заметить, большинство рецензий попадают в категорию «до 25 слов включительно». Сложно сказать, насколько полезны короткие комментарии. При этом стоит отметить, что супер короткие отзывы (в одно слово) занимают примерно 1% из общего числа проанализированных обзоров.

Распределение длины отзывов по звездам

Отзывы с пятью звездами имеют большую долю коротких комментариев, тогда как отзывы с одной звездой, наоборот, содержат больше длинных обзоров. Тут виден явный тренд, что негативные отзывы длиннее. Это достаточно логично. При негативном опыте есть что-то, что пошло не так, например, товар мог быть доставлен уже сломанным, или он работал не должным образом, или просто плохого качества. С другой стороны, если товар работает должным образом, и пользователь доволен, то нет ничего, что заставило бы его писать длинный отзыв.

Орфографические ошибки

Следующим пунктом анализа стала орфография. При использовании проверки авторы исследования отмечали все опечатки, которые содержались в отзывах. Перед тем как анализировать ошибки и категории комментариев, стоит посмотреть на общую картину с орфографией.

Орфографические ошибки
доля отзывов с орфографическими ошибками

Оказывается, авторы рецензий не так уж плохи в орфографии — большинство (72%) отзывов вовсе не имеют ошибок. Доля ошибок постепенно снижается до 5% в обзорах, где есть три и более ошибок.

Теперь перейдем к уже знакомому анализу — картину с ошибками по категориям звезд.

Распределение отзывов с ошибками по звездам

Здесь прослеживается тенденция, когда негативные отзывы имеют большую долю комментариев с ошибками. Можно предположить, что это связано с длинной отзывов, так как негативные отзывы зачастую длиннее. Чем длиннее отзыв, тем больше возможностей сделать опечатку или ошибку.

Чтобы дополнительно скорректировать этот анализ, авторы рассмотрели понятие среднего количества ошибок.

Как часто совершаются орфографические ошибки
доля написанных с ошибками слов

Данные в таблице демонстрируют, что в положительных отзывах (четыре и пять звезд) реже всего встречаются ошибки. В отзывах с пятью звездами ошибки встречаются в 1,6% словах, тогда как в отзывах с одной звездой — в 2%. Разница между ними на самом деле ниже, чем в нашем предыдущем анализе. На самом деле, мы тут видим другой тренд — чаще ошибки встречаются в отзывах с тремя звездами — примерно в одном слове из 45 (2,2%).

Грамматические ошибки

Последняя категория этой проверки — грамматика. Здесь исследователи сосредоточились на правильном использовании апострофов и пунктуации.

Чтобы понять, что авторы рецензий правильно используют пунктуацию, был сделан специальный признак для сокращений, который показывал правильно используется апостроф или нет. Так, исследователи могли понять, написано «cant» или «can’t».

График ниже показывает долю авторов отзывов, которые сделали по крайней мере одну связанную с апострофом ошибку в распределении по рейтингу звезд. В конкретно этом случае были проанализированы только те комментарии, которые вообще имели апострофы (правильно или неправильно использованные), таких было около 14% от общего числа. Отзывы без этого символа в исследования включены не были вообще.

Используются ли апострофы правильно?
доля отзывов с отсутствующим апострофом по звездам

И снова можно заметить, что отзывы с пятью звездами имеют самый низкий коэффициент ошибок — 18%, тогда как в отзывах с одной звездой доля ошибок уже 20%. Но на самом деле самый высокий показатель по ошибкам с апострофами в отзывах с четырьмя звездами (29%).

Последний тест, связанный с пунктуацией, проверил, ставят ли авторы рецензий знаки препинания в конце предложения. Хотя предложения без какого-то окончания встречаются в интернете достаточно часто, это все-таки считается грамматической ошибкой.

Отзывы без знаков препинания в конце предложений

В комментариях с пятью звездами больше всего отсутствуют знаки в конце предложений, хотя разница с отзывами на три и четыре звезды не очень большая. Можно предположить, что это связано с длиной отзыва — авторы отзывов с одним или двумя словами реже ставят какой-то знак в конце своего комментария. Это показывает, что, хотя положительные отзывы имеют меньше орфографических ошибок, в них есть некоторое несоответствие требованиям письма.

Исследование продемонстрировало, что отзывы с пятью звездами имеют меньше всего орфографических ошибок, но в них больше грамматических ошибок — отсутствие знаков препинания в конце предложения. Отзывы с четырьмя звездами имеют больше ошибок с апострофом. В отзывах с одной звездой, наоборот, больше орфографических ошибок. Длина рецензии может быть фактором, который влияет на тип ошибок в положительных и негативных отзывах.

Антирекорд роботизации

Вдогонку к позавчерашнему посту о том, что половине трудоспособного населения России угрожает автоматизация. Этот риск если не нивелируется, то существенно снижается низкими темпами внедрения промышленных роботов в нашей стране.

Например, в 2016 году продажи промышленных роботов у нас обвалились на 40% по сравнению с прошлым — с 550 до 316 штук.

Для сравнения, в Китае, лидере промышленной роботизации, их было куплено за 2015 год 68 000 штук. В Японии, занимающей второе место, 35 000 штук. Всего в мире за 2016 год было поставлено 294 000 роботов.

Этот рынок оценивался в 35 млрд $ в 2016 году. Общее число промышленных роботов в мире составляло около 1,6 млн штук с прогнозом роста до 2,5 млн к 2019 году (данные Международной федерации робототехники, IFR).

При этом, вопреки опасениям, роботизация не сокращает, а создает рабочие места: в США за 2010—2015 годы было установлено 80 тысяч роботов и создано 230 тысяч новых рабочих мест, уровень занятости в роботизируемых производствах увеличился на 27%, а в Германии на 80 тысяч роботов, появившихся в промышленности, было создано 93 тысячи рабочих мест.

На диаграмме ниже показана динамика продаж промышленных роботов в России в 2005—2015 годах.

По материалу издания Хайтек.

3 апреля   работа   роботы

Только 0,9% россиян зарабатывает больше 120-150 тысяч ₽ в месяц

Банк ВТБ в маркетинговых целях заказал компании MARC Russia оценить число «состоятельных россиян» — людей с доходом выше 120 тысяч ₽ в месяц (150 для Москвы). Компания опросила пять тысяч человек в возрасте 18—69 лет в 100 городах.
«Состоятельных» оказалось меньше процента — 1,3 млн человек.
По данным Росстата за 2017 год средний доход населения в России составил 31,5 тысячу ₽, среднемесячная зарплата — 39 тысяч ₽.
Источник: РБК

1 апреля   зарплата

42 млн россиян угрожает автоматизация

Это 49,3% всего трудоспособного населения. Такую оценку даёт старший сотрудник лаборатории исследований корпоративных стратегий и поведения фирм РАНХиГС Степан Земцов в своей работе «Потенциальная роботизация и экономика незнания в регионах России».

Наибольшему риску автоматизации подвержены массовые рутинные рабочие места: продавцы, водители, грузчики, уборщики и охранники.

Источник и подробности в материале РБК.

1 апреля   работа   роботы

Отношение европейской молодежи к религии

По данным свежего опроса, результаты которого приводит The Guardian, в 12 европейских странах среди людей 16-29 лет преобладает атеизм: они не относят себя ни к одной религиозной вере. Лидирует Чехия, где атеистов 91%. В России этот показатель — 49%, мы на 13 месте.

Источник: The Guardian

Русские фильмы 1991—2018: сборы и оценка на Кинопоиске

Андрей Дорожный сделал интерактивную диаграмму, на которой расположил всё наше кино с сборами больше миллиона долларов.

Рекорд по сборам и оценке — «Движение вверх» 2017 года — 8,2 балла, почти 54 млн $.

Второе место по баллам — «Брат 2» 2000 года — собрал в России всего 1,08 млн $.

Интерактивная диаграмма (ссылки работают только на десктопе): DataWrapper

30 марта   кино

Мусор — проблема не только подмосковья, и даже не только России

Это глобальная проблема. За последние 10 лет человечество произвело пластика больше, чем за предыдущие 100. На каждого современного человека приходится около тонны пластикового мусора.

Сильно загрязнены океаны. Например, в Тихом океане плавает гигантская пластиковая помойка — Great Paсific Garbage Patch — площадью, по разным оценкам, от 700 тыс. до 15 млн км² (от 0,41 % до 8 % общей площади Тихого океана). Ещё её называют «Тихоокеанский мусороворот», потому что мусор находится в постоянном движении.

Суммарный вес мусора в Мировом океане оценивается в 268,940 тонн, а количество частиц мусора в 5,25 триллиона штук.

На диаграмме ниже дана оценка загрязнения Мирового океана пластиковым мусором по числу частиц в четырёх категориях размеров. Указана плотность в частицах на квадратный километр. Оценка дана по результатам 4 специальных экспедиций, проведённых в 2007—2013 годах.

23 марта   мусор   океан
23 марта   telegram
23 марта   смертность

Занятный факт про динамику явки на прошедших выборах Президента РФ

18 марта к 10 утра по Московскому времени явка составила 16,55%. А на прошлых выборах к 10 утра явка была такой:
2000 год — 6,36%,
2004 год — 8,01%, 
2008 год — 8,94%, 
2012 год — 6,53%.

Источник: РИА «Новости» по цитате Эллы Памфиловой, но эти данные почти вдвое расходятся с данными, опубликованными на сайте ЦИКа на данный момент: 9,79% явки на 10 утра.

Вот таблица с явкой по часам на сайте ЦИКа.

22 марта   выборы

Конверсия разных рекламных каналов

Аналитический сервис Heap проанализировал конверсию рекламы в сфере eCommerce и показал, какие рекламные каналы приносят большую конверсию в покупки. Анализ основан на пяти миллионах пользовательских сессий.

По конверсии лидируют поисковые системы: около 8% против 4,7% у Facebook и 3,1% у Instagram. Но по трафику лидерство у социальных медиа. Точные цифры смотрите на графиках.

Источник: heapanalytics

21 марта   медиа   реклама   соцсети
Ctrl + ↓ Ранее

© Кирилл Олейниченко, 2016—2018 РСС
Движок — Эгея