Сразу после бана Трампа в Твиттере в США начало резко снижаться число выявляемых заболеваний коронавирусом
К вопросу о странных совпадениях в данных и безумных корреляциях:

К вопросу о странных совпадениях в данных и безумных корреляциях:
Медуза: «Росстат 8 февраля опубликовал данные о смертности в России за 2020 год. Из них следует, что в стране с апреля и по 31 декабря избыточная смертность составила 358 тысяч человек. Ранее вице-премьер Татьяна Голикова признала, что избыточная смертность на 81% связана с коронавирусом (...). Между тем по более детализированным данным департамента здравоохранения Москвы, с вирусом связаны 98—100% „избыточных смертей“. Если считать, что на самом деле почти вся избыточная смертность вызвана эпидемией, можно предположить, что смертей (...) было в 6,3 раза больше, чем 57 тысяч, о которых официально говорили власти. Это значит, что Россия в 2020 году заняла второе (после США) место по числу жертв коронавируса и вошла в пятерку самых пострадавших из расчета на душу населения. А к началу февраля, скорее всего, Россия вышла на первое место в мире по числу смертей на 100 тысяч населения».
В прошлом году было много дискуссий о том, стоит ли вводить строгие ограничения, чтобы спасать жизни, или наоборот, не стоит вводить строгие ограничения, чтобы спасти экономику.
Chartr построили график смертности от COVID и ожидаемого реального роста/падения ВВП за 2020 год для 50 стран с наибольшим количеством смертей от COVID-19.
Этот упрощённый анализ показывает небольшую отрицательную корреляцию между ростом ВВП и числом смертей от коронавируса.
Что тут причина, а что следствие, и есть ли вообще причинность, неясно, но точно понятно, что нет выбора «экономика или жизни». Можно спасать и то, и другое. Как можно и провалить и то, и другое.
Авторы при помощи нескольких интерактивных примеров и диаграмм демонстрируют:
— как мультиплицируется эффект даже ненадёжных масок
— как распространение вируса зависит от доли использующих маски людей
— как коэффициент репродукции R0 зависит от ношения масок разной эффективности
— как число заражённых зависит от R0 и эффективности масок
Есть видеоверсия:
Есть такой контринтуитивный закон Бенфорда или закон первой цифры см. этот пост. Если очень упрощённо, то в природе существуют такие наборы случайных данных, в которых первая цифра будет единицей примерно в 6 раз чаще, чем девятка.
Интуитивно кажется, что первая цифра в наборе случайных данных должна быть любой от 0 до 9 с равной вероятностью. Но это не так. И этот закон применяют, например, для выявления мошенничества с финансами.
Так вот, пользователь Реддита применил этот закон к данным о числе новых случаев заболевания короной в Германии, Великобритании, США и России. По горизонтали — первые значащие цифры, по вертикали — частота их появления.
Судя по диаграмме, подтасовки статистики нет только в Германии. И в России статистика самая неестественная из этих четырёх стран.
21 сентября число зарегистрированных смертей от COVID-19 в США превысило 200 тысяч. Визуализация сделана по данным New York Times, Covid Tracking Project и Centers for Disease Control and Prevention.
Страны находятся рядом и во многом схожи. Но в Швеции ограничительные меры были сильно мягче, чем у соседей и носили скорее рекомендательный характер, без обязательных карантинов и полноценного локдауна.
По данным ЗАГСа в июне 2020 года в Петрербурге умерло 7106 человек — печальный рекорд за 10 лет, больше 2000 смертей сверх среднего.
Берегите себя. Оставайтесь дома, если можете. Носите маски и респираторы в общественных местах и транспорте. Эпидемия не закончена, что бы вам не рассказывали чиновники и официальная статистика заболеваемости коронавирусом.
Источник данных / картинка отсюда
Вот ещё картинка канала @grafstat с данными о смертности в Питере по месяцам за 10 лет
Выпустить на рынок вакцину обычно занимает годы, потому что это сложный многоступенчатый процесс. Для коронавируса исследователи пытаются ускорить этот срок. New York Times запустили трекер разработки вакцин.
Сейчас в нём более 143 кандидатов. Вот, как они разделились по категориям на сегодняшний день:
5 вакцин идёт по программе WARP Speed (буквально — сверхсветовая скорость). Это программа Правительства США для ускоренной разработки, включающая финансирование на миллиарды долларов и сниженные требования тестированию.
125+ вакцин на стадии доклинического тестирования. Учёные дают вакцину животным, чтобы проверить, вызывает ли она иммунную реакцию.
8 вакцин на фазе испытания безопасности. Вакцину дают небольшому количеству людей для проверки безопасности и дозировки, а также для подтверждения того, что она стимулирует иммунную систему.
8 вакцин на стадии расширенных испытаний. Учёные дают вакцину сотням людей, разделённых на группы. Проверяется безопасность вакцины и её способность стимулировать иммунную систему.
2 вакцины на стадии испытания эффективности. Вакцину дают тысячам людей и ждут, сколько из них заразится, по сравнению с добровольцами, получившими плацебо. Эти испытания могут определить, защищает ли вакцина от коронавируса.
0 вакцин на стадии одобрения. Регулирующие органы в каждой стране рассматривают результаты испытаний и принимают решение об утверждении вакцины. Во время пандемии вакцина может получить разрешение на чрезвычайное использование до получения официального одобрения.
При этом носители, которые контактируют с другими только вне помещений, почти никого не заражают.
По подсчётам «Медиазоны», среднее число смертей в мае за последние 10 лет составило 9 777. В этом году за этот месяц умерло на 5 936 человек больше.
По данным мартовского опроса в 23 странах на четырех континентах от 16% до 58% людей отвечали «да» на вопрос «вы верите, что иностранная держава или другая сила намеренно распространяет коронавирус?»
За время пандемии я видел десятки диаграмм и интерактивных визуализаций на тему. Но то, что сделали в «Лаборатории данных» — лучшее. Это датавиз высочайшего класса — наглядный, понятный и осмысленный.
Ребята создали интерактивные обновляемые диаграммы, где можно посмотреть:
— рейтинг стран по количеству выявленных случаев и выявленных смертей в динамике
— динамику выявленных случаев во времени по странам
— динамику роста во времени по странам
— сводную статистику по России и по США
— количество случаев по регионам России и штатам США
Тот график с данными за 16-27 января предсказывал более 16000 заболевших 30 января при сохранении геометрической прогрессии. Фактически к позднему вечеру 30 января было выявлено 9776 новых случаев, то есть в полтора раза меньше.
Пока что число заражений растёт в геометрической прогрессии: каждый заражённый в среднем заражает ещё 2,5 человека.
Коронавирус — острое вирусное заболевание с поражением верхних дыхательных путей. Инкубационный период инфекции, по приблизительным данным Минздрава, составляет от 2 до 14 суток. Основные симптомы: повышение температуры тела; кашель (сухой или с небольшим количеством мокроты); ощущение сдавленности в грудной клетке; одышка.