Повторяемость слов в текстах поп-песен
Коллин Моррис задался вопросом: как много повторяемых слов в поп-песнях? Для этого он проанализировал тексты 15 тысяч синглов из рейтинга Billboard Hot 100 с 1958 по 2017 год.
Моррис использовал один из алгоритмов Лампеля—Зива (Lempel-Ziv), используемых в архиваторах файлов. В данном случае алгоритм ищет повторяющиеся проходы, слова и выражения. Затем алгоритм удаляет такие обороты, уменьшая общий объем песни. В конечном результате средняя песня из Billboard Hot 100 сократилась на 50%.
Исполнители, с самыми повторяющимися словами в песнях:
- Rihanna — 65% (все песни исполнителя можно сократить почти на 65%);
- Beyonce и Britney Spears — 60%;
- One Direction — 59%;
- Madonna — 58%;
- Michael Jackson и Mariah Carey — 57%.
Исполнители, в чьих песнях повторений меньше всего:
- Frank Sinatra — 35%;
- Elvis Presley — 36%;
- Billy Joel и Brad Paisley — 38%;
- Ray Charles, Connie Francis, John Denver — 39%;
- George Strait — 40%.
Самые повторяемые песни:
- Around The World — Daft Punk, 1997 — 98%;
- The Rockafeller Skank — Fatboy Slim, 1998 — 95%;
- Chain Of Fools (Part 1) — Jimmy Smith, 1968 — 92%.
2014 год стал самым «повторяемым» годом. Средняя песня из этого года на 22% более повторяема, чем песни 1960 года.
Статья Морриса с подробностями и интерактивной визуализацией: Pudding