Lista Przebojów Trójki

Lista Przebojów Trójki to chyba najpopularniejsza lista przebojów w Polsce, a z pewnością najstarsza. Zobaczmy czego możemy się dowiedzieć z całej jej historii.

Potrzebne będzie kilka pakietów R (do pobrania danych dodatkowo rvest):

Pobranie danych

Skorzystamy z archiwum Listy Trójki zebranym na stronie LP3.pl – klikając w kolejne numery notowań po prawej stronie widzimy, że zmienia się adres strony według schematu http://www.lp3.pl/alpt.phtml?m=1&nn=XXX gdzie XXX to kolejny numer (niekoniecznie notowania). Trzeba znaleźć największy numer (najnowsze notowanie) i przejść przez kolejne strony (kolejne XXX od jeden do tej największej liczby).

Analiza kodu HTML strony pozwala na wybranie odpowiednich jej fragmentów i tym samym zgromadzenie danych. Szczegółowym kodem nie będę zamęczał – znajduje się na GitHubie. Pojawiają się pytania od Was jak scrappować strony – być może przygotuję o tym kiedyś dedykowany wpis techniczny (choć wolę przygotowywać analizy :). Dane zapisałem w pliku lokalnym.

Swoją drogą na LP3.pl znajdziecie część z poniższych analiz.

Przygotowanie danych do dalszych analiz

Pod uwagę weźmiemy tylko piosenki z pełnego notowania (miejsca 1-30, z pominięciem poczekalnii). Aby było sprawiedliwie na przestrzeni całej historii zamiast miejsc na liście użyjemy punktacji, którą sami nadamy: 30 punktów za pierwsze miejsce, 29 za drugie itd. Tak samo nadawane są punkty podczas rocznych podsumowań Listy.

Czas zatem na…

Analizy

Mając tak przygotowane dane możemy przejść do tego, co najciekawsze.

Prowadzący notowania

Każde notowanie w serwisie LP3.pl to nie tylko informacje o pozycji konkretnych piosenek, ale też jego numer, data i osoba prowadząca. Lista Trójki kojarzy się przede wszystkim z Markiem Niedźwieckim. Zobaczmy jak dużo notowań prowadził:

Zdecydowaną większość. A jak wyglądał podział notowań w roku pomiędzy poszczególnych prowadzących? Wybieramy tylko tych, którzy prowadzili najwięcej, resztę wrzucimy do worka “inni”:

Widać, że w 2007 roku Marka zastąpił Piotr Baron. Niedźwiecki wrócił do Listy w 2010 roku i od tego czasu Listę prowadzi na zmianę z Baronem (plus sporadycznie innymi osobami, głównie Piotrem Metzem). I to się zgadza, bo przez pewien czas (od grudnia 2007 do końca marca 2010) Niedźwiecki pracował w Radiu Złote Przeboje.

Lista przebojów wykreowała osobowości radiowe, ale Lista to przede wszystkim piosenki. Przyjrzyjmy się więc im.

Piosenki

Najpoularniejsze piosenki (top wszech czasów)

Jaka piosenka była tą najlepszą w prawie 30 latach? Może ta, która najczęściej była na pierwszym miejscu? A co z tymi, które były ciągle drugie? Dlatego właśnie użyjemy punktów. Utwór mógł być na liście bardzo długo, a nigdy nie dotrzeć na szczyt – to oznacza, że był popularny i lubiany, a nie miał szczęścia.

Bezapelacyjnie króluje piosenka Queenu. Zwróćcie uwagę na piosenkę Gotye – będzie o niej trochę dalej.

Najpopularniejsze polskie piosenki

Powyżej pojawiło się kilka polskich utoworów, ale zobaczmy pełne polskie top 30:

Niesamowite jest to, że piosenka stosunkowo “młoda” (jak na historię listy) znalazła się na trzecim miejscu. I jakże inna jest to piosenka w porównaniu z Perfectem – to już inne pokolenie słuchaczy. Warto zwrócić również uwagę na “Wojenkę” Lao Che.

Najpopularniejsze piosenki roku

Sprawdźmy teraz jakie były hity rok po roku:

Najpopularniejsze polskie piosenki roku

I jeszcze to samo dla samych polskich utworów:

Przejdźmy do wykonawców.

Wykonawcy

Może być tak, że ktoś nagra hit, który zdobędzie popularność w krótkim czasie, a później nikt o nim nie pamięta. Gotye to idealny przykład (chociaż wolę podawać za przykład Macarenę, która swego czasu pobiła rekord ilości notowań na szcycie Billboardu).

Najpopularniejszy artysta listy

Tutaj widać gust muzyczny słuchaczy Trójki. I jakże on się różni od najpopularniejszych piosenek! Queen jest dopiero 28, chociaż wygrał w kategorii najlepszy utwór. Widać więc, że liczy się nie tyle jedna piosenka co cały ich zestaw, najlepiej przez wiele lat. Queen nie miał tego szczęścia – Freddie zmarł w 1991 roku i od tego czasu Queenu właściwie nie ma. Kolejne piosenki zapewne poprawiłyby wynik zespołu. Podobnie jest z polską Republiką – również ustąpiła miejsca innym po śmierci Ciechowskiego. Ehh… o każdym z tych wykonawców mógłbym długo i namiętnie. Cóż, kocham muzykę i jest chyba najważniejszą dziedziną sztuki dla mnie.

Najpopularniejszy polski artysta całej listy

Tradycyjnie sprawdźmy najlepszych polskich wykonawców:

Przygotujmy sobie listę najlepszych artystów, z której będziemy korzystać później. Nie jesst to pełne Top 30 – kolejne wykresy będą mniejsze i bardziej czytelne.

Forma artystów na przestrzeni lat

Teraz wybierzemy artystów, których piosenki były na liście przez co najmniej 15 lat i sprawdzimy ile punktów zdobyli (wszystkie ich piosenki) w poszczególnych latach. Da to jakiś obraz tego jak przebiegała historia popularności wykonawcy.

Tym razem z punktów przeszliśmy na miejsce na liście (same punkty dałyby straszliwie rozstrzeloną skalę osi Y). Widzimy oczywiście, że niektórzy przestali pojawiać się na liście, a inni pokazali się dopiero w pewnym momencie (Coldplay, Hey, Myslovitz).

Wynik artysty dla kolejnych notowań

Teraz coś podobnego (dla wybranej dwunastki najlepszych) – suma punktów zdobytych w kolejnych notowaniach:

Wykresy są bardziej “dynamiczne” w pionie – przeliczenie punktów na kolejność na liście spłaszczyło wykresy.

Kult swój szczyt miał w okolicy 1998-2000 roku, ostatnio jest znowu bardziej lubiany. Maanam się skończył, podobnie jak Republika (tutaj akurat nie jest to dziwne). Śmiem twierdzić, że Metallica zyskuje głównie przez sentyment i wiek głosujących – ci, którzy byli w liceum w czasie “Master of Puppets” albo czarnej płyty głosują teraz na nowe utwory (które na ostatniej płycie są całkiem całkiem).

Analiza poszczególnych artystów

Przyjrzyjmy się historii wybranego artysty na przestrzeni lat. Wybrałem Maanam ze względu na liczbę piosenek notowanych na liście.

Najpopularniejsze piosenki w danym roku

Dlaczego “Luciola ’99” występuje w 1999 i 2000 roku? Pewnie weszła do notowania pod koniec 1999 i jednocześnie była jedyną (albo najlepszą) piosenką Maanamu w tym roku – zerknięcie w dane pokazuje, że zadebiutowała 3 grudnia 1999 (załapała się na 4 notowania w 1999), z listy wypadła w marcu 2000. W 2000 była na liście dłużej (niż w 1999) i wyżej (najwyżej na 8 miejscy w styczniu 2000).

Sprawdźmy jak poszczególni wykonawcy zdobywali popularność (albo raczej punkty na liście):

Skumulowana liczba punktów per wykonawca

Najwyżej jak do tej pory jest U2. Hey i Kult w ostatnich kilku latach idą łeb w łeb mijając się na drugim i trzecim miejscu. Ale ten wykres jest nieco mylący: nie widać tempa zmian, bo poszczególne linie zaczynają się w różnych momentach. Zróbmy tak, żeby wszystkie linie zaczynały się w tym samym miejscu:

I tutaj widać ciekawostkę: Hey potrzebował mniej więcej rok mniej niż Kult aby dojść do tego samego poziomu. I jeśli Hey będzie podążał tą samą drogą to za rok, może dwa przebije U2 (o ile U2 nie zrobi kilku hiciorów, a nowa płyta ponoć 1 grudnia tego roku, pierwszy singiel już za kilkanaście dni).

Najlepsze lata wykonawców

Możemy zobaczyć jak wyglądała liczba punktów zdobytych przez artystów w poszczególnych latach – to daje obraz tego, kiedy artyści byli “na fali”.

Hey świetnie zadebiutował i pociągnął passę pierwszymi płytami (było notowanie, gdzie “Dreams” i “Teksański” były w pierwszej trójce, później “Misie”, “Ja sowa” i “Ho”), teraz wracają (płytą, która do mnie nie dociera – chyba za mało słucham nowości, a ciągle wierzę w to, że najlepsze płyty najtrudniej wchodzą).

Maanam i Republika to najlepsze polskie kapele tal 80, bezapelacyjnie. Depeche Mode pozamiatało 2006 rok głównie singlem “Martyr” oraz “John the Revelator”. U2 to z kolei wielki sukces płyty “POP” (po “Achtung baby!” moja ulubiona, a słabo znana wśród znajomych) i singlem “Sweetest Thing”. Kult najwięcej zgarnął za piosenki z “Ostatecznego krachu systemu korporacji”.

Największe hity wykonawców

Zobaczmy jeszcze liczbę punktów zdobytych przez poszczególne piosenki wybranych artystów – która piosenka była największym hitem?

Hity

Czas na analizę hitów. Najpierw tych z pierwszego miejsca:

Najczęściej na 1 miejscu

To będzie fajne:

Artist Title n
GOTYE FEAT. KIMBRA Somebody That I Used to Know 18
LAO CHE Wojenka 14
QUEEN These Are the Days of Our Lives 14
BRYAN ADAMS (Everything I Do) I Do It for You 11
MADONNA Frozen 11
ARTUR ROJEK Syreny 10
DIRE STRAITS Brothers in Arms 10
ANITA LIPNICKA I wszystko się może zdarzyć 9
DEPECHE MODE Heaven 9
DEPECHE MODE Where’s the Revolution 9
KULT Gdy nie ma dzieci 9
LUXTORPEDA Wilki dwa 9
MICHAEL JACKSON FEAT. SLASH Give in to Me 9
PET SHOP BOYS It’s a Sin 9
EDYTA BARTOSIEWICZ Sen 8
EUROPE The Final Countdown 8
GUNS N’ ROSES Don’t Cry 8
JAROMÍR NOHAVICA Minulost 8
METALLICA Whiskey in the Jar 8
NO DOUBT Don’t Speak 8

Wygrywa Gotye. Jednorazowy hicior był najczęściej na pierwszym miejscu w całej historii Listy Trójki. Bijąc na głowę (4 notowania więcej na pierwszym miejscu) najlepszą piosenkę Listy (“These Are the Days of Our Lives”).

Ale czy pierwsze miejsce to jest jakiś wyznacznik? Wspominałem Makarenę. Może trzeba policzyć pierwszą trójkę?

Najczęściej w Top3

Artist Title W top3 1 2 3
QUEEN These Are the Days of Our Lives 27 14 9 4
GOTYE FEAT. KIMBRA Somebody That I Used to Know 26 18 5 3
GUNS N’ ROSES Don’t Cry 23 8 9 6
ARTUR ROJEK Syreny 20 10 5 5
DEPECHE MODE Where’s the Revolution 19 9 6 4
ORGANEK Mississippi w ogniu 19 6 9 4
LAO CHE Wojenka 18 14 3 1
U2 Ordinary Love 18 4 10 4
DEPECHE MODE Heaven 17 9 4 4
LUXTORPEDA Wilki dwa 17 9 3 5
METALLICA Whiskey in the Jar 17 8 7 2
KULT Dziewczyna bez zęba na przedzie 17 5 5 7
MICHAEL JACKSON FEAT. SLASH Give in to Me 16 9 2 5
FISZ EMADE TWORZYWO FEAT. JUSTYNA ŚWIĘS Ślady 16 7 7 2
KAZIK 12 groszy 16 6 7 3
BRYAN ADAMS (Everything I Do) I Do It for You 15 11 3 1
MADONNA Frozen 15 11 3 1
DIRE STRAITS Brothers in Arms 15 10 3 2
EUROPE The Final Countdown 15 8 5 2
ARTUR ROJEK Beksa 15 7 6 2
BON JOVI Born to Be My Baby 15 6 5 4
KULT Prosto 15 6 3 6
MYSLOVITZ Długość dźwięku samotności 15 6 2 7
VOO VOO Gdybym 15 5 4 6
BRODKA Varsovie 15 2 9 4

Tutaj sytuacja jest już bardziej wyprostowana. Zaskakują wysokie pozycje dwóch nowych piosenek Depeche Mode oraz Rojek, Lao Che i Organek. “Brothers in Arms”, która jest zazwyczaj w top 3 każdego “Topu wszech czasów” w pierwszej trójce kolejnych notowań była tylko 15 razy.

Czy są jakieś jednorazowe hity? Czyli takie piosenki, które wpadły na szczyt, ale tylko raz (na szczycie właśnie) były w pierwszej piątce?

Artist Title
CHŁOPCY Z PLACU BRONI Kocham Cię ’93
LECH JANERKA Ramydada

Kto był

Najdłużej na liście

Przy okazji: poniższy kod nadaje się doskonale do rysowania wykresów Gantta.

W nawiasie liczba notowań, w których dany utwór wystąpił.

Odrzućmy pierwsze trzy (były na liście przez kilka tygodni, wypadały i wracały na listę po kilku latach – stąd takie wyniki) i przyjrzyjmy się kolejnym pozycjom dla czwartej piosenki:

To samo dla Gotye:

Spróbujmy czegoś więcej: przygotujmy jakieś wskaźniki. Na przykład jak wygląda (i czy jest) wpływ liczby piosenek na liście z osiągniętą średnią liczbą punktów.

Górna lewa ćwiartka to w pewnym sensie fenomenalni artyści: prawie każda ich piosenka okazywała się hitem (było ich mniej, ale były wyżej). Górna prawa część to wyjadacze, sprawdzone maszyny – dużo numerów, dobrze odbieranych przez słuchaczy.

Sprawdźmy coś podobnego dla konkretnych utworów:

Liczba notowań a liczba na pierwszym miejscu

Czy im dłużej piosenka jest na liście tym większe ma szanse na pierwsze miejsce?

Dla tych co były najczęściej na pierwszym miejscu:

Nie powiedziałbym, że istnieje taka zależność. Można być na Liście długo i nie trafić na pierwsze miejsce.

Te same dane można przedstawić niego inaczej, czyli

Jaki procent notowań dana piosenka była na pierwszym miejscu?

Tutaj Lao Che (ze świetną piosenką) pobiło Gotye. Najlepszy utwór (piosenka Queenu) tylko przez 1/4 notowań była na pierwszym miejscu – sprawdza się więc teza, że punkty mają sens.

Jak długo piosenki są na liście?

Średnio piosenka jest na liście przez 9.3 notowań, przy medianie 8. Najdłużej (w sensie liczby notowań) było ARCHIVE z “Again” (70 razy).

Ile czasu zajmuje dotarcie do pierwszego miejsca?

Średnio piosenka dociera do pierwszego miejsca po 5.8 notowaniach przy medianie 5. 3/4 piosenek robi to w 7 notowań, zaś najdłużej zajęło to (28 notowań) STING – Fragile.

Zobaczmy historię tego Stinga:

Na pierwszym miejscu debiutowały:

Artist Title
JON & VANGELIS I’ll Find My Way Home
REPUBLIKA Tak długo czekam (Ciało)
EDYTA GÓRNIAK To nie ja
PRZYJACIELE KARPIA IV Karp IV — Restauracja
ARTUR ANDRUS Ballada o Baronie, Niedźwiedziu i Czarnej Helenie
ADELE Skyfall
KULT Prosto
ARTUR ROJEK Beksa
ARTUR ROJEK Syreny
LAO CHE Wojenka
ADELE Hello

Przy czym zaznaczyć trzeba, że Jon & Vangelis to pierwsze miejsce z pierwszego notowania.

Tagi

Możemy zabawić się w złączenie danych z innym źródłem. Na przykład z informacjami o piosenkach z LastFM.

Dodanie tagów z LastFM

O LastFM pisałem kilka miesięcy temu, poszukajcie stosownych wpisów. Dla każdej z piosenek pobierzemy tagi jakimi została opisana w serwisie LastFM.

Mając otagowane kolejne piosenki możemy zobaczyć jaki był

najpopularniejszy tag

oraz

najpopularniejszy tag w poszczególnych latach

To “80s” to trochę nieszczęśliwy tag (może należało brać drugi tag w kolejności, a nie tylko pierwszy?). Warto też skorzystać z innego źródła, na przykład ze Spotify. Sporify da nam też informacje o kilku parametrach piosenek, co również może być ciekawe (czy tempo, energia i inne numeryczne wartości mają wpływ na wynik na liście? Czy jest jakaś zależność?). Ale to pozostawiam już Wam. Warto zerknąć na jeden z wcześniejszych wpisów.

Dla zainteresowanych: kod źródłowy w R na GitHubie, razem z danymi.

3 myśli na temat „Lista Przebojów Trójki

Dodaj komentarz