Genre Latin dan Pop Paling Menonjol, Ribuan Lagu Lain Kalah Bersaing di Data Spotify

Author: Redaksi Android62

Genre dan ciri audio ternyata sama-sama memberi sinyal kuat tentang lagu yang paling mudah menarik perhatian. Dalam analisis terhadap lebih dari 30.000 lagu hit, popularitas tidak terlihat muncul secara acak, melainkan mengikuti pola tertentu yang bisa dibaca dari data.

Temuan itu muncul dari pengolahan dataset Spotify yang disusun oleh Joakim Arvidsson dan diambil dari Kaggle. Seluruh data dimasukkan ke dalam pandas DataFrame lalu ditelusuri lewat Jupyter Notebook dengan bantuan NumPy, pandas, Seaborn, Matplotlib, statsmodels, dan SciPy.

Lagu populer tidak tersebar merata

Saat data diperiksa dari awal, banyak distribusi variabel tampak miring ke satu sisi. Popularitas lagu juga menumpuk pada angka rendah, sehingga hanya sebagian kecil trek yang benar-benar menonjol dibanding sisanya.

Kondisi itu membuat analisis tidak berhenti pada sekadar melihat angka rata-rata. Ribuan lagu tersebut dipakai untuk mencari kecenderungan yang lebih luas, bukan hanya pola pada contoh kecil.

Tiga ciri audio yang paling menonjol

Untuk melihat faktor yang paling berkaitan dengan popularitas, fitur audio diuji satu per satu. Model regresi linear sempat dipakai, tetapi hasilnya diberi catatan karena ada kemungkinan collinearity, yaitu ketika beberapa variabel bergerak terlalu mirip.

Karena itu, analisis dilanjutkan dengan regularized regression. Dari koefisien model, tiga prediktor negatif terbesar terhadap popularitas adalah energy, speechiness, dan instrumentalness.

Di sisi lain, tiga prediktor positif yang paling menonjol adalah danceability, loudness, dan valence. Artinya, lagu yang lebih mudah ditarikan, terdengar lebih keras, dan terasa lebih positif cenderung punya hubungan yang lebih baik dengan popularitas.

Genre juga memberi petunjuk yang jelas

Selain karakter audio, genre ikut memberi sinyal yang tidak bisa diabaikan. Analisis berikutnya menggunakan ANOVA untuk melihat apakah popularitas berbeda secara signifikan antar playlist genre.

Hasil box plot memperlihatkan perbedaan yang cukup jelas antar genre. Nilai p dari ANOVA juga sangat rendah, sehingga genre dinilai sebagai prediktor yang signifikan terhadap popularitas.

Saat data divisualisasikan lewat bar plot, pola itu terlihat semakin tegas. Dari pengamatan tersebut, genre Latin dan pop disebut sebagai area yang layak dituju jika targetnya adalah lagu yang berpotensi menjadi hit.

Popularitas tetap tidak bisa dijelaskan sepenuhnya

Meski begitu, hasil analisis ini tidak berarti setiap lagu sukses bisa dijelaskan hanya lewat angka. Musik tetap punya sisi subjektif, dan selera pendengar tidak selalu bergerak mengikuti rumus statistik.

Namun, data menunjukkan bahwa beberapa ciri umum memang bisa dipetakan dengan cukup jelas. Di antara ribuan lagu, kombinasi genre yang tepat dan karakter audio tertentu lebih sering muncul pada lagu-lagu yang berhasil menarik perhatian.

Berita Terbaru