Musik går att lyssna på, men den går också att räkna på. När musik översätts till strukturerad metadata, alltså ordnade uppgifter om artist, utgivning, genre och ljudegenskaper, öppnas en helt egen forskningsväg. Den här guiden går igenom vad musikmetadata är, hur forskare använder den och vilka fallgropar man bör känna till.
Vad menas med musikmetadata?
Metadata är data om data. För en låt handlar det inte om själva ljudet utan om uppgifterna runt omkring: titel, artist, album, utgivningsår, längd, genre, medverkande och tekniska ljudmått. När sådana uppgifter samlas i en konsekvent struktur kan stora kataloger jämföras och analyseras systematiskt. Öppna databaser som MusicBrainz och Discogs är exempel på sådana strukturerade samlingar.
Forskningsfältet bakom
Att utvinna mening ur musik som data studeras inom fältet Music Information Retrieval. Den vetenskapliga konferensen ISMIR har sedan år 2000 samlat forskare som arbetar med allt från genreklassificering till rekommendationssystem. Metadata är råvaran i mycket av det arbetet, eftersom den gör det möjligt att träna och utvärdera modeller på enhetliga uppgifter.
Så används metadatan
- Trendanalys över tid. Med utgivningsår och ljudmått kan forskare följa hur populärmusikens tempo, energi eller längd förändrats decennium för decennium.
- Genrestudier. Genretaggar gör det möjligt att kartlägga hur breda kategorier fragmenterats till subgenrer och hur dessa relaterar till varandra.
- Nätverksanalys. Uppgifter om medverkande och samarbeten kan modelleras som sociala nätverk, vilket avslöjar hur artister knyts samman.
- Kulturell och geografisk spridning. Information om var artister verkar låter forskare studera hur musik rör sig mellan platser och språkområden.
Kvalitet och källkritik
Strukturerad data ser objektiv ut, men den är resultatet av mänskliga och maskinella val. Genretaggar är ofta inkonsekventa, utgivningsår kan avse en återutgivning snarare än originalet och ljudmått bygger på modeller som kan ändras. En ansvarsfull analys börjar därför med att granska datans ursprung och täckning. En katalog som domineras av engelskspråkig populärmusik ger en skev bild om man drar slutsatser om all musik.
Upphovsrätt och etik
Metadata och aggregerad statistik kan ofta användas friare än själva inspelningarna, men gränserna varierar mellan länder. Inom EU finns särskilda undantag för text- och datautvinning i forskningssyfte, reglerade i upphovsrättsdirektivet från 2019. Den som bygger forskning på musikdata bör hålla isär det som är fakta och aggregat, vilket normalt går bra att dela, från det som är skyddat innehåll som låttexter och inspelningar.
Att komma igång
För den som vill pröva själv är det klokt att börja smått: hämta ett avgränsat dataset, kontrollera hur fälten är definierade och ställ en konkret fråga som datan faktiskt kan svara på. Vill du läsa vidare om de numeriska måtten finns vår guide om ljudegenskaper som tempo, energi och valens, och på sidan Resurser listar vi öppna arkiv att utgå från.
Vidare läsning: Lär dig mer om standarderna ISRC, ISWC och MBID, om upphovsrätt och TDM-undantag för forskning och om genreklassificering med data.