Ljudegenskaper i musikdata: tempo, energi och valens

När musik beskrivs som data räcker det inte med genre och årtal. Stora musikkataloger förses ofta med en uppsättning numeriska ljudegenskaper som försöker fånga hur en låt låter och känns. Den här guiden förklarar vad de vanligaste måtten betyder, hur de beräknas i grova drag och vad man bör tänka på när man använder dem i analys.

Vad är en ljudegenskap?

En ljudegenskap är ett mått som härleds ur själva ljudsignalen eller ur en modell som tränats på ljud. I stället för att en människa lyssnar och sätter ett betyg räknar en algoritm fram ett värde, ofta normaliserat till skalan 0 till 1. Det gör att miljontals låtar kan jämföras på samma sätt, vilket är hela poängen när man arbetar med katalogdata.

De mått som beskrivs nedan blev allmänt kända genom de ljudegenskaper som tidigare exponerades via Spotifys utvecklar-API. Liknande begrepp förekommer i forskningsfältet Music Information Retrieval, som studerar hur information kan utvinnas ur musik.

Tempo

Tempo anges i taktslag per minut, ofta förkortat bpm. Måttet uppskattar låtens upplevda hastighet genom att hitta den underliggande pulsen. En lugn ballad kan ligga runt 70 bpm medan dansmusik ofta hamnar mellan 120 och 130 bpm. Tempo är ett av de mest intuitiva måtten, men det kan bli fel när en låt har en tvetydig puls, till exempel när algoritmen råkar halvera eller dubblera det verkliga tempot.

Energi

Energi är ett mått mellan 0 och 1 på hur intensiv och aktiv en låt upplevs. Hög energi förknippas med snabbhet, hög ljudstyrka och ett tätt arrangemang, medan låg energi hör ihop med lugn och gleshet. En akustisk visa får typiskt lågt energivärde, en hårdrockslåt högt. Energi säger inget om huruvida musiken är glad eller sorgsen, bara hur mycket den driver på.

Valens

Valens beskriver hur positiv eller negativ en låt känns, även den på en skala från 0 till 1. Hög valens signalerar glädje och optimism, låg valens signalerar svärta eller vemod. Begreppet är hämtat från psykologin, där valens länge använts för att beskriva känslors riktning. I musikdata är valens särskilt användbart eftersom det fångar en känslomässig dimension som varken tempo eller energi täcker.

Danceability och akustiskhet

Danceability väger samman tempo, rytmstabilitet och taktart till ett mått på hur väl en låt lämpar sig för dans. Akustiskhet uppskattar sannolikheten att en inspelning är akustisk snarare än elektroniskt producerad. Båda måtten är modellbaserade gissningar, inte exakta fakta, och bör tolkas som tendenser över många låtar snarare än sanningar om en enskild inspelning.

Att använda måtten ansvarsfullt

  • Tänk i aggregat. Ett enskilt valensvärde kan vara missvisande, men medelvärdet över tusen låtar i en genre säger ofta något verkligt.
  • Var försiktig med jämförelser över tid. Beräkningsmetoder ändras, och en katalog som byggts upp under många år kan ha mätts på olika sätt.
  • Blanda inte ihop mått och smak. Hög energi är inte detsamma som hög kvalitet. Måtten beskriver ljudet, inte värdet.
  • Dokumentera källan. Ange alltid varifrån ljudegenskaperna kommer och när de hämtades, så att analysen går att granska.

Rätt använda ger ljudegenskaper ett kraftfullt sätt att studera musik i stor skala. De gör det möjligt att fråga hur energin i populärmusik förändrats över decennier eller om en genre blivit gladare eller mörkare. Svaren blir bara så bra som datan och den eftertanke man lägger på tolkningen.

Vidare läsning: Se hur dessa egenskaper används vid genreklassificering med data och vilka metadatastandarder som binder ihop inspelningar och verk.