Jag är född i Stockholm 1953. Jaha, tänker ni. Än sen då? Jo, det är så att jag därmed tillhör en mycket speciell grupp människor, troligen mer kartlagda än några andra. Jag är ett så kallat Metropolitbarn.
Metropolit var stor en undersökning som skulle följa alla oss som var födda i Stockholm det året under hela livet. Arbetsmetoderna var återkommande frågeformulär, både till oss och våra föräldrar, plus mängder med data hämtade från alla register där vi fanns registrerade: skolan, militären, försäkringskassan, ….Alla uppgifter samlades i Metropolitregistret, person för person. Och för dem som hade tillgång till registret gick det att se hur många dagar vi var sjukskrivna olika år, vad våra föräldrar hade för bakgrund och åsikter, när vi lärde oss simma och jag vet inte vad. Sannolikt fanns där till och med mer registrerat om mig än hos Google.
I mitten av 80-talet kom registret fram i ljuset och det blev så mycket bråk att forskarna tvingades ta bort personkopplingen. Men innan det skedde, kunde vi Metropolitbarn beställa utdrag för att se vad som fanns registrerat om oss. Så gjorde jag och så gjorde många andra.
Materialet innehöll knappast några sensationer. Man vet ju ungefär hur man haft det. Men det som slog mig var att många uppgifter var så konstiga. I vissa fall var de rent felaktiga, men ett nästan större problem var att uppgifter från olika källor registrerats på olika sätt. Det som en myndighet klassade på ett sätt, hade en helt annorlunda definition hos en annan – trots att uppgifterna vid första påseendet såg helt jämförbara ut.
Bara ett exempel. Jag ansågs i min barndom tillhöra ”socialgrupp ett”. Det kändes märkligt eftersom vi inte levde något överklassliv utan bodde i en trerumslägenhet i den då nybyggda förorten Hässelby gård. Jag gissar att förklaringen är att båda mina föräldrar pluggat på universitet (och träffats där). Kanske rimligt för dem som definierat klassificeringen, men lätt en källa till missförstånd för andra. Uppgifter som samlas in och definieras av olika människor – eller maskiner – kan med andra ord tolkas helt olika.Idag kallas sammanställning av stora mängder information från olika källor för big data och kan röra allt från kartläggning av människors livsstil till driften av en processanläggning. Big data beskrivs fram-förallt som ett tekniskt problem, men jag utgår från att svårigheterna också är desamma som på 1900-talet. Ska man sammanställa data från många källor måste man vara medveten om att information används olika i olika sammanhang. Inser man inte det, riskerar man att dra helt felaktiga slutsatser, hur mycket data man än lyckas samla ihop.
(Visited 16 times, 1 visits today)