An overview of life at a completely unprecedented scale @ Dagbladet Information

You are here

I den teknologi, vi hele tiden har på os, sidder små sendere, der registrerer, hvor vi bevæger os. GPS i biler og mobiltelefoner bruger vi til at finde vej, købe billetter i offentlig transport og talrige andre tjenester. Men også mobiltelefonens forbindelse til sendemaster kan bruges til at fastlægge, hvor du er, og selv telefonens søgen efter trådløse netværk og bluetoothenheder kan registreres og udnyttes til at kortlægge dine bevægelser. Overvågningsmæssigt er det naturligvis en historisk revolution, at alle borgere går rundt med sendere, der kan registrere deres bevægelser. Men for forskning og styring er der også tale om et kæmpe potentiale, som vi først lige er begyndt at få øjnene op for.

»For videnskaben er det meget interessant, at det for første gang i historien er muligt for forskere at få adgang til data om den menneskelige afdfærd i så stor skala. Det har aldrig været muligt før,« siger Dino Pedreschi, der er professor i Computervidenskab på Universitetet i Pisa.

Som forsker har han været involveret i projekter, der ud fra GPS-data kortlagde transportmønstre imellem forskellige kvarterer i en by. På den måde kunne han se, hvor mange der var faste beboere, pendlere, sporadisk besøgende og turister i de forskellige områder. De data kunne blandt andet bruges til at vise, hvem der kørte på arbejde hvorhenne, og hvilke kvarterer i byen der bidrog mest til bilforureningen.

Inden for byplanlægning har lokationsdata netop været brugt i Elfenbenskysten, hvor teleselskabet Orange i forbindelse med projektet Data 4 Development frigav det efter sigende største datasæt med mobildata nogensinde. Ud fra det anonymiserede materiale, der bestod af mastedata fra 2,5 millarder opkald fordelt på fem millioner kunder, kunne forskere fra IBM kortlægge behovet for to helt nye busruter for at lette trafikken i millionbyen Abidjan.

»Vi fandt, at vi ville kunne reducere indbyggernes rejsetid i byen med 10 procent,« forklarede Olivier Verscheure, der er forsker ved IBM i Dublin, til BBC. Analysen af de store datamængder handler om at forstå, hvordan befolkningen bruger en by eller region, og hvordan man igennem deres bevægelser kan gøre strukturerne mere effektive eller bæredygtige. Det kan ske ved omprioriteringer af busruter, udvidelse af veje eller cykelstier eller ved at gøre trafikreguleringen mere intelligent, mens der også er potentiale for at udvikle systemer for delebiler eller cykler.

Begrænset adgang
Det meste af det historiske data, der kan udnyttes er dybest set bare biprodukter for at få kommunikationsværktøjer til at fungere. Men i takt med udviklingen af Big Data-analyseværktøjer kan ny viden trækkes ud af dataet, der ellers bare går til spilde. Problemet er, at dataet ofte hverken er til brugernes eller forskernes rådighed.

»Det er et potentiale, so0m videnskaben har, men forskere er også meget frustrerede over, at vi ikke har adgang til de her data, fordi de er ejet og kontrolleret af Google, Visa, teleselskaberne eller andre af de store virksomheder,« siger Dino Pedreschi.

»Det er ikke al Big Data, der er utilgængeligt, men det er det meste af det, der er rigtigt interessant,« siger han.

Dataet om vores bevægelsesmønstre er særligt kontroversielt, og mange frygter, at deres data bliver brugt til overvågning eller markedsføring af kommercielle produkter, man ikke er interesseret i. Det blev en skandale for en måned siden, da Sunday Times afslørede, at det britiske researchfirma Ipsos Mori havde tilbudt mobildata fra 27 millioner mobiltelefoner til blandt andet politiet og private firmaer, der kunne have interesse i så store mængder akkumulered information om bevægelsesmønstre. Dataet havde Ipsos Mori købt af teleselskabet EE og inkluderede ifølge salgsmaterialet som Sunday Times havde fået fat i: »køn, alder, postnummer, hvilke hjemmesider der var besøgt, tidspunkt på dagen, hvor sms’er var sendt og kundens lokation, når der blev foretaget opkald«. Artiklen medførte et ramaskrig blandt tidligere kunder og interesseorganisationer, der mente, at det var krænkende for kundernes privatliv, at deres data blev videresolgt til andre aktører. Men ifølge Ipsos Mori var dataet uproblematisk, for det var slet ikke muligt at identificere individer. Tværtimod var der tale om »cutting edge research«, som kun byggede på »anonymiserede og akkumulerede data«, som ikke kunne føres tilbage til nogle enkeltpersoner. Det var altså mængden af folk, der havde foretaget en given handling – som at besøge en hjemmeside eller gå på en given gade – snarere end det, var hvad den enkelte person havde foretaget sig.

Selve debatten var et eksempel på, hvor følsomme dataete føles for kunderne, og sikkert også en del af forklaringen på, at så få teleselskaber udbyder kundernes lokationsdata til salg. Dino Pedreschi har selv haft adgang til data fra teleselskaber på den betingelse, at forskerne ikke måtte nævne, hvilket firma, det var fra, og at de kun offentliggør resultaterne af forskningen og ikke selve dataet. Så selv om mange forskere og firmaer er interesserede i lokaliseringsoplysningerne holder både privatlivshensyn og lukkethed udviklingen tilbage.

»Vi burde kigge på værdien af lokationsdata med mindre fokus på overvågning,« siger Viktor Mayer-Schönberger, der er professor i Internet Governance and Regulation på Oxford University og medforfatter til bogen Big Data – A Revolution That Will Transform How We Live, Work and Think.

»Jeg frygter, at en stor samfundsmæssig værdi går tabt, fordi vi ikke tænker på det på en mere innovativ og original måde, hvor vi både beskytter den enkeltes privatliv, men også får værdien ud af akkumulationen,« siger han og nævner Inrix som en innovativ udnyttelse og opsamling af lokationsdata.

Inrix er en navigationsapplikation, man kan få til sin smartphone, som baserer sig på trafikdata i realtid. 100 millioner bilister bruger programmet, som fungerer ved både at tage noget fra brugeren og give noget igen ved at gøre telefonen til en sensor, der registrerer, hvor du er, og hvor hurtigt du kører. Til gengæld for de informationer, får du så få gavn af realtids kørevejledning på baggrund af data fra alle de andre brugere, og på den måde kan man blive ledt uden om trafikpropper og køer. Dataet bliver derudover genbrugt til analyser af økonomiske vækstbetingelser på lokalt plan, da det har vist sig, at biltrafik i USA korrellerer med indkøbsvaner.

Det er ifølge Dino Pedreschi, der har beskæftiget sig med netop privatlivsproblematikken i blandt andet bogen Mobility, Data Mining and Privacy, fuldt ud muligt at lave forskning i lokationsdata uden at krænke enkeltindividers privatliv ved at adskille selve grundforskningen fra publiceringen af resultaterne. På samme måde som man i årevis har gjort med medicinsk forskning, der også ofte baserer sig på meget personlige oplysninger om enkeltindividers sygdomme.

»Det er utroligt, at vi i det 21. århundrede har alle disse sensorer derude, men at vi ikke rigtigt er i stand til at gøre noget ved dataet på et akkumuleret niveau. Man kan være ligeglad med den enkeltes individuelle bevægelser, det er de akkumulerede bevægelser, der kan være interessante,« siger Viktor Mayer-Schönberger, der selv har en forhåbning om at lokationsdataet kan føre til mere faktuelt baserede beslutninger i den offentlige styring:

»Lokationsdata kan bruges til at se, hvor den bedste placering af trafiklys vil være. Fordi du kan rent faktisk se, hvor folk går over gaden, og hvor mange der gør det. I dag sker den slags beslutninger ofte på baggrund af at lokale grupper lægger pres på politikere eller som reaktion på et enkelt trafikdrab. Men det er jo ikke data,« siger han.

Et samlet billede
En af de danske virksomheder, som forsøger at bruge lokationsdata til at planlægge veje og trafikregulering, er konsulentfirmaet COWI. Mens teleselskaberne kunne have interessante data i den forbindelse, har det ifølge Informations oplysninger indtil videre ikke været et område, de ønskede at gå ind i. I stedet har COWI udviklet det såkaldte City Sense, hvor de med teknologi fra firmaet Blip Systems sætter bokse op rundtomkring i de byer og ved de veje, hvor de ønsker at foretage målinger. Boksene er i stand til opfange signaler fra bluetooth og WIFI-enheder og fanger dig altså, hvis du bevæger dig rundt med din smartphone og har bluetooth eller WIFI tændt. Det sker ikke på en måde, så den kan se, at det er lige netop dig, da den giver hver enhed et unikt ID, som ikke har noget at gøre med dit telefonnummer eller andre personidentificerbare oplysninger, forklarer Jonas Hammershøy Olesen, der er trafikplanlægger i COWI.

»Alt foregår fuldt anonymiseret og krypteret, så man ikke kan finde tilbage til de enkelte enheder,« siger han. Blip Systems estimerer selv, at man kan opsamle 20-30 procent af mobilbrugerne på den her måde, mens man også kan fange mange nyere biler, fordi de har indbygget bluetooth. Man får måske ikke et datasæt, der dækker den samlede færdsel, men det er effektivt til at måle, hvor lang tid det tager at komme fra A til B på forskellige tidspunkter af døgnet. Projektet startede for to et halvt år siden med de indledende diskussioner, og stille og roligt er det blevet til specifikke produkter særligt i forhold til veje, hvor de har 10 projekter kørende i Danmark.

»Vi kortlægger rejsetider og bevægelsesmønstre i trafikken. Det handler om at bruge de her data til at optimere vores trafiksystemer og kortlægge trængsel,« siger Jonas Hammershøy Olesen. Mængden af data de får ind fra boksene er enorme, og det kan bidrage til at kvalificere grundlaget for beslutninger. Firmaet har længe arbejdet med at optimere trafikkryds, men de data, de har haft indtil nu, har ikke kunnet sige særligt meget om, hvordan trafikken i praksis bliver afviklet.

»Vi kan se, at den måde man har gjort det hidtil har været begrænset af, at man faktisk ikke har haft ret meget viden. Pludselig kan vi på minutniveau se, hvor lang tid det tager at køre på en strækning på alle tidspunkter af døgnet, og det kan vi bruge til at optimere programmeringen af trafikkrydsene,« siger Jonas Hammershøy Olesen, der også ser det som en mulighed for at komme udover forskellige pressionsgruppers indflydelse eller bilisters subjektive oplevelse af trafikken.

»Nogle steder kan vi se, at folk oplever, at der er frygtelig meget trængsel, og det kan vi se, at det er der også. Men kun et kvarter om morgenen og et kvarter om eftermiddagen,« siger han.

— Havde vi bygget de jyske motorveje dengang, hvis vi havde haft de her data. Er det her en garanti mod dumme beslutninger?

»Det ved jeg ikke. Beslutningerne er der andre, der træffer, men vi kan med det her hjælpe til at skabe et bedre grundlag at træffe dem på.«