Hur data science kan rädda miljön

Topic: statistik

Fredrik Moeschlin
16.07.2016

Har du lagt märke till lastbilarna som kör runt cyklar för Styr & Ställ i Göteborg? De ser till att det finns cyklar där vi behöver dem och lediga platser dit vi vill cykla. Utan lastbilarna skulle cyklarna snart sluta rulla. Du trodde kanske att Styr & Ställ var miljövänligt? Göteborgs Stad lyfter gärna fram cykeluthyrningen som "ett sätt att hjälpa till att skydda miljön och minska utsläppen av växthusgaser". Men är det verkligen så? I detta inlägg dyker vi än djupare i avancerad analys och visar hur data science kan användas för att granska omfördelningen av cyklar. Hur mycket omfördelning görs idag och hur går det till? Vilka utsläpp genererar detta? Kan man göra omfördelningen smartare eller finns det alternativ? Detta sista inlägg rundar av vår serie där vi visar hur data science och avancerad analys kan förbättra din verksamhet – i praktiken.

Vart åker lastbilarna?

De öppna data vi använder är som sagt begränsade och vi ser bara hur många cyklar och lediga ställ en station har vid olika tidpunkter (se del två för detaljer). Om vi tittar på data för en station med stor efterfrågan kan vi se några intressanta mönster. I grafen här under ser vi en vanlig dag för stationen Gibraltargatan/Eklandagatan. Det är tydligt att efterfrågan på cyklar är hög större delen av dagen. Samtidigt ser vi några intressanta hack i kurvan där stationen under kort tid får omkring 20 nya cyklar inställda (klockan 08:00, 12:30 och 19:00). Den enda rimliga förklaringen är att en lastbil har lämnat av cyklar. Denna omfördelning har här "räddat" stationen från att vara tom och därigenom gjort flera extra cykelturer möjliga.

Gibraltargatan_2016-05-18

För att automatiskt identifiera alla tillfällen då en lastbil har besökt en station behöver vi bara leta efter detta mönster – antingen många inställda eller uttagna cyklar under en kort tid. Genom pattern recognition hittar vi det karakteristiskta mönstret för omfördelningar och optimerar med tillgängliga data. (Rent praktiskt grupperas även liknande händelser nära i tid och det krävs minst 7 inställda eller uttagna cyklar för att undvika tveksamma fall som då flera cyklar hyrs ut från samma station inom kort tid).

Färdighet #12: mönsterigenkänning (pattern recognition)

Här finns naturligtvis en osäkerhet inbyggd och vi kommer att missa omfördelningar där endast ett fåtal cyklar ställs in eller tas ut. Det är upp till läsaren att fundera på hur ekonomiskt och miljömässigt försvarbara sådana besök är och om de borde förekomma. Sökningen med mönstermatchning ger en lista på vilka stationer som har besökts, vid vilka tidpunkter och hur många cyklar som ställts in eller tagits ut. Så här ser exempelvis de första händelserna under en söndag i juni ut:

Station Tid Cyklar Körd sträcka (m fågelväg)
Bastionsplatsen 08:25 11 uttagna -
Posthuset/Åkareplatsen 08:40 10 uttagna 836
Gibraltarg/Eklandag 09:00 9 inställda 4697
Chalmers Tvärgata 09:09 10 inställda 940
Korsvägen 09:21 10 uttagna 1718
Korsvägen/Södra Vägen 09:32 10 uttagna 249
Chalmersplatsen 09:57 10 inställda 2046
Kapellplatsen 10:08 9 inställda 798
...

Redan denna tabell ger en mängd insikter. Tiderna och stationerna gör det troligt att endast en lastbil har varit i bruk denna söndag. Vi ser också ett mönster av "rundor" där det först plockas ut 20 cyklar vilka sedan ställs av. Det är inte slumpen då lastbilarna rymmer drygt 20 cyklar. Den körda sträckan är beräknad fågelvägen utifrån stationernas koordinater. Under knappt sju timmar kördes 6 rundor där omkring 120 cyklar omfördelades under det att lastbilen färdades 44 km (fågelvägen). Det verkar finnas en viss osäkerhet på antalet uttagna och inställda cyklar vilket är rimligt då vårt mönster inte är perfekt. Samtidigt är det inte omöjligt att chauffören väljer att behålla cyklar för att ta med på service. Vi är troligen inte så långt från sanningen. Kartan här nedanför visar hur resan gått till fågelvägen (antaget endast en lastbil).

omfördelningsrutt

Var åttonde cykeltur sker med lastbil

Vi har tagit fram statistik för alla omfördelningar under maj och juni 2016. Data visar att drygt 400 cyklar (45 % av alla i systemet) flyttas runt under en vardag och omkring 130 cyklar (15 % av alla) under en helgdag. Det blir tre gånger fler cyklar flyttade på vardagar och det känns därför rimligt att anta att tre lastbilar då är i bruk. I ett tidigare inlägg såg vi att det totalt hyrs ut mellan 3000 och 4000 cyklar på vardagar. Det innebär att antalet omflyttade cyklar motsvarar en åttondel av alla uthyrda cyklar på vardagar. Omvänt kan man säga att en av åtta cykelturer möjliggörs av en lastbil. Diagrammet nedan visar en sammanställning av när på dygnet omfördelningen sker under en genomsnittlig vardag. Det är tydligt att omfördelningens fokus ligger på morgontrafiken.

Omfördelning över timme vardagar

Nedförsbackar lockar

Beräknar vi skillnaden mellan antalet inställda och utplockade cyklar vid en station får vi dess netto-omfördelning. I diagrammet nedan visar vi omfördelningen i netto för några utvalda stationer. Färgen på bollarna visar om cyklar främst plockas ut eller ställs in och storleken motsvarar antalet omfördelade cyklar netto. Vi ser tydligt hur cyklar flyttas från stadens centrala delar till de högre belägna delarna vid Chalmers och Johanneberg. Det är antagligen roligare att rulla ned till centrum än att trampa tillbaka upp. Samtidigt bör vi komma ihåg att detta endast visar hur omfördelningen går till idag, inte nödvändigtvis hur behovet ser ut.

Overview redistribution3

Vore spårvagnen bättre för miljön?

Hur miljövänligt är det egentligen att ta en hyrcykel? Och vad är alternativet? Göteborg Stad presenterade för några år sedan ett samverkansprojekt där man listade hur mycket koldioxid olika transporter släpper ut per person och kilometer. För kortväga persontransporter släpper exempelvis bilresor ut 176 g per personkilometer, buss 78 g/personkm och spårvagn noll då de kör på grön el. Det skulle vara intressant att ta med Styr & Ställ här.

Vem är största miljöboven

Vi fokuserar på omfördelningen och bortser från alla koldioxidutsläpp som skett vid produktion, leverans och installation av cyklar, stationer och lastbilar. När vi tittar på helgdagar, då endast en lastbil används, ser vi att det i snitt flyttas runt 130 cyklar över en sträcka på 45 km fågelvägen. Den verkliga sträckan i en stad är rimligen 50 % längre än fågelvägen vilket ger 67,5 km. På vardagar flyttas det runt tre gånger fler cyklar och det känns rimligt att anta att sträckan blir ungefär tre gånger längre, det vill säga drygt 200 km. Hur mycket diesel drar lastbilarna? Transportstyrelsen fordonsuppgifter visar att de ger ett koldioxidutsläpp på 246 g/km vid stadstrafik. Med andra ord genererar omfördelningen 49 kg koldioxidutsläpp under en normal vardag. Fördelat på det totala antalet uthyrningar en vardag får vi ett koldioxidutsläpp på omkring 16 g/uthyrning. Den genomsnittliga cykelturen är kanske 2 km och utsläppet från Styr & Ställ blir därmed runt 8 g/personkm. Naturligtvis har olika cykelturer olika stor effekt. En variant vore att säga att de 1/8 uthyrningar som måste kompenseras med lastbil bär all skuld och att de då genererar 64 g/personkm. Oavsett vilket: spårvagn eller den nya elbussen är betydligt miljövänligare. I diagrammet nedan har vi kompletterat data från samverkansprojektet med Styr & Ställs utsläpp.

koldioxidutsläpp

Gör omfördelningen cykelsystemet bättre?

I det andra inlägget tittade vi på hur servicegraden i Styr & Ställ kan beräknas. En bra servicegrad betyder att det i regel finns lediga cyklar och fria platser på stationer. Frågan är vilken effekt omfördelningen har på servicegraden? Och hur kan man optimera omfördelningen så den ger bästa service?

För det första måste vi tänka på multivariat statistik då servicegraden kan påverkas av mer än omfördelningen. Antalet uthyrningar är en av de viktigaste faktorerna; när många vill hyra cyklar blir det snabbt skevt fördelat mellan stationerna. Ju fler uthyrningar som sker, desto mer omfördelning krävs för att få balans. Mer omfördelning behöver därför inte betyda bättre servicegrad.

Färdighet #13: statistik

Ett förenklat sätt att analysera detta samspel är att titta på en begränsad delmängd där inverkan av antal uthyrningar är begränsad. Vi aggregerar därför data per timme och begränsar oss till de timmar som har haft mellan 200 och 300 uthyrningar. För varje timme beräknar vi servicegrad och summerar antal omfördelade cyklar. Därefter beräknar vi förändringen i servicegrad mellan den aktuella timmen och nästkommande. I diagrammet nedan ser vi hur antalet omfördelade cyklar förändrar servicegraden inom denna delmängd. Varje enskild punkt representerar en timmes information: dels hur många cyklar som omfördelades (x-axeln) och dels hur servicegraden påverkades (y-axeln).

Omfördelning och förändring av servicegrad

Vi ser en tydlig trend i diagrammet där fler omfördelningar ger förbättrad servicegrad. Men spridningen är stor vilket betyder att resultatet av omfördelningar kan skilja sig mycket. Delvis kan det förklaras av spridning i antal uthyrningar men det är också tydligt att vissa insatser är mindre bra eller direkt felaktiga. Diagrammet visar tydligt var vi har problem och gör det lättare att hitta exempel i data. Nedan ser vi ett exempel där stationen vid Gibraltargatan/Eklandagatan har fått för många cyklar på eftermiddagen och snabbt blivit full. Detta är en högt belägen station som ofta står tom, men faktum är att den har en trend med inkommande cyklar runt 16:00 (jämför diagrammet i början av inlägget). I praktiken innebär detta att Styr & Ställs omfördelning förutom utsläpp ibland också gör systemet sämre. Tänk den användare som ofta möts av en tom station på morgonen: hur frustrerande är det då inte att möta en full station när man för en gångs skull cyklat upp för alla backar?

Gibraltargatan_full

Östra Hamngatan är ett omvänt exempel där det tas ut för många cyklar. I diagrammet nedan ser vi tre måndagar där det ofta blir fullt på morgonen. Detta problem kunde enkelt ha förebyggts genom att minska antalet cyklar på helgen eller genom att flytta bort fler tidigare. När nu omfördelningen kommer först runt 10:00 är problemet istället att det tas bort för många. Efter lunch vänder nämligen trenden och folk börjar hyra fler cyklar. Framåt kvällen blir stationen därför tom. Resultatet blir tydligt när vi tittar på den 16/5: här tar man ut lite färre cyklar och som belöning dröjer det 3 timmar längre tills stationen blir tom.

Östra Hamngatan flera datum

Färdighet #14: kvantitativ och kvalitativ analys

Dags att minska onödiga koldioxidutsläpp

Exemplen ovan gör det tydligt att omfördelningen inte sker helt genomtänkt, ibland försämrar servicegraden och gör cykeluthyrningen mindre miljövänlig än den kunde ha varit. I en modern smart stad känns det rimligt att kräva en smart omfördelning. Genom att arbeta med statistik och prediktion är det enkelt att automatisera förslag till rutter och antal cyklar att hämta eller ställa in. Dessutom kan man ge snabb återkoppling till varje operatör: vad blev effekten av det jag gjorde? Utan återkoppling från data fortsätter det planlösa arbetet där varje operatör har sin egen bild av vad som är bäst. Faktum är att det finns företag som specialiserat sig på hur man kan göra omfördelning effektivare och miljövänligare. En annan möjlighet är att minska behovet av lastbilar, till exempel genom att ge en belöning till den som cyklar mot strömmen.

Vi kommer förmodligen alltid att behöva en viss omfördelning för att få balans i Styr & Ställ. Därför är det viktigt att börja tänka datadrivet och ta hjälp av mer avancerad analys för att göra arbetet smartare och bättre. Detta gäller inte bara stadens cykelsystem – samma resonemang kan lätt appliceras på allt från parkering till trängselskatt. Här är det lätt att påstå att man redan jobbar datadrivet och analytiskt. Trots det förblir parkeringarna fulla och köerna består. Först när man öppet kan presentera och visualisera förbättringar arbetar man riktigt datadrivet. Här hjälper vi till med kärnan inom data science: avancerad analys av data, visualisering av resultat och underlag till ständig förbättring. Hör av dig om du vill veta mer!

Läs mer:
Del 1 – Data Science i praktiken
Del 2 – Hur tillgängligt är Styr & Ställ?
Del 3 - Styr och ställ stationen på rätt plats
The Data Scientist

Business Intelligence

Bloggen för Business Intelligence.