Data Science i praktiken
Efter inlägget The Data Scientist har många frågat efter mer detaljer, hur gör man i praktiken? Vi vill passa på att dela ett belysande exempel på advanced analytics i en serie inlägg.
Hyrcyklar väcker känslor
Ett aktuellt ämne den här årstiden är cykling och i Göteborg har särskilt hyrcyklarna varit uppe på tapeten. Staden har ett avtal med en stor reklamfirma som håller igång Styr & Ställ i utbyte mot annonsplatser. Med systemet i innerstaden kan man hyra en cykel vid en station och sedan ställa tillbaka den vid en annan. Häromveckan diskuterades en förlängning av avtalet och det väckte liv i en debatt om hur välfungerande och prisvärt systemet är.
Inte mycket fakta i debatten
Diskussionen har, i brist på fakta, varit tydligt värdeladdad med påståenden om att det fungerar bra och är "gratis för kommunen" medan andra påstår att det är "världens dyraste lånecykelsystem", vilket bemöts av operatören med att "cyklarna kostar inte en krona". Operatören hävdar i en egen undersökning att "97 % av användarna skulle rekommendera systemet". Det är oklart vad alternativet då är, men med över hundra regndagar om året kan jag personligen rekommendera buss och spårvagn i över 3 % av fallen. Man frågar sig var fakta är? Har ingen analyserat systemet?
Lastbilar får cyklarna att rulla ..?
För att förstå affären behövs ingen data scientist: genom att leverera ett hyrcykelsystem slipper operatören betala för reklamplats och staden ger medborgare och turister cyklar, samtidigt som kostnaderna smidigt göms undan. (Uteblivna intäkter är också en kostnad.) Praktiskt är det lite lurigare när exempelvis många rullar från Chalmers till stan men få trampar tillbaka. Redan 2012 konstaterades i en TNS Sifo-undersökning att "Vissa terminaler är ofta tomma när cyklar ska hämtas ut eller fulla när de ska lämnas tillbaka". Reklamföretaget försöker mildra detta genom omfördelning där de dagligen flyttar omkring cyklar med mindre lastbilar. Men hur bra blir det? Vem mäter systemets servicegrad? På sin höjd skriver tidningen en artikel om att det inte fungerar. Om vi skulle se cykelsystemet som en gemensam kostnad för staden, vore det då inte rimligt att systemet och omfördelningen sköttes så effektivt som möjligt?
Hur bra fungerar Styr & Ställ egentligen?
Ett cykelsystem är klockrent för tillämpad data science: tusentals cyklar genererar data när de dagligen hyrs ut och ställs tillbaka, och användarnas beteende påverkas av många faktorer så som stationernas geografiska placering, omfördelningen av cyklar, händelser i staden, väderlek med mera. Med tre specifika analyser visar vi hur data science kan användas för att syna ett system i sömmarna:
- Servicegrad – finns det cyklar och lediga platser när de behövs?
- Geografi – var borde vi har fler cykelstationer?
- Omfördelning – flyttar man cyklar så att tillgängligheten blir optimal?
Om användaren är nöjd är däremot en annan fråga som även beror av pris, hur lättanvända stationerna är och inte minst väder och dagshumör. Men det minsta vi kan begära är att systemet har de bästa förutsättningarna och kontinuerligt mäts, följs upp och förbättras. Vem som betalar är här irrelevant, fokus är hur mycket nytta pengarna genererar.
Eller vad tycker du om Styr & Ställ?
Läs mer:
Del 2 – Hur tillgängligt är Styr & Ställ?
Del 3 – Styr och ställ stationen på rätt plats
Del 4 – Hur data science kan rädda miljön
The Data Scientist
Avancerad Analys - lätt att komma igång