The Data Scientist

Topic: advanced analytics

Fredrik Moeschlin
10.06.2016

Vill du ha bättre balans mellan arbete och fritid? Då är data scientist det absolut bästa jobbet, enligt den amerikanska tidskriften Forbes rankning. Dessutom menar de att data scientist var den 8e bäst betalda tjänsten 2015. Yrket har fått ett ordentligt uppsving de senaste åren och i hajpen med Big Data utsetts till århundradets sexigaste yrke. Vissa letar febrilt efter en riktig data scientist som kan få fart på den avancerade analysen men de verkar lika sällsynta som enhörningar. För den som dyker djupare i begreppet blir det snart tydligt att definitionerna går isär och mycket bara är prat och fluff. Men det finns en viktig kärna i begreppet som vi vill fånga och förmedla. Data scientists har en viktig roll att spela och är här för att stanna. Låt oss titta närmre på vad som skiljer en data scientist från en business analyst, vilken bakgrund och karaktär en data scientist har, samt hur de driver utvecklingen.

Data Scientist eller Business Analyst?

Inom de flesta företag har man idag affärsanalytiker som utreder analysfrågor, sammanställer data, tolkar och presenterar rapporter och interaktiva gränssnitt för att analysera verksamheten. Det är väsentligt för att utifrån fakta kunna fatta avgörande beslut för att utveckla och förbättra affären. Detta har länge varit arbetsuppgifterna för en business analyst. Vad är då syftet med det arbete en data scientist gör? Precis samma sak! Vänd på frågan: vad skulle syftet annars vara om inte att utveckla och förbättra affären? Den stora skillnaden ligger i att en data scientist tänker bredare, upptäcker och angriper större och komplexare datakällor med nya metoder, tankesätt och verktyg. En utförligare skillnad mellan dessa två discipliner finns här. Frågar vi Data Science Central (med tydlig åsikt i frågan) lyfter de fram data scientists som "de där som sysslar med Big Data".

Data Scientist = data + scientist

Ser vi etymologiskt på begreppet data scientist så handlar det helt enkelt om data och forskare. Data kan vara vilka som helst men genom att tolka dem är förhoppningen att få information och insikter. En forskare i sin tur är en person "involverad i en systematisk aktivitet för att få kunskap som beskriver den naturliga världen". Begreppet "dataforskare" på svenska blir väldigt brett men det är också det som är en data scientists styrka: bredden att ta sig an vitt skilda utmaningar där nya data tolkas och omvandlas till affärsnytta.

Michelangelos "Adams skapelse" med Wikipedias logo (Michelangelo di Lodovico Buonarroti Simoni 1475 - 1564)

Ett Universalgeni?

I bilden nedan tar vi upp några av de kompetenser som är avgörande för en framgångsrik data scientist. Det har sagts att "Wanligen äger Geniet någon viss särskild rigtning: omfattar det åter alla eller de flesta föremål för vetandet, kallas det Universalgenie". Under renässansen var universalgeniet ideal och universiteten syftade till att utveckla studenternas intellektuella, konstnärliga, sociala och fysiska sidor [lat. universitas: helhet]. I dagens samhälle är specialisering nyckeln och en universitetsutbildning i "allmänkunskap" är svår att hitta. Samtidigt är det precis vad vi kräver av en data scientist: hantera stora komplexa datamängder, hålla fokus på verksamhetens strategiska mål, utvärdera statistiska test, nätverka med alla från beslutsfattare till IT-experter, skapa snygga visualiseringar, bygga interaktiva dashboards, skripta effektiva maskininlärningsalgoritmer, tänka fram nya hypoteser, säkerställa att analyser är vetenskapliga, förstå olika affärsverksamheter och inte minst kunna kommunicera och övertyga om vad man eventuellt kommit fram till. Hur klarar man det? Hemligheten är att nybörjaren lär sig snabbast och att man inte behöver vara specialist på alla områden.

Kunskaper

Var växer data scientists?

Den viktigaste grogrunden för data scientists är utan tvekan nyfikenhet och inspiration kombinerat med intelligens och motivation. En bred teknisk utbildning med forskningsinriktning är ingen nackdel och det är inte slumpen att till exempel tekniska fysiker blir framgångsrika data scientists. Vissa har tagit steget längre och förkovrat sig i ett doktorandprojekt. För en del specialområden är en doktorstitel en förutsättning men det måste vägas mot den praktiska och affärsmässiga erfarenhet motsvarande tid i näringslivet kan ge. Oavsett utbildning och bakgrund: alla kan utvecklas till bättre data scientists! På Knowit erbjuder vi fokuserade kurser som lyfter hela bolags data science-nivå. För specifika ämnen och tekniker finns även öppna tjänster som Coursera, European Data Science Academy och Data Science Masters. Minst lika viktigt är att utforska GitHub, StackOverflow, StackExchange och att pröva sig fram i tävlingarna på Kaggle.

Nyckeln till att växa är att ständigt lära sig nytt, prova nya tekniker och teorier för att bredda sin kunskap. En data scientist föredrar ett öppet klimat med öppen källkod och testar gärna nya lösningar. De älskar teamwork för att dela lärdomar och erfarenheter, och inspireras att upptäcka nytt. I en organisation ser de sig som en upptäckare och drivs av de stora vita fläckarna på kartan över spännande data. Nu tänker du kanske "aha, det är de där som ständigt måste googla reda på allt mitt under middagen!?" Nja i vissa fall, men den sociala kompetensen är minst lika viktig!

Explorer

Bra hantverkare klagar inte på sina verktyg

Precis som en hantverkare är en data scientist inte mycket utan sina verktyg. Och en bra hantverkare lägger tid på att vårda och utveckla sina verktyg. Det behövs en verktygslåda med stor mångfald för olika problem: skriptspråk för scientific computing, bibliotek för maskininlärning & data mining, databaser för strukturerade och ostrukturerade data, GIS-verktyg, javabaserade verktyg för visualisering, molntjänster för tyngre analys, gränssnitt för webbutveckling, linuxfunktioner för "data wrangling", olika Business Intelligence-program, och inte minst metoder och processer för projektledning, organisation, affärsmässighet och strategiskt arbete. Listan över program och metoder kan göras lång men det viktiga med ett verktyg är vilken funktion det har och vilken nytta det ger.

Här för att stanna

Det är uppenbart att data scientists har kommit för att stanna. Deras bredd och analytiska angreppssätt är utan tvekan en stor tillgång idag när data är en allt viktigare tillgång. Men de måste få en bra miljö för sitt arbete och får inte fastna i något datastädjobb. På rätt plats kompletterar de business analysts med nya verktyg och färdigheter, drivs av att utveckla sig själva och verksamheten, och sår frön till innovation längs vägen. Hur data scientists når den perfekta balansen mellan arbete och fritid förblir däremot en gåta. Kanske har det med mångsidigheten, öppenheten och nyfikenheten att göra?

Läs mer:
data science i praktiken - analys av Styr & Ställ i Göteborg
avancerad analys - lätt att komma igång,
knowit satsar på värdebyggande avancerad analys,
en elefant i din IT-miljö löser inte alla problem,
gone fishin' in the data lake,
avancerad analys - så bygger du värde!

 

Business Intelligence

Bloggen för Business Intelligence.