Blogg | Knowit

Avancerad analys förstår Göteborgs bostadsmarknad

Skriven av Magnus Gyllenhammar | Sep 7, 2016 10:00:00 PM

Bostadsmarknaden är något som vi alla påverkas av och som den senaste tiden definitivt varit i ropet. Framförallt i storstäderna har det varit extra stor diskussion, med bostadsköer på flera år och ständigt stigande bostadspriser. Under sommaren har jag använt avancerad analys för att grotta ner mig och skapa mig en bättre bild av vad som händer på bostadsmarknaden i Göteborg. Det blev en djupdykning. Utöver att guida er genom den analys som jag gjort kommer jag också presentera ett antal tips och tricks, som kan öka förutsättningen för att göra en bra bostadsaffär.

Vilka faktorer påverkar en bostads pris? Det var den första frågan jag ställde mig. En ytterligare frågeställning var om det finns några mönster eller trender i marknaden som man som köpare eller säljare skulle kunna dra nytta av. Är några områden i staden mer populära än andra?

Jag kommer besvara alla dessa frågor i denna artikel, men först skall jag gå igenom hur jag byggde upp en plattform för avancerad analys, inklusive de verktyg och språk som använts.

Lokalisering och inhämtning av data

Det första steget är att få tag på relevant och tillförlitlig data. En klar källa för bostadsstatistik och data är hemnet. Här finns både slutpriser och bostadsinformation, så som bostadsstorlekt, antal rum, tomtyta etc. Det första steget blev således att komma åt den data som finns på hemnets webbplats för slutpriser. Då de inte har en öppen databas krävdes att annat angreppssätt.

python är ett open-source scriptspråk som lämpar sig väldigt bra för den typen av datahantering och insamling, med många färdigskrivna paket och funktioner som man kan använda sig av. Genom att använda python kunde jag extrahera och spara ner de objekt som hemnet har publicerat på sin hemsida med slutpriser. Nästa steg var att "tvätta" data, som det heter. Det vill säga, att från de rena textraderna ta fram och kategorisera de siffror och den information som finns sparad där samt att validera att informationen är komplett och rimlig.

Strukturering och lagring av data

Efter att data är inhämtad behöver den struktureras och kategoriseras. Detta görs med fördel i en databas. I mitt fall valde jag att skapa en postgreSQL-databas i Google Cloud. Detta möjliggjorde både enkel uppkoppling från flertalet enheter, som kan genomföra analyser, och valet av postgreSQL innebar att jag kunde göra geografiska analyser enkelt direkt i databasen med hjälp av påbyggnadspaketet postGIS.

Geografiska parametrar

Då jag fått fram koordinaterna för varje bostadsobjekt var det enkelt att ta fram några geografiska attribut som borde inverka på bostadspriset. Med hjälp av den öppna geografiska data i Open Street Map (OSM) och postGIS kunde jag, till exempel, lokalisera avståndet till närmaste busshållplats, sjö, naturområde och motorväg. Utöver dessa parametrar tog jag även fram antalet restauranger, affärer och byggnader inom ett visst antal meter från bostadsobjektet.

Avancerad och visuell analys

Nu när databasen är uppbyggd och data är inhämtad och kategoriserad var det dags att analysera den. Genom att använda en kombination av R och Tableau kunde jag genomföra en bra blandning av grafisk, visuell (Tableau) och avancerad analys (R).

Resultat om bostadsmarknaden

Genom att kolla på data i aggregerad form över den tidsperiod som jag har tillgång till (2012->) kunde jag avgöra om det finns några intressanta mönster i marknaden.

Det första resultatet är att det finns ett klart säsongsberoende i slutpriserna över året. Detta mönster varierar dock med typen av bostad som betraktas.

Mönster för bostadsrätter

Från figuren nedan kan vi dra slutsatsen att bostadsrätter säljs för högre pris i slutet av sommaren, men att det då också säljs färre objekt. Detta kan i sin tur få oss att tro att det är köparna som här driver på marknaden och är villiga att betala mer för att få en bostad just under de månaderna. I juni är det istället tvärtom. Priset sjunker kraftigt men det är fortfarande ett stort antal affärer som genomförs. Här är det rimligt att anta att det är säljarna som är desperata att bli av med sina lägenheter innan sommarens intåg och de kan då tänka sig att sälja för en liten rabatt.

Genomsnitts pris per kvadratmeter (linjer) och antalet försäljningar (staplar) för de tre analyserade hustyperna, villor, radhus och bostadsrätter.

Om man vill köpa en bostadsrätt skall man med fördel göra det i just juni eller senhöst till och med februari för att betala så lite som möjligt.

Mönster för villor

På samma sätt kan vi kolla på figuren och följa kurvan för villor. Här kan vi istället se att den ligger mycket jämnare över hela året, men att det är något dyrare att köpa villa på våren än på hösten och att maj både är den populäraste månaden att sälja och köpa hus samt att det medför högst pris.

Köp villa i juni om rätt bostad finns på marknaden eller mitt under hösten för att få bostaden till ett så bra pris som möjligt.

Mönster för radhus

För radhus kan vi istället se en tydlig nedgång i pris per kvadratmeter i juli, vilken också är förknippad med lägre antal försäljningar. Men om man kan få tag på ett radhus som passar de kriterier man satt upp är det definitivt ett bra läge att köpa i juli. Annars skall man precis som för villor undvika att köpa på våren och snarare satsa på hösten och då framförallt december.

Prisutveckling

Över den period som analyserats så kan man se en tydlig ökning i priset per kvadratmeter. I genomsnitt över alla bostäder har priset ökat med 4 600 kr/m²/år. Om vi kollar på figuren med pristrenden nedan kan vi se att denna trend är tydlig för alla tre bostadstyper, bostadsrätt, villa samt radhus. Framförallt bostadsrätter ökat i värde med i genomsnitt 5 276 kr/m²/år medan villor och radhus har ökat med strax under 3 000 kr/m²/år. Vi kan även se att antalet försäljningar har ökat stadigt.

Pris och försäljningstrender för villor, radhus och bostadsrätter. Den övre delen av figuren visar genomsnittspriset per kvadratmeter, som punkter, och trendlinjerna för dessa. Den undre visar antalet försäljningar för de olika hustyperna samt trenden för det sammanlagda antalet.

I kartan nedan kan vi tydligt se att var bostaden ligger påverkar priset. I stort verkar det som att det är dyrare att bo i stadskärnan samt längs kusten söder om staden. Något som vi också känner igen oss i. Ett fåtal fastigheter har även sålts över medelpris ute i skärgården.

De röda punkterna indikerar objekt som sålts under genomsnittspris medan de gröna indikerar ett försäljningspris över genomsnitt.

Självorganiserande kartor

Självorganiserade kartor (Self Organising Maps, SOMs) är ett område inom maskininlärning, som använder abstrakta kartor för att förstå och förenkla komplexa dataset. För att se hur olika områden har utvecklats över tid behöver vi ett sätt att dela in bostäderna i områden, som sedan kan analyseras. Ett smidigt och dataspecifikt sätt att göra det på är att använda just SOMs. Normalt används dessa som ett sätt för dimensionsreduktion, men det går såklart även att göra en mappning inom samma dimensioner. Genom att skapa en karta (oftast i två dimensioner) och låta punkter på denna kartan flytta sig för att täcka det presenterade datasetet, som kan sträcka sig över ett godtyckligt antal dimensioner, kan man på så sätt få en överskådlig representation av ett högdimensionellt rum. I mitt fall var det dock mycket lättare än så. Jag ville bara skapa något sätt dela in bostadsobjekten i olika områden geografiskt, så jag ville skapa en SOM i två dimensioner som gör just det, delar in objekten i grupper beroende på deras koordinater, som ju också är i två dimensioner. Baserat på antalet objekt totalt och storleken på det geografiska området som betraktades, så valde jag en SOM med 15x15 noder. Det fina med SOMs är att istället för att skapa ett rutnät med lika stora rutor kan kartan dynamiskt sprida ut sig och ha fler noder i områden med fler objekt och färre i mer glesbebyggda områden. På så sätt kunde jag effektivt täcka in alla objekt effektivt och samtidigt skapa relevanta kluster av bostäder.

Dessa kluster använde jag sedan för att beräkna vilka områden som har utvecklats mest i pris per år. Resultatet av detta presenteras i figuren nedan. Utvecklingstakten spänner mellan allt från -5 000 kr/m²/år till 11 000 kr/m²/år. Vi kan se att majoriteten av områdena har utvecklats positivt medan Eriksberg, Majorna och Kungsladugård verkar ha minskat i pris per kvadratmeter över perioden som analyserats. Störst tillväxt har Olofstorp/Gråbo och Hovås haft båda med en tillväxt takt på runt 10 000 kr/m²/år.

Prisutvecklingen per kluster där mörkt blått indikerar stark tillväxt och rött indikerar negativ tillväxt. Klicka gärna på bilden för att utforska vyn i Tableau.

Budgivning och accepterat pris

Det går också att se en trend i att skillnaden mellan utgångspriset och slutpriset ökat över perioden som analyserats, vilket kan ses i figuren nedan. I början av perioden var prisökningen under budgivning ungefär 1 500 kr/m² medan den mot mitten av 2016 har ökat till nästan 4 000 kr/m². I faktiska slutpriser betyder det en ökning under budgivning på i snitt nästan 400 000 kr från utgångspriset. Betyder detta att mäklarna sätter lockpriser? Inte nödvändigtvis. Säljaren kan mycket väl vara nöjd med att få det priset som bostaden läggs ut för och i så fall är det ju knappast ett lockpris? Men mäklarna borde veta bättre och sätta högre utgångspriser. Takten som utgångspriserna ökat följer inte ens nästan den takt som slutpriserna har och då är det klart att bostäderna går upp i pris under budgivningen. Som säljare bör man skapa sig en egen bild av marknaden och ifrågasätta mäklarens utgångspris. Och som köpare är man nog tyvärr utelämnad till att förvänta sig att bostäder ökar kraftigt i pris under budgivningen.

Skillnaden mellan utgångspris och trendlinjerna för försäljningspriset för de tre analyserade hustyperna, villa, radhus och bostadsrätt, presenteras i den översta grafen. I den undre visas skillnaden mellan utgångspris och slutpris.

SOM klusterna kan även användas för att jämföra olika områdens budgivningstrender. Dessa kan vi se i kartan nedan. Det är störst prisskillnad på grund av budgivning i stadskärnan, men även några av klustren ute i skärgården verkar haft en del hårda budgivningar. Endast ett av klustren har i genomsnitt en minskning från utgångspriset och det är Hovås, samma som utvecklats snabbast. Här verkar det som att säljarna förstår marknaden och har en övertro till marknaden till skillnad från de andra områdena som mäklarna lyckas övertyga säljarna om ett utgångspris under marknadspris i genomsnitt.

Budgivningstrender för klustren från den själv organiserade kartan (SOM). Mörkt blå indikerar stor positiv prisskillnad medan rött indikerar att bostadäder i klustret i genomsnitt sålts för under utgångspris. Klicka gärna på bilden för att utforska vyn i Tableau.

Prediktion och viktiga parametrar

Mitt tredje syfte med undersökningen var att avgöra vilka parametrar som inverkar på priset. Tyvärr är det väldigt svårt att säga från den data som jag haft tillgång till. Vi kan se i korrelationsplotten nedan att det finns en viss korrelation mellan slutpriset och typiska bostadsparametrar, så som antal rum, yta, biyta, driftskostnad, avgift och även hustyp. Även avståndet till närmsta motorväg verkar ha viss korrelation till priset. Men när jag skapat olika prediktionsmodeller baserat på de numeriska parametrarna, som finns tillgängliga, så var det tydligt att de parametrarna helt enkelt inte innehåller tillräckligt med information för att helt bestämma slutpriset. Många gömda parametrar kan mycket väl påverka slutpriset än mer. Exempel på sådana parametrar är fel vid besiktning, använda material, skick på bostaden i allmänhet, utsikt, solläge etc. Mer prediktiv styrka än de ovan presenterade prisökningstrenderna är svårt att uppnå med den begränsade data analyserats här.

Korrelationen mellan de presenterade faktorerna presenteras. Notera främst raden för priset och vilka parametrar detta korrelerar till.

Sammanfattning

Jag har guidat er igenom en analys av Göteborgs bostadsmarknad där jag kunnat visa vilka de bästa tiderna att köpa och sälja olika bostadstyper är. Även vilka områden som visat störst tillväxtpotential och även var man kan förvänta sig att få betala mer än utgångspris på grund av en hård budgivning presenterats.

Specifika parametrar som påverkar priset har jag dock inte kunnat utröna. De normalt publicerade parametrarna verkar bara ge en del av hela bilden där många faktorer som påverkar priset är både subjektiva eller otillgängliga.

Utöver det har jag presenterat några effektiva verktyg för att genomföra avancerad analys och byggt upp metoder, som kan användas för ett brett spektrum av applikationsområden. Kanske kan det vara något för ert företag?

Tack för att ni läste. Förhoppningsvis vet ni nu hur ni skall göra för att maximera potentialen från er bostadsaffär.

Vill ni veta mer om hur vi jobbar med avancerad analys, tveka inte att höra av er!

Läs mer:
Data Science i praktiken
The Data Scientist