Avancerad analys förstår Göteborgs bostadsmarknad
Bostadsmarknaden är något som vi alla påverkas av och som den senaste tiden definitivt varit i ropet. Framförallt i storstäderna har det varit extra stor diskussion, med bostadsköer på flera år och ständigt stigande bostadspriser. Under sommaren har jag använt avancerad analys för att grotta ner mig och skapa mig en bättre bild av vad som händer på bostadsmarknaden i Göteborg. Det blev en djupdykning. Utöver att guida er genom den analys som jag gjort kommer jag också presentera ett antal tips och tricks, som kan öka förutsättningen för att göra en bra bostadsaffär.
Vilka faktorer påverkar en bostads pris? Det var den första frågan jag ställde mig. En ytterligare frågeställning var om det finns några mönster eller trender i marknaden som man som köpare eller säljare skulle kunna dra nytta av. Är några områden i staden mer populära än andra?
Jag kommer besvara alla dessa frågor i denna artikel, men först skall jag gå igenom hur jag byggde upp en plattform för avancerad analys, inklusive de verktyg och språk som använts.
Lokalisering och inhämtning av data
Det första steget är att få tag på relevant och tillförlitlig data. En klar källa för bostadsstatistik och data är hemnet. Här finns både slutpriser och bostadsinformation, så som bostadsstorlekt, antal rum, tomtyta etc. Det första steget blev således att komma åt den data som finns på hemnets webbplats för slutpriser. Då de inte har en öppen databas krävdes att annat angreppssätt.
python är ett open-source scriptspråk som lämpar sig väldigt bra för den typen av datahantering och insamling, med många färdigskrivna paket och funktioner som man kan använda sig av. Genom att använda python kunde jag extrahera och spara ner de objekt som hemnet har publicerat på sin hemsida med slutpriser. Nästa steg var att "tvätta" data, som det heter. Det vill säga, att från de rena textraderna ta fram och kategorisera de siffror och den information som finns sparad där samt att validera att informationen är komplett och rimlig.
Strukturering och lagring av data
Efter att data är inhämtad behöver den struktureras och kategoriseras. Detta görs med fördel i en databas. I mitt fall valde jag att skapa en postgreSQL-databas i Google Cloud. Detta möjliggjorde både enkel uppkoppling från flertalet enheter, som kan genomföra analyser, och valet av postgreSQL innebar att jag kunde göra geografiska analyser enkelt direkt i databasen med hjälp av påbyggnadspaketet postGIS.
Geografiska parametrar
Då jag fått fram koordinaterna för varje bostadsobjekt var det enkelt att ta fram några geografiska attribut som borde inverka på bostadspriset. Med hjälp av den öppna geografiska data i Open Street Map (OSM) och postGIS kunde jag, till exempel, lokalisera avståndet till närmaste busshållplats, sjö, naturområde och motorväg. Utöver dessa parametrar tog jag även fram antalet restauranger, affärer och byggnader inom ett visst antal meter från bostadsobjektet.
Avancerad och visuell analys
Nu när databasen är uppbyggd och data är inhämtad och kategoriserad var det dags att analysera den. Genom att använda en kombination av R och Tableau kunde jag genomföra en bra blandning av grafisk, visuell (Tableau) och avancerad analys (R).
Resultat om bostadsmarknaden
Genom att kolla på data i aggregerad form över den tidsperiod som jag har tillgång till (2012->) kunde jag avgöra om det finns några intressanta mönster i marknaden.
Det första resultatet är att det finns ett klart säsongsberoende i slutpriserna över året. Detta mönster varierar dock med typen av bostad som betraktas.
Mönster för bostadsrätter
Från figuren nedan kan vi dra slutsatsen att bostadsrätter säljs för högre pris i slutet av sommaren, men att det då också säljs färre objekt. Detta kan i sin tur få oss att tro att det är köparna som här driver på marknaden och är villiga att betala mer för att få en bostad just under de månaderna. I juni är det istället tvärtom. Priset sjunker kraftigt men det är fortfarande ett stort antal affärer som genomförs. Här är det rimligt att anta att det är säljarna som är desperata att bli av med sina lägenheter innan sommarens intåg och de kan då tänka sig att sälja för en liten rabatt.
Om man vill köpa en bostadsrätt skall man med fördel göra det i just juni eller senhöst till och med februari för att betala så lite som möjligt.
Mönster för villor
På samma sätt kan vi kolla på figuren och följa kurvan för villor. Här kan vi istället se att den ligger mycket jämnare över hela året, men att det är något dyrare att köpa villa på våren än på hösten och att maj både är den populäraste månaden att sälja och köpa hus samt att det medför högst pris.
Köp villa i juni om rätt bostad finns på marknaden eller mitt under hösten för att få bostaden till ett så bra pris som möjligt.
Mönster för radhus
För radhus kan vi istället se en tydlig nedgång i pris per kvadratmeter i juli, vilken också är förknippad med lägre antal försäljningar. Men om man kan få tag på ett radhus som passar de kriterier man satt upp är det definitivt ett bra läge att köpa i juli. Annars skall man precis som för villor undvika att köpa på våren och snarare satsa på hösten och då framförallt december.
Prisutveckling
Över den period som analyserats så kan man se en tydlig ökning i priset per kvadratmeter. I genomsnitt över alla bostäder har priset ökat med 4 600 kr/m²/år. Om vi kollar på figuren med pristrenden nedan kan vi se att denna trend är tydlig för alla tre bostadstyper, bostadsrätt, villa samt radhus. Framförallt bostadsrätter ökat i värde med i genomsnitt 5 276 kr/m²/år medan villor och radhus har ökat med strax under 3 000 kr/m²/år. Vi kan även se att antalet försäljningar har ökat stadigt.
I kartan nedan kan vi tydligt se att var bostaden ligger påverkar priset. I stort verkar det som att det är dyrare att bo i stadskärnan samt längs kusten söder om staden. Något som vi också känner igen oss i. Ett fåtal fastigheter har även sålts över medelpris ute i skärgården.
Självorganiserande kartor
Självorganiserade kartor (Self Organising Maps, SOMs) är ett område inom maskininlärning, som använder abstrakta kartor för att förstå och förenkla komplexa dataset. För att se hur olika områden har utvecklats över tid behöver vi ett sätt att dela in bostäderna i områden, som sedan kan analyseras. Ett smidigt och dataspecifikt sätt att göra det på är att använda just SOMs. Normalt används dessa som ett sätt för dimensionsreduktion, men det går såklart även att göra en mappning inom samma dimensioner. Genom att skapa en karta (oftast i två dimensioner) och låta punkter på denna kartan flytta sig för att täcka det presenterade datasetet, som kan sträcka sig över ett godtyckligt antal dimensioner, kan man på så sätt få en överskådlig representation av ett högdimensionellt rum. I mitt fall var det dock mycket lättare än så. Jag ville bara skapa något sätt dela in bostadsobjekten i olika områden geografiskt, så jag ville skapa en SOM i två dimensioner som gör just det, delar in objekten i grupper beroende på deras koordinater, som ju också är i två dimensioner. Baserat på antalet objekt totalt och storleken på det geografiska området som betraktades, så valde jag en SOM med 15x15 noder. Det fina med SOMs är att istället för att skapa ett rutnät med lika stora rutor kan kartan dynamiskt sprida ut sig och ha fler noder i områden med fler objekt och färre i mer glesbebyggda områden. På så sätt kunde jag effektivt täcka in alla objekt effektivt och samtidigt skapa relevanta kluster av bostäder.
Dessa kluster använde jag sedan för att beräkna vilka områden som har utvecklats mest i pris per år. Resultatet av detta presenteras i figuren nedan. Utvecklingstakten spänner mellan allt från -5 000 kr/m²/år till 11 000 kr/m²/år. Vi kan se att majoriteten av områdena har utvecklats positivt medan Eriksberg, Majorna och Kungsladugård verkar ha minskat i pris per kvadratmeter över perioden som analyserats. Störst tillväxt har Olofstorp/Gråbo och Hovås haft båda med en tillväxt takt på runt 10 000 kr/m²/år.
Budgivning och accepterat pris
Det går också att se en trend i att skillnaden mellan utgångspriset och slutpriset ökat över perioden som analyserats, vilket kan ses i figuren nedan. I början av perioden var prisökningen under budgivning ungefär 1 500 kr/m² medan den mot mitten av 2016 har ökat till nästan 4 000 kr/m². I faktiska slutpriser betyder det en ökning under budgivning på i snitt nästan 400 000 kr från utgångspriset. Betyder detta att mäklarna sätter lockpriser? Inte nödvändigtvis. Säljaren kan mycket väl vara nöjd med att få det priset som bostaden läggs ut för och i så fall är det ju knappast ett lockpris? Men mäklarna borde veta bättre och sätta högre utgångspriser. Takten som utgångspriserna ökat följer inte ens nästan den takt som slutpriserna har och då är det klart att bostäderna går upp i pris under budgivningen. Som säljare bör man skapa sig en egen bild av marknaden och ifrågasätta mäklarens utgångspris. Och som köpare är man nog tyvärr utelämnad till att förvänta sig att bostäder ökar kraftigt i pris under budgivningen.
SOM klusterna kan även användas för att jämföra olika områdens budgivningstrender. Dessa kan vi se i kartan nedan. Det är störst prisskillnad på grund av budgivning i stadskärnan, men även några av klustren ute i skärgården verkar haft en del hårda budgivningar. Endast ett av klustren har i genomsnitt en minskning från utgångspriset och det är Hovås, samma som utvecklats snabbast. Här verkar det som att säljarna förstår marknaden och har en övertro till marknaden till skillnad från de andra områdena som mäklarna lyckas övertyga säljarna om ett utgångspris under marknadspris i genomsnitt.
Prediktion och viktiga parametrar
Mitt tredje syfte med undersökningen var att avgöra vilka parametrar som inverkar på priset. Tyvärr är det väldigt svårt att säga från den data som jag haft tillgång till. Vi kan se i korrelationsplotten nedan att det finns en viss korrelation mellan slutpriset och typiska bostadsparametrar, så som antal rum, yta, biyta, driftskostnad, avgift och även hustyp. Även avståndet till närmsta motorväg verkar ha viss korrelation till priset. Men när jag skapat olika prediktionsmodeller baserat på de numeriska parametrarna, som finns tillgängliga, så var det tydligt att de parametrarna helt enkelt inte innehåller tillräckligt med information för att helt bestämma slutpriset. Många gömda parametrar kan mycket väl påverka slutpriset än mer. Exempel på sådana parametrar är fel vid besiktning, använda material, skick på bostaden i allmänhet, utsikt, solläge etc. Mer prediktiv styrka än de ovan presenterade prisökningstrenderna är svårt att uppnå med den begränsade data analyserats här.
Sammanfattning
Jag har guidat er igenom en analys av Göteborgs bostadsmarknad där jag kunnat visa vilka de bästa tiderna att köpa och sälja olika bostadstyper är. Även vilka områden som visat störst tillväxtpotential och även var man kan förvänta sig att få betala mer än utgångspris på grund av en hård budgivning presenterats.
Specifika parametrar som påverkar priset har jag dock inte kunnat utröna. De normalt publicerade parametrarna verkar bara ge en del av hela bilden där många faktorer som påverkar priset är både subjektiva eller otillgängliga.
Utöver det har jag presenterat några effektiva verktyg för att genomföra avancerad analys och byggt upp metoder, som kan användas för ett brett spektrum av applikationsområden. Kanske kan det vara något för ert företag?
Tack för att ni läste. Förhoppningsvis vet ni nu hur ni skall göra för att maximera potentialen från er bostadsaffär.
Vill ni veta mer om hur vi jobbar med avancerad analys, tveka inte att höra av er!