Data science för en dotter del 1

Strax efter studenten drog min yngsta dotter till andra sidan jordklotet för att studera. Om man nu kallar nedanstående bild för att studera……

Inför nästa termin har jag, helt ogenerat, tvingat henne att läsa Data science och Informatics. Något som renderat i en, inte helt obetydlig prestationsångest hos henne. Utan uns av dåligt samvete tänkte jag dock försöka förbereda henne genom att förmedla allt jag kan i några, inte helt otippat, korta blogg-poster. ”Korta var ordet” anser förmodligen mina yngre kollegor Henrik och Josef.

Håll till godo Vanja!

Vad är Data science
Nästan alla företag vet och förstår värdet av data för sina bolag. Många har dessutom väldigt mycket data tillgängligt. Problemet är att dom ofta inte vet hur dom skall fånga den, förädla den och använda den. Det är här ”du” och dina kurskamrater kommer in.

Grunden är att använda information i syfte att fatta bättre beslut. Det kan vara en människa som fattar beslutet eller en sak som din telefon. Det här kallas för datadrivna beslut som baseras på fakta, inte på erfarenhet eller intuition/känsla. Ibland kan det dock vara en kombination av detta.

De flesta högst värderade bolagen idag har automatiserat sitt datadrivna beslutsstöd. Annonserna du ser på Facebook eller Instagram är exempel på detta. Banker som reagerar på att du använder ditt kort i Australien, men är skriven i Sverige är ett annat exempel. Spotify anpassar låtlistor efter data om dig etc.

Varför heter det Data science? Sience betyder ju vetenskap. Det är vetenskapen om att utvinna värde ur information. Man observerar (data), utvecklar en hypotes och man verifierar resultatet.

Fördelarna med datadrivet beslutsfattande är att man tar bort den mänskliga faktorn. Människor som jobbat på samma jobb i tiotals år baserar sina beslut på gammal erfarenhet vilket gör att besluten blir allt sämre ju längre tiden går. Naturen har ordnat detta genom att människor dör, men idag går allt för fort. Så antingen behöver du sysselsätt dig med att döda beslutsfattare på företag eller arbeta med att införa datadrivet beslutsfattande.

Ofta jobbar man i steg.

  • Steg 1 – Formulera frågan. Hur kan vi göra vår produkt bättre? Hur kan vi få fler kunder? Hur kan vi bli mer träffsäkra i vår marknadsföring?
  • Steg 2 – Hämta datan. Först måste du få tag på alla data och den kan vara mer eller mindre gömd. Dark data, öppen data, intern data, social data etc. Sedan måste du jobba lite med den. Kanske rensa en del, ta hänsyn till lagar mm.
  • Steg 3 – Utforska datan. Kan du se några mönster, kan du redan nu se några ”a-ha moments”. Framför allt ser du några anomalier i relation till sega beslutsfattare.
  • Steg 4 – Här modellerar du datan. Här kommer massor av ord som jag skall skriva om snare. Big data, datavalidering, machine learning, regressionsanalys mm.
  • Steg 5 – Visualisering. Inget av allt du gjort hittills har något värde om du inte kan förmedla resultatet på ett tillgängligt sätt. Här kommer din kurs i Informatics in. Vad lärde vi oss? Kan vi bygga en story av informationen? Det här är nästan som ett helt område i sig!

Det var allt för denna gång. Var det rätt? Kanske, kanske inte. Det vet du om 8 månader.

About Patrick Gilbert

Jag hjälper företag och människor att lyckas skapa exceptionella kundupplevelser, lönsamhet och effektivitet genom att utnyttja digitaliseringens möjligheter.

Leave a Reply

Your email address will not be published. Required fields are marked *