Jag är i det närmaste euforisk över alla de möjligheter Big data kommer att ge oss framöver. Framför allt möjligheterna som kommer att göra att vår syn på marknadskommunikation kommer att få en ny dimension. Som vanligt kraxar belackarna om ”fluga”, ”hype”, etc. Lyssna inte på dessa obskuranta reaktionärer!!!
Varför?
Varje dag producerar vi 2,5 kvintiljoner byte data. Vi talar 30 nollor här! Explosionen av det sociala kommer inte att göra denna siffra mindre. 90% av all existerande online-data är skapad de senaste två åren!
För mig är detta som julafton när man var barn. All data är som paketen som ligger under granen. Jag vet inte riktigt vad det är i, bara att det är många paket! Snart kan vi öppna paketen, analysera och sen jävlar blir det åka av!
En av belackarnas huvudargument är att det bara är en ny term för business intelligence. Och delvis håller jag med, men termen gör att vi kommer att titta på analys på ett lite annat sätt tror jag. Kombinationen av nya typer av källor och kombinationen av dessa kommer skapa sammanhang vi aldrig sett tidigare. För om vi tycker att det sociala skapar mycket data, lägg till när snart ALLT är uppkopplat. All elektronik, våra kläder, ytmaterial på hus etc.
Glöm dock inte “pre-processing”.
Jag har sett en trend de sista åren att bara för att hårddiskarna är billiga och att det är tekniskt möjligt sparas en stor data i onödan, detta kostar på i datanäten och alla backup band som genereras.
Se till att filterera och fundera på vilken data som är viktigt för eftervärlden. Att mäta yttertemperatur var 10’e sekund ger inget mervärde. Upplösning och brus gör att detta inte tillför något annat är mycket data.
Enkla exempel på pre-processing är medelvärdesbildning av mätningar av yttertemperaturen, Detta skulle ge ett bättre tillförlitligare värde. En annan pre-processign är skalning och kalibrering som ser till att mätvärdena är omräknade i grader med rätt antal decimaler istället för i mV med maximal upplösning.
Idag genererar denna stora datamängd redan att man har svårt att se igenom och drunknar i analysarbete.
Rätt Hans!
Eller som en väldigt klok, tjusig, kreativ och ödmjuk herre skrivit:
“Dessa datamängder är dessutom helt ny typ av data som vi delvis inte är vana vid. Jag ser inte lagringen som det stora problemet, inte heller insamlingen. Utmaningen ligger i att strukturera och exekvera på dessa datamängder.”
http://www.patrickgilbert.se/customerexperience/?p=5289