En dag i en dataforskers liv
BrainStations Data Scientist karriereguide kan hjælpe dig med at tage de første skridt mod en lukrativ karriere inden for datavidenskab. Læs videre for at få et overblik over, hvordan dataforskere bruger deres dage på arbejdet.
Bliv dataforsker
Tal med en læringsrådgiver for at lære mere om, hvordan vores bootcamps og kurser kan hjælpe dig med at blive dataforsker.
Ved at klikke på Send accepterer du vores Vilkår .
Indsend
Kunne ikke indsende! Vil du opdatere siden og prøve igen?
Lær mere om vores Data Science BootcampTak skal du have!
Vi kontakter dig snart.
Se Data Science Bootcamp-siden
En dag i en dataforskers liv
Af alle de discipliner, der er undersøgt i Brainstations Digital Skills Survey, kan datavidenskab omfatte det bredeste udvalg af applikationer. Men selvom datavidenskab har eksisteret i årtier, er den først for nylig kommet i fuldt flor. Efterhånden som tilgængeligheden af data er udvidet, har virksomheder indset, hvor vigtig datavidenskab kan være, siger Briana Brownell, grundlægger og administrerende direktør for Pure Strategy, og en dataforsker i 13 år. Hver virksomhed skal nu have et delvist fokus på teknologi. For eksempel i denne uge betalte McDonald's anslået 300 millioner USD for at erhverve sit eget big data-firma.
Det er derfor ikke underligt, at konkurrencen om Data Scientists er utrolig høj. På blot to år forventes efterspørgslen at vokse med 28 procent, svarende til omkring 2,7 millioner nye job. Det er flere åbninger, end nyuddannede vil være i stand til at udfylde - hvilket betyder, at teknologiarbejdere inden for andre områder bliver nødt til at opfriske deres færdigheder og gå over til data for at imødekomme denne efterspørgsel.
Faktisk tyder vores undersøgelse på, at dette allerede sker. Omtrent fire ud af fem dataprofessionelle begyndte deres karriere med at lave noget andet, og 65 procent af alle dataforskere har arbejdet i feltet i fem år eller mindre. Denne enorme tilstrømning af nye sind har en tveægget effekt, siger Brownell; på den ene side kommer der mange nye ideer, siger hun. Når jeg ser på noget af det indhold, der kommer ud af datavidenskabssamfundet, er jeg overrasket over, hvor meget innovation der er. Bagsiden er dog en tendens til at genopfinde hjulet.
Stor efterspørgsel efter Data Scientists er fantastisk, hvis du er en (eller overvejer at blive det), men for arbejdsgivere kan rekruttering være en skræmmende udfordring. Her er omskilling en oplagt løsning; det kan være mere omkostningseffektivt at omskole en nuværende medarbejder i data science end at headhunte en ny.
Men selvom du planlægger at ansætte et nyt datavidenskabsteam, kan din organisation som helhed blive nødt til at opfriske sin datafærdighed, advarer Brownell. Alle vil gerne arbejde med noget, der har indflydelse på deres arbejdsplads, som gør folks liv bedre, siger hun. Hvis din virksomhedskultur ikke er sådan, at [dine dataforskere] kan få indflydelse, er det næsten umuligt at ansætte. Ledelse skal være i stand til ikke kun at kommunikere til potentielle ansatte, hvordan de vil være i stand til at bidrage - men til at forstå de forslag, deres datavidenskabsteam i sidste ende også fremsætter.
Desværre, siger Brownell, er det ubehagelige flertal de virksomheder, der ikke har fundet ud af tingene. Vores undersøgelse understøtter dette: De fleste respondenter (52 procent) beskrev niveauet af datafærdigheder på tværs af deres organisationer som grundlæggende, med mellemliggende det næstmest almindelige svar (31 procent). Dette tyder på, at nogle grundlæggende datavidenskabelige uddannelser kunne være nyttige for et stort flertal af virksomheder - især inden for ledelse.
Dette behov for forbedret datafærdighed – og kommunikation – forstærkes af den måde, de fleste datavidenskabshold er struktureret på: som et diskret team, normalt med 10 personer eller færre (ifølge 71 procent af respondenterne), og ofte fem eller færre (38 procent). ). Disse tætte hold har ikke råd til at blive isoleret. Personer, der arbejder i større virksomheder, er normalt inden for en lille datavidenskabsspecifik gruppe, og deres kunder er interne - andre dele af organisationen, forklarer Brownell, så det er et team, der skal operere på tværs af mange forskellige områder af organisationen.
Hvad er datavidenskab præcist?
Den almindelige opfattelse (at Data Scientists knuser tal) er ikke for langt væk, siger Brownell. Der er en masse datasæt, der skal have indsigt afsløret fra dem, og det involverer en masse trin som modelbygning og dataoprydning, og endda bare at beslutte, hvilke data du har brug for. I sidste ende er denne indsats dog målorienteret: I sin kerne skal du gøre noget med dataene.
For den sags skyld er data ikke altid tal. Mens et flertal af de adspurgte (73 procent) angav, at de arbejder med numeriske data, sagde 61 procent, at de også arbejder med tekst, 44 procent med strukturerede data, 13 procent med billeder og 12 procent med grafik (og små minoriteter arbejder endda med video og lyd). — henholdsvis 6 procent og 4 procent). Disse undersøgelsesresultater antyder, hvordan datavidenskab ekspanderer langt ud over finansielle tabeller, idet de hverver folk til projekter som at maksimere kundetilfredsheden eller hente værdifuld indsigt fra de sociale mediers brandslange.
Som et resultat er der enorm variation inden for datavidenskabsområdet, siger Brownell. Hver industri har sit eget bud på, hvilke typer data dataforskerne arbejder på, hvilke typer resultater de forventer, og hvordan det passer ind i deres virksomheds ledelsesstruktur. I alle tilfælde er målet dog at udnytte data til at hjælpe en virksomhed med at træffe bedre beslutninger. Det kunne være at gøre produkter bedre, forstå det marked, de ønsker at gå ind i, fastholde flere kunder, forstå deres arbejdskraftforbrug, forstå, hvordan man laver gode ansættelser – alle mulige forskellige ting.
Data Science job
Inden for nogle teknologiske områder kan det være din bedste fod inden for døren at blive generalist – ikke så med datavidenskab. Arbejdsgivere leder typisk efter færdigheder, der er specialiserede til deres branche. Fordi datavidenskab findes i så mange forskellige varianter, blev vores undersøgelse undersøgt dybere og undersøgte fem hovedjobkategorier: Dataanalytiker, forsker, forretningsanalytiker, data- og analysechef og egentlig dataforsker.
På tværs af alle disse jobtitler tager datastrid og oprydning det meste af ens tid – men til hvad formål? Oftest er målet at optimere en eksisterende platform, produkt eller system (45 procent), eller at udvikle nye (42 procent). Når vi gravede dybere, fandt vi ud af, at optimering af eksisterende løsninger har en tendens til at falde til Business Analysts og Data Analysts, mens udvikling af nye løsninger oftere falder til Data Scientists og forskere.
De teknikker, dataforskere bruger, varierer også på tværs af specialiseringer. Lineær regression var et fælles værktøj på tværs af alle kategorier, citeret af 54 procent af de adspurgte, men der var et par overraskelser, da vi så på den software, folk bruger.
Excel – den arbejdshest af datasætmanipulation – er praktisk talt allestedsnærværende, citeret af 81 procent af alle respondenter og det mest populære værktøj i alle kategorier undtagen Data Scientists egentlig (som oftest stoler på Python – og citerede også et større værktøjssæt end andre kategorier). ). Hvad gør Excel så uundgåelig, selv i 2019?
Det, jeg elsker ved Excel, er, hvordan det giver dig mulighed for at se dataene og få en intuitiv fornemmelse for dem, forklarede Brownell. Vi bruger også meget Python, og i så fald, når du laver analyser på en datafil, er den skjult; medmindre du specifikt programmerer en del af din kode til at visualisere de rådata, du analyserer, kan du ikke se det. Med Excel er det lige foran dig. Det har mange fordele. Nogle gange kan du opdage problemer med datafilen. Jeg ser aldrig Excel forsvinde fra analyse.
Når det er sagt, er der stadig en lang liste af andre programmer, der bruges på området - ikke overraskende i betragtning af dens mangfoldighed. SQL (43 procent) og Python (26 procent) er førende i popularitet, med Tableau (23 procent), R (16 procent), Jupyter Notebooks (14 procent) og en håndfuld andre, der har klokket betydelige tal op – for ikke at nævne det kæmpestore 32 procent af de adspurgte, der citerede andre værktøjer, selv givet denne allerede lange liste.
Hvad er fremtiden for datavidenskab?
Til sidst spurgte vi, hvilke tendenser der vil forme det digitale landskab i løbet af de næste fem til 10 år. Machine learning og AI – som begge har applikationer inden for datavidenskab – var overvældende den udvikling, respondenterne forventer vil have den største effekt, med henholdsvis 80 procent og 79 procent. Dette til trods for, at mindre end en fjerdedel (23 procent) af dem i øjeblikket arbejder med kunstig intelligens.
Kunstig intelligens kan absolut transformere datavidenskab, bekræfter Brownell, hvis virksomhed udvikler AI-produkter. Det er virkelig herligheden ved uovervågede læringsmetoder. Vi har kun så meget tid til at se på disse datasæt, og især med store, er det meget svært at gøre alt. AI-værktøjer kan hjælpe med at afsløre noget, som du måske ikke ville have tænkt på at lede efter. Det har vi helt sikkert oplevet.
Andre tendenser Data Scientists forventer at dominere i den nærmeste fremtid: tingenes internet (51 procent), blockchain (50 procent) og e-handel (36 procent), augmented reality og virtual reality (38 procent og 27 procent) og endda stemme- baserede erfaringer (25 procent) - alle væsentlige fremvisninger og alle områder, hvor datavidenskab kan bruges godt.