Data Science vs Data Mining
BrainStations Data Scientist karriereguide kan hjælpe dig med at tage de første skridt mod en lukrativ karriere inden for datavidenskab. Læs videre for at få et overblik over de vigtigste forskelle mellem datavidenskab og datamining.
Bliv dataforsker
Tal med en læringsrådgiver for at lære mere om, hvordan vores bootcamps og kurser kan hjælpe dig med at blive dataforsker.
Ved at klikke på Send accepterer du vores Vilkår .
Indsend
Kunne ikke indsende! Opdater siden og prøv igen?
Lær mere om vores Data Science BootcampTak skal du have!
Vi kontakter dig snart.
Se Data Science Bootcamp-siden
Da verden interesserer sig mere for datavidenskab, er det forståeligt, at der kan være en vis forvirring over terminologi, der ofte forkert bruges i flæng. Med det i tankerne kiggede vi nærmere på forskellen mellem datavidenskab og datamining.
Datavidenskab
Som vi har været inde på i andre områder af denne vejledning, er datavidenskab et felt, der bruger matematik og teknologi til at finde ellers usynlige mønstre i de enorme mængder af rådata, som vi i stigende grad genererer. Med det mål at lave præcise forudsigelser og smarte beslutninger giver datavidenskab os mulighed for at finde ellers umærkelig indsigt, der gemmer sig i umiddelbar nærhed i disse skare af data.
De forretningsmæssige og samfundsmæssige påvirkninger af datavidenskab er enorme, og efterhånden som datadrevet beslutningstagning bliver en stadig mere presserende prioritet for smarte virksomheder – MIT-forskning viser, at virksomheder, der fører an i brugen af datadrevet beslutningstagning, var seks procent mere rentable end deres konkurrenter – feltet for datavidenskab påvirker og ændrer, hvordan vi ser bedste markedsføringspraksis, forbrugeradfærd, operationelle problemer, forsyningskædecyklusser, virksomhedskommunikation og forudsigelige analyser.
En spirende tro på datavidenskab er virkelig konsistent på tværs af alle typer virksomheder. Dresners undersøgelse viste, at de industrier, der leder vejen for big-data-investeringer, omfatter telekommunikation (95 procent adoption), forsikring (83 procent), reklame (77 procent), finansielle tjenesteydelser (71 procent) og sundhedspleje (64 procent).
Datavidenskab er et bredt felt, der spænder over forudsigende årsagsanalyse (eller forudsigelse af mulighederne for en fremtidig begivenhed), præskriptiv analyse (som ser på en række handlinger og de relaterede resultater) og maskinlæring, som beskriver processen med at bruge algoritmer til at undervise computere, hvordan man finder mønstre i data og laver forudsigelser.
BrainStations Digital Skills Survey fandt, at dataforskere primært arbejder på at udvikle nye ideer, produkter og tjenester, i modsætning til andre dataprofessionelle, der fokuserer mere tid på at optimere eksisterende platforme. Og dataforskere er også unikke blandt big-data-professionelle ved, at deres mest brugte værktøj er Python.
Selvom datavidenskab er et bredt felt, er dets ultimative formål at bruge data til at træffe bedre informerede beslutninger.
Data Mining
Hvor datavidenskab er et bredt felt, beskriver data mining en række teknikker inden for datavidenskab til at udtrække information fra en database, der ellers var uklar eller ukendt. Data mining er et trin i processen kendt som
vidensopdagelse i databaser eller KDD, og ligesom andre former for minedrift handler det om at grave efter noget værdifuldt. Da data mining kan ses som en delmængde af datavidenskab, er der selvfølgelig overlapning; data mining omfatter også sådanne trin som datarensning, statistisk analyse og mønstergenkendelse, såvel som datavisualisering, maskinlæring og datatransformation.
Hvor datavidenskab imidlertid er et tværfagligt område af videnskabelig undersøgelse, er data mining mere optaget af forretningsprocessen, og i modsætning til maskinlæring er data mining ikke udelukkende optaget af algoritmer. En anden vigtig forskel er, at datavidenskab beskæftiger sig med alle former for data, hvor data mining primært beskæftiger sig med strukturerede data.
Målet med datamining er i høj grad at tage data fra et vilkårligt antal kilder og gøre det mere anvendeligt, hvor datavidenskab har større mål om at bygge datacentrerede produkter og træffe datadrevne forretningsbeslutninger.