Data Mining

Hva er Data Mining:

Data mining er et engelsk begrep knyttet til datavitenskap hvis oversettelse er datautvinning . Den består av en funksjonalitet som aggregerer og organiserer data, finner i dem relevante mønstre, foreninger, endringer og uregelmessigheter .

Begrepet datautvinning oppsto først i 1990 i databasemiljøene. Data mining er prosessanalysestrinnet kjent som KDD ( Knowledge Discovery in Databases ), sin bokstavelige oversettelse er "Knowledge Discovery in Databases".

Data mining kan deles inn i noen få grunnleggende trinn: leting, modellbygging, mønsterdefinisjon og validering og verifisering.

Data mining er en relativt nylig praksis i verden av databehandling, og den bruker informasjonssøking, kunstig intelligens, mønstergjenkjenning og statistiske teknikker for å søke etter sammenhenger mellom forskjellige data som gjør at du kan få gunstig kunnskap for et selskap eller individ. For et selskap kan datautvinning være et viktig verktøy som forbedrer innovasjon og lønnsomhet.

Bruken av data mining er ganske vanlig i store databaser, og sluttresultatet av bruken kan vises ved hjelp av regler, hypoteser, beslutningstrender, dendrogrammer etc.

Godt utført datautvinning skal utføre slike oppgaver som: anomalitetsdeteksjon, assosieringsregellæring (avhengighetsmodellering), gruppering, klassifisering, regresjon og oppsummering. Datautvinningsprosessen oppstår typisk ved bruk av data i datalageret .

Det er flere selskaper og programvare som er dedikert til data mining, da identifisering av mønstre i databaser blir stadig viktigere. Identifikasjonen av relevante standarder er imidlertid ikke unik for datamaskinverdenen. Den menneskelige hjerne bruker en lignende prosess for å identifisere mønstre og skaffe seg kunnskap.

I de senere årene har datautvinning vært mye brukt innen vitenskap og ingeniørfag, for eksempel bioinformatikk, genetikk, medisin, utdanning og elektroteknikk.

Begrepet data mining er ofte forbundet med å trekke ut informasjon om folks adferd. Av denne grunn reiser datautvinning i noen situasjoner juridiske problemer og problemer knyttet til personvern og etikk. Til tross for dette hevder mange at datautvinning er etisk nøytral, da det ikke har noen etiske implikasjoner.

Ekte data mining eksempler

Datautvinning brukes ofte av bedrifter og organisasjoner for å få kunnskap om brukere / ansatte / kunder. For eksempel er det i offentlig sektor mulig å krysse mellom sivilstanden til en ansatt og den lønnen han tjener for å se om dette påvirker hans ekteskapsliv.

Bedrifter som supermarkedskjeder kan bruke dette kryssdata for å bestemme produkter som er kjøpt sammen. Hvis en kunde som kjøper produkt X også kjøper produkt Y, kan det være lurt å plassere de to produktene i nærheten for å gjøre det lettere for kunden å kjøpe.