Forskel mellem data mining og OLAP

Anonim

Data Mining vs OLAP

Både data mining og OLAP er to af de fælles Business Intelligence (BI) teknologier. Business intelligence refererer til computerbaserede metoder til at identificere og udvinde nyttig information fra forretningsdata. Data mining er inden for datalogi, der beskæftiger sig med at udvinde interessante mønstre fra store datasæt. Det kombinerer mange metoder fra kunstig intelligens, statistik og databasehåndtering. OLAP (online analytisk behandling) som navnet antyder er en samling af måder at forespørge multidimensionale databaser.

Data mining er også kendt som Knowledge Discovery in data (KDD). Som nævnt ovenfor er det et område inden for datalogi, der beskæftiger sig med udvinding af tidligere ukendte og interessante oplysninger fra rå data. På grund af den eksponentielle vækst af data, især inden for områder som erhverv, er dataudvinding blevet et meget vigtigt redskab til at konvertere denne store rigdom af data til business intelligence, da manuel udvinding af mønstre er blevet tilsyneladende umulig de sidste par årtier. For eksempel er det i øjeblikket blevet brugt til forskellige applikationer som social network analysis, svindel afsløring og markedsføring. Data mining handler normalt om følgende fire opgaver: clustering, klassificering, regression og forening. Clustering identificerer lignende grupper fra ustrukturerede data. Klassificering er læringsregler, der kan anvendes på nye data og vil typisk indeholde følgende trin: forbehandling af data, design af modellering, læring / funktionvalg og evaluering / validering. Regression er at finde funktioner med minimal fejl i modeldata. Og forening søger relationer mellem variabler. Data mining bruges normalt til at svare på spørgsmål som de vigtigste produkter, der kan hjælpe med at opnå et højt overskud næste år i Wal-Mart.

OLAP er en klasse af systemer, der giver svar på multidimensionelle forespørgsler. OLAP bruges typisk til markedsføring, budgettering, prognoser og lignende applikationer. Det siger sig selv, at de databaser, der bruges til OLAP, er konfigureret til komplekse og ad hoc-forespørgsler med en hurtig præstation i tankerne. Typisk bruges en matrix til at vise output fra en OLAP. Rækkerne og kolonnerne dannes af forespørgelsens dimensioner. De bruger ofte metoder til aggregering på flere tabeller for at få resuméer. For eksempel kan det bruges til at finde ud af om salget af dette år i Wal-Mart i forhold til sidste år? Hvad er forudsigelsen for salget i næste kvartal? Hvad kan man sige om tendensen ved at se på procentandelen?

Selvom det er indlysende, at Data mining og OLAP er ens, fordi de opererer på data for at få intelligens, kommer den væsentligste forskel fra, hvordan de opererer på data.OLAP-værktøjer tilvejebringer multidimensionel dataanalyse, og de giver opsummeringer af dataene, men kontraherende fokuserer data mining på forhold, mønstre og påvirkninger i datasættet. Det er en OLAP-aftale med aggregering, hvilket koger ned til driften af ​​data via "tilføjelse", men data mining svarer til "division". Andre bemærkelsesværdige forskelle er, at mens OLAP gennemfører sammenlignings- og kontrastteknikker langs forretningsdimensionen i realtid, mens data mining værktøjer model data og returnerer handlinger.