Bei normalen Auswertungen von Datenbeständen (z. B. durch OLAP) können bestimmte,
vorher festgelegte Fragestellungen bearbeitet werden. Zum Beispiel: Wie viele meiner Kunden
sind zwischen 20 und 40 Jahre alt und leben in München. Beim Data-Mining werden die
Datenbestände nach Regelmäßigkeiten, Mustern und Strukturen, Abweichungen und jeglicher
Art von Beziehungen und gegenseitigen Beeinflussungen untersucht. Der Prozess der
Mustererkennung und Wissensextraktion wird auch „Wissensentdeckung in Datenbanken“
genannt. Im Data-Mining, als einem kreativen Prozess, werden im Arbeitsfortschritt
Hypothesen entwickelt und überprüft.
Verschiedene Data-Mining-Verfahren sind:
|
Gruppierung von Objekten aufgrund von Ähnlichkeiten
|
|
Identifikation und Extraktion weniger systembestimmender Faktoren
|
|
datenreduzierendeInformationsverdichtung durch Bündelung mehrerer
Variablen zu wenigen Faktoren
|
|
z. B. Warenkorbanalyse
|
|
Einordnung von Objekten in bestimmte Klassen und Kategorien
|
|
Klassifikation von Objekten unbekannter Klassenzugehörigkeit
|
|
Darstellung aufeinanderfolgender, hierarchischer Entscheidungen
|
|
|
|
Identifikation von Beziehungen zwischen einer abhängigen und einer
oder mehrerer unabhängigen Variablen
|
|
Überführung beliebiger Eingabemuster in das gewünschte
Ausgabemuster
|
|
Aufteilung von Objekten in zwei Klassen unter Maximierung des
Abstands zur Klassengrenze
|